GPT-5 系统说明卡

2025-09-02 57 0

总览

GPT-5 是一个统一系统,由以下几个部分组成:

  • 快速响应模型:用于处理大多数常见问题;
  • 深入推理模型:专门应对更复杂的问题;
  • 实时路由器:根据对话类型、问题复杂度、是否需要工具调用,以及用户明确表达的意图(例如提示中包含“think hard about this”),动态决定使用哪个模型;
  • 路由器基于真实用户行为持续训练,包括用户切换模型的情况、对回答的偏好程度、以及回答正确性,从而不断提升效率;
  • 一旦使用达到上限,将启用相应模型的微型版本继续处理请求;
  • 未来计划将所有功能整合进一个模型中。

系统中命名方式如下:

早期模型GPT-5 系列模型
GPT-4ogpt-5-main
GPT-4o-minigpt-5-main-mini
OpenAI o3gpt-5-thinking
OpenAI o4-minigpt-5-thinking-mini
GPT-4.1-nanogpt-5-thinking-nano
OpenAI o3 Progpt-5-thinking-pro

在 API 中,开发者可以直接访问:

  • 推理模型(thinking)、
  • 微型版本(thinking-mini)以及
  • 更小更快的 nano 版本(thinking-nano)。

在 ChatGPT 界面中,还提供一个“thinking-pro”版本,它采用并行测试时计算方式,进一步提升响应能力。

本说明卡的重点在于 "gpt-5-thinking" 和 "gpt-5-main" 两种模型,其他版本的性能评估内容则附在说明卡后文。


性能提升与优势

GPT-5 不仅在基准测试中超越前代模型、响应速度更快,更重要的是,在现实使用中的实用性显著提升。具体改进包括:

  • 显著减少了 幻觉现象(hallucination);
  • 提高模型的 执行指令能力
  • 减少 谄媚倾向(sycophancy);
  • 在 ChatGPT 的三大常见用途上整体升级:写作、编程、健康问答
  • 所有 GPT-5 模型均支持 安全完成(safe completions) —— 一种新的安全训练方法,在遇到违禁内容时能提供合适替代回答,而不是简单拒绝。

此外,依照 OpenAI 的“准备度框架”(Preparedness Framework),gpt-5-thinking 被划为在 生物与化学领域具有高能力的模型,并因此启用了相应安全防护措施。虽然尚无确凿证据表明其能够帮助新手制造严重生物危害,但出于谨慎考虑,已启动相关安全机制。

相关文章

车友投稿:Claude code最强文本输入助手-wisprflow
车友投稿: Claude Code Status Line 状态栏
车友投稿:如何回到opus4 的怀抱
Claude Code 又更新!AI 编程进入“反向教学”模式,写到一半会停下考你:这行代码你来写
车友投稿: 什么是Claude Code Subagent?
车友投稿:Claude code结合Kiro Spec工作流

发布评论