
总览
GPT-5 是一个统一系统,由以下几个部分组成:
- 快速响应模型:用于处理大多数常见问题;
- 深入推理模型:专门应对更复杂的问题;
- 实时路由器:根据对话类型、问题复杂度、是否需要工具调用,以及用户明确表达的意图(例如提示中包含“think hard about this”),动态决定使用哪个模型;
- 路由器基于真实用户行为持续训练,包括用户切换模型的情况、对回答的偏好程度、以及回答正确性,从而不断提升效率;
- 一旦使用达到上限,将启用相应模型的微型版本继续处理请求;
- 未来计划将所有功能整合进一个模型中。
系统中命名方式如下:
早期模型 | GPT-5 系列模型 |
---|---|
GPT-4o | gpt-5-main |
GPT-4o-mini | gpt-5-main-mini |
OpenAI o3 | gpt-5-thinking |
OpenAI o4-mini | gpt-5-thinking-mini |
GPT-4.1-nano | gpt-5-thinking-nano |
OpenAI o3 Pro | gpt-5-thinking-pro |
在 API 中,开发者可以直接访问:
- 推理模型(thinking)、
- 微型版本(thinking-mini)以及
- 更小更快的 nano 版本(thinking-nano)。
在 ChatGPT 界面中,还提供一个“thinking-pro”版本,它采用并行测试时计算方式,进一步提升响应能力。
本说明卡的重点在于 "gpt-5-thinking" 和 "gpt-5-main" 两种模型,其他版本的性能评估内容则附在说明卡后文。
性能提升与优势
GPT-5 不仅在基准测试中超越前代模型、响应速度更快,更重要的是,在现实使用中的实用性显著提升。具体改进包括:
- 显著减少了 幻觉现象(hallucination);
- 提高模型的 执行指令能力;
- 减少 谄媚倾向(sycophancy);
- 在 ChatGPT 的三大常见用途上整体升级:写作、编程、健康问答;
- 所有 GPT-5 模型均支持 安全完成(safe completions) —— 一种新的安全训练方法,在遇到违禁内容时能提供合适替代回答,而不是简单拒绝。
此外,依照 OpenAI 的“准备度框架”(Preparedness Framework),gpt-5-thinking 被划为在 生物与化学领域具有高能力的模型,并因此启用了相应安全防护措施。虽然尚无确凿证据表明其能够帮助新手制造严重生物危害,但出于谨慎考虑,已启动相关安全机制。