一、Claude sonnet 4.5 模型评测
Anthropic 在9月30号的凌晨推出了全新的Claude sonnet 4.5的模型,首先让我们直接看官方贴出的编程领域的测试报告:
SWE-bench Verified 评估:

数学和推理方面的评分:

还有一个评测我觉得也相对来说比较重要,就是大模型在欺骗、谄媚、妄想等方面的评分:

总结一句话:Claude sonnet 4.5 在编程、自动化、电脑操作、理工科、金融等等领域全部相对于Opus 4.1都有明显提高。
大模型的上下文窗口依然是200K token,价格的话和sonnet 4 保持一致,这回大家用claude code就可以狂用sonnet 4.5 也不用担心用量限制了。
二、Claude Code 2.0 新功能介绍
下面介绍一下claude code 2.0新版本的主要功能点,关于细节和bug优化的我就不赘述了,我这边只总结最明显的优化功能:
1、现在claude code支持查看用量了,使用/usage即可查看使用限制,但是我在windows电脑上实际操作的时候是查看不了的如图:

这个我专门去查询了一下相关资料可能是:/usage
只有 Claude Code 的付费订阅(如 Claude Code Pro/Team/Enterprise)才可以用。你现在这台 Windows 端里登录的账号,插件没有识别到有效的 Claude Code 订阅,所以不给显示配额与用量。
反正大家可以多试试,应该我怀疑可能是没有刷新或者是windows系统的bug吧。
2、现在Claude Code有VS Code插件版本的扩展了,可以直接在VS Code中安装这个插件,然后直接在侧边栏进行使用:

而且这个插件版本其实很多功能都已经配置好了,比如在这个输入框中输入/,相对于的命令都已经具备:

包括历史记录、MCP配置、模型选择等等内容这个插件版本都具备了,在这一点上确实不得不说Anthropic效率还是真的高。
MCP一键集成:

思考深度可视化控制:

包括计划优化模式(底部还更新了token使用量和会话的消耗费用):

3、可以在claude code中使用 " ctrl + r " 可以搜索之前的历史对话记录:

也就是说之前你发送的提示词,现在不记得是哪些内容了,现在可以直接输入关键字就能够搜索到,然后再按Esc就可以直接填充到当前的输入框中。
4、整体的界面样式进行了更改,主要是主页,包括其他/status 等功能页面的样式做了调整

5、现在Claude Code当会话的上下文过长时,会自动的进行压缩和删减:
上下文编辑会在接近令牌限制时,自动清除上下文窗口内过时的工具调用和结果。当您的代理执行任务并积累工具结果时,上下文编辑会移除过时内容,同时保持对话流程,有效延长代理无需人工干预即可运行的时间。
6、Claude Code可以支持检查点进行回溯了,只需按两次 Esc 键或使用/rewind 命令,即可立即回退到先前版本,回退的方式支持:仅回退代码修改、仅回退对话、回退对话和代码修改

其他更多的功能大家可以自行进行尝试,我今天早上第一时间试用claude 4.5的时候,确实解决了一个Windows Forms应用程序的一个显示bug,这个bug是我在昨天使用codex CLI三四次持续对话都没有解决的bug,而且速度也是保持一如既往的快,我这边总体评价,编程能力方面一如既往的强,而且、而且、而且:现在这个模型是完整版,没有降智!!
大家输入claude之后,正常来说右下角会有Auto-upgrade……的提示,证明是自动进行升级,如果没有升级到最新的版本大家也可以直接再执行一下安装claude code的命令:
npm install -g @anthropic-ai/claude-code
升级到最新版本之后输入/model

默认的这个就是使用的sonnet 4.5的模型。