智能新纪元
2025.08.06
74.5% SWE-bench 新高度
顶级客户的真实反馈
全渠道无缝接入
更大改进即将到来
SWE-bench Verified
AI编程能力新高度
今天,我们重新定义
AI编程能力的上限
在SWE-bench Verified上
实现历史性突破
Opus 4.1 在多文件代码重构方面表现出了特别显著的性能提升,这正是我们开发团队最需要的能力。
精准
是AI编程的灵魂
Opus 4.1 能够精确定位大型代码库中的问题,不做多余调整,不引入新bug,这种精准度对日常调试至关重要。
在我们的初级开发者基准测试中,Opus 4.1 实现了一个标准差的性能提升,相当于从 Sonnet 3.7 到 Sonnet 4 的飞跃。
每一个百分点的提升
都是千万行代码的智慧结晶
让智能无处不在
让创新触手可及
模型字符串:
claude-opus-4-1-20250805
上下文窗口:
200K tokens(官方上限)
部分供应商默认64K调用上限
价格:与 Opus 4 保持一致
混合推理模型,智能平衡性能
这只是开始
更大的突破即将到来
在接下来的几周内
我们将发布
更加重大的模型改进
SWE-bench 新纪录
全平台即刻可用
更大突破即将到来
让我们一起创造智能的未来