Claude Opus 4.1

智能新纪元

2025.08.06

今日议程

突破·性能

74.5% SWE-bench 新高度

见证·价值

顶级客户的真实反馈

触达·平台

全渠道无缝接入

展望·未来

更大改进即将到来

74.5%

SWE-bench Verified
AI编程能力新高度

25% 50% 75% 100% 74.5% 攀登AI编程新高峰

今天,我们重新定义
AI编程能力的上限

三大核心能力提升

智能体任务
</> 实际编程
推理能力
</> 智能体任务 实际编程 推理能力

超越自我
引领行业

在SWE-bench Verified上
实现历史性突破

0% 25% 50% 75% 100% Opus 4.1 74.5% Opus 4 72.5% Gemini 2.5 Pro 63.8% GPT-4.1 54.6% +2.0% SWE-bench Verified 性能对比

Opus 4.1 在多文件代码重构方面表现出了特别显著的性能提升,这正是我们开发团队最需要的能力。

src/ utils.js helpers.js main.js api.js database.js config.js 结构混乱 重构 src/ 📁 components/ 📁 services/ 📁 utils/ 📁 config/ 📄 index.js 结构优化

精准
是AI编程的灵魂

Opus 4.1 能够精确定位大型代码库中的问题,不做多余调整,不引入新bug,这种精准度对日常调试至关重要。

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 function processData (data) { const result = []; for ( let i = 0; i < data.length; i++) { if (data[i].value > 100) { result .push(data[i]); } if (data[i].status = 'active') { ← Bug: 应该是 === result [i].active = true; } } return result ; } = 'active' 精准修复 检测到的问题: 1 修复的问题: 1 引入的新问题: 0

在我们的初级开发者基准测试中,Opus 4.1 实现了一个标准差的性能提升,相当于从 Sonnet 3.7 到 Sonnet 4 的飞跃。

基准 Sonnet 3.7 Sonnet 4 Opus 4.1 +1σ +1σ 初级开发者基准测试性能 性能提升 σ = 标准差 每个σ ≈ 显著提升

每一个百分点的提升
都是千万行代码的智慧结晶

全平台覆盖

随时随地,触手可及

  • Claude.ai 网页版
  • 移动应用
  • 桌面客户端
  • API 接口
  • Claude Code 终端工具
Opus 4.1 Web 移动端 桌面端 {API} API 云平台 $ claude Claude Code A G 合作平台

智能无处不在
创新触手可及

技术细节

模型字符串:
claude-opus-4-1-20250805

上下文窗口:
200K tokens(官方上限)
部分供应商默认64K调用上限

价格:与 Opus 4 保持一致
混合推理模型,智能平衡性能

OPUS 4.1 20250805 上下文窗口 200K tokens 工具使用 增强版 代码重构 多文件支持 推理引擎 混合模式 性能平衡 速度 ████████░░ 精度 ██████████

立即升级的理由

  • 所有场景全面超越 Opus 4
  • 价格保持不变,性能大幅提升
  • 无缝迁移,即刻体验
Opus 4 当前版本 升级 Opus 4.1 新版本 +2.0% 性能 价格不变 即刻升级 升级进行中...

这只是开始
更大的突破即将到来

未来已来

在接下来的几周内
我们将发布
更加重大的模型改进

今天 Opus 4.1 几周内 重大改进 未来 ? 敬请期待

今日要点

74.5%

SWE-bench 新纪录

全平台即刻可用

更大突破即将到来

4.1

谢谢

让我们一起创造智能的未来

One More Thing...

Claude Code - 研究预览版 $ claude code Claude Code 已启动... 请描述您的编程任务: > 重构这个项目的架构,提升性能 分析中... ✓ 分析完成 ✓ 生成优化方案 ✓ 自动重构完成 性能提升 42%
19 / 21