当前位置：首页 >大马帮 >強化代理、編碼及推理能力，Anthropic 升級推 Claude Opus 4.1 模型

強化代理、編碼及推理能力，Anthropic 升級推 Claude Opus 4.1 模型

2025-11-22 04:21:27 [和田地区] 来源：傲世轻物网

搶在 OpenAI 推出 GPT-5 模型前夕，Anthropic 6 日推出 Claude Opus 4.1 模型，強化了 Opus 4 在代理任務、程式碼編輯、推理方面的表現。Anthropic 甚至預告，未來數週內推出更大規模的模型升級。

Opus 4.1 將 Claude 的程式碼編輯能力在基準測試 SWE-bench Verified 提升 2 個百分點、達到 74.5%，同時改善 Claude 深入研究和資料分析技能，尤其在細節追蹤和代理式搜尋方面更勝以往。

▲ Claude Opus 4.1 基準測試表現。

Anthropic 分享客戶測試情況，像是 GitHub 指出，相較 Opus 4，Opus 4.1 在多數功能上均有提升，其中多檔案程式重構的表現最為顯著。樂天集團（Rakuten Group）也發現，Opus 4.1 可在大型程式碼庫精準定位修正，避免不必要的調整或錯誤引進，樂天的團隊偏好在日常開發除錯保持這種精準度。Windsurf 則回報，Opus 4.1 在其「初級開發者基準測試」比 Opus 4 提升了一個標準差，性能提升幅度與 Sonnet 3.7 再到 Sonnet 4 大致相同。

Opus 4.1 定價與 Opus 4 相同，現在開放給付費訂閱用戶，並且可在 Claude Code 使用，客戶也能透過 Anthropic 的 API（claude-opus-4-1-20250805）、Amazon Bedrock 及 Google Cloud 的 Vertex AI 存取新版。

（首圖來源：Anthropic）

延伸閱讀：

世界上最強大的編碼模型降臨，Anthropic 發表 Claude 4 系列新模型

文章看完覺得有幫助，何不給我們一個鼓勵

請我們喝杯咖啡

想請我們喝幾杯咖啡？

每杯咖啡 65 元

x 1

x 3

x 5

x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0 元《關於請喝咖啡的 Q & A》

留給我們的話

取消確認

(责任编辑：廖大森)

相关内容

推荐文章

广西桂林市委原书记周家斌被公诉
”　　(为保护候选人隐私，文中人名均为化名)document.writeln('关注创业、电商、站长，扫描A5创业网微信二维码，定期抽大奖。...[详细]
党的十八大以来文化体制改革成果述评
而运营和推广，只需要借助势的力量，顺势而为即可。...[详细]
涉及上下班途中、居家工作等，这些情形可认定工伤
回湖南总能感受很多和上海不一样的乐趣，嗦一口湖南米粉，吃地道的湘菜，听纯粹的湘音，真的韵味!　　2、这几年253在企业通讯领域发展得很快，一些具体的数字因为某些原因不方便透漏，但可以给大家说几个简单的...[详细]
年轻一代成为匠人群体新兴力量：80、90后占六成
　　对于文娱市场来说，付费视频用户的高速增长将催生一批新型的内容公司。...[详细]
美航天局公布“星际访客”彗星最新图像
对于频繁而又经常发生的操作，这种状态反馈应该微妙，而对于重要而又不经常发生的交互，这种反馈则应该做的更加明显。...[详细]
官方：截至6月末累计对外公布税收违法黑名单案4606件
　　　　理清关系　　　　相互靠近的元素会在视觉上给人以相互关联的感觉，而这种视觉的远近上的感知，通常是借助留白来呈现的。...[详细]
中国驻韩国大使馆：希望美方不要挑拨生事
格式http://www.20ll.com/sitemap.xml　　如果网站长时间收录有问题，那么我们可以对比网站日志中的搜索引擎蜘蛛行为，了解网站是哪方面出了问题;如果网站被封，或者被K，我们也都...[详细]
十集政论片《将改革进行到底》主要讲什么？主要内容
　　视觉反馈　　在许多设计方案中，视觉反馈是很容易被忽略的组成部分，然而它是整个UX设计中，对体验影响非常大的元素。...[详细]
以军空袭加沙多地已致10人死亡
　　另一方面也与消费升级的大趋势密不可分。...[详细]
山西省市场监管局开展旅游市场价格秩序专项整治行动
　　张兰和俏江南的失败，更多还是要归因于张兰个人在经营和管理上的失误，引进资本，只是让这些错误更早浮现。...[详细]

热点阅读

随机内容

友情链接

接受PR>=1、BR>=1，流量相当，内容相关类链接。