搶在 OpenAI 推出 GPT-5 模型前夕,Anthropic 6 日推出 Claude Opus 4.1 模型,強化了 Opus 4 在代理任務、程式碼編輯、推理方面的表現。Anthropic 甚至預告,未來數週內推出更大規模的模型升級。
Opus 4.1 將 Claude 的程式碼編輯能力在基準測試 SWE-bench Verified 提升 2 個百分點、達到 74.5%,同時改善 Claude 深入研究和資料分析技能,尤其在細節追蹤和代理式搜尋方面更勝以往。

▲ Claude Opus 4.1 基準測試表現。
Anthropic 分享客戶測試情況,像是 GitHub 指出,相較 Opus 4,Opus 4.1 在多數功能上均有提升,其中多檔案程式重構的表現最為顯著。樂天集團(Rakuten Group)也發現,Opus 4.1 可在大型程式碼庫精準定位修正,避免不必要的調整或錯誤引進,樂天的團隊偏好在日常開發除錯保持這種精準度。Windsurf 則回報,Opus 4.1 在其「初級開發者基準測試」比 Opus 4 提升了一個標準差,性能提升幅度與 Sonnet 3.7 再到 Sonnet 4 大致相同。
Opus 4.1 定價與 Opus 4 相同,現在開放給付費訂閱用戶,並且可在 Claude Code 使用,客戶也能透過 Anthropic 的 API(claude-opus-4-1-20250805)、Amazon Bedrock 及 Google Cloud 的 Vertex AI 存取新版。
(首圖來源:Anthropic)
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:小文)
鞋类电商的标准化很高,物流标准,拍照标准(服装拍照要找模特,试穿、各种搭配,鞋没这么复杂),还不像服装和其他品类中间涉及那么多的环节(比如服装拍完了要修图,模特必须好看,否则影响售卖看等等),仓储也会...[详细]
外挂问题:其实棋牌外挂也很多,有很多撸羊毛的用户通过外挂等手段,不断获取游戏币来获利,给平台带来不必要的损失。...[详细]
但目前很多电商只是打出口号,并没有真正实施。...[详细]
一、文档概览和分析目的 体验机型:小米MIX 系统版本:6.0.1MXB48T App版本:1.17.1.23 体验时间:2017.3.25 分析目的: 了解《王者荣耀》的产品战略、产...[详细]全球要闻:“五一”假期客流量大 北京移动运用大数据赋能城市管理
3.提供免运费 研究发现运费在网上购物过程中起到不小的作用。...[详细]
该项目倡议每天捐赠3元为贫困地区学童提供免费午餐。...[详细]
因为我担心这篇文章会让很多人对创始人产生误解,甚至造成员工和管理层的对立,我不想背这个黑锅。...[详细]
新片场联合创始人周迪表示,他们入驻成为大鱼号合伙人,优惠条件包括:“首先是有流量扶持,平台会通过算法将他们的内容实现更多的曝光;另外,平台对原创内容的保护,会针对机构提供一些维权的服务...[详细]世界速看:沪上黄金周|“五一”酒店搜索量达去年9倍 连锁投资加盟升温
招股书显示,信而富2016年营收为5586万美元,2015年为5613万美元,2014年为5777万美元。...[详细]
否则,公司及创始股东应根据新股东的要求,采取措施弥补每一新股东。...[详细]