搶在 OpenAI 推出 GPT-5 模型前夕,Anthropic 6 日推出 Claude Opus 4.1 模型,強化了 Opus 4 在代理任務、程式碼編輯、推理方面的表現。Anthropic 甚至預告,未來數週內推出更大規模的模型升級。
Opus 4.1 將 Claude 的程式碼編輯能力在基準測試 SWE-bench Verified 提升 2 個百分點、達到 74.5%,同時改善 Claude 深入研究和資料分析技能,尤其在細節追蹤和代理式搜尋方面更勝以往。

▲ Claude Opus 4.1 基準測試表現。
Anthropic 分享客戶測試情況,像是 GitHub 指出,相較 Opus 4,Opus 4.1 在多數功能上均有提升,其中多檔案程式重構的表現最為顯著。樂天集團(Rakuten Group)也發現,Opus 4.1 可在大型程式碼庫精準定位修正,避免不必要的調整或錯誤引進,樂天的團隊偏好在日常開發除錯保持這種精準度。Windsurf 則回報,Opus 4.1 在其「初級開發者基準測試」比 Opus 4 提升了一個標準差,性能提升幅度與 Sonnet 3.7 再到 Sonnet 4 大致相同。
Opus 4.1 定價與 Opus 4 相同,現在開放給付費訂閱用戶,並且可在 Claude Code 使用,客戶也能透過 Anthropic 的 API(claude-opus-4-1-20250805)、Amazon Bedrock 及 Google Cloud 的 Vertex AI 存取新版。
(首圖來源:Anthropic)
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:卢湾区)
渠道向上,终端向下 票务数据的春天到了吗? 2013年,周星驰导演的《西游降魔篇》上映,华谊兄弟为《西游降魔篇》做宣发,模式很传统:提前看片、商务推广、包场活动等。...[详细]
放心到什么程度呢?学霸、零绯闻、双商高、而且赚钱能力比上一任继承者能力还强。...[详细]
在赚钱的同时,我们所有做的事情的主要目标,一个是新世相品牌是有名的,另一个是,我们的用户群不只是知道或者是看过我们的人,而是深度喜欢我们的人,且是有参与感甚至是有归属感的一群共同行动人。...[详细]
我对「一将功成万骨枯」的增长没有兴趣。...[详细]
第三,内容创业者要有格局。...[详细]
汽车自身成本+停车成本+充电费用+运维成本,一辆用于分时租赁的新能源汽车面临的成本高昂,有数据统计,目前分时租赁企业平均单车亏损在一天50元-120元。...[详细]
” 没有库存的商业模式,稳健的运营、资本的追捧,一切看起来都很完美…… 被外部环境和资本裹挟前进 2011年1月,乐淘发布了第三轮融资信息,联创策源、老虎...[详细]
创业初期,董路先在一直播做直播,而将直播内容做成短视频会是乐播足球的核心产品。...[详细]深铁再向万科借款16.7亿用于偿债 此前已累计借款291.3亿
如果他将女孩推出地铁门的时间再晚一点,她是不是会被夹伤,甚至死亡? 纵使,刚开始,这个男孩是被骚扰,但是,他也有文明处理这件事情的选择。...[详细]