搶在 OpenAI 推出 GPT-5 模型前夕,Anthropic 6 日推出 Claude Opus 4.1 模型,強化了 Opus 4 在代理任務、程式碼編輯、推理方面的表現。Anthropic 甚至預告,未來數週內推出更大規模的模型升級。
Opus 4.1 將 Claude 的程式碼編輯能力在基準測試 SWE-bench Verified 提升 2 個百分點、達到 74.5%,同時改善 Claude 深入研究和資料分析技能,尤其在細節追蹤和代理式搜尋方面更勝以往。

▲ Claude Opus 4.1 基準測試表現。
Anthropic 分享客戶測試情況,像是 GitHub 指出,相較 Opus 4,Opus 4.1 在多數功能上均有提升,其中多檔案程式重構的表現最為顯著。樂天集團(Rakuten Group)也發現,Opus 4.1 可在大型程式碼庫精準定位修正,避免不必要的調整或錯誤引進,樂天的團隊偏好在日常開發除錯保持這種精準度。Windsurf 則回報,Opus 4.1 在其「初級開發者基準測試」比 Opus 4 提升了一個標準差,性能提升幅度與 Sonnet 3.7 再到 Sonnet 4 大致相同。
Opus 4.1 定價與 Opus 4 相同,現在開放給付費訂閱用戶,並且可在 Claude Code 使用,客戶也能透過 Anthropic 的 API(claude-opus-4-1-20250805)、Amazon Bedrock 及 Google Cloud 的 Vertex AI 存取新版。
(首圖來源:Anthropic)
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:廖大森)
” (为保护候选人隐私,文中人名均为化名)document.writeln('关注创业、电商、站长,扫描A5创业网微信二维码,定期抽大奖。...[详细]
而运营和推广,只需要借助势的力量,顺势而为即可。...[详细]
回湖南总能感受很多和上海不一样的乐趣,嗦一口湖南米粉,吃地道的湘菜,听纯粹的湘音,真的韵味! 2、这几年253在企业通讯领域发展得很快,一些具体的数字因为某些原因不方便透漏,但可以给大家说几个简单的...[详细]
对于文娱市场来说,付费视频用户的高速增长将催生一批新型的内容公司。...[详细]
对于频繁而又经常发生的操作,这种状态反馈应该微妙,而对于重要而又不经常发生的交互,这种反馈则应该做的更加明显。...[详细]
理清关系 相互靠近的元素会在视觉上给人以相互关联的感觉,而这种视觉的远近上的感知,通常是借助留白来呈现的。...[详细]
格式http://www.20ll.com/sitemap.xml 如果网站长时间收录有问题,那么我们可以对比网站日志中的搜索引擎蜘蛛行为,了解网站是哪方面出了问题;如果网站被封,或者被K,我们也都...[详细]
视觉反馈 在许多设计方案中,视觉反馈是很容易被忽略的组成部分,然而它是整个UX设计中,对体验影响非常大的元素。...[详细]
另一方面也与消费升级的大趋势密不可分。...[详细]
张兰和俏江南的失败,更多还是要归因于张兰个人在经营和管理上的失误,引进资本,只是让这些错误更早浮现。...[详细]