掃描下載 Gate App
qrCode
更多下載方式
今天不再提醒

Anthropic 完成了 AI 模型升級,推出 Claude Opus 4.5,並大幅降低價格

Decrypt的藝術、時尚與娛樂中心。


深入了解 SCENE

Anthropic於周一發布了Claude Opus 4.5,完成了其三款模型的系列,並標志着該公司在短短兩個月內的第三次重大發布。新的旗艦模型在編碼基準測試中名列前茅,同時大幅降低了價格。

此次發布標志着一系列快速推出的結束,該系列始於九月下旬的Claude Sonnet 4.5,並在十月繼續推出Claude Haiku 4.5。現在,Opus作爲其兄弟產品加入,Anthropic爲開發者提供了一個完整的工具包:Opus用於復雜的生產工作,Sonnet用於日常任務,Haiku則用於需要簡單邏輯的速度和效率相關任務。

Claude Opus 4.5 在 SWE-bench Verified 上得分 80.9%,這是一個測試真實世界軟件工程任務的基準。這個分數超越了 OpenAI 的 GPT-5.1-Codex-Max 的 77.9% 和谷歌的 Gemini 3 Pro 的 76.2%。Anthropic 表示,Opus 在其內部性能工程考試中超過了每一位人類候選人——這是一項爲期兩小時的評估,旨在評估在壓力下的判斷力。

在人工智能巨頭之間展開了一場爭奪戰,爭取在年末時佔據排行榜的頂端。谷歌於11月18日推出了Gemini 3 Pro,將其定位爲多模態推理的突破。OpenAI在第二天反擊,推出了GPT-5.1-Codex-Max。

介紹 Claude Opus 4.5:世界上最好的編碼、代理和計算機使用模型。

Opus 4.5 是人工智能系統所能做出的一個進步,並預示着工作方式的更大變化。 pic.twitter.com/mid2Z1qzIf

— 克勞德 (@claudeai) 2025年11月24日

<br>

Anthropic的Opus回應在幾天後發布,但它帶來了一個吸引人的條件:每百萬個輸入令牌定價爲$5 ,每百萬個輸出令牌定價爲$25 ,這比之前的Opus模型削減了67%。

阿裏巴巴的Qwen模型爲競爭增添了另一個維度。該公司在1月底發布了Qwen2.5-Max,擁有超過20萬億的訓練令牌,聲稱其在關鍵基準測試中優於DeepSeek-V3。Qwen3-Max於9月推出,擁有超過1萬億個參數,在LMArena全球排名第三,並在深度研究、多模態推理或東部語言的工作流程等不同任務中表現出色。盡管Qwen模型在西方市場仍相對不爲人知,但它們代表了中國在美國芯片出口限制下推動人工智能自給自足的努力。

該定價位於OpenAI最新的GPT-5.1 ($1.25/$10)和Anthropic較舊的Opus 4.1 ($15/$75)之間,盡管仍然比Gemini 3 Pro的$2/$12貴。降價表明市場壓力,因爲領先的人工智能實驗室不僅在能力上競爭,還在於使前沿智能經濟上可行,以便進行大規模部署。

克勞德最新的產品仍然比許多亞洲競爭對手價格更高,但功能也更強大。因此用戶現在可以在成本效益和純技術能力之間進行選擇。

Sonnet 4.5於9月30日發布,帶來了先進的編碼和代理能力,成本適中,在特定任務上已經優於Opus 4.1。更簡單的Haiku 4.5於10月15日發布。Opus 4.5現在位於頂端,處理最困難的推理和最長時間運行的任務。

與Sonnet和GPT-5類似,Claude Opus 4.5使用了Anthropic所稱的"混合推理"架構——一個爲直接推理和思維鏈處理訓練的單一模型。它支持200,000個令牌的上下文窗口,並可以輸出多達64,000個令牌。該模型的知識截止日期是2025年3月,略早於Sonnet的1月日期。

開發者西蒙·威利森在周末對Opus 4.5進行了廣泛測試,使用它對他的一個項目進行了重構。該模型處理了39個文件中的20個提交,增加了2,022行,刪除了1,173行。威利森寫道:“這顯然是一個優秀的新模型,”盡管他提到事後恢復到Sonnet 4.5並沒有顯著降低他的生產力。

"我並不是說新型號在 Sonnet 4.5 上沒有改進——但我不能自信地說我提出的挑戰 [對] 它能夠識別出兩者之間能力的顯著差異,"他寫道。

開發者、YouTuber 和 AI 平台 T3 Chat 的 CEO Theo Browne 在一段視頻評論中稱 Claude Opus 4.5 “瘋狂,” 並補充說它 “絕對是迄今爲止最好的編碼模型。”

競爭格局變得越來越擁擠。谷歌的Gemini 3 Pro上周佔據了頭條新聞,在LMArena上得分1501,並獲得了Salesforce首席執行官Marc Benioff的贊揚,他表示他將拋棄ChatGPT,轉向谷歌的模型。這個公告使Alphabet的股票上漲了超過6%,並據報道讓OpenAI首席執行官Sam Altman感到不安,他告訴同事Gemini將會造成“暫時的經濟逆風”。

微軟和英偉達上周宣布對Anthropic進行數十億美元的投資,使這家初創公司的估值達到約$350 億美元。這些交易包括擴展的Azure集成和英偉達支持的基礎設施,用於訓練和部署Claude模型。

Opus 4.5 可通過 Anthropic 的 API、AWS Bedrock、Google Vertex AI 以及 Claude Web 和桌面應用程序立即使用。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)