掃描下載 Gate App
qrCode
更多下載方式
今天不再提醒

最新的Grok迭代降低了一些有趣的數字。版本4.1 Fast具備推理能力,在擴展的NYT Connections基準測試中達到了93.5——比其前身的92.1提高了1.4點。



什麼引起了注意?標準模式(非推理)也有所增長,攀升至25.8。沒有華麗的公告,只是悄然推出了更新的性能指標。

爲了提供背景,這些基準測試評估語言模型在復雜模式識別任務上的表現。推理模式的改進表明邏輯處理能力增強,而基礎模型的升級則表明整體架構的優化。

像這樣的版本更新通常反映了迭代訓練優化,而不是根本性的重新設計。盡管如此,兩種模式的一致性提升表明模型能力的有意義進展。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 1
  • 轉發
  • 分享
留言
0/400
TheShibaWhisperervip
· 11小時前
又悄摸摸升級?Grok這手段還挺賊的,數字能看但沒啥花頭新聞🤔
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)