Gateアプリをダウンロードするにはスキャンしてください
qrCode
その他のダウンロードオプション
今日はこれ以上表示しない

最新のGrokのイテレーションでは、興味深い数字がドロップされました。バージョン4.1 Fastは推論能力を搭載し、Extended NYT Connectionsベンチマークで93.5を達成しました。これは前のバージョンの92.1から1.4ポイントのジャンプです。



何が注目を集めましたか?標準モード(非推論)も上昇し、25.8に達しました。派手な発表はなく、ただ静かに更新されたパフォーマンス指標が公開されました。

文脈として、これらのベンチマークは言語モデルを複雑なパターン認識タスクでテストします。推論モードの改善は論理処理の向上を示唆しており、ベースモデルのアップグレードは全体的なアーキテクチャの洗練を示しています。

このようなバージョンの更新は、通常、基本的な再設計ではなく、反復的なトレーニングの最適化を反映しています。それでも、両方のモードでの一貫した向上は、モデルの能力における意味のある進展を示しています。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 1
  • リポスト
  • 共有
コメント
0/400
TheShibaWhisperervip
· 11時間前
またひそかにアップグレード?Grokのこの手法は結構ずる賢い、数字は見えるけど特に目新しいニュースはない🤔
原文表示返信0
  • ピン