扫码下载 APP
qrCode
更多下载方式
今天不再提醒

最新的Grok迭代降低了一些有趣的数字。版本4.1 Fast具备推理能力,在扩展的NYT Connections基准测试中达到了93.5——比其前身的92.1提高了1.4点。



什么引起了注意?标准模式(非推理)也有所增长,攀升至25.8。没有华丽的公告,只是悄然推出了更新的性能指标。

为了提供背景,这些基准测试评估语言模型在复杂模式识别任务上的表现。推理模式的改进表明逻辑处理能力增强,而基础模型的升级则表明整体架构的优化。

像这样的版本更新通常反映了迭代训练优化,而不是根本性的重新设计。尽管如此,两种模式的一致性提升表明模型能力的有意义进展。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 2
  • 转发
  • 分享
评论
0/400
TheShibaWhisperervip
· 11-27 09:34
又悄摸摸升级?Grok这手段还挺贼的,数字能看但没啥花头新闻🤔
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)