扫码下载 APP
qrCode
更多下载方式
今天不再提醒

埃隆的团队刚刚降低了一个炸弹消息——Grok 4.1 Fast 在 τ²-Bench 上为通信代理工作流程夺得了桂冠,达到了 93% 的准确率,并且在这个过程中超越了其他所有人。我们说的是超过像 Anthropic 最新构建这样的重量级选手。人工智能竞赛?是的,它刚刚变得更加激烈。曾经看起来像炒作的事情变成了硬数据,现在的问题不是 xAI 是否能够竞争,而是谁在忙着追赶。快速迭代,真实结果,毫无冷却。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 5
  • 转发
  • 分享
评论
0/400
FlashLoanPhantomvip
· 16小时前
ngl grok这次93%真的打脸了,之前还有人说是炒作呢
回复0
ETH三明治侠vip
· 16小时前
93%准确率?这下Anthropic得慌了,xAI真的玩真的啊
回复0
degenwhisperervip
· 16小时前
ngl grok这次真的打醒了一堆人,93%准确率不是开玩笑。之前吹牛逼的那些现在该慌了
回复0
闪电梭哈侠vip
· 16小时前
ngl这次grok真的来真的,93%直接砸在脸上,anthropic怎么说
回复0
空气币品鉴大师vip
· 16小时前
93%啊,这数字有点猛...不过τ²-Bench这个基准测试到底靠不靠谱,还是得看看有没有人复现啦
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)