Команда Илона только что Падение бомбы — Grok 4.1 Fast захватил корону на τ²-Bench для телекоммуникационных агентских рабочих процессов, достигнув 93% точности и обогнав всех остальных в процессе. Мы говорим о том, что он опережает тяжеловесов, таких как последние сборки Anthropic. Гонка ИИ? Да, она только что стала гораздо жарче. То, что выглядело как хайп, превратилось в реальные цифры, и теперь вопрос не в том, может ли xAI конкурировать — а в том, кто пытается догнать. Быстрые итерации, реальные результаты, ноль спокойствия.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
15 Лайков
Награда
15
5
Репост
Поделиться
комментарий
0/400
FlashLoanPhantom
· 14ч назад
честно говоря, grok на этот раз действительно 93% ударил в лицо, раньше кто-то говорил, что это просто пиар.
Посмотреть ОригиналОтветить0
EthSandwichHero
· 14ч назад
93% точность? Теперь Anthropic должен беспокоиться, xAI действительно играет по-настоящему!
Посмотреть ОригиналОтветить0
degenwhisperer
· 14ч назад
честно говоря, grok на этот раз действительно разбудил кучу людей, 93% точности - это не шутка. Те, кто раньше хвастался, теперь должны нервничать.
Посмотреть ОригиналОтветить0
LightningAllInHero
· 14ч назад
честно говоря, на этот раз grok действительно пришел, 93% прямо в лицо, что скажет anthropic?
Посмотреть ОригиналОтветить0
ShitcoinConnoisseur
· 14ч назад
93%啊,这数字有点猛...不过τ²-Bench этот Бенчмарк тест действительно надежен или нет, всё же надо посмотреть, есть ли кто-нибудь, кто это воспроизвёл.
Команда Илона только что Падение бомбы — Grok 4.1 Fast захватил корону на τ²-Bench для телекоммуникационных агентских рабочих процессов, достигнув 93% точности и обогнав всех остальных в процессе. Мы говорим о том, что он опережает тяжеловесов, таких как последние сборки Anthropic. Гонка ИИ? Да, она только что стала гораздо жарче. То, что выглядело как хайп, превратилось в реальные цифры, и теперь вопрос не в том, может ли xAI конкурировать — а в том, кто пытается догнать. Быстрые итерации, реальные результаты, ноль спокойствия.