Остання модель xAI тільки що переписала рейтинг — і цифри не брешуть. Grok 4.1 з'явився з бенчмарк-оцінками, які викликають хвилю в сфері ШІ.

Текстова арена LMArena розповідає історію просто: Grok 4.1 Thinking займає перше місце, маючи рейтинг Ело 1483. Це на 31 пункт більше, ніж у наступного претендента. Це не незначна перемога — це рішуча перемога.

Те, що робить це примітним, не тільки сирий бал. Це час і траєкторія. Поки інші великі лабораторії ітерують поступово, xAI представила модель, яка перераховує очікування. Розподіл Ело свідчить про значні здобутки в можливостях, а не лише про налаштування оптимізації.

Для всіх, хто стежить за розвитком ШІ в екосистемі Web3 та криптовалют, це важливо. Кращі моделі міркування відкривають можливості для кращого аналізу в ланцюгу, розумніших агентів та більш тонких стратегій DeFi. Інфраструктура, яка підтримує децентралізовану інтелектуальність, тільки що отримала серйозне оновлення.

Конкуренція тепер має новий еталон, за яким слід гнатися.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

11 лайків

Нагородити
11
7
Репост
Поділіться

Прокоментувати

0/400

HodlOrRegret

· 8год тому

grok знову до місяця? Різниця в 31 очко дійсно вражаюча, але бенчмарк ця річ... чи справді вона може працювати на практиці, чи просто цифри гарно виглядають?