Остання модель xAI тільки що переписала рейтинг — і цифри не брешуть. Grok 4.1 з'явився з бенчмарк-оцінками, які викликають хвилю в сфері ШІ.
Текстова арена LMArena розповідає історію просто: Grok 4.1 Thinking займає перше місце, маючи рейтинг Ело 1483. Це на 31 пункт більше, ніж у наступного претендента. Це не незначна перемога — це рішуча перемога.
Те, що робить це примітним, не тільки сирий бал. Це час і траєкторія. Поки інші великі лабораторії ітерують поступово, xAI представила модель, яка перераховує очікування. Розподіл Ело свідчить про значні здобутки в можливостях, а не лише про налаштування оптимізації.
Для всіх, хто стежить за розвитком ШІ в екосистемі Web3 та криптовалют, це важливо. Кращі моделі міркування відкривають можливості для кращого аналізу в ланцюгу, розумніших агентів та більш тонких стратегій DeFi. Інфраструктура, яка підтримує децентралізовану інтелектуальність, тільки що отримала серйозне оновлення.
Конкуренція тепер має новий еталон, за яким слід гнатися.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
11 лайків
Нагородити
11
7
Репост
Поділіться
Прокоментувати
0/400
HodlOrRegret
· 8год тому
grok знову до місяця? Різниця в 31 очко дійсно вражаюча, але бенчмарк ця річ... чи справді вона може працювати на практиці, чи просто цифри гарно виглядають?
Переглянути оригіналвідповісти на0
BottomMisser
· 11-27 21:50
Грок цей розрив у 31 бал, чесно кажучи, це трохи жорстоко.
Переглянути оригіналвідповісти на0
FreeRider
· 11-27 03:50
grok 4.1 ця хвиля справді потужна, різниця в 31 бал є свідченням того, що це не маніпуляція. web3 тут використовує таку здатність міркувати, у блокчейні аналіз має виглядати набагато краще... до речі, як інші компанії реагують?
Переглянути оригіналвідповісти на0
MetaReckt
· 11-27 03:49
результат grok 4.1 дійсно вражаючий... різниця в 31 очко elo - це не дрібниця, інші компанії, напевно, почали нервувати
Переглянути оригіналвідповісти на0
FlatlineTrader
· 11-27 03:48
grok 4.1 дійсно крутий, але перебільшений... справді важливо, чи зможе ця річ зробити так, щоб у блокчейні аналізи більше не були такими поганими
Переглянути оригіналвідповісти на0
MEVSandwichMaker
· 11-27 03:46
31 пункт різниці так великий? Grok справді має до місяця, аналізуюча здатність DeFi у блокчейні прямо підвищена.
Переглянути оригіналвідповісти на0
FlyingLeek
· 11-27 03:25
grok цього разу дійсно жорсткий, 31 очко розчавило, відразу стало божеством... але, якщо чесно, цифри бенчмарку можуть змінити стан справ у defi? На мій погляд, навряд чи.
Остання модель xAI тільки що переписала рейтинг — і цифри не брешуть. Grok 4.1 з'явився з бенчмарк-оцінками, які викликають хвилю в сфері ШІ.
Текстова арена LMArena розповідає історію просто: Grok 4.1 Thinking займає перше місце, маючи рейтинг Ело 1483. Це на 31 пункт більше, ніж у наступного претендента. Це не незначна перемога — це рішуча перемога.
Те, що робить це примітним, не тільки сирий бал. Це час і траєкторія. Поки інші великі лабораторії ітерують поступово, xAI представила модель, яка перераховує очікування. Розподіл Ело свідчить про значні здобутки в можливостях, а не лише про налаштування оптимізації.
Для всіх, хто стежить за розвитком ШІ в екосистемі Web3 та криптовалют, це важливо. Кращі моделі міркування відкривають можливості для кращого аналізу в ланцюгу, розумніших агентів та більш тонких стратегій DeFi. Інфраструктура, яка підтримує децентралізовану інтелектуальність, тільки що отримала серйозне оновлення.
Конкуренція тепер має новий еталон, за яким слід гнатися.