Скануйте, щоб завантажити додаток Gate
qrCode
Більше варіантів завантаження
Не нагадувати сьогодні

Остання ітерація Grok тільки що Падіння деякі цікаві цифри. Версія 4.1 Fast з можливостями міркування досягла 93.5 за розширеним стандартом NYT Connections — це стрибок на 1.4 пункту від 92.1 попередника.



Що привернуло увагу? Стандартний режим (безміркування) також показав зростання, піднявшись до 25.8. Ніяких яскравих оголошень, просто оновлені показники продуктивності були тихо представлені.

Для контексту, ці показники тестують мовні моделі на складних завданнях розпізнавання патернів. Поліпшення режиму міркування вказує на покращену логічну обробку, в той час як оновлення базової моделі свідчить про загальні вдосконалення архітектури.

Оновлення версій, подібні до цього, зазвичай відображають ітеративні оптимізації навчання, а не фундаментальні переробки. Проте, послідовні досягнення в обох режимах вказують на значний прогрес у можливостях моделі.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 1
  • Репост
  • Поділіться
Прокоментувати
0/400
TheShibaWhisperervip
· 11год тому
Знову тихенько оновлюються? Методи Grok досить хитрі, цифри видно, але немає нічого цікавого в новинах 🤔
Переглянути оригіналвідповісти на0
  • Закріпити