Гонка за розвитком загального штучного інтелекту (AGI) ще має пройти довгий шлях, за словами дослідників Apple, які стверджують, що провідні моделі штучного інтелекту, такі як ChatGPT і Claude, все ще борються з аргументами. Незважаючи на те, що існує (LRMs) великих моделей аргументації, їх можливості та обмеження все ще недостатньо вивчені. Поточні оцінювання в основному зосереджені на точності остаточної відповіді, не надаючи погляду на здатність міркувати.
Дослідження показує, що LRM не узагальнюють аргументацію ефективно і часто стикаються з падінням точності при збільшенні складності. Дослідники дійшли висновку, що ці моделі лише імітують аргументацію, не захоплюючи її по-справжньому, що не відповідає вимогам AGI. AGI все ще залишається віддаленою метою, хоча деякі лідери галузі вважають, що його можна досягти протягом наступних кількох років.