Соревнование по разработке общего искусственного интеллекта (AGI) все еще длинное, по словам исследователей Apple, которые считают, что такие ведущие модели ИИ, как ChatGPT и Claude, все еще испытывают трудности с аргументацией. Несмотря на наличие крупных моделей аргументации (LRMs), их способности и ограничения все еще не совсем понятны. Текущие оценки в основном сосредоточены на точности окончательных ответов, не предоставляя понимания способности к аргументации.
Исследования показывают, что LRM не обобщают аргументацию эффективно и часто сталкиваются с падением точности при увеличении сложности. Исследователи пришли к выводу, что эти модели лишь имитируют аргументацию, не охватывая её по-настоящему, что не соответствует требованиям AGI. AGI все еще остается далекой целью, хотя некоторые лидеры в отрасли считают, что его можно достичь в ближайшие несколько лет.