La carrera para desarrollar (AGI) de inteligencia artificial en general todavía tiene un largo camino por recorrer, según los investigadores de Apple, que argumentan que los principales modelos de IA como ChatGPT y Claude todavía luchan con argumentos. Aunque ha habido (LRMs) grandes modelos de argumentación, sus capacidades y limitaciones aún son poco conocidas. Las evaluaciones actuales se centran principalmente en la precisión de la respuesta final, sin proporcionar una mirada a la capacidad de razonar.
Los estudios muestran que los LRM no generalizan argumentos de manera efectiva y a menudo sufren un colapso en la precisión a medida que aumenta la complejidad. Los investigadores concluyen que estos modelos solo imitan argumentos sin realmente capturarlos, lo que no cumple con los requisitos de AGI. El AGI sigue siendo un objetivo lejano, aunque algunos líderes de la industria creen que puede lograrse en los próximos años.