Perlombaan untuk mengembangkan kecerdasan buatan umum (AGI) masih panjang, menurut para peneliti dari Apple, yang berpendapat bahwa model AI terkemuka seperti ChatGPT dan Claude masih menghadapi kesulitan dalam berargumentasi. Meskipun telah ada model-model berargumentasi besar (LRMs), kemampuan dan keterbatasan mereka masih belum sepenuhnya dipahami. Penilaian saat ini sebagian besar berfokus pada akurasi jawaban akhir tanpa memberikan pandangan tentang kemampuan berargumentasi.
Penelitian menunjukkan bahwa LRM tidak menggeneralisasi argumen secara efektif dan sering mengalami keruntuhan akurasi seiring dengan meningkatnya kompleksitas. Para peneliti menyimpulkan bahwa model ini hanya meniru argumen tanpa benar-benar menangkapnya, yang tidak memenuhi persyaratan AGI. AGI tetap menjadi tujuan yang jauh, meskipun beberapa pemimpin industri percaya itu dapat dicapai dalam beberapa tahun ke depan.