Karpathy: Pengenalan kemampuan AI mengalami kegagalan yang serius, versi gratis dan Agent terdepan adalah "produk yang sepenuhnya berbeda"

Mantan Kepala AI Tesla dan salah satu pendiri OpenAI, Andrej Karpathy, pada 9 April memublikasikan sebuah tulisan panjang di X, dengan mengatakan bahwa pemahaman publik tentang kemampuan AI sedang mengalami perpecahan yang serius. Ia berpendapat bahwa orang yang menggunakan ChatGPT versi gratis dan teknisi yang setiap hari menggunakan alat agent mutakhir seperti Codex dan Claude Code, sebenarnya sedang membahas “produk yang sepenuhnya berbeda”, tetapi kedua pihak sama-sama merasa bahwa yang mereka lihat adalah gambaran utuh dari AI.

Dua dunia, dua jenis pemahaman AI

Karpathy membagi pengguna AI saat ini menjadi dua kelompok.

Kelompok pertama adalah orang yang pada suatu titik tahun lalu mencoba ChatGPT versi gratis, lalu membentuk kesan mereka secara keseluruhan tentang AI dari sana. Yang mereka lihat adalah berbagai kesalahan model—halusinasi, hasil pencarian yang tidak masuk akal, dan bahkan pola suara yang membuat kesalahan pada pertanyaan sederhana seperti “mengemudi atau berjalan pergi mencuci mobil”. Karpathy mengakui bahwa masalah-masalah ini memang ada, tetapi menekankan bahwa versi gratis dan model yang ketinggalan zaman tidak dapat mewakili kemampuan sebenarnya dari model agent mutakhir sebelum tahun 2026.

Kelompok kedua memenuhi dua syarat sekaligus: menggunakan model agent mutakhir terbaru berbayar (seperti OpenAI Codex atau Claude Code), dan menggunakan secara profesional di bidang-bidang teknis seperti pengembangan perangkat lunak, matematika, dan penelitian. Karpathy menyebut bahwa kelompok ini sedang mengalami “dampak psikologis AI” yang sangat tinggi (AI Psychosis), karena kemajuan terbaru model-model ini di bidang teknis “hanya bisa digambarkan sebagai menakjubkan”—Anda bisa benar-benar menyaksikan mereka menyelesaikan masalah arsitektur perangkat lunak yang semula memerlukan waktu berhari-hari bahkan berminggu-minggu dalam waktu kurang dari satu jam.

Mengapa kemajuan terkonsentrasi di bidang teknis

Karpathy menjelaskan mengapa peningkatan kemampuan AI tampak khususnya signifikan di bidang teknis seperti pengembangan perangkat lunak, tetapi tidak begitu menonjol pada penggunaan umum seperti pencarian, penulisan, dan pemberian saran.

Ada dua penyebab: pertama, bidang teknis menyediakan fungsi penghargaan yang dapat diverifikasi (misalnya, apakah unit test lulus), yang membuat pelatihan reinforcement learning dapat berjalan secara efektif; sementara itu, kualitas tulisan sulit untuk dinilai secara jelas. Kedua, dalam skenario B2B bidang teknis lebih bernilai secara komersial, sehingga perusahaan-perusahaan AI menginvestasikan proporsi terbesar sumber daya tim mereka ke arah-arah tersebut.

Kedua kelompok saling tidak mengerti apa yang dibicarakan pihak lain

Karpathy menyimpulkan bahwa kedua kelompok ini sedang “berbicara pada jalurnya masing-masing”. Mode suara dari versi gratis OpenAI yang membuat masalah sehari-hari berantakan, sementara Codex versi berbayar tingkat tertinggi dari OpenAI dapat, dalam satu jam, merestrukturisasi seluruh basis kode atau menemukan celah sistem—dua hal ini sama-sama benar.

Dalam balasan lanjutan, ia menambahkan bahwa ada orang yang mengajukan pandangan kepadanya: insiden OpenClaw mendapat perhatian sosial yang begitu besar karena insiden itu membuat banyak non-teknisi untuk pertama kalinya berkenalan dengan model agent mutakhir, sementara selama ini mereka hanya tahu bahwa AI itu sama dengan ChatGPT versi web.

Artikel ini Karpathy: Pemahaman tentang kemampuan AI mengalami kesenjangan serius, versi gratis dan Agent mutakhir adalah “produk yang sepenuhnya berbeda” pertama kali muncul di media ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

OpenAI Merekrut Talenta Perangkat Lunak Perusahaan Teratas karena Agen Frontier Mengganggu Industri

Pesan Berita Gate, 26 April — OpenAI dan Anthropic telah merekrut eksekutif senior dan insinyur spesialis dari perusahaan perangkat lunak perusahaan besar, termasuk Salesforce, Snowflake, Datadog, dan Palantir. Denise Dresser, mantan CEO Slack di bawah Salesforce, bergabung dengan OpenAI sebagai chief revenue officer, sementara

GateNews2jam yang lalu

Worxphere Mengganti Merek JobKorea dengan Alat Perekrutan Berbasis AI

Berita Gate, 26 April — Platform HR Korea Selatan, Worxphere, telah mengganti merek JobKorea saat beralih dari papan lowongan online tradisional ke solusi perekrutan berbasis AI. Perusahaan ini mengonsolidasikan layanan termasuk JobKorea dan Albamon ke dalam satu platform terpadu yang mencakup pekerjaan tetap,

GateNews12jam yang lalu

AI Agent kini bisa secara mandiri mereproduksi makalah akademis yang kompleks: Mollick mengatakan kesalahan lebih banyak berasal dari teks asli manusia, bukan dari AI

Mollick 指出, metode dan data publik saja sudah cukup bagi AI agent untuk mereplikasi penelitian kompleks tanpa adanya naskah dan kode program asli; jika replikasi tidak sesuai dengan naskah asli, biasanya itu karena kesalahan dalam pengolahan data pada naskah itu sendiri atau kesimpulan yang terlalu berlebihan, bukan karena AI. Claude terlebih dahulu mereplikasi naskah, lalu GPT‑5 Pro melakukan verifikasi silang; sebagian besar berhasil, hanya terhambat ketika data terlalu besar atau ada masalah replication data. Tren ini secara besar mengurangi biaya tenaga kerja, sehingga replikasi menjadi pemeriksaan yang umum dan dapat dilakukan, serta juga mengajukan tantangan institusional untuk proses peninjauan dan tata kelola; alat kebijakan tata kelola pemerintah atau menjadi isu kunci.

ChainNewsAbmedia13jam yang lalu

UEA Mengumumkan Peralihan Ke Model Pemerintahan Berbasis AI dalam Dua Tahun Ke Depan

Yang Mulia Syekh Mohammed bin Rashid Al Maktoum menyatakan bahwa tujuannya adalah agar 50% sektor pemerintahan beroperasi melalui agen AI otonom. Transisi ini juga akan mencakup pelatihan pegawai federal untuk “menguasai AI” dan akan diawasi oleh Syekh Mansour bin Zayed. Poin-Poin Penting:

Coinpedia04-25 08:39

Platform Perdagangan AI Fere AI Menggalang $1,3M dalam Pendanaan yang Dipimpin oleh Ethereal Ventures

Pesan Berita Gate, 25 April — Fere AI, platform perdagangan aset digital berbasis AI, mengumumkan penyelesaian putaran pendanaan sebesar $1,3 juta yang dipimpin oleh Ethereal Ventures, dengan partisipasi dari Galaxy Vision Hill dan Kosmos Ventures, menurut Globenewswire. Platform ini mendukung jaringan lintas-rantai

GateNews04-25 07:46

Nvidia Meluncurkan Agen AI OpenAI Codex ke Seluruh Tenaga Kerja dengan Infrastruktur Blackwell

Pesan Gate News, 25 April — Nvidia telah meluncurkan Codex dari OpenAI, sebuah agen AI yang didukung oleh GPT-5.5, ke seluruh tenaga kerjanya setelah uji coba yang berhasil dengan sekitar 10.000 karyawan, menurut komunikasi internal dari CEO Jensen Huang dan CEO OpenAI Sam Altman. Codex dirancang untuk membantu

GateNews04-25 03:11
Komentar
0/400
Tidak ada komentar