OpenAI 推 GPT-5.5: 12M konteks, indeks AA teratas, Terminal-Bench 82.7% menulis ulang tolok ukur agen

OpenAI pada 4/23 secara resmi merilis GPT-5.5, menempatkannya sebagai model utama untuk pekerjaan yang berorientasi agen (agentic) dan pemrosesan pengetahuan perusahaan, serta secara bersamaan hadir di ChatGPT dan Codex. Materi promosi resmi menetapkan nada sebagai “model kami yang paling pintar dan paling intuitif untuk digunakan”, sementara AA Intelligence Index meraih puncak dengan 60 poin, unggul atas Claude Opus 4.7 dan Gemini 3.1 Pro Preview masing-masing sebesar 3 poin.

Ikhtisar data kunci

Perbandingan indikator GPT-5.5 (GPT-5.4 atau pesaing setara) AA Intelligence Index 60 Claude Opus 4.7:57; Gemini 3.1 Pro Preview:57 Terminal-Bench 2.0 (workflow berbasis command line) 82.7% GPT-5.4:75.1% Expert-SWE (penilaian kode internal OpenAI) 73.1% GPT-5.4:68.5% Jendela konteks 12.000.000 token meningkat secara signifikan, dapat memproses keseluruhan repositori program perusahaan atau beberapa jam video Harga (per 1 juta token) Masukan 5 dolar, Keluaran 30 dolar GPT-5.4 2 kali harga satuan; namun penggunaan token keluaran turun sekitar 40%, biaya bersih naik sekitar 20%

Posisi: Dirancang untuk “Era Agen”

OpenAI mendeskripsikan GPT-5.5 sebagai model dasar untuk komputasi yang berorientasi agen, mampu memahami tujuan yang kompleks, menggunakan alat, memeriksa sendiri hasil pekerjaan, dan dapat menyelesaikan tugas multi-langkah tanpa manusia perlu ikut campur di setiap langkah. Berdasarkan wawancara TechCrunch, CEO Greg Brockman menggambarkan versi ini sebagai “langkah besar menuju komputasi di masa depan, tetapi hanya satu langkah”, serta menekankan bahwa “dibanding 5.4 ia adalah penalar yang lebih cepat dan lebih tajam, menggunakan token lebih sedikit”.

Kepala ilmuwan Jakub Pachocki menyatakan, “Kami melihat peningkatan yang sangat signifikan dalam jangka pendek”; sementara pemimpin riset Mark Chen menekankan bahwa versi ini menghadirkan “terobosan yang bermakna” dalam alur kerja penelitian sains dan teknologi.

Cakupan pasokan dan segmentasi versi

GPT-5.5: Pengguna Plus, Pro, Business, Enterprise dapat menggunakannya di ChatGPT dan Codex

GPT-5.5 Pro: Versi penalaran tingkat lebih tinggi yang dapat digunakan oleh pengguna Pro, Business, Enterprise di ChatGPT

Integrasi Codex: Sekaligus dapat digunakan pada alat agen program OpenAI, memperkuat pengeditan multi-file, command line, dan loop pengujian

Peningkatan narasi keamanan siber dan pertahanan secara paralel

Anggota tim teknis Mia Glaese saat diwawancarai TechCrunch menyatakan kemampuan keamanan siber GPT-5.5 akan berdampak besar pada cara OpenAI “menerapkan model dengan investasi pertahanan digital”. Narasi ini berhadapan langsung dengan kontroversi baru-baru ini yang beredar seputar model keamanan siber kelas senjata Claude Mythos dari Anthropic—sebelumnya, Altman baru saja mengkritik strategi “pemasaran berbasis ketakutan” Anthropic dalam acara《Core Memory》. Di GPT-5.5, OpenAI lebih menekankan narasi “siap menyerang dan bertahan, dapat dideploy”, yang bertujuan untuk membedakan diri dari posisi Anthropic yang membatasi akses.

Perubahan strategi harga

Harga per 1 juta token GPT-5.5 digandakan menjadi Masukan 5 dolar dan Keluaran 30 dolar, ini adalah generasi pertama seri GPT-5 yang menunjukkan kenaikan harga satuan secara signifikan. Penjelasan OpenAI adalah: efisiensi penalaran model dapat mengurangi penggunaan token keluaran sekitar 40%, sehingga tagihan aktual untuk tugas tipikal sekitar 20% lebih tinggi dibanding GPT-5.4, bukan sekadar 2 kali lipat. Bagi perusahaan, keputusan karenanya bergeser dari “apakah harga satuannya sepadan” menjadi “dalam prompt yang sama, apakah GPT-5.5 dapat menyelesaikan tugas yang lebih kompleks dengan total Token yang lebih sedikit”.

Sinyal bagi industri

GPT-5.5 memperlebar kesenjangan OpenAI dalam Terminal-Bench dan penilaian SWE internal; dua benchmark ini menguji eksekusi agen berbasis command line serta tugas rekayasa perangkat lunak dunia nyata—sebagai medan pertempuran skor yang lebih langsung untuk konfrontasi positif Codex dan Claude Code. Ditambah dengan peluncuran bersamaan jendela konteks 12.000.000 token, OpenAI memberi tekanan pada dua jalur sekaligus: “pemrosesan penuh basis pengetahuan perusahaan” dan “agen tugas panjang”. Bagi Anthropic, Claude Opus 4.7 tertinggal 3 poin dari Claude Opus 4.7 di AA Index dengan 57 poin; bagi pengguna Claude Code, ada pula alasan tambahan untuk mengamati kemajuan generasi berikutnya (Opus 4.8 atau Claude generasi baru).

Artikel ini mengangkat promosi OpenAI untuk GPT-5.5: Konteks 12M, AA Index puncak, Terminal-Bench 82.7% mengganti benchmark agen Muncul pertama kali di 鏈新聞 ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

OpenAI Merekrut Talenta Perangkat Lunak Perusahaan Teratas karena Agen Frontier Mengganggu Industri

Pesan Berita Gate, 26 April — OpenAI dan Anthropic telah merekrut eksekutif senior dan insinyur spesialis dari perusahaan perangkat lunak perusahaan besar, termasuk Salesforce, Snowflake, Datadog, dan Palantir. Denise Dresser, mantan CEO Slack di bawah Salesforce, bergabung dengan OpenAI sebagai chief revenue officer, sementara

GateNews3jam yang lalu

Worxphere Mengganti Merek JobKorea dengan Alat Perekrutan Berbasis AI

Berita Gate, 26 April — Platform HR Korea Selatan, Worxphere, telah mengganti merek JobKorea saat beralih dari papan lowongan online tradisional ke solusi perekrutan berbasis AI. Perusahaan ini mengonsolidasikan layanan termasuk JobKorea dan Albamon ke dalam satu platform terpadu yang mencakup pekerjaan tetap,

GateNews13jam yang lalu

AI Agent kini bisa secara mandiri mereproduksi makalah akademis yang kompleks: Mollick mengatakan kesalahan lebih banyak berasal dari teks asli manusia, bukan dari AI

Mollick 指出, metode dan data publik saja sudah cukup bagi AI agent untuk mereplikasi penelitian kompleks tanpa adanya naskah dan kode program asli; jika replikasi tidak sesuai dengan naskah asli, biasanya itu karena kesalahan dalam pengolahan data pada naskah itu sendiri atau kesimpulan yang terlalu berlebihan, bukan karena AI. Claude terlebih dahulu mereplikasi naskah, lalu GPT‑5 Pro melakukan verifikasi silang; sebagian besar berhasil, hanya terhambat ketika data terlalu besar atau ada masalah replication data. Tren ini secara besar mengurangi biaya tenaga kerja, sehingga replikasi menjadi pemeriksaan yang umum dan dapat dilakukan, serta juga mengajukan tantangan institusional untuk proses peninjauan dan tata kelola; alat kebijakan tata kelola pemerintah atau menjadi isu kunci.

ChainNewsAbmedia15jam yang lalu

UEA Mengumumkan Peralihan Ke Model Pemerintahan Berbasis AI dalam Dua Tahun Ke Depan

Yang Mulia Syekh Mohammed bin Rashid Al Maktoum menyatakan bahwa tujuannya adalah agar 50% sektor pemerintahan beroperasi melalui agen AI otonom. Transisi ini juga akan mencakup pelatihan pegawai federal untuk “menguasai AI” dan akan diawasi oleh Syekh Mansour bin Zayed. Poin-Poin Penting:

Coinpedia04-25 08:39

Platform Perdagangan AI Fere AI Menggalang $1,3M dalam Pendanaan yang Dipimpin oleh Ethereal Ventures

Pesan Berita Gate, 25 April — Fere AI, platform perdagangan aset digital berbasis AI, mengumumkan penyelesaian putaran pendanaan sebesar $1,3 juta yang dipimpin oleh Ethereal Ventures, dengan partisipasi dari Galaxy Vision Hill dan Kosmos Ventures, menurut Globenewswire. Platform ini mendukung jaringan lintas-rantai

GateNews04-25 07:46

Nvidia Meluncurkan Agen AI OpenAI Codex ke Seluruh Tenaga Kerja dengan Infrastruktur Blackwell

Pesan Gate News, 25 April — Nvidia telah meluncurkan Codex dari OpenAI, sebuah agen AI yang didukung oleh GPT-5.5, ke seluruh tenaga kerjanya setelah uji coba yang berhasil dengan sekitar 10.000 karyawan, menurut komunikasi internal dari CEO Jensen Huang dan CEO OpenAI Sam Altman. Codex dirancang untuk membantu

GateNews04-25 03:11
Komentar
0/400
Tidak ada komentar