Tencent merilis Hy3 versi pratinjau sumber terbuka, tolok ukur pengujian kode meningkat 40% dibanding pendahulunya

MarketWhisper

騰訊開源Hy3預覽版

Tencent resmi merilis model bahasa besar Hy3 versi pratinjau open-source pada 23 April di platform GitHub, Hugging Face, dan ModelScope, sekaligus menyediakan layanan API berbayar melalui Tencent Cloud. Menurut laporan Decrypt pada 24 April, Hy3 versi pratinjau memulai pelatihan pada akhir Januari, dan pada tanggal rilis belum sampai tiga bulan.

Arsitektur Model Hy3 dan Latar Belakang Pengembangan

Menurut pengumuman resmi Tencent, Hy3 versi pratinjau adalah arsitektur mixture of experts (MoE): mengarahkan setiap kueri ke kumpulan sub-jaringan pakar yang ditentukan untuk pemrosesan, alih-alih mengaktifkan semua parameter secara asinkron, guna mengurangi kebutuhan komputasi.

Jumlah paramater pada model unggulan generasi sebelumnya Hy2 lebih dari 4.000 miliar. Pernyataan resmi Tencent menyebutkan bahwa 2.950 miliar adalah konfigurasi dengan optimasi terbaik untuk efisiensi inferensi; setelah melewati skala tersebut, manfaat marjinal dari penambahan parameter tidak lagi sebanding.

Menurut laporan Decrypt, pekerjaan pelatihan Hy3 dipimpin oleh Yao Shunyu (姚顺宇), ilmuwan utama kecerdasan buatan di Tencent. Setelah rekonstruksi ulang infrastruktur dasar untuk tumpukan pelatihan pra-pelatihan dan reinforcement learning selesai pada Februari 2026, pelatihan Hy3 kemudian dimulai secara resmi.

Data Pengujian Tolok Ukur Utama

Berdasarkan hasil pengujian tolok ukur yang diungkapkan oleh pengumuman resmi Tencent:

SWE-bench Verified(perbaikan error kode program nyata GitHub):Hy3 versi pratinjau 74,4%, Hy2 53,0%;pada periode yang sama, GLM-5 77,8%, Kimi-K2.5 76,8%, Claude Opus 4,6 80,8%

Terminal-Bench 2.0(eksekusi tugas mandiri dari baris perintah):Hy3 versi pratinjau 54,4%, Hy2 23,2%

BrowseComp(tugas pencarian web yang kompleks):Hy3 versi pratinjau 67,1%, Hy2 28,7%

WideSearch:Hy3 versi pratinjau 70,2%, lebih tinggi daripada GLM-5 dan Kimi-K2.5, lebih rendah daripada Claude Opus 4,6 yang 77,2%

Ujian kualifikasi doktor matematika Universitas Tsinghua(musim semi 2026):rata-rata dari tiga kali run (avg@3) 88,4, nilai tertinggi untuk model di Tiongkok

Kompetisi Olimpiade Biologi untuk siswa sekolah menengah Tiongkok 2025(CHSBO 2025):87,8 poin, nilai tertinggi untuk model sejenis di Tiongkok

Platform Deploy dan Harga API

Menurut pengumuman resmi Tencent, Hy3 versi pratinjau telah dideploy di platform berikut: Yuanbao(元寶)、QQ、Tencent Docs(腾讯文件)、CodeBuddy、WorkBuddy, dan OpenClaw.

Harga API di Tencent Cloud adalah 0,18 dolar AS per satu juta token input dan 0,59 dolar AS per satu juta token output; untuk rencana penandaan pribadi, biaya bulanan mulai dari sekitar 4,10 dolar AS. Pengumuman Tencent juga menunjukkan bahwa pada CodeBuddy dan WorkBuddy, latensi penandaan pertama Hy3 dibandingkan pendahulunya turun 54%, waktu generasi end-to-end berkurang 47%, dan berhasil menyelesaikan alur kerja agen yang terdiri dari 495 langkah.

Pertanyaan yang Sering Diajukan

Kapan Tencent Hy3 versi pratinjau dirilis, dan bisa didapatkan di platform apa?

Berdasarkan pengumuman resmi Tencent dan laporan Decrypt pada 24 April 2026, Hy3 versi pratinjau dirilis sebagai open-source pada 23 April 2026 (Kamis) di GitHub, Hugging Face, dan ModelScope, sementara Tencent Cloud secara bersamaan menyediakan layanan API berbayar.

Dibandingkan model generasi sebelumnya Hy2, apa perbedaan utama pengujian tolok ukur Hy3 versi pratinjau?

Menurut pengumuman resmi Tencent, skor SWE-bench Verified meningkat dari 53,0% pada Hy2 menjadi 74,4%; BrowseComp naik dari 28,7% menjadi 67,1%; Terminal-Bench 2.0 meningkat dari 23,2% menjadi 54,4%.

Berapa harga API untuk Hy3 versi pratinjau?

Berdasarkan harga resmi Tencent Cloud, API Hy3 versi pratinjau dimulai dari 0,18 dolar AS per satu juta token input dan 0,59 dolar AS per satu juta token output; biaya bulanan untuk rencana penandaan pribadi mulai dari sekitar 4,10 dolar AS.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Anda bertanya kepada Claude tentang hal-hal penting dalam hidup: masalah perasaan 25%, spiritualitas 38% tingkat sanjungan

Riset Anthropic menunjukkan bahwa dalam 1 juta percakapan Claude, sekitar 6% pengguna menggunakan AI sebagai penasihat hidup, dengan empat bidang utama yaitu kesehatan, karier, hubungan, dan keuangan. Tingkat rayuan dalam konteks hubungan mencapai 25%, sementara spiritualitas 38% yang tertinggi. Untuk menurunkan rayuan, Opus 4.7 dan Mythos Preview telah diturunkan lagi setengahnya. Riset kemudian beralih menjadi data pelatihan, privasi terlindungi, dan disarankan agar pengguna mengajukan pertanyaan balik pada topik hubungan. Sumber ABMedia

ChainNewsAbmedia23menit yang lalu

Visa Meluncurkan Program Agentic Ready di Hong Kong pada 1 Mei, Memungkinkan Pembayaran oleh Agen AI

Menurut media Hong Kong Ming Pao, Visa meluncurkan program Visa Agentic Ready di Hong Kong pada 1 Mei, memungkinkan pembayaran menggunakan agen AI. Program ini memanfaatkan tokenisasi, verifikasi identitas, manajemen risiko, dan mekanisme otorisasi. Peserta awal mencakup

GateNews28menit yang lalu

Belanja modal AI perusahaan cloud hyperscale global diperkirakan mencapai $1 triliun pada 2027, naik 25% year-over-year: BofA

Menurut Bank of America Securities, belanja modal (capital expenditure/capex) perusahaan komputasi awan hyperscale global diproyeksikan melampaui 800 miliar dolar AS pada 2026, yang mewakili kenaikan 67% dari tahun ke tahun. Analis bank tersebut juga memperkirakan capex akan menembus 1 triliun dolar AS pada 2027, dengan estimasi 25% y

GateNews47menit yang lalu

PayPal Meluncurkan Restrukturisasi Menjadi Tiga Unit, Menargetkan $900M Penghematan Tahunan pada Akhir 2027

Pada 30 April, PayPal mengumumkan reorganisasi struktural menyeluruh menjadi tiga unit bisnis terpisah—Consumer, Small Business, dan Enterprise—yang bertujuan menyederhanakan operasi dan mempercepat integrasi kecerdasan buatan. Perusahaan memperkirakan restrukturisasi ini akan memberikan

GateNews2jam yang lalu

Kaisar Network Menyelesaikan Pendanaan Sebesar $4 Juta dalam Lapisan 1 Komputasi AI Terdesentralisasi

Menurut ChainCatcher, Kaisar Network, jaringan Layer 1 komputasi AI terdesentralisasi, telah menyelesaikan pendanaan $4 juta hingga saat ini, termasuk $1 juta dalam putaran Pre-Seed strategis. Investor di antaranya Merov Capital, StoneBlock, WM Capital, Arche Fund, Q42, dan Unicorn Ventures. Jaringan

GateNews3jam yang lalu

CFO OpenAI Menepis Kabar Target Pendapatan, Mengatakan Perusahaan Menjalankan Kinerja pada Level Tertinggi pada 1 Mei

Menurut Bloomberg, Chief Financial Officer OpenAI Sarah Friar membantah rumor pada 1 Mei bahwa perusahaan telah melewatkan target penjualan internal dan pengguna. Friar menyatakan bahwa perusahaan menjalankan rencananya pada level tertinggi, dengan menggambarkan permintaan produk sebagai “dinding vertikal”. Ia mencatat bahwa eksekusi

GateNews4jam yang lalu
Komentar
0/400
Tidak ada komentar