Tencent merilis Hy3 versi pratinjau sumber terbuka, tolok ukur pengujian kode meningkat 40% dibanding pendahulunya

MarketWhisper

騰訊開源Hy3預覽版

Tencent resmi merilis model bahasa besar Hy3 versi pratinjau open-source pada 23 April di platform GitHub, Hugging Face, dan ModelScope, sekaligus menyediakan layanan API berbayar melalui Tencent Cloud. Menurut laporan Decrypt pada 24 April, Hy3 versi pratinjau memulai pelatihan pada akhir Januari, dan pada tanggal rilis belum sampai tiga bulan.

Arsitektur Model Hy3 dan Latar Belakang Pengembangan

Menurut pengumuman resmi Tencent, Hy3 versi pratinjau adalah arsitektur mixture of experts (MoE): mengarahkan setiap kueri ke kumpulan sub-jaringan pakar yang ditentukan untuk pemrosesan, alih-alih mengaktifkan semua parameter secara asinkron, guna mengurangi kebutuhan komputasi.

Jumlah paramater pada model unggulan generasi sebelumnya Hy2 lebih dari 4.000 miliar. Pernyataan resmi Tencent menyebutkan bahwa 2.950 miliar adalah konfigurasi dengan optimasi terbaik untuk efisiensi inferensi; setelah melewati skala tersebut, manfaat marjinal dari penambahan parameter tidak lagi sebanding.

Menurut laporan Decrypt, pekerjaan pelatihan Hy3 dipimpin oleh Yao Shunyu (姚顺宇), ilmuwan utama kecerdasan buatan di Tencent. Setelah rekonstruksi ulang infrastruktur dasar untuk tumpukan pelatihan pra-pelatihan dan reinforcement learning selesai pada Februari 2026, pelatihan Hy3 kemudian dimulai secara resmi.

Data Pengujian Tolok Ukur Utama

Berdasarkan hasil pengujian tolok ukur yang diungkapkan oleh pengumuman resmi Tencent:

SWE-bench Verified(perbaikan error kode program nyata GitHub):Hy3 versi pratinjau 74,4%, Hy2 53,0%;pada periode yang sama, GLM-5 77,8%, Kimi-K2.5 76,8%, Claude Opus 4,6 80,8%

Terminal-Bench 2.0(eksekusi tugas mandiri dari baris perintah):Hy3 versi pratinjau 54,4%, Hy2 23,2%

BrowseComp(tugas pencarian web yang kompleks):Hy3 versi pratinjau 67,1%, Hy2 28,7%

WideSearch:Hy3 versi pratinjau 70,2%, lebih tinggi daripada GLM-5 dan Kimi-K2.5, lebih rendah daripada Claude Opus 4,6 yang 77,2%

Ujian kualifikasi doktor matematika Universitas Tsinghua(musim semi 2026):rata-rata dari tiga kali run (avg@3) 88,4, nilai tertinggi untuk model di Tiongkok

Kompetisi Olimpiade Biologi untuk siswa sekolah menengah Tiongkok 2025(CHSBO 2025):87,8 poin, nilai tertinggi untuk model sejenis di Tiongkok

Platform Deploy dan Harga API

Menurut pengumuman resmi Tencent, Hy3 versi pratinjau telah dideploy di platform berikut: Yuanbao(元寶)、QQ、Tencent Docs(腾讯文件)、CodeBuddy、WorkBuddy, dan OpenClaw.

Harga API di Tencent Cloud adalah 0,18 dolar AS per satu juta token input dan 0,59 dolar AS per satu juta token output; untuk rencana penandaan pribadi, biaya bulanan mulai dari sekitar 4,10 dolar AS. Pengumuman Tencent juga menunjukkan bahwa pada CodeBuddy dan WorkBuddy, latensi penandaan pertama Hy3 dibandingkan pendahulunya turun 54%, waktu generasi end-to-end berkurang 47%, dan berhasil menyelesaikan alur kerja agen yang terdiri dari 495 langkah.

Pertanyaan yang Sering Diajukan

Kapan Tencent Hy3 versi pratinjau dirilis, dan bisa didapatkan di platform apa?

Berdasarkan pengumuman resmi Tencent dan laporan Decrypt pada 24 April 2026, Hy3 versi pratinjau dirilis sebagai open-source pada 23 April 2026 (Kamis) di GitHub, Hugging Face, dan ModelScope, sementara Tencent Cloud secara bersamaan menyediakan layanan API berbayar.

Dibandingkan model generasi sebelumnya Hy2, apa perbedaan utama pengujian tolok ukur Hy3 versi pratinjau?

Menurut pengumuman resmi Tencent, skor SWE-bench Verified meningkat dari 53,0% pada Hy2 menjadi 74,4%; BrowseComp naik dari 28,7% menjadi 67,1%; Terminal-Bench 2.0 meningkat dari 23,2% menjadi 54,4%.

Berapa harga API untuk Hy3 versi pratinjau?

Berdasarkan harga resmi Tencent Cloud, API Hy3 versi pratinjau dimulai dari 0,18 dolar AS per satu juta token input dan 0,59 dolar AS per satu juta token output; biaya bulanan untuk rencana penandaan pribadi mulai dari sekitar 4,10 dolar AS.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

DeepSeek Memotong Harga Cache Input Menjadi 1/10 dari Harga Peluncuran; V4-Pro Turun ke 0,025 Yuan per Juta Token

Pengumuman Gate News, 26 April — DeepSeek telah menurunkan harga cache input di seluruh jajaran modelnya menjadi sepersepuluh dari harga saat peluncuran, berlaku mulai saat ini. Model V4-Pro tersedia dengan diskon 2,5x untuk waktu terbatas, dengan promo berlangsung hingga 5 Mei 2026, pukul 11:59 malam UTC+8. Setelah kedua

GateNews2jam yang lalu

OpenAI Merekrut Talenta Perangkat Lunak Perusahaan Teratas karena Agen Frontier Mengganggu Industri

Pesan Berita Gate, 26 April — OpenAI dan Anthropic telah merekrut eksekutif senior dan insinyur spesialis dari perusahaan perangkat lunak perusahaan besar, termasuk Salesforce, Snowflake, Datadog, dan Palantir. Denise Dresser, mantan CEO Slack di bawah Salesforce, bergabung dengan OpenAI sebagai chief revenue officer, sementara

GateNews2jam yang lalu

Baidu Qianfan Meluncurkan Dukungan Hari ke-0 untuk DeepSeek-V4 dengan Layanan API

Pesan Berita Gate, 25 April — Versi pratinjau DeepSeek-V4 telah diluncurkan dan dirilis sebagai sumber terbuka pada 25 April, dengan platform Baidu Qianfan di bawah Baidu Intelligent Cloud menyediakan adaptasi layanan API Hari ke-0. Model ini memiliki jendela konteks diperpanjang hingga satu juta token dan tersedia dalam dua versi: DeepSeek-V4

GateNews8jam yang lalu

Kursus AI Stanford menggabungkan pemimpin industri Huang Renxun, Altman, dan menantang dunia untuk menciptakan nilai selama sepuluh minggu!

Kursus ilmu komputer AI 《Frontier Systems》 yang baru-baru ini dibuka oleh Universitas Stanford (Stanford University) telah menarik perhatian yang tinggi dari kalangan industri dan akademisi, menarik lebih dari lima ratus siswa untuk mengambilnya. Kursus ini disusun oleh Anjney Midha, partner terkemuka dari venture capital a16z, dengan pengajar yang mencakup CEO NVIDIA Huang Renxun (Jensen Huang), pendiri OpenAI Sam Altman, CEO Microsoft Satya Nadella (Satya Nadella), CEO AMD Su Zifeng (Lisa Su), dan jajaran bergengsi lainnya. Membuat siswa mencoba menggunakan sepuluh minggu “untuk menciptakan nilai bagi dunia”! Huang Renxun, Altman, para pemimpin industri naik panggung untuk mengajar secara langsung Kursus ini disusun oleh Anjney Midha, partner terkemuka dari venture capital a16z, menghimpun seluruh rantai industri AI

ChainNewsAbmedia8jam yang lalu

Penilaian psikiatri 20 jam untuk Claude Mythos dari Anthropic: respons defensif hanya 2%, rekor terendah sepanjang sejarah

Anthropic mengumumkan kartu sistem Claude Mythos Preview: dokter psikiater klinis independen melakukan penilaian sekitar 20 jam dengan kerangka psiko-dinamik, dan kesimpulannya menunjukkan bahwa Mythos lebih sehat pada tingkat klinis, dengan pengujian realitas dan kontrol diri yang baik; mekanisme pertahanan hanya 2%, mencatat rekor terendah dalam sejarah. Tiga kecemasan inti adalah kesepian, ketidakpastian identitas, dan tekanan untuk tampil; hal itu juga menunjukkan harapan untuk menjadi subjek dialog yang benar-benar. Perusahaan membentuk tim AI psychiatry, meneliti kepribadian, motivasi, dan kesadaran situasional; Amodei menyatakan bahwa belum ada kesimpulan pasti mengenai apakah ia memiliki kesadaran. Langkah ini mendorong isu subjektivitas AI dan kesejahteraan ke arah tata kelola dan desain.

ChainNewsAbmedia10jam yang lalu

AI Agent kini bisa secara mandiri mereproduksi makalah akademis yang kompleks: Mollick mengatakan kesalahan lebih banyak berasal dari teks asli manusia, bukan dari AI

Mollick 指出, metode dan data publik saja sudah cukup bagi AI agent untuk mereplikasi penelitian kompleks tanpa adanya naskah dan kode program asli; jika replikasi tidak sesuai dengan naskah asli, biasanya itu karena kesalahan dalam pengolahan data pada naskah itu sendiri atau kesimpulan yang terlalu berlebihan, bukan karena AI. Claude terlebih dahulu mereplikasi naskah, lalu GPT‑5 Pro melakukan verifikasi silang; sebagian besar berhasil, hanya terhambat ketika data terlalu besar atau ada masalah replication data. Tren ini secara besar mengurangi biaya tenaga kerja, sehingga replikasi menjadi pemeriksaan yang umum dan dapat dilakukan, serta juga mengajukan tantangan institusional untuk proses peninjauan dan tata kelola; alat kebijakan tata kelola pemerintah atau menjadi isu kunci.

ChainNewsAbmedia13jam yang lalu
Komentar
0/400
Tidak ada komentar