Pindai untuk Mengunduh Aplikasi Gate
qrCode
Opsi Unduhan Lainnya
Jangan ingatkan saya lagi hari ini

Perbedaan teknologi antara GPU NVIDIA dan chip AI buatan sendiri Google, Amazon AWS serta arah pasar di masa depan

Di tengah gelombang AI generatif yang melanda dunia, inti dari inovasi ini adalah chip kecerdasan buatan yang mampu melakukan komputasi cepat. Selama lebih dari sepuluh tahun terakhir, NVIDIA telah menanam benih revolusi industri AI dengan GPU-nya, kini Blackwell GPU dirancang khusus untuk pelatihan dan inferensi AI yang paling canggih, telah menjadi standar peralatan di pusat data global, dengan volume pengiriman mencapai 6 juta unit tahun lalu. Dalam rak server besar, 72 GPU dapat digabungkan melalui teknologi NVLink menjadi unit komputasi seperti satu GPU raksasa. Saat ini, pasar chip AI tidak lagi menjadi panggung tunggal bagi GPU NVIDIA, ASIC yang dikustomisasi dan FPGA mulai diadopsi oleh perusahaan teknologi besar, apa perbedaan antara chip AI ini? Bagaimana ini akan mempengaruhi perkembangan AI di masa depan, bahkan mungkin menggoyahkan dominasi NVIDIA? Artikel ini diambil dari ringkasan poin video CNBC.

GPU: Awal Era Emas AI

GPU telah beralih dari kartu permainan menjadi inti AI, yang dapat ditelusuri kembali ke AlexNet tahun 2012. Tim peneliti pertama kali menggunakan kemampuan komputasi paralel GPU Nvidia untuk pelatihan jaringan saraf, berhasil unggul jauh dari pesaing lainnya dalam kompetisi pengenalan gambar, dan juga membuka era pembelajaran mendalam.

Keunggulan inti GPU berasal dari ribuan inti pemrosesan paralel, yang dapat melakukan operasi tensor seperti perkalian matriks dengan efisien, dan sangat cocok untuk pelatihan dan inferensi AI. Saat ini, Nvidia tidak hanya memasok GPU kepada OpenAI, pemerintah, dan perusahaan di berbagai negara, tetapi juga langsung membangun sistem server lengkap. Server Blackwell dengan satu rak dijual seharga hingga 3 juta dolar, dan Nvidia bahkan mengungkapkan bahwa mereka mengeluarkan 1000 unit per minggu, menunjukkan betapa tingginya permintaan akan kekuatan komputasi AI. Pesaing Nvidia, AMD, mengandalkan GPU Instinct dan ekosistem perangkat lunak sumber terbuka untuk mempercepat kemajuan, dan baru-baru ini mendapatkan dukungan dari OpenAI dan Oracle, menjadi pendorong penting di pasar infrastruktur AI. Perbedaan GPU AMD terletak pada penggunaan perangkat lunak sumber terbuka, sementara GPU Nvidia secara erat mengelilingi CUDA untuk optimasi, di mana CUDA adalah platform perangkat lunak milik Nvidia.

ASIC yang dirancang khusus untuk satu tujuan menjadi tren baru

Dari Google, Amazon, Meta, Microsoft, hingga OpenAI dan Broadcom, para raksasa cloud berinvestasi dalam penelitian dan pengembangan ASIC (sirkuit terpadu khusus aplikasi) yang disesuaikan. Chip yang dirancang khusus untuk satu tujuan ini diperkirakan akan menjadi kategori chip AI dengan pertumbuhan tercepat dalam beberapa tahun ke depan.

Seiring dengan model bahasa besar memasuki tahap kematangan, permintaan untuk inferensi dengan cepat melampaui pelatihan. Biaya, konsumsi energi, dan stabilitas inferensi menjadi titik sakit bagi platform cloud, dan inilah medan pertempuran utama ASIC. Berbeda dengan GPU yang serba guna, ASIC seperti “alat presisi khusus”, dioptimalkan dengan pengkodean keras untuk jenis beban kerja AI tunggal, sehingga lebih cepat dan lebih efisien dalam konsumsi daya. Kekurangannya adalah fleksibilitas yang lebih rendah, dan ambang batas pengembangan yang sangat tinggi, biaya desain untuk satu chip kustom dapat mencapai miliaran dolar, sehingga hanya raksasa cloud yang mampu menanggungnya.

Biaya ASIC kustom untuk AI lebih tinggi. Sangat mahal, setidaknya memerlukan ribuan bahkan miliaran dolar. Namun bagi penyedia layanan cloud besar yang tidak mampu membayar ASIC kustom, AS6 kustom dapat memberikan imbalan karena efisiensinya yang lebih tinggi dan mengurangi ketergantungan pada Nvidia.

Asic dari Broadcom dengan kuat menantang pangsa pasar AI

Broadcom dan perusahaan desain chip lainnya seperti Marvell adalah mitra strategis inti bagi perusahaan cloud besar. Google TPU, akselerator yang dikembangkan sendiri oleh Meta, serta ASIC yang akan diluncurkan oleh OpenAI, semuanya melibatkan partisipasi mendalam dari Broadcom. Broadcom membantu membangun TPU Google dan pelatihan inferensi AI Meta, analis memperkirakan bahwa pangsa pasar Broadcom di pasar ASIC kustom dapat mencapai 70% hingga 80%.

FPGA: Pilihan fleksibel antara ASIC dan GPU

FPGA digunakan di sisi perangkat untuk mendukung AI tepi, bukan di cloud. Keunggulan terbesar FPGA adalah “dapat dikonfigurasi ulang”. Ketika perusahaan perlu menguji arsitektur sebelum perangkat keras ditetapkan, FPGA menawarkan opsi di antara fleksibilitas GPU dan kinerja tinggi ASIC. Meskipun kinerjanya tidak sebaik ASIC, fleksibilitasnya membuatnya tetap diminati oleh pusat data dan perangkat embedded. AMD (mengakuisisi Xilinx) dan Intel (mengakuisisi Altera) adalah dua kekuatan utama di pasar FPGA.

Google TPU

Google adalah pemain besar pertama dalam ASIC, yang pertama kali mengembangkan sirkuit terpadu khusus (ASIC) untuk akselerasi kecerdasan buatan, dan menciptakan istilah Tensor Processing Unit (TPU) saat ASIC pertamanya diluncurkan pada tahun 2015. TPU juga berkontribusi pada penemuan arsitektur Transformer oleh Google pada tahun 2017, yang menjadi dasar bersama bagi AI seperti ChatGPT dan Claude. Saat ini, Google telah berkembang hingga generasi ke-7 TPU Ironwood, dan membantu Anthropologie menggunakan jutaan TPU untuk melatih model seri Claude. Banyak rumor beredar bahwa TPU bahkan dapat melampaui GPU Nvidia dalam beberapa kasus, tetapi secara tradisional Google hanya menggunakannya untuk diri sendiri, sehingga potensi sebenarnya dari TPU belum sepenuhnya terungkap.

AWS Tranium: Matriks Inferensi Awan

AWS setelah mengakuisisi Annapurna Labs, sepenuhnya berinvestasi dalam chip AI miliknya sendiri. Tranium dan Inferentia telah menjadi pilar penting bagi platform pelatihan dan inferensi AWS. Tranium terdiri dari banyak mesin tensor kecil, sangat fleksibel, dan menurut AWS, memiliki nilai lebih baik 30% hingga 40% dibandingkan dengan perangkat keras lainnya di cloud. Pada tahun 2024, Anthropic akan melatih model dengan 500.000 Tranium 2 di pusat data AWS di North Indiana, yang bahkan sama sekali tidak menggunakan GPU Nvidia, menunjukkan bahwa posisi ASIC sedang meningkat.

NPU (Pengolah Jaringan Saraf): Chip AI tepi untuk ponsel, komputer, dan perangkat otomotif

Selain pusat data, chip AI juga merambah ke perangkat pribadi. NPU (Neural Processing Unit) adalah chip yang dirancang khusus untuk menjalankan kecerdasan buatan tepi di perangkat, bukan di cloud, yang dapat menjaga privasi pribadi. Saat ini, NPU terintegrasi dalam SoC Qualcomm Snapdragon, AMD, Intel, dan Apple M Series, digunakan untuk ponsel, laptop, rumah pintar, mobil, bahkan robot. AI di perangkat akan memberikan perlindungan privasi yang lebih tinggi, latensi yang lebih rendah, dan kontrol yang lebih kuat, menjadi pendorong penting untuk gelombang berikutnya dari penyebaran AI.

Taiwan Semiconductor Manufacturing Company menjadi inti dari perebutan chip

Baik itu NVIDIA Blackwell, Google TPU, atau AWS Tranium, sebagian besar chip AI akhirnya diproduksi oleh TSMC. Ini mengikat pasokan komputasi AI dengan geopolitik global. Amerika Serikat sedang berusaha menarik kembali sebagian kemampuan manufaktur chip ke dalam negeri melalui pabrik TSMC di Arizona dan proses 18A Intel. Namun, perusahaan-perusahaan Cina seperti Huawei dan Alibaba juga sedang aktif membangun ASIC mereka sendiri, mencari alternatif dalam negeri di bawah kontrol ekspor.

Era dominasi chip AI telah tiba

Baik dominasi kuat GPU NVIDIA maupun jalur ASIC dari perusahaan seperti Google, AWS, Meta, dan OpenAI yang sedang mendorong AI tepi ke setiap ponsel dan mobil, perang chip terus memanas. Meskipun tidak mudah untuk menggoyahkan posisi NVIDIA, ukuran pasar AI sangat besar, pemain baru terus masuk, dan peta chip di dekade mendatang pasti akan semakin sengit.

Artikel ini membahas perbedaan teknologi antara GPU NVIDIA dan chip AI yang dikembangkan sendiri oleh Google dan Amazon AWS, serta arah pasar di masa depan. Artikel ini pertama kali muncul di Chain News ABMedia.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)