เทคโนโลยีใหม่ของ Google ทำให้ตลาดตกใจ ความต้องการหน่วยความจำ AI ลดลงถึงหกเท่า! SK Hynix และ Micron ลดราคาพร้อมกัน

ChainNewsAbmedia

กูเกิลเปิดตัวอัลกอริทึม TurboQuant ลดการใช้หน่วยความจำของโมเดลภาษาใหญ่ลงอย่างน้อย 6 เท่า พร้อมทั้งเพิ่มความเร็วในการคำนวณเพื่อการอนุมานสูงสุดถึง 8 เท่า โดยไม่ลดความแม่นยำของโมเดล ตลาดจึงมองเทคโนโลยีนี้เป็น “การทำลายความต้องการด้านอุปกรณ์” ซึ่งมีเหตุผลตรงไปตรงมา: หากความต้องการหน่วยความจำในช่วงการอนุมานของ AI ถูกบีบอัดหลายเท่า แสดงว่าเส้นโค้งความต้องการ DRAM HBM และ NAND ในศูนย์ข้อมูลในอนาคตอาจมีแนวโน้มลดลงเชิงโครงสร้าง

หลังจากประกาศข่าว หุ้นในกลุ่มหน่วยความจำและการเก็บข้อมูลร่วงพร้อมกัน เช่น SanDisk (SNDK) ร่วง 3.5%, Micron Technology (MU) ร่วง 3.4%, Western Digital (WDC) ร่วง 1.63%; ในกลุ่มซัพพลายเชนเอเชีย Samsung Electronics ร่วง 4.71% และ SK Hynix ร่วงถึง 6.23% ก็มีมุมมองที่เชื่อว่า TurboQuant อาจเปลี่ยนแปลงมากกว่าการลดความต้องการ แต่เป็นการเพิ่มประสิทธิภาพการใช้ทรัพยากรแทน

อัลกอริทึมล่าสุดของกูเกิล: ใช้หน่วยความจำน้อยลง 6 เท่า, เร็วขึ้น 8 เท่า

จากคำอธิบายของทีมวิจัยกูเกิล TurboQuant เป็นอัลกอริทึมการควอนตัม (quantization) สำหรับโมเดลภาษาใหญ่และระบบค้นหาด้วยเวกเตอร์ ซึ่งเน้นการบีบอัดข้อมูล “key-value cache” และโครงสร้างข้อมูลเวกเตอร์มิติสูงที่ใช้ทรัพยากรอย่างมาก ในการทดสอบเทคโนโลยีนี้สามารถลดการใช้หน่วยความจำลงอย่างน้อย 6 เท่า พร้อมทั้งเพิ่มความเร็วในการคำนวณสูงสุดถึง 8 เท่า โดยไม่ลดความแม่นยำของโมเดล

(ผลกระทบต่อ Vera Rubin ของ NVIDIA? วิเคราะห์ยุคสงครามหน่วยความจำ: SK Hynix, Samsung, Micron, SanDisk)

ความก้าวหน้านี้ตรงกับจุดอับของโครงสร้างพื้นฐาน AI ในปัจจุบัน การขยายขีดความสามารถของ AI สร้างสรรค์ในระดับการคำนวณสูงพึ่งพาหน่วยความจำความเร็วสูงเช่น HBM เพื่อรองรับน้ำหนักโมเดลและ KV cache ขนาดใหญ่ เพื่อป้องกันการค้างของหน่วยความจำในระหว่างการอนุมาน แต่ TurboQuant ผสมผสานเทคนิค PolarQuant และ Quantized Johnson-Lindenstrauss (QJL) ซึ่งสามารถบีบอัดข้อมูลได้เกือบ “ไม่มีค่าใช้จ่ายหน่วยความจำเพิ่มเติม” เท่ากับใช้ทรัพยากรฮาร์ดแวร์น้อยลงในการทำงานที่มีประสิทธิภาพเท่าเดิมหรือดีกว่า

อัลกอริทึมของ Google ส่งผลกระทบต่อหน่วยความจำ! ผู้ผลิตหน่วยความจำในอเมริกาและเกาหลีใต้ร่วงตาม

เทคโนโลยีนี้ถูกตีความในตลาดว่าเป็น “การทำลายความต้องการด้านอุปกรณ์” หลังประกาศข่าว หุ้นในกลุ่มหน่วยความจำและการเก็บข้อมูลร่วงพร้อมกัน เช่น SanDisk (SNDK) ร่วง 3.5%, Micron Technology (MU) ร่วง 3.4%, Western Digital (WDC) ร่วง 1.63%; ในกลุ่มซัพพลายเชนเอเชีย Samsung Electronics ร่วง 4.71% และ SK Hynix ร่วงถึง 6.23%

เหตุผลเบื้องหลังเป็นตรงไปตรงมา: หากความต้องการหน่วยความจำในช่วงการอนุมานของ AI ถูกบีบอัดหลายเท่า หมายความว่าเส้นโค้งการเติบโตของความต้องการ DRAM HBM และ NAND ในศูนย์ข้อมูลในอนาคตอาจมีแนวโน้มลดลงอย่างมีโครงสร้าง โดยเฉพาะในบริบทที่อุตสาหกรรม AI กำลังเปลี่ยนจาก “การฝึกสอน” ไปสู่ “การอนุมาน” ซึ่งเทคนิคเพิ่มประสิทธิภาพจะมีผลกระทบมากขึ้นเรื่อย ๆ

อย่างไรก็ตาม ยังมีมุมมองที่เชื่อว่า TurboQuant อาจเปลี่ยนแปลงมากกว่าการลดความต้องการ แต่เป็นการเพิ่มประสิทธิภาพการใช้ทรัพยากร เมื่อค่าใช้จ่ายลดลงและความล่าช้าลดลง การใช้งาน AI อาจขยายตัวมากขึ้น ส่งผลให้ความต้องการพลังการคำนวณรวมยังคงเติบโต โครงสร้างนี้คือ “ความต้องการต่อหน่วยลดลง แต่ความต้องการรวมเพิ่มขึ้น” โรงงานหน่วยความจำขนาดใหญ่มักเต็มกำลังการผลิตแล้ว ตลาดอาจกำลังตั้งคำถามว่า ขีดจำกัดการเติบโตของ AI อยู่ที่ระดับใด?

ดูต้นฉบับ
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น