Gate News повідомляє, що 17 березня NVIDIA представила чіп Groq 3 LPU (модуль обробки мовлення). Це перший чіп, випущений після придбання NVIDIA у грудні минулого року стартапу з AI-інференсу Groq за приблизною сумою 20 мільярдів доларів. Виробництво очікується розпочати у третьому кварталі цього року. Шасі Groq 3 LPX може вмістити 256 LPU, оснащене 128 ГБ внутрішньої SRAM та пропускною здатністю розширеного з’єднання 640 ТБ/с. Офіційно заявлено, що при поєднанні LPX з Vera Rubin NVL72, максимальна пропускна здатність для інференсу на мегават може зрости до 35 разів, відкриваючи потенціал для доходів у сценаріях з трильйонами параметрів і мільйонами токенів у контексті. Джон Хенекен описав обидва процесори як “екстремально різні, але взаємопов’язані: один орієнтований на високу пропускну здатність, інший — на низьку затримку”, а внутрішня пам’ять LPX значно розширює загальний обсяг доступної пам’яті для моделей. Шасі LPX планується випустити у другій половині цього року разом із платформою Vera Rubin. Крім того, Хенекен продемонстрував прототип архітектури наступного покоління під кодовою назвою Kyber. Kyber змінює розташування 144 GPU у вертикальні стелажі для підвищення фізичної щільності та зниження затримки, і буде встановлений у платформі Vera Rubin Ultra, яка очікується у 2027 році.