Gate News rapporte qu’au 18 mars, Nvidia se prépare à lancer en Chine la puce d’inférence Groq 3 LPU, dont la sortie est prévue dès mai au plus tôt. Selon des sources proches du dossier, cette puce n’est ni une version dégradée ni spécialement conçue pour le marché chinois. Il s’agit de la première introduction de la gamme de produits de Groq en Chine depuis l’acquisition par Nvidia, fin 2025, de la société de puces d’inférence AI pour environ 17 milliards de dollars, cette démarche étant distincte de la stratégie de puces pour la Chine, qui inclut déjà la relance de la production du GPU H200, approuvée précédemment. La Groq 3 LPU est un coprocesseur dédié à l’inférence, doté de 500 Mo de SRAM intégré, avec une bande passante d’inférence pouvant atteindre 150 To/s, mais une puissance en virgule flottante relativement faible, peu adaptée à l’entraînement de modèles. Cette architecture pourrait faire en sorte que sa puissance de calcul maximale reste en dessous des seuils de performance actuellement contrôlés à l’export par les États-Unis (TPP < 21 000 et bande passante DRAM < 6 500 GB/s), permettant ainsi d’éviter les restrictions à l’exportation auxquelles sont soumis des GPU comme le H200. Cependant, dans le cadre du plan initial de Nvidia, la LPU Groq doit être utilisée avec le GPU Vera Rubin, qui ne peut pas être exporté vers la Chine (proportion recommandée d’environ 25:75). La version chinoise devra fonctionner de manière autonome avec d’autres systèmes, et ses performances réelles restent à confirmer.