Gate News, le 25 mars, l’Institut de recherche de Google a publié l’algorithme de compression quantifiée TurboQuant, qui peut compresser le cache KV des grands modèles linguistiques à 3 bits, réduisant l’utilisation de mémoire d’au moins 6 fois, sans nécessiter d’entraînement ou de fine-tuning, tout en préservant la précision du modèle. En mode 4 bits, la vitesse de calcul de l’attention sur le GPU H100 de NVIDIA est jusqu’à 8 fois plus rapide que la ligne de base non quantifiée à 32 bits. L’équipe de recherche a validé TurboQuant sur des benchmarks de contexte long tels que LongBench, Needle In A Haystack, ZeroSCROLLS, en utilisant les modèles Gemma et Mistral, et TurboQuant a obtenu des performances optimales dans tous les tests. Cet algorithme se compose de deux sous-algorithmes : PolarQuant, qui élimine la surcharge mémoire des méthodes de quantification traditionnelles via une transformation en coordonnées polaires, et QJL, qui corrige l’erreur résiduelle avec seulement 1 bit. La recherche a été menée sous la direction d’Amir Zandieh de l’Institut de recherche de Google et du vice-président et Google Fellow Vahab Mirrokni, en collaboration avec KAIST en Corée du Sud et l’Université de New York, et sera présentée à l’ICLR 2026. Google indique que l’une des principales applications de cette technologie est de résoudre le goulot d’étranglement du cache KV dans des modèles tels que Gemini.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Enquête de Nomura : huit investisseurs institutionnels sur dix prévoient d’allouer 2 % à 5 % de leur AUM à des actifs cryptographiques
Une enquête menée en 2026 par Nomura (et sa filiale de cryptomonnaies Laser Digital) auprès des investisseurs institutionnels en actifs numériques indique que près des quatre cinquièmes des investisseurs institutionnels interrogés prévoient d’allouer de 2 % à 5 % de leur total d’actifs sous gestion (AUM) au marché des cryptomonnaies. La majorité des institutions déclare avoir l’intention de le faire au cours de l’année à venir plutôt que d’investir immédiatement.
MarketWhisper04-17 03:05
Enquête Nomura : 80% des investisseurs institutionnels disposés à allouer 2 à 5% aux cryptomonnaies
Une enquête de Nomura révèle que 80% des investisseurs institutionnels visent à investir 2 à 5% dans les cryptomonnaies, en privilégiant des stratégies de rendement comme le staking et le prêt. La clarté réglementaire et la gestion des risques sont essentielles pour stimuler l’intérêt des institutions pour les actifs numériques.
GateNews04-16 19:11
Le marché des stablecoins atteint $322B ATH, le volume de négociation du T1 2026 atteint 8,3 billions de dollars
Le marché des stablecoins a connu une croissance significative, bondissant de 2,25 milliards de dollars pour atteindre $322 milliard, malgré une contraction plus large du marché des cryptomonnaies. Le USDC a enregistré une hausse substantielle de l’offre, tandis que le USDT a maintenu sa part de marché. Les stablecoins à rendement ont contribué de manière notable à cette croissance, l’activité transactionnelle atteignant un niveau record.
GateNews04-16 19:02
La Ethereum Foundation annonce les résultats du projet ETH Rangers : plus de 5,8 M$ d’actifs récupérés ou gelés
Le projet ETH Rangers de la Ethereum Foundation a été mené à bien avec succès, en finançant 17 chercheurs afin d’améliorer la sécurité publique au sein de l’écosystème. Les réalisations incluent la récupération de 5,8 M$ d’actifs, l’identification de plus de 785 vulnérabilités et le développement de plusieurs outils de sécurité.
GateNews04-16 14:32
Les principaux VC crypto constatent des baisses importantes d'AUM au milieu du ralentissement du marché en 2025
Pendant la baisse marquée du marché crypto en 2025, de grandes sociétés de capital-risque ont constaté des baisses significatives de leurs AUM, mais Haun Ventures a progressé de 30 %. Paradigm et a16z lèvent plus de 4,2 milliards de dollars pour de nouveaux fonds, mettant en évidence des performances contrastées selon les entreprises.
GateNews04-16 11:01