Google lança algoritmo TurboQuant: quantização KV cache de 3 bits sem perda de precisão, velocidade de inferência aumenta até 8 vezes

Notícias do Gate News, a 25 de março, o Google Research lançou o algoritmo de compressão quântica TurboQuant, que consegue comprimir o cache KV de grandes modelos de linguagem para 3 bits, reduzindo o uso de memória pelo menos 6 vezes, sem necessidade de treino ou ajuste fino, sem perder precisão do modelo. No modo de 4 bits, a velocidade de cálculo de atenção na GPU Nvidia H100 é até 8 vezes superior à linha de base de 32 bits não quantificados. A equipe de pesquisa validou o TurboQuant usando modelos Gemma e Mistral em benchmarks de contexto longo como LongBench, Needle In A Haystack e ZeroSCROLLS, alcançando desempenho ótimo em todos os testes. O algoritmo é composto por duas subferramentas: PolarQuant, que elimina o custo de memória das quantizações tradicionais por meio de transformação em coordenadas polares, e QJL, que corrige o erro residual usando apenas 1 bit. A pesquisa foi liderada por Amir Zandieh do Google Research e Vahab Mirrokni, vice-presidente e Google Fellow, em colaboração com KAIST na Coreia do Sul e a Universidade de Nova York, e será apresentada na ICLR 2026. O Google afirmou que uma das principais aplicações dessa tecnologia é resolver o gargalo do cache KV em modelos como Gemini.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Relatório dos ETPs cripto da WisdomTree: $137M Entradas líquidas na Q1 2026

De acordo com o anúncio dos resultados do 1T 2026, os produtos de exchange-traded (ETPs) cripto da WisdomTree reportaram entradas líquidas de US$ 137 milhões no primeiro trimestre deste ano. Os ativos totais sob gestão dos ETPs cripto subiram para aproximadamente US$ 1,8 bilhão durante o 1T 2026. A empresa também lançou novos ETPs cripto

GateNews1h atrás

A Tether Reporta Lucro de US$ 1,04 bilhão no 1º tri e um Buffer de Reserva de US$ 8,23 bilhões

A Tether, emissora da stablecoin, registrou um lucro no primeiro trimestre de US$ 1,04 bilhão e atingiu uma reserva de folga de US$ 8,23 bilhões. A empresa destacou que o mercado cripto esteve altamente volátil durante o primeiro trimestre.

CryptoFrontier4h atrás

Os ETPs cripto da WisdomTree registram entradas líquidas na $137M Net no 1º trimestre de 2026, revertendo saídas do ano anterior

De acordo com a WisdomTree, os produtos negociados em bolsa de criptomoedas (ETPs) da empresa registraram entradas líquidas de US$ 137 milhões no primeiro trimestre de 2026, uma reversão significativa em relação às saídas líquidas de US$ 89 milhões no mesmo período do ano passado. O total de ativos de ETPs de cripto sob gestão subiu para aproximadamente US$ 1,8

GateNews7h atrás

A CoinShares registra US$ 7,4 bilhões de AUM no primeiro relatório anual desde a listagem na Nasdaq

De acordo com o seu primeiro relatório anual, a CoinShares informou ativos brutos sob gestão de US$ 7,4 bilhões em 2025. A gestora europeia de ativos cripto gerou receita de US$ 165,7 milhões no ano completo, com a receita do negócio de gestão de ativos atingindo US$ 126,4 milhões, alta de 13% em relação a US$ 111,7 milhões em 2024. Líquido em

GateNews7h atrás

JPMorgan: o crescimento do uso de stablecoins pode não impulsionar a expansão da capitalização de mercado

Analistas do JPMorgan liderados pelo diretor-gerente Nikolaos Panigirtzoglou disseram, em um relatório, que, embora o uso de stablecoins esteja crescendo rapidamente, isso talvez não se converta em um crescimento equivalente na capitalização total do mercado de stablecoins. O fator-chave é a aceleração de velocidade — a frequência com que a mesma stablecoin é usada —

CryptoFrontier9h atrás

A Tether publica lucro de US$ 1,04 bilhão no 1º trimestre de 2026, já que o buffer de reservas atinge recorde de US$ 8,23 bilhões

De acordo com um relatório de atestação preparado pela empresa independente de contabilidade BDO, a Tether registrou US$ 1,04 bilhão em lucro líquido durante o 1T de 2026, com as reservas excedentes atingindo um recorde de US$ 8,23 bilhões em 31 de março. As reservas da Tether continuam fortemente concentradas em instrumentos líquidos de alta qualidade e curta duração

GateNews11h atrás
Comentário
0/400
Sem comentários