2026-03-26 02:58:59

NOVIDADE: Google apresentou TurboQuant, um novo algoritmo de compressão de memória para sistemas de IA que visa reduzir drasticamente o uso de cache durante a inferência sem comprometer o desempenho.

O anúncio gerou comparações imediatas com Pied Piper, a startup fictícia da série de TV Silicon Valley, embora por enquanto permaneça um desenvolvimento baseado em laboratório.
Google Research afirmou que TurboQuant pode reduzir a memória de trabalho usada na inferência de IA em pelo menos seis vezes.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.