El nuevo algoritmo de compresión de Google, TurboQuant, promete reducir la demanda de memoria para modelos de inteligencia artificial en un factor de aproximadamente 6x. Esta innovación podría tener un impacto significativo en el mercado, ya que las acciones de fabricantes de memoria ya han comenzado a caer, posiblemente debido a esta noticia.
TurboQuant se presenta como una solución eficiente para el desafío del sobrecoste de memoria en la cuantización vectorial, manteniendo la precisión del modelo sin pérdidas significativas. Según Google, esta técnica optimiza el uso de memoria al cambiar el enfoque de vectores estándar a un sistema de referencia más absoluto, eliminando así la necesidad de normalización de datos.
Las pruebas realizadas por Google indican que TurboQuant no solo reduce el tamaño de la memoria en un factor de 6x, sino que también mejora la búsqueda en dimensiones altas. Esto permitiría construir y consultar índices vectoriales grandes con un consumo de memoria mínimo y tiempos de preprocesamiento cercanos a cero, manteniendo una precisión de última generación.