NVIDIA acaba de publicar un artículo impresionante sobre cómo comprimieron un modelo de 16 bits a 4 bits y pudieron mantener un 99.4% de precisión, lo que es básicamente sin pérdidas. Es una lectura obligada. Enlace abajo.