NVIDIA ha appena pubblicato un documento eccezionale su come hanno compresso un modello da 16 bit a 4 bit riuscendo a mantenere il 99,4% di accuratezza, che è praticamente senza perdita. Questo è un must read. Link qui sotto.