NVIDIA hat gerade ein beeindruckendes Papier veröffentlicht, in dem sie erklären, wie sie ein Modell von 16-Bit auf 4-Bit komprimiert haben und dabei 99,4 % Genauigkeit beibehalten konnten, was praktisch verlustfrei ist. Das ist ein Muss. Link unten.