NVIDIA właśnie opublikowało świetny artykuł na temat tego, jak skompresowali model z 16-bitów do 4-bitów, zachowując 99,4% dokładności, co jest praktycznie bezstratne. To lektura obowiązkowa. Link poniżej.