NVIDIA právě vydala skvělý článek o tom, jak komprimovala model z 16bitového na 4bitový a dokázala udržet 99,4% přesnost, což je v podstatě bezztrátové. Toto je povinné čtení. Odkaz níže.