NVIDIA щойно опублікувала вражаючу статтю про те, як вони стиснули модель з 16-бітної до 4-бітної і змогли зберегти точність 99,4%, що фактично безвтратно. Це обов'язкове до прочитання. Посилання нижче.