نشرت NVIDIA بحثا رائعا عن كيفية ضغط النموذج من 16-بت إلى 4-بت وتمكنوا من الحفاظ على دقة 99.4٪، وهي في الأساس بدون فقدان. هذا كتاب لا بد من قراءته. الرابط أدناه.