NVIDIA 剛發表了一篇精彩的論文,介紹他們如何將模型從 16 位壓縮到 4 位,並能夠保持 99.4% 的準確率,這基本上是無損的。 這是必讀的。以下是連結。