模型量化對稱量化和非對稱量化

本文的模型量化是優化深度學習模型推理過程的記憶體容量和記憶體頻寬問題的概念，通過將模型引數的浮點數型別轉換稱整型儲存的一種模型壓縮技術。以可以接受的精度損失換取更少的儲存開銷和頻寬需求，更快的計算速度，更低的能耗與占用面積。

比如int8量化，就是讓原來32bit儲存的數字對映到8bit儲存。int8範圍是[-128,127]， uint8範圍是[0,255]。

模型量化優點：

模型量化缺點：

比如進行int8的量化，資料範圍是[-128,127],最大值最小值分別是xmax, xmin，x_q表示量化後的資料，x_f表示浮點資料。

x_q=x_f/scale +zero

scale=(xmax-xmin)/(127-(-128))=(xmax-xmin)/255

zero=0-round(xmin/scale)或者zero=255-round(xmax/scale)

量化方式分為對稱量化和非對稱量化，其中上面是非對稱量化的方式，如果是對稱量化，則是將原浮點數的範圍由[xmin, xmax]擴充為[-xmax, xmax]，這裡假定 |xmax|>|xmin|。然後按照上面公式轉換量化值。對稱量化對於正負數不均勻分布的情況不夠友好，比如如果浮點數全部是正數，量化後的資料範圍是[128,255], [0，127]的範圍就浪費了，減弱了int8資料的表示範圍。

對稱量化的圖示

非對稱量化的圖示

模型量化對稱量化和非對稱量化

對稱加密和非對稱加密！

對稱加密和非對稱加密！

對稱加密和非對稱加密

模型量化 對稱量化和非對稱量化

對稱加密和非對稱加密！

對稱加密和非對稱加密！

對稱加密和非對稱加密

相關推薦

模型量化對稱量化和非對稱量化