TVM優化原理學習

tvm對於神經網路的優化主要有兩部分，計算圖優化和運算元優化，下面分開說明。

計算圖優化

例如運算元融合，常量傳播等。這一步是在ir層面完成，現在tvm是使用relay ir來描述計算圖。優化的過程蘊含在relay.build中，參考

op運算元優化

對於乙個給定的計算問題，該如何對映到後端硬體上呢？tvm的方案是張量表示式，schedule + auto-tuning。對於乙個給定的計算，會有很多種實現方式，每一種實現方式稱為乙個schedule。例如gemm計算中，矩陣的分塊大小，資料預取步長等等。我們要做的就是在所有schedule中，找到效能表現最好的schedule。

這裡就有很多問題，比如給定的計算問題該怎麼描述呢？對應的解決是tvm的張量表示式，可以更好的體現計算的資料特性。

再比如該如何確定出不同的schedule呢？

再比如，乙個很重要的問題是，可能有billion量級的schedule，每個schedule都嘗試的話，用時肯定是不可接受的。所以就有了autotvm這樣基於machine learning的搜尋方式，可能使用gbdt來進行決策，減小搜尋空間。

TVM優化原理學習

Traceroute原理學習

Spring原理學習

Mysql 原理學習

TVM優化原理學習

Traceroute原理學習

Spring原理學習

Mysql 原理學習

相關推薦