努力成為優秀視覺工程師的一天（四）

1. googlenet網路的深度理解

googlenet相比alexnet和vgg網路，最大的改進就是引入了inception模組，為什麼引入呢？根據前面神經網路的經驗，我們需要通過增加網路深度（層數）來提高訓練效果，但缺點是：層數多導致引數多，容易引起過擬合、梯度消失等問題，因此呢，解決上述缺點的根本方法是使用「稀疏連線結構」（為什麼呢？一方面，現實中的生物神經網路連線本身就是稀疏的；另一方面，arora等人證明，對於大規模的稀疏網路，可通過分析前一層啟用值的相關統計資料和對高度相關的輸出神經元聚類來逐層構建最優的網路結構，這種方法可以在不損失效能的前提下降低網路參數量。）----說實話，我覺得這個涉及到的數學知識比較深，要深入的去理解並不容易~

然而，計算機軟硬體對非均勻稀疏資料的計算效率很差，那麼有沒有一種方法既能夠保持網路結構的稀疏性，並且充分利用密集矩陣的高效計算？還真有。大量文獻表明對稀疏矩陣進行聚類為密集矩陣可以提高效能。inception module就是基於這種思想提出來的。

2. inception是什麼？（參考這裡：非常通俗易懂）

inception是把多個卷積或池化操作，放在一起組裝成乙個網路模組，設計神經網路時以模組為單位去組裝整個網路結構。

3. googlenet相比之前的網路有哪些具體的改進？

總之，googlenet v1出現的同期，效能與之接近的大概只有vggnet了，並且二者在影象分類之外的很多領域都得到了成功的應用。但是相比之下，googlenet的計算效率明顯高於vggnet，大約只有500萬引數，只相當於alexnet的1/12(googlenet的caffemodel大約50m，vggnet的caffemodel則要超過600m)。

努力成為優秀視覺工程師的一天（四）

努力成為優秀視覺工程師的一天（二）

努力成為優秀視覺工程師的一天（一）

努力成為優秀的工程師

努力成為優秀視覺工程師的一天（四）

努力成為優秀視覺工程師的一天（二）

努力成為優秀視覺工程師的一天（一）

努力成為優秀的工程師

相關推薦