努力成為優秀視覺工程師的一天(四)

2021-10-08 22:43:06 字數 801 閱讀 2394

1. googlenet網路的深度理解

googlenet相比alexnet和vgg網路,最大的改進就是引入了inception模組,為什麼引入呢?根據前面神經網路的經驗,我們需要通過增加網路深度(層數)來提高訓練效果,但缺點是:層數多導致引數多,容易引起過擬合、梯度消失等問題,因此呢,解決上述缺點的根本方法是使用「稀疏連線結構」(為什麼呢?一方面,現實中的生物神經網路連線本身就是稀疏的;另一方面,arora等人證明,對於大規模的稀疏網路,可通過分析前一層啟用值的相關統計資料和對高度相關的輸出神經元聚類來逐層構建最優的網路結構,這種方法可以在不損失效能的前提下降低網路參數量。)----說實話,我覺得這個涉及到的數學知識比較深,要深入的去理解並不容易~

然而,計算機軟硬體對非均勻稀疏資料的計算效率很差,那麼有沒有一種方法既能夠保持網路結構的稀疏性,並且充分利用密集矩陣的高效計算?還真有。大量文獻表明對稀疏矩陣進行聚類為密集矩陣可以提高效能。inception module就是基於這種思想提出來的。

2. inception是什麼?(參考這裡:非常通俗易懂)

inception是把多個卷積或池化操作,放在一起組裝成乙個網路模組,設計神經網路時以模組為單位去組裝整個網路結構。

3. googlenet相比之前的網路有哪些具體的改進?

總之,googlenet v1出現的同期,效能與之接近的大概只有vggnet了,並且二者在影象分類之外的很多領域都得到了成功的應用。但是相比之下,googlenet的計算效率明顯高於vggnet,大約只有500萬引數,只相當於alexnet的1/12(googlenet的caffemodel大約50m,vggnet的caffemodel則要超過600m)。

努力成為優秀視覺工程師的一天(二)

1.經典神經網路alexnet的理解 1 卷積層 池化層 和全連線層的理解 從巨集觀的角度看,如果我們要對一幅影象進行識別,從影象處理 畫素的角度來看,每個物體不同畫素的組成構成了不同的特徵,通過這些特徵來區分物體是什麼 那麼卷積層就是從影象中提取各種特徵,池化層就是為了簡化特徵提取最重要的特徵,這...

努力成為優秀視覺工程師的一天(一)

1.經過rgbd slam的一系列配置之後,重新開啟pytorch的深度學習演算法,在pycharm中在呼叫matplotlib庫的時候遇到了如下問題 大概意思就是說 qt平台有些問題,這個問題乍一看我以為是之前配置qt的時候環境變數修改了一些東西,所以按照網上各種修改環境變數的做法,通通做了一遍,...

努力成為優秀的工程師

華為諾亞方舟實驗室首席科學家李航結合自己的親身經驗,提出了成為優秀工程師應該遵循的五項原則 面對問題,解決問題 系統地解決問題 站在使用者角度看問題 以最小的代價獲得最大的效益 磨在細處。我一直在it企業的研究部門任職,迄今經歷了三家公司 nec 微軟 華為。工作都是既有基礎研究,又有產品開發。其實...