VGG 網路結構

2021-09-18 04:03:22 字數 1147 閱讀 2557

從圖中可以看出vgg結構由5層卷積層、3層全連線層、softmax輸出層構成,層與層之間使用max-pooling(最大池化)分開,所有隱層的啟用單元都採用relu函式。vgg最大的貢獻就是證明了卷積神經網路的深度增加和小卷積核的使用對網路的最終分類識別效果有很大的作用。

卷積層部分尺度沒有變化(3*3的卷積核,stride為1,padding為1),只有通過max pooling層時尺度縮小一倍(2*2,stride為2)。

作者認為兩個3x3的卷積堆疊獲得的感受野大小,相當乙個5x5的卷積;而3個3x3卷積的堆疊獲取到的感受野相當於乙個7x7的卷積。這樣可以增加非線性對映,也能很好地減少引數(例如7x7的引數為49個,而3個3x3的引數為27)。

vgg11-vgg19結構圖

以網路結構d(vgg16)為例,介紹其各層的處理過程如下:

1、輸入224x224x3的,經64個3x3的卷積核作兩次卷積+relu,卷積後的尺寸變為224x224x64

2、作max pooling(最大化池化),池化單元尺寸為2x2(效果為影象尺寸減半),池化後的尺寸變為112x112x64

3、經128個3x3的卷積核作兩次卷積+relu,尺寸變為112x112x128

4、作2x2的max pooling池化,尺寸變為56x56x128

5、經256個3x3的卷積核作三次卷積+relu,尺寸變為56x56x256

6、作2x2的max pooling池化,尺寸變為28x28x256

7、經512個3x3的卷積核作三次卷積+relu,尺寸變為28x28x512

8、作2x2的max pooling池化,尺寸變為14x14x512

9、經512個3x3的卷積核作三次卷積+relu,尺寸變為14x14x512

10、作2x2的max pooling池化,尺寸變為7x7x512

11、與兩層1x1x4096,一層1x1x1000進行全連線+relu(共三層)

12、通過softmax輸出1000個**結果

VGG16網路結構

vgg 訓練資料處理過程 let s be the smallest side of an isotropically rescaled training image.各向同性的縮放訓練影象的最小邊 以s 256為例 1.將進行等比例縮放,最小邊長度為256 2.對等比例比變化後的影象隨機擷取224...

VGG網路結構詳解與模型的搭建

2.使用pytorch搭建vgg並訓練 3.使用tensorflow搭建vgg並訓練 vgg網路是在2014年由牛津大學著名研究組vgg visual geometry group 提出,斬獲該年imagenet競賽中 localization task 定位任務 第一名 和 classificat...

VGG 16網路結構詳解

vgg,又叫vgg 16,顧名思義就是有16層,包括13個卷積層和3個全連線層,是由visual geometry group組的simonyan和zisserman在文獻 very deep convolutional networks for large scale image recognit...