在caffe上訓練網路模型總結

這段時間使用遷移學習的方法，使用vgg16模型訓練自己的資料集，現將在訓練過程中遇到的問題記錄下來：

1、不改變vgg16模型的網路結構，來訓練自己的資料集。這部分都是照著網上一步一步來，沒有什麼大的問題，就是要特別要注意base_lr（學習率的設定），這個設定的不對在訓練過程中會出現不收斂的情況。

2、改變vgg16模型，來訓練自己的資料集。這個時候可以使用遷移學習也可以不使用遷移學習，使用不適用遷移學習主要是在vgg_train.bat中是否有--weights=c:/caffe/caffe-master/examples/vggface/vgg_face.caffemodel此行**。這部分我依然使用的是遷移學習的方法，這個時候一定明白在訓練的過程中你的訓練次數時候足夠，我用的是小樣本進行訓練，總共是200張**一共40個人，batch_size設定為3，max_iter最大迭代次數為600，訓練後準確率一直很低而且loss值一直下不去。之後看了一些文章和問問同學後發現是我的batch_size設定的太小，這就相當於我只訓練個1800張**這是遠遠不夠的。

關於batch_size的介紹可以看看這篇文章：

在caffe上訓練網路模型總結

caffe模型訓練小技巧

caffe模型訓練batch size設定

caffe網路模型配置說明

在caffe上訓練網路模型總結

caffe模型訓練小技巧

caffe模型訓練batch size設定

caffe網路模型配置說明

相關推薦