在caffe上訓練網路模型總結

2021-08-21 18:51:33 字數 541 閱讀 8517

這段時間使用遷移學習的方法,使用vgg16模型訓練自己的資料集,現將在訓練過程中遇到的問題記錄下來:

1、不改變vgg16模型的網路結構,來訓練自己的資料集。這部分都是照著網上一步一步來,沒有什麼大的問題,就是要特別要注意base_lr(學習率的設定),這個設定的不對在訓練過程中會出現不收斂的情況。

2、改變vgg16模型,來訓練自己的資料集。這個時候可以使用遷移學習也可以不使用遷移學習,使用不適用遷移學習主要是在vgg_train.bat中是否有--weights=c:/caffe/caffe-master/examples/vggface/vgg_face.caffemodel此行**。這部分我依然使用的是遷移學習的方法,這個時候一定明白在訓練的過程中你的訓練次數時候足夠,我用的是小樣本進行訓練,總共是200張**一共40個人,batch_size設定為3,max_iter最大迭代次數為600,訓練後準確率一直很低而且loss值一直下不去。之後看了一些文章和問問同學後發現是我的batch_size設定的太小,這就相當於我只訓練個1800張**這是遠遠不夠的。

關於batch_size的介紹可以看看這篇文章:

caffe模型訓練小技巧

一 學習率調整 乙個對於排程學習率的建議 如果在驗證集上效能不再增加就讓學習率除以2或者5,然後繼續,學習率會一直變得很小,到最後就可以停止訓練了 二 finetun微調 finetune的過程相當於繼續訓練,跟直接訓練的區別是初始化的時候 a.直接訓練是按照網路定義指定的方式初始化 如高斯隨機初始...

caffe模型訓練batch size設定

batch size 批尺寸 是機器學習中乙個重要引數,涉及諸多矛盾,下面逐一展開。batch 的選擇,首先決定的是下降的方向。如果資料集比較小,完全可以採用全資料集 full batch learning 的形式,這樣做至少有 2 個好處 其一,由全資料集確定的方向能夠更好地代表樣本總體,從而更準...

caffe網路模型配置說明

參考 caffe模型需要兩個最重要的引數檔案 網路模型和引數模型,分別是 prototxt和 solver.prototxt檔案。本節介紹網路模型引數檔案說明,引數模型檔案說明參考 caffe引數模型配置說明 layer transform param data param name 表示該層的名稱...