Caffe模型除錯中的錯誤總結

2021-08-23 14:31:14 字數 807 閱讀 7766

錯誤:cannot copy param 0 weights from layer '...'; shape mismatch

即model和prototxt定義的模型不一樣。通常是fine-tune時尺寸有了調整,或者改了網路結構想要train時去掉weight引數即可。

錯誤:check failed: error == cudasuccess (2 vs. 0) out of memory

錯誤提示gpu memery不足。首先可以用nvidia-smi來檢查有沒有多餘程式占用了空間

如果沒有可關閉的程式的話,可以在prototxt中把batch_size調小一點。

錯誤:eltwise_layer.cpp:34   check failed: bottom[i]->shape() == bottom[0]->shape()

這個錯誤就是在執行element-wise運算的時候(比如concat),運算元維度不一致。往上追溯錯誤日誌,可以看到相加的兩個元素,根據需要對其維度進行調整。

錯誤:math_functions.cu:79 check failed: error == cudasuccess (77 vs. 0) an illegal memory access was encountered

一開始以為還是batch_size調小點就行,結果調到1都不行。網上查詢了一些資料,發現出現這個錯誤的原因非常多樣,共同的結果就是記憶體訪問出現問題。經過較長時間的debug,將某一層的depthconv換成conv後不再報錯。

caffe使用中的錯誤總結

1 check failed readprotofromtextfile param file,param failed to parse solverparameter file examples mnist lenet solver.prototxt 這是因為在lenet solver.prot...

caffe編譯錯誤總結

問題1 fatal error hdf5.h 沒有那個檔案或目錄 在makefile.config檔案,新增 usr include hdf5 serial 到 include dirs,也就是把下面第一行 改為第二行 include dirs python include usr local in...

在caffe上訓練網路模型總結

這段時間使用遷移學習的方法,使用vgg16模型訓練自己的資料集,現將在訓練過程中遇到的問題記錄下來 1 不改變vgg16模型的網路結構,來訓練自己的資料集。這部分都是照著網上一步一步來,沒有什麼大的問題,就是要特別要注意base lr 學習率的設定 這個設定的不對在訓練過程中會出現不收斂的情況。2 ...