Caffe模型除錯中的錯誤總結

錯誤：cannot copy param 0 weights from layer '...'; shape mismatch

即model和prototxt定義的模型不一樣。通常是fine-tune時尺寸有了調整，或者改了網路結構想要train時去掉weight引數即可。

錯誤：check failed: error == cudasuccess (2 vs. 0) out of memory

錯誤提示gpu memery不足。首先可以用nvidia-smi來檢查有沒有多餘程式占用了空間

如果沒有可關閉的程式的話，可以在prototxt中把batch_size調小一點。

錯誤：eltwise_layer.cpp:34 check failed: bottom[i]->shape() == bottom[0]->shape()

這個錯誤就是在執行element-wise運算的時候（比如concat），運算元維度不一致。往上追溯錯誤日誌，可以看到相加的兩個元素，根據需要對其維度進行調整。

錯誤：math_functions.cu:79 check failed: error == cudasuccess (77 vs. 0) an illegal memory access was encountered

一開始以為還是batch_size調小點就行，結果調到1都不行。網上查詢了一些資料，發現出現這個錯誤的原因非常多樣，共同的結果就是記憶體訪問出現問題。經過較長時間的debug，將某一層的depthconv換成conv後不再報錯。

caffe使用中的錯誤總結

1 check failed readprotofromtextfile param file,param failed to parse solverparameter file examples mnist lenet solver.prototxt 這是因為在lenet solver.prot...

caffe編譯錯誤總結

問題1 fatal error hdf5.h 沒有那個檔案或目錄在makefile.config檔案，新增 usr include hdf5 serial 到 include dirs，也就是把下面第一行改為第二行 include dirs python include usr local in...

在caffe上訓練網路模型總結

這段時間使用遷移學習的方法，使用vgg16模型訓練自己的資料集，現將在訓練過程中遇到的問題記錄下來 1 不改變vgg16模型的網路結構，來訓練自己的資料集。這部分都是照著網上一步一步來，沒有什麼大的問題，就是要特別要注意base lr 學習率的設定這個設定的不對在訓練過程中會出現不收斂的情況。2 ...

Caffe模型除錯中的錯誤總結

caffe使用中的錯誤總結

caffe編譯錯誤總結

在caffe上訓練網路模型總結

相關推薦