機器學習深度學習入門訓練中的問題

1.損失函式後面的epoch中出現劇烈的抖動,如下圖所示，說明你的學習率在此時比較高，需要進行學習率的衰減。

2.損失函式在剛開的時候抖動，並且隨著epoch的增加損失函式保持在一定的範圍內，說明你的學習率比較大。

3.損失函式減少的比較緩慢，說明你的學習率比較小。

有關學習率的影響具體如下文的連線所示：

4.遷移學習的具體情況如下：

øcnn feature + classifier；這個比較好理解，通常做法就是在大的資料集（比如imagenet）上訓練出乙個cnn，然後提取最後一層卷積層或者倒數第二層全連線層的輸出作為cnn 特徵，然後直接使用 svm、貝葉斯或softmax等分類器進行分類；

øfine-tuning:將在大資料集上訓練得到的weights作為特定任務（小資料集）的初始化權重，重新訓練該網路（根據需要，修改全連線層輸出）；至於訓練的方式可以是：1.微調所有層2.固定網路前面幾層權重，只微調網路的後面幾層，這樣做有兩個原因：a. 避免因資料量小造成過擬合現象；b.cnn前幾層的特徵中包含更多的一般特徵（比如，邊緣資訊，色彩資訊等），這對許多任務來說是非常有用的，但是cnn後面幾層的特徵學習注重高層特徵，也就是語義特徵，這是針對於資料集而言的，不同的資料集後面幾層學習的語義特徵也是完全不同的；

在進行微調網路並僅訓練網路後幾層的時候，需要指定這幾層的訓練引數，否則會出現損失函式一直減小，準確率先增大後減小，但是在tensorboard上無法正確顯示的情況，具體實現如下（總覺得這種解決方法比較牽強）：

var_list = [v for v in tf.trainable_variables() if v.name.split('/')[0] in train_layers]
train_op = tf.train.adamoptimizer(lr).minimize(loss, var_list=var_list, global_step=global_step)

後來發現，如果微調網路並訓練全部網路層數時，調整好學習率即可解決上面的問題：

var_list = [v for v in tf.trainable_variables()]
train_op = tf.train.adamoptimizer(lr).minimize(loss, var_list=var_list, global_step=global_step)

5.訓練集準確率低於驗證集準確率10%，一開始總覺得是自己**的問題，除錯了好久，訓練集的準確率還是低，最後換了乙個資料集訓練集和準確率才正常，最後經驗證發現是資料集中資料和標籤沒有一一對應好，修改之後即可

6.訓練集的loss先下降後上公升，該類問題的原因有多種，主要的解決辦法如下：

7.驗證集的loss先下降後上公升，可考慮此時模型已經過擬合了

8.改變優化器後，loss一直不收斂，可嘗試使用降低學習率的方法

持續更新中......

機器學習深度學習入門訓練中的問題

機器深度學習入門3000問（龜速持續更新）

機器學習和深度學習入門總結

03 機器學習深度學習該怎樣入門？

機器學習 深度學習入門 訓練中的問題

機器 深度 學習入門3000問（龜速持續更新）

機器學習和深度學習入門總結

03 機器學習 深度學習該怎樣入門？

相關推薦

機器學習深度學習入門訓練中的問題

機器深度學習入門3000問（龜速持續更新）

03 機器學習深度學習該怎樣入門？