樣本數量不足時，使用遷移學習

專案背景：

要做行業內文字相似性匹配，但是資料量不足，嘗試了三種方法：

１）載入網上ｄｏｗｎｌｏａｄ的預訓練網路，用少量樣本只訓練最後兩層的少量引數

２）載入網上ｄｏｗｎｌｏａｄ的預訓練網路，用少量樣本對所有網路引數進行微調

3）載入網上ｄｏｗｎｌｏａｄ的預訓練網路，用少量樣本只訓練起始兩層的少量引數

最後取得了不錯的效果

以下內容借鑑　

這幅圖說明了該用哪種遷移學習，讓我們逐個來看。

1）右下角場景，待訓練的資料集較小，已訓練的模型和當前任務相似。此時可以只是重新訓練已有模型的靠近輸出的幾層，例如將imagenet中輸出層原來可以判別一萬種輸出的網路改的只能判別貓的品種，從而利用已有網路來做低層次的特徵提取。

2）左下角場景，待訓練的資料集較小，已訓練的模型和當前任務場景差距較大。例如你有的已訓練網路能識別出白天高速路上的違章車輛，你需要訓練乙個能識別出夜間違章車輛的模型，由於不管白天夜晚，交通規則是沒有變化的，所以你需要將網路靠近輸入的那幾層重新訓練，等到新的網路能夠提取出夜間車輛的基本資訊後，就可以借用已有的，在大資料集下訓練好的神經網路來識別違章車輛，而不用等夜間違章的車輛的**積累的足夠多之後再重新訓練。

3）左上角場景，待訓練的資料集較大，已有的模型和新模型的資料差異度很高。此時應該做的是從頭開始，重新訓練。

4）右上角場景，待訓練的資料集較大，已有模型的訓練資料和現有的訓練資料類似。此時應該使用原網路的結構，並保留每一層的節點權重，再逐層微調。

樣本數量不足時，使用遷移學習

讀取LMDB檔案的樣本數量

如何確定抽樣的樣本數量

機器學習樣本資料集，訓練正負樣本

樣本數量不足時，使用遷移學習

讀取LMDB檔案的樣本數量

如何確定抽樣的樣本數量

機器學習樣本資料集，訓練正負樣本

相關推薦