一種遷移學習和元學習的整合模型

傳統上我們需要很多的訓練資料才能訓練出乙個好的模型。但是在很多任務上，如：自動駕駛，無人機等，我們就需要快速地應對一些未見過的情形。

遷移學習通過在其他資料集上的大量訓練，然後將其訓練出的模型複製到目標任務上，最後在目標任務上通過少量標註資料對模型進行微調。但是這個基於梯度下降的方法在新任務上依然需要很多的標註資料。

元學習則是指一類只關注學習本身的學習演算法。元學習在任務空間進行訓練，而不是在（像遷移學習一樣）例項空間進行訓練。遷移學習在單個任務上進行優化，但是元學習會在任務空間裡取樣多個任務，然後在多個任務上學習。因此元學習模型理所應當的在未知任務上表現地更好。雖然元學習確實在few-shot learning上表現良好，但是當目標任務上可訓練的樣本較多時，元學習的效能就不太好了。比如可能隨著時間的推移，我們積累了越來越多的標註資料，我們當然想要不斷地提高我們的效能啦！但是隨著資料的增多，元學習可能就不work了。還有一種情形是，目標任務的類別太多時，元學習的表現也不太好。

所以作者就想到了要結合元學習和遷移學習之優勢，以彌補各自的不足。

這個模型有兩個損失函式，1)任務專用的-遷移學習（task-specific），記作 l(x

,y)(

θ)l_(\theta)

l(x,y)

(θ)

； 2)任務無關的-元學習(task-agnostic)，記作 lt(

θ)l_t(\theta)

lt(θ)

。這個模型則根據這兩個損失函式更新後的向量的加權和來更新。引數更新方法如下：

本模型的元學習部分使用maml或reptile。

以下是模型的結構。

作者在miniimagenet資料集上做了驗證，結果mtl的表現極好。實驗結果如下：

從實驗來看，mtl在各個任務上都碾壓了遷移學習和元學習的方法，確實是集兩者之所長。考慮到這篇文章這個很玄學的idea，一騎絕塵的實驗結果應該也是這篇文章能發在aaai上的重要原因。

一種遷移學習和元學習的整合模型

一種深度學習方法遷移學習

學習知識的一種思路

PHP學習的一種習慣

一種遷移學習和元學習的整合模型

一種深度學習方法 遷移學習

學習知識的一種思路

PHP學習的一種習慣

相關推薦

一種深度學習方法遷移學習