遷移學習概述

遷移學習的目標是從乙個或者多個源領域任務中提取有用知識並將其用在新的目標任務上，本質上就是知識的遷移再利用。遷移學習的問題關鍵就是要解決三個問題，什麼時候遷移，什麼可以遷移，如何遷移。遷移學習的本質就是知識的再利用，數學上，遷移學習包含「域」和「任務」兩個因素。

關於域的定義如下：

關於域上的任務定義，主要包含兩個因素，標籤空間以及函式f

遷移學習的定義：

按照遷移學習的定義，可以將遷移學習分為三種型別，分布差異遷移學習，特徵差異遷移學習和變遷差異遷移學習。分布差異遷移學習之源域和目標域資料的邊緣分布或者條件概率分布不同，特徵差異遷移學習之源域資料和目標資料特徵空間不同，標籤差異遷移學習指源域和目標域的資料標記空間不同。

用香蕉和蘋果分類問題為例，源域資料是已有的帶標籤香蕉和蘋果的文字資料，目標域是新來的不帶標記的香蕉和蘋果的文字資料，源域和目標域的資料來自不同的時間，不同地點，資料分布不同，但標記空間和特徵空間是相同的，利用源域中的資料來進行目標域的學習問題就是屬於分布差異遷移學習問題。

源域資料是帶有標記的蘋果和香蕉的文字資料，而目標域是不帶有標記的蘋果和香蕉的資料，源域和目標域乙個是文字，乙個是影象，屬於特徵差異遷移學習範圍。

源域資料是帶有標記的香蕉和蘋果的文字資料，屬於二分類問題，目標域是不帶標記的梨子，橘子和橙子的文字資料

屬於三分類問題，源域和目標域的資料標記空間不同，屬於標記差異遷移學習的範圍。