遷移學習概述

2021-07-25 02:58:49 字數 897 閱讀 9990

遷移學習的目標是從乙個或者多個源領域任務中提取有用知識並將其用在新的目標任務上,本質上就是知識的遷移再利用。遷移學習的問題關鍵就是要解決三個問題,什麼時候遷移,什麼可以遷移,如何遷移。遷移學習的本質就是知識的再利用,數學上,遷移學習包含「域」和「任務」兩個因素。

關於域的定義如下:

關於域上的任務定義,主要包含兩個因素,標籤空間以及函式f

遷移學習的定義:

按照遷移學習的定義,可以將遷移學習分為三種型別,分布差異遷移學習,特徵差異遷移學習和變遷差異遷移學習。分布差異遷移學習之源域和目標域資料的邊緣分布或者條件概率分布不同,特徵差異遷移學習之源域資料和目標資料特徵空間不同,標籤差異遷移學習指源域和目標域的資料標記空間不同。

用香蕉和蘋果分類問題為例,源域資料是已有的帶標籤香蕉和蘋果的文字資料,目標域是新來的不帶標記的香蕉和蘋果的文字資料,源域和目標域的資料來自不同的時間,不同地點,資料分布不同,但標記空間和特徵空間是相同的,利用源域中的資料來進行目標域的學習問題就是屬於分布差異遷移學習問題。

源域資料是帶有標記的蘋果和香蕉的文字資料,而目標域是不帶有 標記的蘋果和香蕉的資料,源域和目標域乙個是文字,乙個是影象,屬於特徵差異遷移學習範圍。

源域資料是帶有標記的香蕉和蘋果的文字資料,屬於二分類問題,目標域是不帶標記的梨子,橘子和橙子的文字資料

屬於三分類問題,源域和目標域的資料標記空間不同,屬於標記差異遷移學習的範圍。

關於遷移學習的概述

概述背景 傳統的機器學習需要標註大量的資料,而使用過程中不同資料集可能存在一些問題 資料分布差異 標註資料過期 訓練資料過期,也就是好不容易標定的資料要被丟棄,有些應用中資料的分布隨著時間的推移會發生變化。定義及分類 定義 給定由特徵空間x和邊緣概率分布p x 組成的源域d s和學習任務t s,和同...

遷移學習 自我學習

最近在看ng的深度學習教程,看到self taught learning的時候,對一些概念感到很陌生。作為還清技術債的乙個環節,用半個下午的時間簡單搜了下幾個名詞,以後如果會用到的話再深入去看。監督學習在前一篇部落格中討論過了,這裡主要介紹下遷移學習 自我學習。因為監督學習需要大量訓練樣本為前提,同...

深度學習 遷移學習

遷移學習 把公共的資料集的知識遷移到自己的問題上,即將已經訓練好的模型的一部分知識 網路結構 直接應用到另乙個類似模型中去 小資料集 利用遷移學習,應用其他研究者建立的模型和引數,用少量的資料僅訓練最後自定義的softmax網路。從而能夠在小資料集上達到很好的效果。例如 imagenet 資料集,它...