關於遷移學習的概述

2021-09-29 08:23:07 字數 593 閱讀 7363

概述背景

傳統的機器學習需要標註大量的資料,而使用過程中不同資料集可能存在一些問題:資料分布差異、標註資料過期、訓練資料過期,也就是好不容易標定的資料要被丟棄,有些應用中資料的分布隨著時間的推移會發生變化。

定義及分類

定義:給定由特徵空間x和邊緣概率分布p(x)組成的源域d-s和學習任務t-s,和同樣由特徵空間和邊緣概率分布組成的目標域d-t和學習任務t-s,遷移學習的目的在於利用源域和源域中的學習任務中的知識來幫助學習在目標域和目標函式的過程。

遷移學習的形式定義及一種分類方式:

遷移學習中兩個非常重要的概念:域和任務。域可以理解為某個時刻的某個特定的領域;任務就是要做的事。

關鍵點

研究可以用哪些知識在不同的領域或者任務中進行遷移學習,即不同領域之間有哪些共有知識可以遷移

研究在找到了遷移物件之後,針對具體問題所採用哪種遷移學習的特定演算法,即如何設計出合適的演算法來提取和遷移共有知識

研究什麼情況下適合遷移,遷移技巧是否適合具體應用,其中涉及到負遷移的問題

(當領域間的概率分布差異很大時,上述的假設通常難以成立,這會導致嚴重的負遷移問題。負遷移是舊知識對新知識的阻礙作用,比如學習漢語拼音對學習英文本母的影響)

遷移學習概述

遷移學習的目標是從乙個或者多個源領域任務中提取有用知識並將其用在新的目標任務上,本質上就是知識的遷移再利用。遷移學習的問題關鍵就是要解決三個問題,什麼時候遷移,什麼可以遷移,如何遷移。遷移學習的本質就是知識的再利用,數學上,遷移學習包含 域 和 任務 兩個因素。關於域的定義如下 關於域上的任務定義,...

關於CoreData遷移

1.在新專案中新增coredata的類庫,並在 prefix.h中加入 import 2.拷貝原專案中的.xcdatamodeld檔案到新專案中,新增檔案選擇coredata下nsmanagedobject subclass,選擇data models版本,勾選實體。如果實體已經存在,要手動的刪除原...

關於卷遷移的整理

最近在學習hp unix,發現hp unix中卷的遷移過程和其它的如linux,aix有些不同,所以抽空將三種作業系統的操作步驟做了個整理 linux 在redhat linux中lvm資訊是同時儲存在磁碟上和 etc lvm.conf裡,可以通過vgexport命令來實現vg的遷移。vgexpor...