弱監督學習筆記（一）

對於標籤（真值表）、訓練集收集難度大、收集時間長、收集代價高，且對於此緊急的資料，強監督學習可能趕不上它的更新或緊急程度。

弱監督通常分為三種型別：不完全監督、不確切監督、不準確監督。

指的是訓練資料只有部分是帶有標籤的，同時大量資料是沒有被標註過的。這是最常見的由於標註成本過高而導致無法獲得完全的強監督訊號的情況

流行的學習正規化有主動學習、半監督學習、遷移學習。

主動學習：

它假設未標註資料的真值標籤可以向人類專家查詢，讓專家為估計模型最有價值的資料點打上標籤。在我們只考慮用查詢次數衡量標出成本的情況下，主動學習的目標是在提高查詢效率，在查詢次數盡可能小的情況下，使得訓練出的模型效能最好。

衡量查詢樣本的價值時，有兩個被最廣泛使用的標準：資訊量和代表性。

半監督學習（semi-supervised learning）：

半監督學習是一種在沒有人類專家參與的情況下對未標註資料加以分析、利用的學習正規化。通常，儘管未標註的樣本沒有明確的標籤資訊，但是其資料的分布特徵與已標註樣本的分布往往是相關的，這樣的統計特性對於**模型是十分有用的。

遷移學習（transfer learning）

把乙個領域（源領域，標籤很好獲取，而且大量充足）的訓練好的模型，遷移到另外乙個領域（目標領域，通常標籤很難獲得，而且很少），微調一下可能就使得目標領域能夠取得更好的學習效果。

關注於給定了監督資訊，給定粗顆粒度標籤，但資訊不夠精確的場景。比如我要判斷某個圖是否包含車，我能給這個乙個標籤，但我不能給出有什麼具體特徵判斷這個有車

我可以給標籤，但這個標籤不總是對的。你不能全按照我的標籤來學習。