基於不確定性主動學習的基本過程

2021-08-13 00:57:03 字數 644 閱讀 3933

主動學習(active learning):

主動學習也是一種監督學習

與傳統監督學習不同的是,傳統監督學習直接利用外界提供的已標註樣例進行訓練,即訓練集合由已標註樣例構成

而主動學習則主動選擇所需要的樣例,從大量無類別樣例中挑選認為最有價值的樣例進行標註,標註後的樣例加入到訓練集,學習過程同傳統監督學習一樣,都是在有標註的訓練集基礎上生成分類器模型。隨後,主動學習會將模型作為指導,挑選下次的樣例來提高分類器效能。

主動學習的目標是在保證分類器效能前提下使用盡可能少的訓練樣例。合理地選取樣例能夠降低所需的訓練樣本數目

在主動學習的過程中,關鍵是如何從大量的未標註樣例中挑選最有價值的樣例進行標註,一種常用的主動學習的方法是基於不確定性的樣例選擇,策略傾向選擇那些當前分類器最無法確定其類別的樣例進行標註。

選擇演算法從未標註樣例中挑選最有價值的樣例交給專家,進行標註後加入訓練集,這樣可以用盡量少的樣例獲得盡可能高的分類效能

不確定性衡量準則:

樣例挑選過程中,根據基本分類器的不同特點,選擇不同的不確定性評價標準去實

現。在樣例選擇的過程中,還要考慮是否選擇到了孤立點(離群點),孤立點會影響分類器效能。所以在樣例選擇中還需考慮選擇的樣例,與其他未被選擇樣例的距離,或者說以選擇樣例為中心其他樣本密度。

不確定性學習(2)

續上。定義的常量 不確定性很小的一些量,比如 一些物理常量,我們認為他們是確定的,因此為定義的常量。決策變數 決策者可以直接控制的數量,也稱為控制變數或者政策變數。決策變數根據定義沒有真值,其值的確定依賴於決策者。價值引數 代表了決策者以及其代表人群的偏好。價值引數不應該被認為經驗數量 將價值引數的...

重視不確定性

面臨兩種選擇時,多數人認為最重要的是從中選擇,然而設計 無論是軟體設計還是其他設計 並不是這樣的。當你面對兩種可能性時,應該仔細考慮設計中存在的不確定性。不確定性可以促使你推遲決定 譯註1 收集更多的資訊 促使你使用分隔 partition 和抽象 abstract 的方法來降低設計決策的重要性 譯...

不確定性推理

不確定性推理 是指建立在不清楚,不明確的知識和證據基礎上的推理,不完備 不精確的知識推理,模糊知識推理。多種原因導致同一結論。解題方案不唯一,現實生活中的問題有很多解決方案,這些方案之間很難決定誰優誰劣,所以選擇認為較優的方案,就屬於一種不確定性推理。所需知識不完備,不精確。所需知識描述模糊。知識的...