監督學習和無監督學習 監督學習與非監督學習

2021-10-11 20:30:23 字數 1942 閱讀 7307

監督學習(supervised learning)的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的**。

即:利用訓練資料集學習乙個模型,再用模型對測試樣本集進行**。

例如kaggle上的鐵達尼號比賽。

官方提供旅客資料——資料集1(姓名,年齡,性別,社會經濟階層,是否生存等),要求參賽選手建立乙個**模型來回答「另外418名乘客是否會生存?」

這是乙個典型的監督學習(supervised learning)的例子。因為該訓練資料有輸入物件(姓名,年齡,性別,社會經濟階層等)和預期輸出(是否生存)。

有無預期輸出是監督學習(supervised learning)非監督學習(unsupervised learning)的區別。

我們的任務是根據資料集1建立乙個**模型(model),即學習演算法(learning algorithm)。這個過程稱為「學習(learning)」或「訓練(training)」。

由於我們得到的學得模型只是接近了資料的某種潛在規律,因此被稱為『假設(hypothesis)』。相對應的,潛在規律自身則被稱為『真實(ground-truth)』。學習的目的就在於找到最好的『假設(hypothesis)』。

學習演算法(learning algorithm)對資料集2的每個例項(姓名,年齡,性別,社會,社會經濟階層等)進行判斷——『是否能生存?』。

這是乙個二分類任務(輸出為『生存』或『死亡』兩個維度)。

如果所需結果為『生存』,『半生半死』或『死亡』等多個維度,則為多分類任務

如果所需結果為生存率(0~1),則為回歸任務(輸出結果為連續值)。

分類問題(離散)與回歸問題(連續)等都是監督學習。

分類問題:

回歸問題:

非監督學習(unsupervised learning)為直接對資料進行建模。沒有給定事先標記過的訓練範例,所用的資料沒有屬性或標籤這一概念。事先不知道輸入資料對應的輸出結果是什麼。

自動對輸入的資料進行分類或分群,以尋找資料的模型和規律。

如聚類演算法:

針對資料集,自動找出資料中的結構,從而把資料分成不同的簇。

例如:谷歌新聞利用聚類演算法把不同的主題放在一起。

無監督學習(unsupervised learning)的優點:

由於沒有標準的分類方法,有可能從資料中挖出啟發與亮點。

監督學習,無監督學習和半監督學習

監督學習 supervised learning 無監督學習 unsupervised learning 半監督學習 semi supervised learning 2 概念 監督學習 用一部分已知分類 有標記的樣本來訓練機器後,讓它用學到的特徵,對沒有還分類 無標記的樣本進行分類 貼標籤。一句話...

有監督學習和無監督學習 無監督學習

一.無監督學習包含的演算法 聚類 kmeans聚類演算法 降維 pca 之所以叫無監督學習 是因為模型是從無標籤的資料開始學習,沒有目標值。二.kmeans聚類 1.聚類演算法步驟 定義 將高維資料轉化為低維資料的過程,在此過程中可能會捨棄原有資料,創造新的變數 作用 降低原始資料的維數 複雜度 損...

無監督學習與監督學習

1.無監督和有監督的理解方法有很多,主要可以從以下幾方面來理解 1 無監督與監督學習的區別在於乙個無教學值,乙個有教學值。但是,個人認為他們的區別在於無監督學習一般是採用聚簇等演算法來分類不同樣本。而監督學習一般是利用教學值與實際輸出值產生的誤差,進行誤差反向傳播修改權值來完成網路修正的。但是無監督...