基本概念監督與非監督

監督學習（supervised learning）的任務是學習乙個模型，使模型能夠對任意給定的輸入，對其相應的輸出做出乙個好的**。即：利用訓練資料集學習乙個模型，再用模型對測試樣本集進行**。例如kaggle上的鐵達尼號比賽。

官方提供旅客資料——資料集1（姓名，年齡，性別，社會經濟階層，是否生存等），要求參賽選手建立乙個**模型來回答「另外418名乘客是否會生存？」這是乙個典型的監督學習（supervised learning）的例子。因為該訓練資料有輸入物件（姓名，年齡，性別，社會經濟階層等）和預期輸出（是否生存）。有無預期輸出是監督學習（supervised learning）與非監督學習（unsupervised learning）的區別。

我們的任務是根據資料集1建立乙個**模型（model），即學習演算法（learning algorithm）。這個過程稱為「學習（learning）」或「訓練（training）」。由於我們得到的學得模型只是接近了資料的某種潛在規律，因此被稱為『假設（hypothesis）』。相對應的，潛在規律自身則被稱為『真實（ground-truth）』。學習的目的就在於找到最好的『假設（hypothesis）』。用學習演算法（learning algorithm）對資料集2的每個例項（姓名，年齡，性別，社會，社會經濟階層等）進行判斷——『是否能生存？』。

這是乙個二分類任務（輸出為『生存』或『死亡』兩個維度）。如果所需結果為『生存』，『半生半死』或『死亡』等多個維度，則為多分類任務。如果所需結果為生存率（0~1），則為回歸任務（輸出結果為連續值）。

分類問題（離散）與回歸問題（連續）等都是監督學習。

分類問題：

回歸問題：

非監督學習（unsupervised learning）為直接對資料進行建模。沒有給定事先標記過的訓練範例，所用的資料沒有屬性或標籤這一概念。事先不知道輸入資料對應的輸出結果是什麼。自動對輸入的資料進行分類或分群，以尋找資料的模型和規律。如聚類演算法：針對資料集，自動找出資料中的結構，從而把資料分成不同的簇。例如：谷歌新聞利用聚類演算法把不同的主題放在一起。

無監督學習（unsupervised learning）的優點：由於沒有標準的分類方法，有可能從資料中挖出啟發與亮點。

基本概念監督與非監督

資料監督與非監督

機器學習基本概念有監督學習和無監督學習

監督學習和無監督學習監督學習與非監督學習

基本概念 監督與非監督

資料監督與非監督

機器學習基本概念 有監督學習和無監督學習

監督學習和無監督學習 監督學習與非監督學習

相關推薦

基本概念監督與非監督

機器學習基本概念有監督學習和無監督學習

監督學習和無監督學習監督學習與非監督學習