監督學習和非監督學習

2021-07-04 08:08:55 字數 1201 閱讀 2163

重新看一遍ng的機器學習課程,第一次寫讀書筆記,希望能夠堅持下來!

對於監督學習,首先來看乙個例子,如下圖.

圖中的資料來自r語言中的boston資料集,其中lstat軸表示地位較低的人口比重,medv軸表示median value of owner-occupied homes in $1000s。如果有乙個新的lstat值(比如lstat=15),想要對相應的medv值進行**。這時我們可以制定一些方案,比如根據資料擬合出一條直線(下圖紅色),或者擬合一條二次曲線(下圖藍色),然後根據所擬合的直線或者曲線找出lstat=15所對應的mdev值作為**。至於哪一種方案更好,我們以後再討論。

類似上面這個例子,我們這樣定義監督學習。

在上面的例子中,輸出變數medv由連續型資料組成,像這樣輸出變數由連續型資料組成的學習問題稱之為回歸問題,如果輸出變數由離散資料組成,如下圖(每個資料對於乙個標籤,綠色三角形表示0),則這個問題稱之為分類問題。對於分類問題,我們希望學習到線性的或者非線性的分類邊界,來很好的區分樣本。

回歸和分類是最常見的監督學習問題。

下面來看一下什麼叫非監督學習。

在監督學習中,每乙個樣本都對應著乙個標籤或者響應值。而在非監督學習中(如下圖),我們沒有沒有標籤沒有相應值沒有其他任何資訊,我們也不知每個資料點代表什麼,只知道他是乙個資料集。

從上圖中我們能夠發現一些規律,通過無監督學習可以將圖中的資料分成如下10個不同的簇,這裡稱之為聚類演算法,聚類演算法在影象分割、基因表達、新聞事件聚類等等有著重要的應用。對於這樣一些事先並不知道「正確答案「,只是通過一些非監督學習來找出資料的內部聯絡、挖掘有用資訊的方法,我們稱之為非監督學習。

非監督演算法很多,應用也非常廣泛,上面提到的聚類演算法只是非監督學習中的一種。

監督學習和無監督學習 監督學習與非監督學習

監督學習 supervised learning 的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的 即 利用訓練資料集學習乙個模型,再用模型對測試樣本集進行 例如kaggle上的鐵達尼號比賽。官方提供旅客資料 資料集1 姓名,年齡,性別,社會經濟階層,是否生存等 要求參賽...

監督學習和非監督學習

監督學習 監督學習就是分類,把人們已經處理好的訓練樣本 即已知資料和對應輸出 給計算機,計算機通過規律訓練出乙個最佳模型,再用這個模型對輸入的資料進行分類,得出對應的輸出。從而使計算機具有對未知資料進行分類的功能。特點 目標明確 需要帶標籤的訓練樣本 分類效果很容易評估 非監督學習 非監督學習沒有訓...

監督學習,無監督學習和半監督學習

監督學習 supervised learning 無監督學習 unsupervised learning 半監督學習 semi supervised learning 2 概念 監督學習 用一部分已知分類 有標記的樣本來訓練機器後,讓它用學到的特徵,對沒有還分類 無標記的樣本進行分類 貼標籤。一句話...