監督學習和非監督學習

重新看一遍ng的機器學習課程，第一次寫讀書筆記，希望能夠堅持下來！

對於監督學習，首先來看乙個例子，如下圖.

圖中的資料來自r語言中的boston資料集，其中lstat軸表示地位較低的人口比重，medv軸表示median value of owner-occupied homes in $1000s。如果有乙個新的lstat值（比如lstat=15），想要對相應的medv值進行**。這時我們可以制定一些方案，比如根據資料擬合出一條直線(下圖紅色)，或者擬合一條二次曲線(下圖藍色)，然後根據所擬合的直線或者曲線找出lstat=15所對應的mdev值作為**。至於哪一種方案更好，我們以後再討論。

類似上面這個例子，我們這樣定義監督學習。

在上面的例子中，輸出變數medv由連續型資料組成，像這樣輸出變數由連續型資料組成的學習問題稱之為回歸問題，如果輸出變數由離散資料組成，如下圖（每個資料對於乙個標籤，綠色三角形表示0），則這個問題稱之為分類問題。對於分類問題，我們希望學習到線性的或者非線性的分類邊界，來很好的區分樣本。

回歸和分類是最常見的監督學習問題。

下面來看一下什麼叫非監督學習。

在監督學習中，每乙個樣本都對應著乙個標籤或者響應值。而在非監督學習中（如下圖），我們沒有沒有標籤沒有相應值沒有其他任何資訊，我們也不知每個資料點代表什麼，只知道他是乙個資料集。

從上圖中我們能夠發現一些規律，通過無監督學習可以將圖中的資料分成如下10個不同的簇，這裡稱之為聚類演算法，聚類演算法在影象分割、基因表達、新聞事件聚類等等有著重要的應用。對於這樣一些事先並不知道「正確答案「，只是通過一些非監督學習來找出資料的內部聯絡、挖掘有用資訊的方法，我們稱之為非監督學習。

非監督演算法很多，應用也非常廣泛，上面提到的聚類演算法只是非監督學習中的一種。

監督學習和非監督學習

監督學習和無監督學習監督學習與非監督學習

監督學習和非監督學習

監督學習，無監督學習和半監督學習

監督學習和非監督學習

監督學習和無監督學習 監督學習與非監督學習

監督學習和非監督學習

監督學習，無監督學習和半監督學習

相關推薦

監督學習和無監督學習監督學習與非監督學習