機器學習中的監督學習與無監督學習

在機器學習的領域，有兩類主要的任務：監督學習與無監督學習。這兩種方法上的區別在於，監督學習是使用真實的標籤來完成的，但是在無監督中，卻不存在這樣的標籤。因為這樣的特性，監督學習的目標是學習乙個函式，在已知該樣本資料與輸出值的情況下，盡最大的可能去擬合輸入與輸出的關係,無監督學習一般是推斷一組資料的內部結構.

監督學習中有兩大主要的任務，即分類任務與回歸任務.

下圖形象的展示了什麼是分類，什麼是回歸問題

進行監督學習時，有的一些問題需要綜合考慮模型複雜度。

模型的複雜程度取決於訓練資料的性質，這時需要根據具體問題具體的分析，比如我們需要在兩個點之間擬合一條曲線，從理論上來說，我們可以使用任意的複雜的函式曲線進行擬合，但是這樣往往會導致過擬合，因為一般的情況下，我們僅僅會考慮一條直線來擬合兩個點之間的直線。

無監督學習

無監督學習最常見的就是聚類任務、表示學習、密度估計。在這些任務中，我們希望不提供任何的標籤的情況下，了解資料的內在結構。最常用的就是聚類，由於沒有提供標籤，因此大多數無監督的學習方法中沒有具體的方法去比較模型之間的效能.

無監督學習的兩種常見的用法是探索性分析與降維.

無監督學習在探索性分析的任務中很有用，我曾經在資料探勘中，就用到了關於無監督的聚類的問題，其問題的背景就是根據**在某乙個區域的流動範圍，讓我們去估計這乙個地帶的特徵，當時記得用到的就是無監督學習中的層次聚類,因為資料是非常多的，並且有時候收集到的資料有不同的屬性，因此單憑我們去分析，很難能夠發現資料之間的聯絡，但是如果我們使用聚類的演算法思想，我們就可在資料趨勢不明朗的情況下，具體的將我們的資料分為幾個不同的型別，為我們進一步的分析作為指引，（因為在有的資料探勘實現中，我們需要提前知道該樣本的具體分成了幾個類別，將我們的類別數目作為引數傳入到我們的函式中，因此需要聚類的方式先對資料進行分析）

降維指的是使用比較少的特徵表示資料的一種方式,這一問題可以使用無監督的方法來完成，在表示學習中，我們希望了解各個特徵間的關係，使得我們可以用初始特徵間的潛在特徵來表示資料，這種稀疏的潛在特徵通常比原始特徵的維度要低，因此可以使資料特徵變得更加稠密，並且可以消除冗餘.(說了這麼多廢話，主要就是當我們要降維時，要考慮到利用無監督的學習方式去操作)

機器學習中的監督學習與無監督學習

無監督學習與監督學習

監督學習與無監督學習

無監督學習與監督學習

機器學習中的監督學習與無監督學習

無監督學習與監督學習

監督學習與無監督學習

無監督學習與監督學習

相關推薦