無監督學習概論

2021-10-04 19:43:14 字數 1242 閱讀 2169

3. 機器學習三要素

4. 無監督學習方法

機器學習或統計學習一般包括監督學習、無監督學習、強化學習

無監督學習:從無標註資料中學習模型的機器學習問題

聚類是將樣本集合中相似的樣本(例項)分配到相同的類,不相似的樣本分配到不同的類。

降維是將樣本集合中的樣本(例項)從高維空間轉換到低維空間。降維可以幫助發現資料中隱藏的橫向結構

假設樣本 原本存在於低維空間,或近似地存在於低維空間,通過降維可以更好地表示樣本資料的結構,更好地表示樣本之間的關係

假設訓練資料由乙個概率模型生成,同時利用訓練資料學習概率模型的結構和引數

同監督學習一樣,無監督學習也有三要素:模型、策略、演算法

模型就是函式 z=g

θ(x)

z=g_\theta(x)

z=gθ​(

x),條件概率分布 pθ(

z∣x)

p_\theta(z |x)

pθ​(z∣

x),或 pθ(

x∣z)

p_\theta(x|z)

pθ​(x∣

z),在聚類、降維、概率模型估計中擁有不同的形式

策略在不同的問題中有不同的形式,但都可以表示為目標函式的優化

演算法通常是迭代演算法,通過迭代達到目標函式的最優化,比如,梯度下降法。

聚類主要用於資料分析,也可以用於監督學習的前處理

降維主要用於資料分析,也可以用於監督學習的前處理

話題分析是文字分析的一種技術

圖分析 的目的發掘隱藏在圖中的統計規律或潛在結構

有監督學習和無監督學習 無監督學習

一.無監督學習包含的演算法 聚類 kmeans聚類演算法 降維 pca 之所以叫無監督學習 是因為模型是從無標籤的資料開始學習,沒有目標值。二.kmeans聚類 1.聚類演算法步驟 定義 將高維資料轉化為低維資料的過程,在此過程中可能會捨棄原有資料,創造新的變數 作用 降低原始資料的維數 複雜度 損...

無監督學習與監督學習

1.無監督和有監督的理解方法有很多,主要可以從以下幾方面來理解 1 無監督與監督學習的區別在於乙個無教學值,乙個有教學值。但是,個人認為他們的區別在於無監督學習一般是採用聚簇等演算法來分類不同樣本。而監督學習一般是利用教學值與實際輸出值產生的誤差,進行誤差反向傳播修改權值來完成網路修正的。但是無監督...

監督學習和無監督學習

機器學習要解決的第一類問題是分類問題。機器學習的另一項任務是回歸,它主要用於 數值型資料。大多數人可能都見過回歸的例子 資料擬合曲線 通過給定資料點的最優擬合曲線。分類和回歸都屬於監督學習,之所以稱之為監督學習,是因為這類演算法必須知道 什麼,即目標變數的分類資訊。與監督學習對應的是無監督學習,此時...