流形學習《機器學習》筆記

流形學習的基本思想是將高維特徵空間中的樣本分佈群「平鋪」至乙個低維空間，同時能儲存原高維空間中樣本點之間的區域性位置相關資訊。原空間中的樣本分佈可能及其扭曲，平鋪之後將更有利於樣本之間的距離度量，其距離將能更好地反映兩個樣本之間的相似性。原空間中相鄰比較近的點可能不是同一類點，而相鄰較遠的點還有可能是同一類，「平鋪」至低維空間後就能解決這一問題。

遍歷每乙個樣本點，計算與k個最臨近點的距離，無視其他點的距離。

使用最短路徑法（dijkstra法或floyd法）計算兩點之間的距離dist(x1,x2)，得到的距離即為低維空間中的兩點距離。

對待新的帶**樣本：根據高維空間的座標作為輸入、低維空間的座標作為輸出，訓練乙個回歸學習器，來將新的樣本點的座標轉換至低維空間中（該方法僅是權宜之計）。

基本思想是在低維空間中保留領域內樣本點的線性關係，即高維空間中有x=w1*x1+w2*x2+w3*x3，在低維空間中也相應的有x=w1*x1+w2*x2+w3*x3。

（其區域性線性關係是一樣的，保持了下來）

向量w通過最小二乘法來求：

低維空間中的新座標也通過最小二乘法來還原，不過尋優參變數又w變成了座標x

其本質為學習出一種新的距離計算方法。

距離計算式為(xi-xj)』m(xi-xj)，其中m為正定陣，如果m為單位對角陣，則該距離計算式為歐氏距離。

演算法的本質是對m的尋優。

流形學習《機器學習》筆記

流形學習（一）

流形學習t SNE，LLE，Isomap

幾種流形學習演算法

流形學習 《機器學習》筆記

流形學習（一）

流形學習t SNE，LLE，Isomap

幾種流形學習演算法

相關推薦

流形學習《機器學習》筆記