馬氏距離與歐式距離

2021-09-24 10:04:32 字數 686 閱讀 6484

1、歐式距離

2、標準歐式距離

3、馬氏距離

4、測試

構造資料,構建乙個長軸為2短軸為1的橢圓

測試兩個點到質心的距離綠色的點x1(1,0)和黃色的點x2(0,0.8),通過計算歐式距離發現x2距離質心更近一些,但是計算馬氏距離和標準歐式距離卻又是x1距離的更近些

很直接的原因就是長軸的方差比較大,還有就是這個例子中x和y還有一點微弱相關性

5、變數之間的相關性對馬氏距離的影響

按照相關係數的大小調整特徵之間的協方差,然後在計算這兩個點到質心之間的馬氏距離得到下圖

x軸為相關係數,y軸為馬氏距離的大小,結果可以看到相關性係數的絕對值越大也就是特徵之間的共線性越強,馬氏距離越大,而特徵之間共線性太強一般不是我們想要看到的,我們希望特徵之間的最好是正交的,所以在進行馬氏距離的計算之前我們最好先進行特徵提取降維,可以用pca或者自編碼,當特徵之間的相關性都為0的時候,馬氏距離則變成標準歐式距離

馬氏距離vs歐式距離

馬氏距離的計算是建立在總體樣本的基礎上的,這一點可以從協方差矩陣的解釋中可以得出,也就是說,如果拿同樣的兩個樣本,放入兩個不同的總體中,最後計算得出的兩個樣本間的馬氏距離通常是不相同的,除非這兩個總體的協方差矩陣碰巧相同 在計算馬氏距離過程中,要求總體樣本數大於樣本的維數,否則得到的總體樣本協方差矩...

歐式距離 標準化歐式距離 馬氏距離 余弦距離

標準化歐氏距離 馬氏距離 夾角余弦距離 漢明距離 曼哈頓 manhattan 距離1,x2x1,x2 間的距離公式 ixi 的各個維度之間的尺度不一樣。對於尺度無關的解釋 如果向量中第一維元素的數量級是100,第二維的數量級是10,比如v1 100,10,30 v2 500,40 則計算歐式距離 2...

協方差 協方差矩陣 馬氏距離與歐式距離的理解

協方差 協方差矩陣 馬氏距離與歐式距離的理解 最近在應用中,總涉及到對馬氏距離的使用,而馬氏距離中最重要的是協方差矩陣的計算,這些概念困擾了我很久,在查閱資料學習了解後,終於有淺顯理解,做了個筆記與大家分享,才疏學淺,若理解有誤歡迎批評指正。一 方差 協方差 協方差矩陣的概念 在統計學中,方差是單個...