無監督學習距離度量

距離度量(distance measure)函式dist(∙,∙)滿足的一般性質：

非負性：dist(xi,xj

)≥0；

同一性：dist(xi,xj)=0，當且僅當xi=xj；

對稱性：dist(xi,xj)

=dist(xj,xi), ；

直遞性：dist(xi,xj)

≤dist(xi,xk)

+dist(xk,xj), .

常用的距離度量方法是閔可夫斯基距離(minkowski distance)距離度量法，一般表示為：

式中p≥0,p=2即為歐式距離（euclidean distance），p=1時即為曼哈頓距離（manhattan distance）。通常情況下，樣本屬性可分為「有序屬性」（ordinal attribute）和「無序屬性」（non-ordinal attribute），「有序屬性」的屬性值之間的距離具有一定的連續屬性，能夠直接在屬性值上計算距離，因此，從一定意義上來講，閔可夫斯基距離通常用於有序屬性。而無序屬性可用vdm（value difference metric）[stanfill and waltz, 1986]，其表示為：

式中，當樣本中不同屬性的重要性不同時，可以使用「加權距離」（weight distance），以加權「閔可夫斯基距離」(minkowski distance)為例:

其中權重

參考自周志華《機器學習》

無監督學習距離度量

有監督學習和無監督學習無監督學習

無監督學習與監督學習

監督學習和無監督學習

無監督學習 距離度量

有監督學習和無監督學習 無監督學習

無監督學習與監督學習

監督學習和無監督學習

相關推薦

無監督學習距離度量

有監督學習和無監督學習無監督學習