OPTICS聚類演算法原理

optics聚類演算法是基於密度的聚類演算法，全稱是ordering points to identify the clustering structure，目標是將空間中的資料按照密度分布進行聚類，其思想和dbscan非常類似，但是和dbscan不同的是，optics演算法可以獲得不同密度的聚類，直接說就是經過optics演算法的處理，理論上可以獲得任意密度的聚類。因為optics演算法輸出的是樣本的乙個有序佇列，從這個佇列裡面可以獲得任意密度的聚類。

optics演算法的基礎有兩點，

乙個是輸入的引數，包括:半徑

ε ，和最少點數mi

npts

。另乙個是相關概念的定義：

核心點的定義，如果乙個點的半徑內包含點的數量不少於最少點數，則該點為核心點，數學描述即 nε

(p)>=mi

npts

在這個基礎上可以引出核心距離的定義，即對於核心點，距離其第mi

npts

th近的點與之的距離co

redi

st(p

)={u

ndif

ed,m

inpt

sthd

ista

ncei

nn(p

),if n(p

)<=mi

npts

else

可達距離，對於核心點p，o到p的可達距離定義為o到p的距離或者p的核心距離，即公式re

achd

ist(

o,p)

={un

dife

d,ma

x(co

redi

st(p

),di

st(o

,p))

,if n(

p)<=mi

npts

else

o到p直接密度可達，即p為核心點，且p到o的距離小於半徑。

optics演算法的難點在於維護核心點的直接可達點的有序列表。演算法的計算過程如下：

給定半徑

ε ，和最少點數mi

npts

，就可以輸出所有的聚類。

計算過程為：

給定結果佇列

OPTICS聚類演算法原理

K Means聚類演算法原理

DBSCAN聚類演算法原理

AP聚類演算法原理

OPTICS聚類演算法原理

K Means聚類演算法原理

DBSCAN聚類演算法原理

AP聚類演算法原理

相關推薦