Mahout 中 kmeans的引數

2021-08-14 08:51:47 字數 553 閱讀 1457

distancemeasure measure :資料點間的距離計算方法,引數可缺,預設是 squaredeuclidean 算方法

提供引數值:   

chebyshevdistancemeasure 切比雪夫距離

cosinedistancemeasure 余弦距離

euclideandistancemeasure 歐氏距離

mahalanobisdistancemeasure 馬氏距離

manhattandistancemeasure 曼哈頓距離

minkowskidistancemeasure 閔可夫斯基距離

squaredeuclideandistancemeasure 歐氏距離 ( 不採取平方根 )

tanimotodistancemeasure  tanimoto 係數距離

還有一些基於權重的距離計算方法:

weighteddistancemeasure

weightedeuclideandistancemeasure

weightedmanhattandistancemeasure

mahout中的kmeans簡單例項

在mahout in action這本書中,有個kmeans的簡單例項,可書中只給了源 而並沒有指出要匯入哪些包才能正確執行 這本書在內容開始提到書中所有 都是基於mahout0.4版本的,可是我發現這個kmeans的例子,卻是基於mahout0.3的,有幾個函式0.4版中是沒有的 我不知道是不是因...

mahout使用KMeans演算法

mahout提供了記憶體中和分布式的兩種kmeans聚類實現。下面是記憶體中kmeans的 示例,示例 使用了最簡單的一維向量作為輸入 tests kmeans cluster algorithm in memory,note the test uses only 1 d vector i.e.a ...

mahout之聚類演算法 KMeans分析

一,k means聚類演算法原理 k means 演算法接受引數 k 然後將事先輸入的n個資料物件劃分為 k個聚類以便使得所獲得的聚類滿足 同一聚類中的物件相似度較高 而不同聚類中的物件相似度較小。聚類相似度是利用各聚類中物件的均值所獲得乙個 中心物件 引力中心 來進行計算的。k means演算法是...