Python 獲取Kmeans聚類結果每一類的資料

獲取聚類結果中每一類的資料,該資料型別是dataframe

思路：獲取clf_kmeans的標籤，我這裡是聚三類，標籤就是0，1，2

將label轉成series型別，再篩選出指定標籤的res0，我篩選了1

最後在dataframe裡獲取label為1的資料

import pandas as pd
from sklearn.cluster import kmeans
# 建立模型。n_clusters引數用來設定分類個數，即k值，這裡表示將樣本分為兩類。
clf_kmeans = kmeans(n_clusters=3, max_iter=10
) # 模型訓練。得到**值。
print 
"clf_kmeans聚類中心\n
", (clf_kmeans.cluster_centers_)
quantity =pd.series(clf_kmeans.labels_).value_counts()
print 
"cluster2聚類數量\n
", (quantity)
#獲取聚類之後每個聚類中心的資料
res0series =pd.series(clf_kmeans.labels_)
res0 = res0series[res0series.values == 1
] print
"類別為1的資料\n
",(df.iloc[res0.index])

另外一種方法,更簡潔

res = dataframe[(clf_kmeans.labels_ == 1)]

python 實現kmeans聚類

程式設計中在做數值相等判斷的時候，直接使用判斷並不可靠。實際上經過運算後的兩個值浮點型並不可能完全一致，可能會因為小數點後的些許差異導致判斷為false。比如 1 print1e 5 1e 6 這肯定是false,但是實際這兩個值可以看作近似相等。在kmeans中判斷是否結束迴圈，就是判斷重新...

Kmeans聚類演算法 python實現

kmeans演算法 k均值演算法需要輸入待聚類的資料和欲聚類的簇數k，主要過程如下 1.隨機生成k個初始點作為質心 2.將資料集中的資料按照距離質心的遠近分到各個簇中 3.將各個簇中的資料求平均值，作為新的質心，重複上一步，直到所有的簇不再改變 import pandas as pd import ...

Python資料建模 K means聚類

k means聚類的python實現方法介紹最常用的機器學習聚類演算法，且為典型的基於距離的聚類演算法 k均值基於原型的劃分的距離技術，它試圖發現使用者指定個數 k 的簇，以歐式距離作為相似度測度 from sklearn.datasets.samples generator import ...

Python 獲取Kmeans聚類結果每一類的資料

python 實現kmeans聚類

Kmeans聚類演算法 python實現

Python資料建模 K means聚類

相關推薦