Python 獲取Kmeans聚類結果每一類的資料

2022-01-15 00:22:41 字數 834 閱讀 8900

獲取聚類結果中每一類的資料,該資料型別是dataframe

思路:獲取clf_kmeans的標籤,我這裡是聚三類,標籤就是0,1,2

將label轉成series型別,再篩選出指定標籤的res0,我篩選了1

最後在dataframe裡獲取label為1的資料

import pandas as pd

from sklearn.cluster import kmeans

# 建立模型。n_clusters引數用來設定分類個數,即k值,這裡表示將樣本分為兩類。

clf_kmeans = kmeans(n_clusters=3, max_iter=10

) # 模型訓練。得到**值。

print

"clf_kmeans聚類中心\n

", (clf_kmeans.cluster_centers_)

quantity =pd.series(clf_kmeans.labels_).value_counts()

print

"cluster2聚類數量\n

", (quantity)

#獲取聚類之後每個聚類中心的資料

res0series =pd.series(clf_kmeans.labels_)

res0 = res0series[res0series.values == 1

] print

"類別為1的資料\n

",(df.iloc[res0.index])

另外一種方法,更簡潔

res = dataframe[(clf_kmeans.labels_ == 1)]

python 實現kmeans聚類

程式設計中在做數值相等判斷的時候,直接使用 判斷並不可靠。實際上經過運算後的兩個值 浮點型 並不可能完全一致,可能會因為小數點後的些許差異導致判斷為false。比如 1 print1e 5 1e 6 這肯定是false,但是實際這兩個值可以看作近似相等。在kmeans中判斷是否結束迴圈,就是判斷重新...

Kmeans聚類演算法 python實現

kmeans演算法 k均值演算法需要輸入待聚類的資料和欲聚類的簇數k,主要過程如下 1.隨機生成k個初始點作為質心 2.將資料集中的資料按照距離質心的遠近分到各個簇中 3.將各個簇中的資料求平均值,作為新的質心,重複上一步,直到所有的簇不再改變 import pandas as pd import ...

Python資料建模 K means聚類

k means聚類的python實現方法 介紹 最常用的機器學習聚類演算法,且為典型的基於距離的聚類演算法 k均值 基於原型的 劃分的距離技術,它試圖發現使用者指定個數 k 的簇,以歐式距離作為相似度測度 from sklearn.datasets.samples generator import ...