聚類方法學習(二)KMeans演算法與案例

2021-10-22 19:55:36 字數 856 閱讀 9571

kmeans直觀感受就是自動畫圈,通過畫圈自動聚類

優點:收斂速度快

需要的引數少

缺點:k值的選擇較難

初始點的隨機種子對結果影響很大

對異常值敏感

可能只能得到區域性的最優解,而無法得到全域性的最優解

import numpy as np

import matplotlib.pyplot as plt

from sklearn.cluster import kmeans

from sklearn.preprocessing import standardscaler

x = np.random.random(

(100,4

))x = standardscaler(

).fit_transform(x)

plt.scatter(x[:,

0], x[:,

1], marker=

'.', edgecolors=

'white'

)plt.show(

)k_means = kmeans(n_clusters=

5, n_init=12)

k_means.fit(x)

k_means_labels = k_means.labels_

print

(k_means_labels)

# 聚類後的標籤

k_means_cluster_centers = k_means.cluster_centers_

print

(k_means_cluster_centers)

# 聚類中心的座標

sklearn api:

聚類演算法學習

聚類是一種非監督學習方法 在乙個典型的監督學習中,我們有乙個有標籤的訓練集,我們的目標是找到能夠區分正 樣本和負樣本的決策邊界,在這裡的監督學習中,我們有一系列標籤,我們需要據此擬合一 個假設函式。與此不同的是,在非監督學習中,我們的資料沒有附帶任何標籤,我們拿到的 資料就是這樣的 在這裡我們有一系...

K Means聚類演算法

k means聚類演算法 intergret kmeans演算法的基本思想是初始隨機給定k個簇中心,按照最鄰近原則把待分類樣本點分到各個簇。然後按平均法重新計算各個簇的質心,從而確定新的簇心。一直迭代,直到簇心的移動距離小於某個給定的值。k means聚類演算法主要分為三個步驟 1 第一步是為待聚類...

聚類演算法 K means

演算法接受引數 k 然後將事先輸入的n個資料物件劃分為 k個聚類以便使得所獲得的聚類滿足 同一聚類中的物件相似度較高 而不同聚類中的物件相似度較小。聚類相似度是利用各聚類中物件的均值所獲得乙個 中心物件 引力中心 來進行計算的。k means演算法是最為經典的基於劃分的聚類方法,是十大經典資料探勘演...