聚類學習KMeans演算法各引數的含義

聚類學習kmeans演算法各引數的含義**

kmeans函式的引數講解

n_clusters:整型，預設值為8，表示生成的聚類數

max_iter:整型，預設值為300，表示執行一次kmeans演算法所需要的最大迭代數

n_init：整型，預設值為10，表示用不同的聚類中心初始化值執行演算法的次數最終解是在intertia意義下選出的最優結果

init:有三個可選：「k-means++」（預設值）,「random」,或者傳遞乙個ndarray向量，下面具體說明：

k-means++用一種特殊的方法選定初始聚類中心，可加速迭代過程的收斂

random隨機從訓練資料中選取初始質心

如果傳遞的是ndarray,則應該形如（n_clusters,n_features）並給出初始質心

precompute_distances:三個可選值，『aute』,『true』,『false』。預計算距離。『auto』：如果樣本數乘以聚類數大於12million的話則不預計算距離；『true』：總是預計算距離；『false』：永遠不預計算距離

tol：float型別，預設值為1e-4，與intertia結合來群頂收斂條件

n_jobs:整型數，指定計算所用的程序數，內部原理是同時進行n_init指定次數的計算。若值為-1，則用所有的cpu進行運算，若值為1，則不進行並行運算。若值小於-1，則用到的cpu數為（n_cpus+1+n_jobs）.

random_state:整型或者numpy.randomstate型別，可選擇。用於初始化質心的生成器（generator）。如果值為乙個整數，則確定乙個seed。此引數預設值為numpy的隨機數生成器。

copy_x：布林值，預設值為true。當我們用precompute_distances時，將資料中心化會得到更準確的結果。此引數值設定為true,則原始資料不會發生改變。若為false，則直接在原始資料上做修改並在函式返回值時將其還原。但是在資料計算過程中由於有對資料均值的加減運算，所以資料返回後，原始資料和計算前可能會有細小差別。

聚類學習KMeans演算法各引數的含義

K Means聚類演算法

聚類演算法 K means

k means聚類演算法

聚類學習KMeans演算法各引數的含義

K Means聚類演算法

聚類演算法 K means

k means聚類演算法

相關推薦