k 平均演算法

2021-07-27 16:58:31 字數 867 閱讀 3942

k-平均演算法

k-平均演算法源於訊號處理中的一種向量量化方法,現在則更多地作為一種聚類分析方法流行於資料探勘領域。k-平均聚類的目的是:把n個點(可以是樣本的一次觀察或乙個例項)劃分到k個聚類中,使得每個點都屬於離他最近的均值(此即聚類中心)對應的聚類,以之作為聚類的標準。k-平均聚類傾向於在可比較的空間範圍內尋找聚類,期望-最大化技術卻允許聚類有不同的形狀。

給定表示為d的n個例項的資料集(

k是我們事先給定的聚類數,目標函式f也是事先給定的。

該演算法主要分為兩步:

分配(assignment):將每個觀測分配到聚類中,使得組內平方和(wcss)達到最小。因為這一平方和就是平方後的歐氏距離,所以很直觀地把觀測分配到離它最近得均值點即可。(數學上,這意味依照由這些均值點生成的voronoi圖來劃分上述觀測)。

• 更新(update):計算得到上步得到聚類中每一聚類觀測值的圖心,作為新的均值點。

因為算術平均是最小二乘估計,所以這一步同樣減小了目標函式組內平方和(wcss)的值。

因此,該演算法步驟為:

輸入•聚類數k

•表示為d維實數向量(xi∈)的n個例項的資料集

1.隨機從資料集中設定k個例項。 (初始簇手段/中心)

2.將所有其他例項分配給最近的集群中心。

3.計算每個聚類的平均值

4.步驟2和3之間的收斂重複收斂=沒有例項在聚類之間移動

(通常在使用者指定的迭代次數之後)

移動平均演算法

移動平均演算法說明 進行成本計算時,系統自動按照單據業務發生的先後順序進行出庫成本計算,對於入庫業務,系統自動計算結存金額 結存單價,結存數量,結存數量 上一筆結存數量 本次入庫數量 結存金額 上一筆結存金額 本次入庫金額,結存單價 結存金額 結存數量,對於出庫業務,系統自動取當前的結存單價作為出庫...

平均周轉時間各種演算法

1 最高優先順序優先 2 時間片輪轉 時間片為2分鐘 3 fcfs 作業到達順序為c,d,b,e,a 4 短作業優先 分析 本題是乙個關於作業排程演算法的評價的題目。題目給出乙個實際的作業序列,由考生模擬作業的排程與執行過程,並給出對於這個作業序列作業排程演算法的平均周轉時間,從而對比不同排程演算法...

演算法提高 統計平均成績

有4個學生,上4門課,要求輸入全部學生的各門課成績,並分別求出每門課的平均成績。保留2位小數 括號裡是解釋內容,不用輸入輸出。輸入的所有數都為0到100之間 包括端點 的整數 樣例輸入 輸入第1個學生的4門課成績 94 78 87 96 輸入第2個學生的4門課成績 66 87 75 69 輸入第3個...