機器學習實戰 第十章 K mean聚類

2021-07-03 13:24:20 字數 404 閱讀 2983

本系列目的在於總結每乙個分類器的特點(優點、缺點、使用資料型別、使用時的注意事項等)。相關**自己搜。

python:建議使用2.7

python常用函式庫:numpy、scikit-learn等

python整合環境:anaconda

畢業季,玩了20天。

優點:1、程式設計容易實現。

缺點:1、區域性最小值,大量資料收斂慢。

使用資料型別:

1、數值型

使用時注意事項:

0、沒什麼好講。有個二分k-mean,就是劃分乙個簇為兩個簇,是所有點距中心距離的平方差和最小。不過也沒用(貌似通過相似度聚類的方法都不是很好;還有一種類似於topic model的產生概率模型聚類法,相對來說比較好用,詳情參考coursera上的text analysis課程)。

第十章 函式

使用def關鍵字 定義個數可變的位置形參 定義個數可變的關鍵字形參 定義預設值引數 定義個數可變的位置形參 deffun1 args 結果為乙個元組 print args fun1 10,20,30 10,20,30 定義個數可變的關鍵字形參 deffun2 args 結果為乙個字典 print a...

第十章 屬性

z屬性 本章也比較簡單稍作介紹 無參屬性就是我們常見的屬性 可以封裝屬性 以執行緒安全方式訪問 有參屬性就是c 中的所引器 匿名型別 如圖遇到如下 具體點就是 上面的注釋也已經講清楚了,定義的型別之後,構造例項,然後初始化屬性。現在詳細說下 編譯器接收到 上圖 先用var 定義乙個型別,但是不具體指...

第十章 屬性

目錄 10.1 無參屬性 10.2 有參屬性 10.3 呼叫屬性訪問器方法時的效能 10.4 屬性訪問器的可訪問性 10.5 泛型屬性訪問器方法 物件導向設計和程式設計的重要原則之一就是資料封裝,意味著型別的字段不應該公開,否則很容易因為不恰單使用欄位而破壞物件的狀態。可將屬性想象成智慧型字段,即背...