《機器學習實戰》筆記1 5 機器學習步驟

2021-10-23 03:53:43 字數 356 閱讀 7251

第一篇部落格,用來記錄《機器學習實戰》的學習筆記。

從無序的資料中得到有序的資料

收集資料——爬蟲、公開資料來源、裝置輸入(血糖、頻率等)

準備輸入資料

分析輸入資料——人工分析是否有缺失值、異常值等(如果資料**是可信任資料**或者在產品話系統中可略過此步驟)

訓練演算法——在此步驟中機器學習才真正開始,是機器學習演算法的核心,第五步驟也是核心。

測試演算法——實際實用第四部機器學習得到的只是資訊。如果不滿意演算法的輸出結果,則可以回到第4步,改正並加以測試。

實用演算法——將機器學習演算法轉換為應用程式,執行實際任務,以檢驗上述步驟是否可以在實際環境中正常工作。此時如果碰到新的資料問題,重複執行上述步驟。

《機器學習實戰》學習筆記

很久沒寫過部落格了,一重開就給自己挖了這麼乙個大坑 最近一段時間看了 機器學習實戰 這本書,感覺寫得不錯,認真看了看。關於這本書的書評及購買事宜請移步豆瓣 京東 亞馬遜等 這裡不多說。不過有一點,感覺這本書有個很好的地方是給出了各個演算法的python實現 和講解,要求不高的話可以拿來用了 懶 在這...

《機器學習實戰》學習筆記

目錄 第2章 k 近鄰演算法 第3章 決策樹 第4章 基於概率論的分類方法 樸素貝葉斯 第5章 logistic回歸 第7章 利用adaboost元演算法提高分類效能 第8章 數值型資料 回歸 1.python console匯入knn.py檔案 import knn1.reload的使用方法 fr...

《機器學習實戰》學習筆記

通過對輸入資料inx和資料集dataset座標距離的計算返回結果 資料集包括group 座標 和labels 分類 計算inx與group點與點的距離 對距離遞增排序 選取排序後的前k個值對應的label 根據label出現的頻率對inx進行分類 def classify0 inx,dataset,...