《機器學習實戰》小結

最近一段時間讀了peter harrington 的machine learning in action，對機器學習有個大致的了解，做個總結。

全書分為4部分：監督學習（分類、回歸）、無監督學習、其他工具。包含演算法原理解釋，並講解python實現演算法的流程。讀完能對機器學習方法有個大致了解。我主要細看第一部分，快速瀏覽了後面部分。

決策樹

樸素貝葉斯

邏輯回歸（logistic regression，lr）

支援向量機（support vector machines，svm）

adaboost元演算法

回歸：對連續型資料進行**

聚類：

降維去噪：選取影響較大的特徵

1.採集資料：採集解決問題所需的資料

2.準備資料：將資料轉化為便於處理的正確格式

3.分析資料：視覺化資料，對資料特徵進行分析

4.訓練演算法：將問題轉化為數學模型，編碼實現

5.測試演算法：對演算法進行測試驗證，進行優化

6.使用演算法：將演算法應用到實際系統中，解決問題

缺失值處理：1.以可用特徵的平均值填補；2以相似特徵的平均值來填補；3.用特殊值來填補，如1、0；4.忽略有缺失值的樣本；5.用其他機器學習演算法**缺失值；

視覺化：利用matplotlib等對資料進行視覺化，有利於資料特徵分析

核函式：將資料從乙個低維空間線性不可分對映到乙個高維空間線性可分，最常用的徑向基函式

非均衡分類問題：正負樣本相差很大，解決方法：欠抽樣、過抽樣

分類效能指標：錯誤率、正確率、召回率及roc曲線

機器學習實戰第一章機器學習基礎小結

機器學習學習基礎一章先介紹了機器學習的概念，講解了機器學習可以幹什麼，遇到實際問題時應該怎麼選擇合適的機器學習演算法，簡單介紹了機器學習應用程式的步驟，介紹了機器學習實戰過程中當前使用最多的語言python和機器學習中常用的函式庫numpy。機器學習是當前it界非常火的技術之一，屬於人工智慧的一部分...

機器學習實戰

花了一段時間，總算把機器學習實戰粗讀了一遍，重點就在這個粗讀上。這本書的確不錯，機器學習的幾個經典演算法都涉及了，每個演算法都有1 2個實際例子進行說明，都有實實在在的讓我想起了linus的 talk is cheap,show me the code 那句名言。但多年來養成的習慣，從來都是喜...

機器學習機器學習實戰 kmeans

簡介聚類演算法是一種無監督學習，它將相似的物件歸類到同一簇中。聚類的方法可以應用所有的物件，簇內的物件越相似，聚類效果也就越好。聚類和分類的最大不同之處在於，分類的目標是已知的，聚類是完全無監督學習，類別沒有像分類那樣被預先定義出來，所以叫做無監督學習。kmeans演算法是實際中最常用的聚類演算法...

《機器學習實戰》小結

機器學習實戰第一章 機器學習基礎小結

機器學習實戰

機器學習機器學習實戰 kmeans

相關推薦

機器學習實戰第一章機器學習基礎小結