《機器學習實戰》小結

2021-07-11 03:27:14 字數 869 閱讀 1610

最近一段時間讀了peter harrington 的machine learning in action,對機器學習有個大致的了解,做個總結。

全書分為4部分:監督學習(分類、回歸)、無監督學習、其他工具。包含演算法原理解釋,並講解python實現演算法的流程。讀完能對機器學習方法有個大致了解。我主要細看第一部分,快速瀏覽了後面部分。

決策樹

樸素貝葉斯

邏輯回歸(logistic regression,lr)

支援向量機(support vector machines,svm)

adaboost元演算法

回歸:對連續型資料進行**

聚類:

降維去噪:選取影響較大的特徵

1.採集資料:採集解決問題所需的資料

2.準備資料:將資料轉化為便於處理的正確格式

3.分析資料:視覺化資料,對資料特徵進行分析

4.訓練演算法:將問題轉化為數學模型,編碼實現

5.測試演算法:對演算法進行測試驗證,進行優化

6.使用演算法:將演算法應用到實際系統中,解決問題

缺失值處理:1.以可用特徵的平均值填補;2以相似特徵的平均值來填補;3.用特殊值來填補,如1、0;4.忽略有缺失值的樣本;5.用其他機器學習演算法**缺失值;

視覺化:利用matplotlib等對資料進行視覺化,有利於資料特徵分析

核函式:將資料從乙個低維空間線性不可分對映到乙個高維空間線性可分,最常用的徑向基函式

非均衡分類問題:正負樣本相差很大,解決方法:欠抽樣、過抽樣

分類效能指標:錯誤率、正確率、召回率及roc曲線

機器學習實戰第一章 機器學習基礎小結

機器學習學習基礎一章先介紹了機器學習的概念,講解了機器學習可以幹什麼,遇到實際問題時應該怎麼選擇合適的機器學習演算法,簡單介紹了機器學習應用程式的步驟,介紹了機器學習實戰過程中當前使用最多的語言python和機器學習中常用的函式庫numpy。機器學習是當前it界非常火的技術之一,屬於人工智慧的一部分...

機器學習實戰

花了一段時間,總算把 機器學習實戰 粗讀了一遍,重點就在這個粗讀上。這本書的確不錯,機器學習的幾個經典演算法都涉及了,每個演算法都有1 2個實際例子進行說明,都有實實在在的 讓我想起了linus的 talk is cheap,show me the code 那句名言。但多年來養成的習慣,從來都是喜...

機器學習機器學習實戰 kmeans

簡介 聚類演算法是一種無監督學習,它將相似的物件歸類到同一簇中。聚類的方法可以應用所有的物件,簇內的物件越相似,聚類效果也就越好。聚類和分類的最大不同之處在於,分類的目標是已知的,聚類是完全無監督學習,類別沒有像分類那樣被預先定義出來,所以叫做無監督學習。kmeans演算法是實際中最常用的聚類演算法...