機器學習實戰第一章

機器學習能讓我們從資料集得到啟發

搜素引擎，郵件過濾系統，推薦系統，資料探勘（啤酒和尿布）

機器學習在我們生活中隨處可見。機器學習是必學的。即使想做其他方向的研究，ml也是基礎

1：機器學習專業術語

訓練集，測試集，目標變數（如：鳥的類別）。知識表示（如：可以採用規則集的形式，也可以採用概率的形式）。採用何種方式表示知識也很重要

2：機器學習的主要任務（重要知識點）

：分類，回歸《—-都屬於監督學習

：聚類，密度估計《—屬於無監督學習

ps:回歸，主要用於**數值型資料，如：資料擬合曲線

ps:分類的經典演算法有（k近鄰演算法，決策樹，樸素貝葉斯，支援向量機）

回歸的經典演算法有（線性回歸，區域性加權線性回歸，ridge回歸，lasso

最小回歸係數估計）

聚類的經典演算法有（k-均值，dbscan）

3：如何選擇合適的演算法

針對某個場景下的具體問題，有兩步：

a：要完成什麼樣的任務，結合上述2中羅列的，進行排查，斷定

（想**目標值，就是監督學習；否則，就是無監督學習。然後再細

化。。。當然，也不是一成不變的。這只是傳統經驗）

b：分析收集到的資料是什麼。要分析，對資料越了解，越容易建立符合要求的應用程式。主要了解資料以下特性：如，特徵值是離散的，還是連續的，有無缺失值，資料中有無異常值等。

ps:一般來說，沒有最好的演算法。。。好的演算法是反覆試錯得迭代過程

4：開發機器學習應用程式的步驟

雖然機器學習的演算法各有不同，但是使用演算法構建應用程式的步驟卻基本類似

a:收集資料（如：使用爬蟲；公開資料集）

b:準備輸入資料,即整理成某種標準格式（如，整理成 python的list）

c:分析資料（如，檢視有沒有空值，有沒有離群點，異常的值。。。也會涉及到視覺化資料；當特徵太多時，要涉及到特徵壓縮。。。）

d:訓練演算法

e:測試演算法

f：使用演算法

機器學習實戰第一章 KNN演算法

機器學習實戰第一章 knn演算法一.k 近鄰演算法函式分析 def classify0 inx,dataset,labels,k datasetsize dataset.shape 0 diffmat tile inx,datasetsize,1 dataset sqdiffmat diffma...

機器學習實戰第一章機器學習基礎小結

機器學習學習基礎一章先介紹了機器學習的概念，講解了機器學習可以幹什麼，遇到實際問題時應該怎麼選擇合適的機器學習演算法，簡單介紹了機器學習應用程式的步驟，介紹了機器學習實戰過程中當前使用最多的語言python和機器學習中常用的函式庫numpy。機器學習是當前it界非常火的技術之一，屬於人工智慧的一部分...

機器學習第一章

q 什麼是機器學習機器學習不同於以往的計算機程式設計，致力於研究如何通過計算機手段，利用以往的經驗來改善系統自身的效能。一般的程式設計都是明確的告訴電腦該做什麼。機器學習希望提供資料給學習演算法，讓它自己學習，找到其種的規律。在面對新情況的時候就能應用已產生的模型，提供相應的判斷。機器學習的本質任...

機器學習實戰 第一章

機器學習實戰 第一章 KNN演算法

機器學習實戰第一章 機器學習基礎小結

機器學習第一章

相關推薦

機器學習實戰第一章

機器學習實戰第一章 KNN演算法

機器學習實戰第一章機器學習基礎小結