機器學習實戰 第一章

2021-07-05 04:57:42 字數 1160 閱讀 7799

機器學習能讓我們從資料集得到啟發

搜素引擎,郵件過濾系統,推薦系統,資料探勘(啤酒和尿布)

機器學習在我們生活中隨處可見。機器學習是必學的。即使想做其他方向的研究,ml也是基礎

1:機器學習專業術語

訓練集,測試集,目標變數(如:鳥的類別)。 知識表示(如:可以採用規則集的形式,也可以採用概率的形式)。採用何種方式表示知識也很重要

2:機器學習的主要任務(重要知識點)

分類,回歸《—-都屬於監督學習

聚類,密度估計《—屬於無監督學習

ps:回歸,主要用於**數值型資料,如:資料擬合曲線

ps:分類的經典演算法有(k近鄰演算法,決策樹,樸素貝葉斯,支援向量機)

回歸的經典演算法有(線性回歸,區域性加權線性回歸,ridge回歸,lasso

最小回歸係數估計)

聚類的經典演算法有(k-均值,dbscan)

3:如何選擇合適的演算法

針對某個場景下的具體問題,有兩步:

a:要完成什麼樣的任務,結合上述2中羅列的,進行排查,斷定

(想**目標值,就是監督學習;否則,就是無監督學習。然後再細

化。。。當然,也不是一成不變的。這只是傳統經驗)

b:分析收集到的資料是什麼。要分析,對資料越了解,越容易建立符合要求的應用程式。主要了解資料以下特性:如,特徵值是離散的,還是連續的,有無缺失值,資料中有無異常值等。

ps:一般來說,沒有最好的演算法。。。好的演算法是反覆試錯得迭代過程

4:開發機器學習應用程式的步驟

雖然機器學習的演算法各有不同,但是使用演算法構建應用程式的步驟卻基本類似

a:收集資料(如:使用爬蟲; 公開資料集)

b:準備輸入資料,即整理成某種標準格式(如,整理成 python的list)

c:分析資料(如,檢視有沒有空值,有沒有離群點,異常的值。。。也會涉及到視覺化資料;當特徵太多時,要涉及到特徵壓縮。。。)

d:訓練演算法

e:測試演算法

f:使用演算法

機器學習實戰 第一章 KNN演算法

機器學習實戰 第一章 knn演算法 一.k 近鄰演算法函式分析 def classify0 inx,dataset,labels,k datasetsize dataset.shape 0 diffmat tile inx,datasetsize,1 dataset sqdiffmat diffma...

機器學習實戰第一章 機器學習基礎小結

機器學習學習基礎一章先介紹了機器學習的概念,講解了機器學習可以幹什麼,遇到實際問題時應該怎麼選擇合適的機器學習演算法,簡單介紹了機器學習應用程式的步驟,介紹了機器學習實戰過程中當前使用最多的語言python和機器學習中常用的函式庫numpy。機器學習是當前it界非常火的技術之一,屬於人工智慧的一部分...

機器學習第一章

q 什麼是機器學習 機器學習不同於以往的計算機程式設計,致力於研究如何通過計算機手段,利用以往的經驗來改善系統自身的效能。一般的程式設計都是明確的告訴電腦該做什麼。機器學習希望提供資料給學習演算法,讓它自己學習,找到其種的規律。在面對新情況的時候就能應用已產生的模型,提供相應的判斷。機器學習的本質任...