機器學習粗略了解（一）

宣告：本部落格是學習 easy_ray 作者的部落格做的筆記

tom mitchell 寫的《machine learning》中給出了乙個比較學術的描述：「對於某類任務t和效能度量p,如果乙個電腦程式在t以上以p衡量的效能隨著經驗e而自我完善，那麼我們稱這個電腦程式正在從經驗e學習」

任務t --> **的目的（通過**來實現根據房子大小面積等特徵來**房價的模型）

效能度量t --> 評價所構建模型的精準度（**房價的誤差誤差越小越好）

經驗e --> 資料（某城區100套房子的面積和**的真實資料）

例項 :

擁有100組資料例項，構建模型，利用100組資料去訓練這個模型，將100組資料傳送給模型，模型根據這一段資料不斷修正模型引數來自我完善，最終結果我們可以任意將乙個房子的面積或者其他特徵性資訊輸入到模型裡，改模型就會**出房子的**。

例項**

房子尺寸/平方公尺

房子**/萬

100120

8092

120143

7587

6060

4350

資料的視覺化折線圖

構建模型

將以上資料傳到資料模型中，訓練模型，說白了就是用資料來測試功能，最後哪個差值最小哪個功能演算法就相對比較好。模型最終輸出一條擬合線。

粗略總結

利用這條擬合線來**房價，當輸入房子尺寸對應輸出**。

這裡只是大概介紹了下簡要流程，並沒有涉及技術和演算法的介紹。我也是一邊看別人的部落格一邊學習，隨手做個我自己理解的筆記。

supervised learning 監督學習

實際上，我們手裡有一組資料，房子尺寸和**，放到模型中可以**出**。

監督學習可以分為兩類：

1、回歸（regression)

2、分類（classification）

使用以上概念所舉的例子，散點資料中擬合的那條曲線，輸入的值是單獨的，但是輸出的y是連續的值，所以歸類為回歸問題。

舉例：醫院腫瘤資料，1代表惡性，0代表良性，可以通過腫瘤的大小進行**病人的腫瘤是良性還是惡性。

腫瘤大小/厘公尺

是否為惡性10

1212.50

1.9071

91畫出散點圖：

紅色—惡性

藍色—良性

訓練資料可以簡單判斷出如果腫瘤大小超過6厘公尺，有可能是惡性腫瘤

回歸問題輸出的是乙個連續的值，比如放假，利潤等

分類問題輸出的結論性的值。

無監督學習（unsupervised learning）

左—監督學習，右—無監督學習

監督學習已經知道這些資料的特徵，左下角圓形資料，右上角是紅叉。、

無監督學習並不知道這個資料到底有哪些特徵，只能通過學習來摸索到這些資料有哪些特徵。（聚類問題）

強化學習（reinforcement learning）

強化學習中沒有給定的資料，不像監督學習和無監督學習不管怎麼樣都有給定的資料進行樣本擬合，分類，聚類等操作。

類似於正反饋學習，通過實際中的結論不斷反饋來強化學習的演算法。

大總結

我覺得部落格博主總結的很不錯，我就直接摘下來了。

機器學習粗略了解（一）

機器學習筆記（一）了解機器學習

機器學習了解

機器學習之SVM（粗略的筆記）

機器學習 粗略了解（一）

機器學習筆記（一） 了解機器學習

機器學習了解

機器學習之SVM（粗略的筆記）

相關推薦

機器學習粗略了解（一）

機器學習筆記（一）了解機器學習