機器學習演算法篇 線性回歸

2021-09-27 09:26:45 字數 2031 閱讀 5508

機器學習從上面的圖來看是屬於人工智慧的部分,機器學習主要分為回歸,聚類,分類

那麼機器學習的定義是什麼呢?可以參考

何謂 「機器學習」,學界尚未有統一的定義。但有兩個定義特別值得了解:乙個來自卡內基梅隆大學的tom mitchell教授,乙個來自goodfellow、bengio 和 courville合著的經典「花書」《深度學習》。

這裡給出,來自著名的計算機科學家、機器學習研究者,卡內基梅隆大學的 tom mitchell 教授的定義:

對於某類任務 t 和效能度量 p,如果乙個電腦程式在 t 上以 p 衡量的效能隨著經驗 e 而自我完善,那麼我們稱這個電腦程式在從經驗 e 中學習。
機器學習演算法主要分為三類:監督學習,無監督學習,強化學習。

監督學習:通過樣本訓練模型函式,把新資料帶入模型**輸出結果

主要分為:回歸,分類

無監督學習:資料沒有標註,通過演算法找到資料間的關係。

主要分為:聚類和降維。

首先,要介紹的是監督學習裡面的回歸裡的線性回歸?對於線性回歸概念和推倒介紹可以參考

我的總結是:

第一步:確定線性回歸模型

第二步:獲取損失函式

第三步: 梯度下降迭代,引數更新

接著,介紹python 中的機器學習庫scikit-learn,支援分類,回歸,聚類,降維,資料處理等功能

sklea,sample_weight rn有很多資料集,載入資料集需要載入datasets

from sklearn import datasets;

1)內建資料集

比如datasets.load_boston() 波士頓房價,其他的可以去官網搜尋看一下

datasets.fetch_資料集名稱

3)生成本地資料集

datasets.make_資料集名稱

例如製作回歸資料集:

datasets.make_regression(n_samples = 600,n_features=100,....)

主要引數:n_samples:資料樣本,n_features:資料特徵

例如:

sklearn線性回歸

sklearn.linear_model是sklearn中子模組,包含線性回歸,邏輯回歸等演算法。

### 模型建立

from sklearn.linear_model import linearregression

linearregression主要方法:

1.fit(x,y,sample_weight = none) 訓練,x,y訓練資料,sample_weight 每條資料權重

2.predict(x) **

3.coef_  模型係數(方程係數)

4.intercept_  截距值

### 模型驗證

我們需要把資料分成訓練集和測試集,因此我們需要用到train_test_split方法

### 訓練模型評估

使用均方差(mse)或者均根方差(rmse)進行評估:

from sklearn import metrics

mse:metrics.mean_squarred_error(測試值,**值)

rmse:np.sqrt(metrics.mean_squarred_error())

最後我們這裡引入乙個小案例,進一步加強對線性回歸的理解,案例是對波士頓房價的**

機器學習演算法篇 一 線性回歸

以上即為引數 梯度下降特點 選擇合適的學習速率 通過不斷的迭代,找到 0 n,使得j 值最小 正規方程特點 不需要選擇學習速率 不需要n輪迭代 只需要乙個公式計算即可 但是並不是所有的線性回歸都適合用正規方程,我們知道求解乙個矩陣的逆複雜度為o n 3 因此當特徵維度n非常大的時候 x t x 1需...

學習 機器學習之線性回歸篇

2019年3月7日,學習內容 1 什麼是線性模型 變數與變數之間的關係能夠用一次模型來表示 舉例 y c ax by cz 則此為線性模型,需要注意的是直線是特殊的線性模型 因為只有兩個變數時,並且這兩個變數是一元一次方程的關係,則是直線 以前一直以為線性回歸模型就是直線模型,這是錯誤認識。2 當使...

機器學習演算法之線性回歸

有監督學習 學習樣本為 d xi,yi n i 1 輸出 的結果yi為連續值變數 需要學習對映 y 假定輸入x和輸出y之間有線性相關關係 對於給定的x,其輸出y f x wt x b 可以利用最小二乘法對w和b進行估計 根據自變數個數可以將線性回歸主要分為兩種 一元線性回歸和多元線性回歸。一元線性回...