機器學習周志華學習筆記3

第3章線性模型

3.1基本形式

給定由d個屬性描述的示例x=(x1;x2;…;xd),其中xi是x在第i個屬性上的取值，線性模型（linear model）試圖學得乙個通過屬性的線性組合來進行**的函式，即

f(x)=w1*x1+w2*x2+…+wd*xd+b

一般用向量形式寫成

f(x)=wtx+b

其中w=（w1;w2;…;wd）。w和b學得以後，模型就得以確定。

線性模型形式簡單，易於建模，有很好的可解釋性（comprehensibility）。

3.2線性回歸

給定資料集合d=其中xi=(xi1,;xi2;…;xid),yi∈r,線性回歸（linear regression）的目的就是試圖找到乙個線性模型以盡可能準確地**實值輸出，即試圖學得：

其中重要點在於w和b的確定。我們利用均方誤差，使均方誤差最小化即：

線性回歸模型的最小二乘「引數估計」（parameter estimation）為求解w和b使

最小化的過程。可以將分別對w和b求導，得到

然後令上二式為0可得到w和b最優解的閉式解

其中為x的均值。

當樣本由d個屬性描述，我們試圖學得

這稱為「多元線性回歸」（multivariate linear regression）。我們同樣可以用最小二乘法對w和b進行估計。具體過程這裡省略。

線性模型雖然簡單，但是有豐富的變化。對於樣例（x，y）我們希望線性模型的**值逼近真實標記y，即

但是有的時候這種做法並不方便使用，我們令模型的**值逼近y的衍生物，例如：假設我們認為示例所對應的輸出標記是在指數尺度上變化，那麼可以將線性模型設定為：

這就是「對數線性回歸」。

更一般的可以考慮單調可微函式g（.），令

得到的模型稱為「廣義線性模型」（generalized linear model），其中函式g(.)稱為「聯絡函式」（link function）。

3.3對數機率回歸

分類任務中我們需要找乙個單調可微函式將任務分類的真是標記y與線性回歸模型的**值聯絡起來。

以二分類任務為例，輸出標記為y∈，線性回歸模型產生的**值

**過程如圖3.2

但是單位階躍函式不連續，因此不能直接用作式3.15中的。所以我們找了乙個單位階躍函式的替換函式，並希望它單調可微。對數機率函式（logisticfunction）：

從圖3.2可看出，對數機率函式是一種「sigmoid函式」，它將z值轉化成乙個接近0或1的y值，並且其輸出值在z=0附近變化很抖。然後經過數學變換求取最優w和b。具體流程我也很模糊，以後有機會再描述。

機器學習周志華筆記

1，監督學習分類回歸無監督學習聚類 2，決策樹根據資訊增益的大小來確定節點資訊熵描述事務確定性程度的值需要多少個bit來描述資訊 ent d pklog2pk 資訊增益資訊熵某個屬性劃分的平均資訊熵該屬性劃分純度 3，支援向量機中對超平面的理解劃分超平面用以下線性方程表示 w...

周志華機器學習筆記

學習演算法自身的歸納偏好與問題是否相配，往往會起到決定作用。對於上面這句話你的輸入資料被怎麼處理，最終得到什麼結果，我認為偏好指的就是這個處理的過程。線性非線性？那些feature忽略掉？怎麼利用這些資料？更具體一些，你用網路處理，還是傳統方法，資料的分布和你的處理方法相符嗎？沒有免費的午餐定理 ...

《機器學習》（周志華）學習筆記（一）

一假設空間科學推理的兩大手段歸納 induction 和演繹 deduction 歸納泛化過程，從具體的事實歸結出一般性規律演繹特化過程，從基礎原理推演出具體狀況學習過程可以看作乙個在所在假設組成的空間中進行搜尋的過程，搜尋目標是找到與訓練集匹配 fit 的假設，即可以將訓練集中的樣...

機器學習 周志華 學習筆記3

機器學習周志華筆記

周志華 機器學習 筆記

《機器學習》（周志華）學習筆記（一）

相關推薦

機器學習周志華學習筆記3

周志華機器學習筆記