機器學習與資料探勘之邏輯斯諦回歸

機器學習與資料探勘參考文獻

一、二項邏輯斯諦回歸模型

二項邏輯斯諦回歸模型是如下的條件概率分布：

這裡，x∈rn是輸入，y∈是輸出，w∈rn和b∈r是引數，w稱為權值向量，b稱為偏置，w·x為w和x的內積。有時為了方便，將權值向量和輸入向量加以擴充，仍記作w，x，即w=(w(1),w(2),...,w(n),b)t，x=(x(1),x(2),...,x(n),1)t。這時，邏輯斯諦回歸模型如下：

乙個事件的機率是指該事件發生的概率與該事件不發生的概率的比值。如果事件發生的概率是p，那麼該事件的機率是p/(1-p)，該事件的對數機率或logit函式是

對邏輯斯諦回歸而言，由上式得

這就是說，在邏輯斯諦回歸模型中，輸出y=1的對數機率是輸入x的線性模型。或者說，輸出y=1的對數機率是輸入x的線性函式表示的模型，即邏輯斯諦回歸模型。線性函式的值越接近正無窮，p(y=1|x)的概率值就越接近1；線性函式的值越接近負無窮，概率值就越接近0。

二、模型引數估計

邏輯斯諦回歸模型學習時，對於給定的訓練資料集，可以應用極大似然估計法估計模型引數，從而得到邏輯斯諦回歸模型。

設p(y=1|x)=π(x)，p(y=0|x)=1-π(x)，似然函式為

對數似然函式為

對l(w)求極大值，得到w的估計值。

這樣，問題就變成了以對數似然函式為目標函式的最優化問題。邏輯斯諦回歸學習中通常採用的方法是梯度下降法及擬牛頓法。

三、多項邏輯斯諦回歸

假設離散型隨機變數y的取值集合是，那麼多項邏輯斯諦回歸模型是

這裡，x∈rn+1，wk∈rn+1。

機器學習與資料探勘之邏輯斯諦回歸

機器學習與資料探勘

資料探勘與機器學習入門

資料探勘與機器學習釋義

機器學習與資料探勘之邏輯斯諦回歸

機器學習與資料探勘

資料探勘與機器學習入門

資料探勘與機器學習釋義

相關推薦