線性判別函式 判定面以及感知器

2021-07-12 05:18:46 字數 2593 閱讀 5733

標籤: 模式分類

不知道你還記不記得前面講過的判別函式的問題(見概述,貝葉斯策略,最大似然估計)

乙個」判別函式」是指由x的各個分量的線性組合而成的函式: g(

x)=w

tx+w

0 這裡w

是」權向量」,w0

被稱為」閾值權」或者」偏置」,一般情況下有c個這樣的判別函式,分別對應c類中的一類,我們總是選取gi

取得最大值的那個型別(希望明白的是,這個是使得後驗概率最大的那個型別,而有一種可能的線性判別函式是源於分布為正態分佈,而且假設σi

=σ2i

) 其實上面那種定義判別函式得到的分類器叫做」線性機」,線性機把特徵空間分為c個判決區域ri

(i=1

...c

),當x 在ri

中時,g

i 取得最大值,如果i≠

j,gi

=gj 可以得到乙個將ri

和rj 分開的超平面hi

j 實際上線性機的判決區域是凸的,是往往是單聯通的,這使得它為條件概率密度p(

x|wi

) 為單峰的問題設計線性機是比較適合的g(

x)=w

tx+w

0 加上額外的項,就可以很容易得到二次判別函式(考慮對應高斯分布是哪種情況)

g(

x)=w

0+∑i

=1d∑

j=1d

wijx

ixj(

wij=

wji)

甚至你可以加入更高次的項,於是可以愉快地得到多項式判別函式,實際上這可以看成某一種判別函式

g 的泰勒展開忽略更高階的無窮小

g(

x)=∑

i=1d

^aiy

i(x)

或者 g(x

)=at

y

這裡a是d^

維權向量,d^

個分量函式yi

(x) ,有時候被稱為

φ 函式,可以是x的任意函式。這樣的函式對應特徵提取子系統的結果,通過巧妙選擇這些函式,並使得d^

足夠大,就可以通過這樣的展開來逼近任何想要的判決函式。

換句話說,就是你對原始資料做乙個對映,對映到乙個新的特徵空間上,然後在特徵空間進行線性判別,但實際上,如果維度過高,會帶來很嚴重的」維度災難」,使得它往往很難實際應用。

假設我們有乙個包含n個樣本的集合,#y_1,y_2,\ … \ y_n#,一些標記為#w_1#,另一些標記為w2

,我們希望這些樣本確定判別函式g(

x)=a

ty的權向量

a 。我們有理由相信有乙個解,它產生錯誤的概率非常小,那麼很合理的想法是尋找乙個能把這些樣本都正確扥類的權向量。假如這個權向量存在,那麼這些樣本被稱為「線性可分」的。

對於乙個樣本yi

,如果aty

i>

0 ,就標記為w1

,如果at

yi<

0 ,則標記為w2

,特別的,如果取了等號,就不做區分,這樣我們可以用一種」規範化」(normalization)操作來簡化兩類樣本的訓練過程,也就是說屬於w2

的樣本,用負號表示,由此,我們尋找乙個對於所有樣本都有at

yi向量

a ,這樣的向量叫做「分離向量」(separating vector)更正規的說法是」解向量」(solution vector)

求解權向量的過程可認為是確定「權空間」(weight space)中的一點,每個樣本都對解向量的可能位置給出限制。等式at

yi=0

確定了乙個穿過權空間遠點的超平面,yi

為其法向量。解向量,如果存在,必須在每個超平面的正側,而且必須在n個正半空間的交疊區,而且該區域中的任意向量都是解向量,我們稱這樣的區域叫做「解區域」(solution region),下面兩圖分別給出了規範化前和規範化後的解區域影象

考慮構造解線性不等式at

yi>

0 的準則函式問題,最顯然的選擇是假設j(

a;y1

,...

yn) 為被

a 分成錯的樣本數,但是這個函式是個分段的常值函式(顯然取值為自然數),對梯度搜尋不是乙個很好的選擇,乙個更好的選擇是令感知器準則函式(perceotron criterion function):

jp

(a)=

∑y∈y

(−at

y)這裡的y(a

) 是被

a 分錯的樣本集(如果都分對了,顯然

y是空集),由於at

y≥0 , 所以j(

a)是非負的(從幾何上知道,j(

a)和分錯樣本到判決邊界距離之和成正比的)我們可以輕鬆根據下列方程,讓這個距離達到最小值 ∇j

p=∑y

∈y(−

y)a(

k+1)

=a(k

)+η(

k)∑y

∈yky

判別函式(四)之感知器演算法

基本思想 感知器的訓練演算法 已知兩個訓練模式集分別屬於 1類和 2類,權向量的初始值為w 1 可任意取值。若 若 若 若以上情況不符合,則表明該模式樣本在第k次中分類正確,因此權向量不變,即 w k 1 w k 若對此時,感知器演算法可統一寫成 感知器演算法實質上是一種賞罰過程對正確分類的模式則 ...

Fisher線性判別與感知器演算法Matlab實現

本文是在學習此書chapter4時,跑的實驗。x d n維輸入資料 t 標籤 w w0 w1 w2 mis class 錯誤分類資料點數 對t做簡單的檢查 if size unique t 2 2 return elseif max t 1 return elseif min t 1 return ...

模式識別 線性判別函式決策面的數學知識

以下問題均是基於二分類 若 g x 0,則x落在分類面h上。假設 x1 和 x2 都落在決策面h上,則 g x1 g x2 0 這說明 w和超平面h上任一向量正交,即w時h的法向量。當x在r1中時,g x 0,決策面的法向量指向r1,r1中的所有x在h的正側 當x在r2中時,g x 0,決策面的法向...