機器學習與模式識別第三章判別函式

在很多實際問題中，由於樣本特徵空間的類條件概率密度的形式常常很難確定，利用非引數方法估計需要很大的樣本空間，而且隨著特徵空間位數的增加所需的樣本數急劇增加，因此在實際問題中，我們往往不確定某個判別函式類，然後利用樣本集確定出判別函式中的未知引數。

線性判別函式法是一種較為簡單的判別函式，最簡單的是線性函式，它的分介面是超平面，採用線性判別函式所產生的錯誤率或風險雖然可能比貝葉斯分類器來的大，但是他簡單，容易實現，而且需要的計算量和儲存量小。因此可以認為線性判別函式是統計模式識別的基本方法之一。

模式識別系統的主要作用，判別各個模式所屬的類別，對乙個兩類問題的判別，就是將模式x劃分成ω1和ω2兩類。

用判別函式分類的概念兩類問題的判別函式（以二維模式樣本為例）

若x是二維模式樣本x = (x1 x2)t，用x1和x2作為座標分量，得到模式的平面圖：

這時，若這些分屬於ω1和ω2兩類的模式可用乙個直線方程d(x)=0來劃分

d(x) = w1x1 + w2x2 + w3 = 0

其中x1、x2為座標變數，w1、w2、w3為引數方程，則將乙個不知類別的模式代入d(x)，有

用判別函式進行模式分類依賴的兩個因素

用判別函式進行模式分類依賴的兩個因素

（1）判別函式的幾何性質：線性的和非線性的函式。

線性的是一條直線；

非線性的可以是曲線、折線等；

線性判別函式建立起來比較簡單（實際應用較多）；

非線性判別函式建立起來比較複雜。

（2）判別函式的係數：判別函式的形式確定後，主要就是確定判別函式的係數問題。

只要被研究的模式是可分的，就能用給定的模式樣本集來確定判別函式的係數。

n維線性判別函式的一般形式

乙個n維線性判別函式的一般形式：

其中w0 = (w1, w2, …, wn)t稱為權向量（或引數向量）, x = (x1, x2, …, xn)t。

d(x)也可表示為：

d(x) = wtx

其中，x = (x1, x2, …, xn, 1)t稱為增廣模式向量，w = (w1, w2, …, wn+1)t稱為增廣權向量。

兩類情況：判別函式d(x)

8.線性判別函式

例：設有乙個三類問題，其判別函式為：

d12(x)= -x1 - x2 + 5，d13(x)= -x1 + 3，d23(x)= -x1 + x2

若x =(4, 3)t，則：d12(x) = -2，d13(x) = -1，d23(x) = -1

分類失敗。

小結：線性可分

多類情況1和多類情況2的比較

習題

畫的好醜啊！！！

機器學習與模式識別第三章 判別函式