分類演算法感知機（Perceptron）

感知機演算法是一類二分類演算法，其問題描述為，給定乙個訓練資料集

$$t=\,$$

其中$x_i\in \mathbb^n,y_i\in\,i=1,2,\cdots,n$，求引數$w,b$，使得以下損失函式極小化問題的解

$$\min_l(w,b)=\min -\sum_y_i(w\cdot x_i+b),$$

其中$m$為誤分類點的集合。

下一節給出損失函式的推導過程。

感知機演算法求解的資料集必須具有線性可分性，其定義為，對於資料集

$$t=\,$$

其中$x_i\in \mathbb^n,y_i\in\,i=1,2,\cdots,n$，如果存在某個超平面$s$

$$w\cdot x + b = 0,$$

能夠將資料集的正類和負類完全正確地劃分到超平面的兩側，即對所有$y_i=+1$的樣本$i$，有$w\cdot x_i+b>0$，對所有$y_i=-1$的樣本$i$，有$w\cdot x_i + b < 0$，則稱資料集$t$為線性可分資料集（linearly separable dataset）。

感知機演算法即是求解線性可分資料集中的超平面$s$的演算法。由於超平面是由$w$和$b$確定的，因此學習超平面的目標即是確定引數$w$和$b$，按照梯度下降法優化要求，需要定義乙個關於引數$w$和$b$的損失函式進行優化。

注意到，損失函式被期望是連續可導的，因此不能直接選取誤分類點個數作為損失函式，在感知機中，選取誤分類點到超平面$s$的總距離作為損失函式。對於輸入空間$\mathbb^n$中任意一點$x_i$到超平面$s$的距離為

$$\frac\left | w \cdot x_i + b \right |,$$

其次，對於誤分類點來說，滿足

$$-y_i(w_i\cdot x_i+b)>0,$$

因此可以把距離公式的絕對值替換得到

$$-\fracy_i\left ( w \cdot x_i + b \right ),$$

假設超平面$s$的誤分類集合為$m$，那麼所有誤分類點到超平面$s$的總距離為

$$-\frac\sum_y_i\left ( w \cdot x_i + b \right ),$$

不考慮$\frac$，則感知機$sign(w\cdot x+b)$的損失函式定義為

$$l(w,b)=-\sum_y_i(w\cdot x_i+b).$$

《統計學習方法》，李航

分類演算法 感知機（Perceptron）