吳恩達機器學習第十三章支援向量機SVM

在監督學習中，很多監督學習演算法的效能都很相似，我們考慮的不是選哪個演算法，而是選擇演算法時所使用的資料量，這就體現了應用演算法時的技巧，比如你設計的用於學習演算法的特徵的選擇，正則化引數的選擇。

svm和神經網路、邏輯回歸相比，在學習複雜的非線性方程時能夠提供一種更為清晰的方式。

svm的總體優化目標為：

當最小化這個函式的時候，就得到了svm學習到的引數。

支援向量機不會輸出概率，我們通過svm得到的是通過優化上面的代價函式得到乙個引數θ，然後進行直接的**y是等於0還是等於1：若θ的轉置乘以x大於等於0，假設函式輸出1，反之輸出0。

svm假設函式的形式：

h θ(

x)=1 &&&&&θ>=0 \\ 0 &&&&&θ<0 \end \right.

hθ(x)

=||θ||>=1

p(i)∣∣

θ∣∣>=1

和p (i

)∣∣θ

∣∣<=−

1p^||θ||<=-1

p(i)∣∣

θ∣∣<=−

1，p(i)

p^p(

i)也就是每個樣本在θ上的投影，我們可以看到左圖的投影都比較小，那麼為了讓乘積大於1只能讓||θ||足夠大，但是我們的目的就是為了讓||θ||足夠小，所以svm不會選擇左圖那個線。

因此為了得到最大的投影，唯一的方式就是使綠線周圍保持最大間距

，這樣就會得到右圖的那個線，也就是產生大間距分類現象。

訓練樣本沒有標籤，用聚類演算法劃分出多簇用處市場分割社交網路分析計算機集群組織了解銀河系的構成 k均值演算法的核心步驟假設我們要將下列樣本分為兩簇初始化簇中心，遍歷每個樣本將每個樣本分配給相應的簇距離最小優先原則對新簇的所有樣本求平均值，得到新的簇中心重複步驟，知道每個簇不變...

聚類演算法 k means演算法本節問題隨機初始化n個聚類中心距離是歐幾里得距離衣服尺寸的劃分有點像是無監督演算法的市場化 q 如果有乙個聚類中心，它沒有被分配到任何乙個點，怎麼辦？a 一般情況移除這個聚類中心，但是聚類中心就會從k變為k 1 如果想保持k個聚類，則在初始化這個點一次本節目...

為了解決實際生活中的問題，我們通常需要乙個數學模型。比如，小明有乙個房子他想賣掉房子為了知道房子的小明收集了該地區近兩年的房屋交易他發現房屋與房屋大小呈正相關，所以他畫了了一幅圖小明的房屋大小用紅色的代替。可見和小明房屋一樣大小的房子並不存在，而類似的房屋又有很大差別，如此小明決定用...

吳恩達機器學習 第十三章 支援向量機SVM