機器學習基石(6)

2021-09-10 01:29:22 字數 1163 閱讀 8643

希望m最終能取代m(假設集大小)

到底m會不會漲的很慢?假設的數量不會太多?

如果長得很慢,能不能取代掉原來的m?

mh成長函式:到底這個假設集,在n個點上,到底能產生多少種dichotomies?

如果是positive rays,在n=2時候就露出破綻,不能產生那種情形

如果是positive interval,在n=3露出破綻,有一些做不出來

如果是convex set,沒有絲毫破綻

如果是2d perceptrons,不知道成長函式長什麼樣子,但知道4個點的時候就露出一線曙光

k是個break point,k+1之後都是break point

shalter的意思:對n個點,有方法能分成2^n種二分法

最多只能產生四種二分法(為了堅持之前的承諾)

已經知道break point的情況下,其實也就確定了所作假設的型別。比如如果是一維射線,那break point就是2.

定義乙個新的定義:界限函式,bound function。說了成長函式在k有breakpoint,告訴我最多有幾種二分法。

不想要管成長函式到底長什麼樣子,想看到底有多少排列組合。

可以根據那個breakpoint來看,不用看具體是什麼樣的假設集

之前乙個個算出的,k=2的時候,一線曙光發生在k=2的時候,最多的二分法情況為3,4,在有2,3個點的時候。

把剩下的全部填好。第一列,當k=1,無論多少個點都是1.

當n<k,我有n個點,任何k個點不能shatter,條件說了跟沒說一樣,就是2^n種二分法。

當n=k的時候,對角線可以證明就減1,之後馬上滿足。

界限函式的值是15,但最多只能做出14種。b函式只是成長函式的上限,不一定有等號。

最後得出上限的上限。

機器學習基石 學習型別

二分類 多分類回歸 結構化學習 nlp領域相關 無監督學習 半監督學習 有監督學習 增強學習 沒有真實的輸出y,根據模型的輸出反饋,如果反饋結果良好,更接近真實輸出,就給其正向激勵,如果反饋結果不好,偏離真實輸出,就給其反向激勵。batch learning online learning acti...

台大機器學習基石 1

機器學習對於適用場景有一定的前提條件 可以找到某種模式 不容易程式設計實現,不能對目標下乙個簡單的定義 能找到訓練的資料,資料量越大越好 使用機器學習的乙個小例子 銀行信用卡批准 例如銀行會收到申請客戶的個人資料,然後根據個人資訊進行分析,選擇是否發放信用卡,以達到銀行最大收益。機器學習所扮演的角色...

《機器學習基石》 正則化

本節涉及的知識點包括 1 所謂正則化,就是在原來的假設空間上加上一定限制條件 2 推導線性回歸中引入l2正則 3 帶正則化約束條件的問題 等價於 無約束的加正則項的augmented error 4 vc維解釋正則的好處 5 選擇一般正則項的三個原則 6 l1正則和l2正則的對比 所謂正則化假設空間...