機器學習(一) 統計學習及監督學習概論

2021-10-06 23:07:36 字數 497 閱讀 2531

本篇是關於機器學習的開篇之作,這一系列的文章主要是參考李航老師的《統計學習方法》一書,以及兼考慮周志華老師的《機器學習》一書。

本篇部落格是該系列的第一篇,主要是關於統計學習一些基本概念中的重難點。

無監督學習:從無標註資料中學習**模型的機器學習問題

強化學習:指智慧型系統在與環境的連續互動中學習最有效行為策略的機器學習問題

按模型分類

按演算法分類批量學習:一次接受所有資料,學習模型,之後進行**

按技巧分類

演算法:學習模型的具體計算方法

交叉驗證

泛化誤差上界

判別模型:學習得到條件概率分布

標註問題:輸入乙個觀測序列,輸出乙個標記序列

回歸問題:**輸入變數和輸出變數之間的關係

統計學習方法(一) 統計學習與監督學習概論

監督學習 從標註資料中學習 模型的機器學習問題。無監督學習 是指從無標註的資料中學習 模型的機器學習問題。無標註資料是自然得到的資料,模型表示資料的類別 轉換或概率。無監督學習的本質是學習資料中的統計規律或潛在結構。強化學習 是指智慧型系統在於環境的連續互動中學習最優行為策略的機器學習問題。半監督學...

統計學習及監督學習概論(4)

統計學習方法 第二版 1.6 1.8 用學到的模型 hat f 對未知資料 的誤差即為泛化誤差 generalization error 泛化誤差反映了學習方法的泛化能力。事實上,泛化誤差就是所學習到的模型的期望風險。泛化誤差上界 generalization error bound 性質 是樣本容...

統計學習及監督學習概論(3)

統計學習方法 第二版 1.4 1.5 當評估時使用的損失函式給定時,訓練誤差和測試誤差成為學習方法評估的標準。測試誤差反映了學習方法對未知的測試資料集的 能力 泛化能力 1 當選擇的模型複雜度過大時,過擬合現象就會發生。過擬合是指學習時選擇的模型所包含的引數過多,以至出現這一模型對已知資料 得很好,...