機器學習知識點

2021-09-11 18:01:41 字數 2432 閱讀 4613

2.感知機

3 k近鄰法

4.樸素貝葉斯

5.決策樹

6.邏輯回歸與最大熵模型

7.支援向量機

8.整合學習

9.em演算法

10.隱馬爾科夫模型與條件隨機場

11.聚類方法

1.1 監督學習關於資料的基本假設是什麼?

1.2 模型的假設空間是什麼?

1.3 統計學習三要素

1.4 損失函式的定義,有哪些損失函式,風險函式的定義?

1.5 經驗風險與結構風險是什麼?

1.6 什麼是過擬合?

1.7 模型選擇的方法有哪些?

1.8 什麼是hoeffding不等式?

1.9 什麼是泛化能力?泛化能力跟什麼有關?

1.10 生成模型與判別模型的區別

1.11 準確率,精確率,召回率與f1值是什麼?

1.12 roc,auc是什麼?

1.13 監督學習的重要問題有哪些?

2.1 什麼是感知機?(模型,策略,演算法)

2.2 感知機學習演算法的對偶形式是什麼?

3.1 什麼是k-nn?

給定訓練例項點跟輸入例項點,首先確定輸入例項點的k個最近鄰訓練例項點,然後利用k個訓練例項點的類的多數**輸入例項點的類。模型解釋:每個訓練樣本點對應於特徵空間的乙個劃分,該區域的標記就是該訓練點對應的標記。

3.2 什麼是k-nn的三要素?

3.3 k-nn演算法的優缺點?

3.4 列舉k-nn的實現(kd樹)

4.1 貝葉斯法是什麼?

4.2 樸素貝葉斯法的基本假設是什麼?

4.3 怎麼證明後驗概率最大化等價於期望風險最小化(假設0-1損失函式)?

4.4 樸素貝葉斯法的引數估計方法有哪些?

4.5 樸素貝葉斯法的優缺點?

5.1 什麼是分類決策樹模型?

5.2 決策樹模型與if-then規則的聯絡?

5.3 決策樹模型與條件概率的聯絡?

5.4 熵,條件熵是什麼?

5.5 資訊增益,資訊增益比是什麼?

5.6 基尼指數是什麼?

5.7 決策樹學習演算法有哪些組成,常見的決策樹演算法有哪些?

5.8 決策樹的簡單剪枝過程?

5.9 簡述cart演算法

cart樹其實是二叉決策樹,每個節點的特徵取值只有是和否。

5.10 決策樹的優缺點

5.11 gbdt

用於分類任務

gbdt就是gb+dt,弱分類器一般用cart樹。

5.12 xgboost

5.13 xgboost與gbdt的比較

5.14 lightgbm

6.1 什麼是邏輯回歸模型(模型,策略,演算法)

6.2 邏輯回歸的優缺點

6.3 乙個k分類softmax回歸器與k個二分類邏輯回歸器對比?

6.4 什麼是最大熵原理

6.5 什麼是最大熵模型

6.6 由最大熵原理推導最大熵模型

6.7 證明對偶函式的極大化等價於最大熵模型的極大似然估計

7.1 什麼是函式間隔,什麼是幾何間隔?

7.2 什麼是線性可分svm(模型,策略,演算法)

7.3 線性svm(模型,策略,演算法)

7.4 線性svm的原始優化問題等價於加了正則的合頁損失函式

7.6 常用核函式

7.7 smo演算法的思路

7.8 svm的優缺點

8.1 什麼是bagging?

-從n個樣本中有放回的取樣n個樣本;對取樣進行弱學習器的學習;學習多個弱學習器,**用投票的方法得到結果。

8.2 什麼是adaboost演算法?

8.3 為何adaboost具有適應性?

8.4 前向分布演算法是什麼?它與adaboost的關聯?

8.5 提公升樹

8.6 隨機森林

8.7 什麼是stacking整合演算法?

可以增加模型的非線性,從而減少模型的偏差。還可以降低泛化誤差。

9.1 em演算法簡述

9.2 為什麼em演算法能近似實現對觀測資料的極大似然估計?

9.3 em演算法收斂性

9.4 怎麼用em演算法求解高斯混合模型

9.5 f函式的極大-極大演算法

9.6 廣義em演算法

10.1 隱馬爾科夫模型的基本過程是怎樣的?

10.2 隱馬爾科夫模型的三個基本問題

10.3 什麼是馬爾科夫隨機場?

10.4 什麼是條件隨機場?什麼是線性鏈條件隨機場?

10.5 條件隨機場的三個基本問題

11.1 什麼是k-means演算法?

11.2 如何處理資料集中的樣本不平衡?

smote演算法的缺陷

easyensemble演算法

機器學習知識點

1.knn 不適合用來對特徵分布進行分析。2.強化學習中的mdp模型 環境狀態的集合 動作的集合 在狀態之間轉換的規則 規定轉換後 即時獎勵 的規則 描述主體能夠觀察到什麼的規則。3.otsu推到 4.繪製曲線 plt.plot hist.history loss plt.plot hist.his...

機器學習相關知識點

1 tp 將正類 為正類數 fn 將正類 為負類數 fp 將負類 為正類數 tn 將負類 為負類數 精確率 precision p tp tp fp 反映了被分類器判定的正例中真正的正例樣本的比重。準確率 accuracy a tp tn p n tp tn tp fn fp tn 反映了分類器統對...

機器學習知識點總結

錯的。我們可以評估無監督學習方法通過無監督學習的指標,如 我們可以評估聚類模型通過調整蘭德係數 adjusted rand score 把nan直接作為乙個特徵,假設用0表示 用均值填充 用隨機森林等演算法 填充 sgd 隨機梯度下降 sgd momentum 基於動量的sgd 在sgd基礎上做過優...