《機器學習》總複習(上)

2021-10-14 08:00:34 字數 729 閱讀 1240

**

1.1從兩個問題談起

1.相關概念:

(1)機器學習:是人工智慧的另一部分,也是核心技術。其利用經驗、建立統計模型、概率模型,去解決問題。是對某個實際問題建立計算模型,並利用已知的經驗來提公升模型效果的一類方法。

(2)模式識別:用計算的方法根據樣本的特徵將樣本劃分到一定的類別中去。

2.相關流程:

(1)乙個標準的模式識別流程:

「客觀物件」——>「數值表示」——>「計算機演算法」——>「識別結果」

3.相關區別:

(1)**和資料探勘的區別:

①**是偏重得到決策結果,而資料探勘是偏重分析決策原因和過程。

②**問題主要是在生物特徵鑑別、機器視覺、目標跟蹤等領域,代替人進行決策。資料探勘問題主要是在商業資料、醫學資料裡,給人提供參考。

4.兩個問題:

(1)選擇何種模型?

(2)如何最優化該模型?

1.2模型評估與模型引數選擇

1.訓練得到乙個模型的最終目的:在未知的資料上得到盡可能準確的結果。

2.衡量乙個模型泛化能力的重要標準:泛化誤差。

3.區分誤差:

①訓練誤差:訓練集上的平均誤差

②泛化誤差:測試集上的誤差

4.不能把訓練誤差作為模型引數選擇的標準的原因:

①訓練集樣本太少,缺乏代表性。

②訓練集中本身存在錯誤的樣本&#x

機器學習複習

1.判斷與名稱解釋題 a1.1 資料探勘 在較大資料集上通過某些方式發現模型的乙個過程 1.2 機器學習 研究如何通過計算手段,利用經驗提公升系統的效能 1.3 假設空間 對於資料集a,其data對應的特徵為乙個向量,此向量所在的空間稱為假設空間 1.4 奧卡姆剃刀 若有多個假設與觀測一致,則選擇最...

總複習小結

總複習小結 1 經過一學期的程式設計學習,初步認識基礎資料型別,語句結構,可以做一些簡單的程式設計。此次複習總結了一部分的函式 程式設計技巧及易錯知識點。2 符號常量,定義後不再被賦值,習慣上用大寫字母。例 define pi 3.14 const double pi 3.1415 定義最大值 de...

機器學習複習 Apriori

apriori apriori 是關聯分析中比較早的一種方法,主要用來挖掘那些頻繁項集合。其思想是 1.如果乙個專案集合不是頻繁集合,那麼任何包含它的專案集合也一定不是頻繁集合 2.如果乙個專案集合是頻繁集合,那麼它的任何非空子集也是頻繁集合 aprioir 需要掃瞄專案表多遍,從乙個專案開始掃瞄,...