機器學習 基本概念

2021-08-15 04:34:42 字數 726 閱讀 2792

1、定義:訓練好的分類器對訓練樣本很好的分類,但是對測試樣本的分類結果很糟糕。

2、原因:特徵維度過多,導致擬合的函式完美的經過訓練集,但是對新資料的**結果則較差。

3、解決方法:

減少特徵維度: 可以人工選擇保留的特徵,或者模型選擇演算法;

正則化:保留所有的特徵,通過降低引數θ的值,來影響模型

1、定義:分類器學習能力太差,連在訓練樣本上都沒有很好的分類

2、原因:特徵維度過少,導致擬合的函式無法滿足訓練集,誤差較大。

3、解決方法:增加特徵維度

1、**離散值

2、屬監督學習,擁有標記資訊

3、只涉及兩個類別的「二分類」任務,通常稱其中乙個類為「正類」,另乙個類為「反類」。

4、涉及多個類別時,稱為「多分類」任務

1、**連續值

2、屬監督學習,擁有標記資訊

1、將訓練集中的資料分成若干組,每組稱為乙個「簇」,這些自動形成的簇可能對應一些潛在的概念劃分

2、屬無監督學習,不擁有標記資訊

採用某種對映方法,將原高維空間中的資料點對映到低維度的空間中。

學得的模型適用於新樣本的能力

從特殊到一般的「泛化」過程,即從具體的事實歸結出一般性規律

從一般到特殊的「特化」過程,即從基礎原理推演出具體狀況

1、若有多個假設與觀察一致,則選擇最簡單的那個

2、演算法自身的歸納偏好與問題的匹配度會影響演算法在該問題上的好壞

機器學習基本概念

什麼是學習?如果乙個系統能夠通過執行某個過程改進它的效能,這就是學習。赫爾伯特 西蒙 什麼是機器學習?對於某給定的任務 t 在合理的效能度量方案 p的前提下,電腦程式可以通過自主學習任務 t 的經驗 e 隨著提供合適,優質,大量的經驗 e 該程式對於任務 t的效能逐步提高。任務,經驗,效能 什麼是統...

機器學習基本概念

1.基本的概念 領域集 乙個任意的集合 集合中的例項是我們希望能夠貼上標籤的資料。的元素稱為例項。標籤集 學習器所追求的結果集合。可以為,器想要得到的最終資料。訓練資料 帶標籤的領域及元素集合,通常會組成乙個區域性聚合s,也叫作訓練集。2.機器學習的一般流程 採集資料 標記 訓練 得到 器 乙個學習...

機器學習基本概念

1.基本概念 訓練集 測試集 特徵值 監督式學習 非監督學習 半監督學習 分類 回歸 2.概念學習 概念學習是指從某個布林函式的輸入輸出訓練樣例中推斷出該布林函式。3.樣例 天氣 溫度 濕度 風力 水溫 預報 享受運動 1 晴 暖 普通 強 暖 一樣 是 2 晴 暖 大 強 暖 一樣 是 3 雨 冷...