機器學習基本概念

2022-04-07 20:39:52 字數 799 閱讀 4551

1. 10折交叉驗證:英文名是10-fold cross-validation,用來測試演算法的準確性。是常用的測試方法。將資料集分成10份。輪流將其中的9份作為訓練資料,1分作為測試資料,進行試驗。每次試驗都會得出相應的正確率(或差錯率)。10次的結果的正確率(或差錯率)的平均值作為對演算法精度的估計,一般還需要進行多次10折交叉驗證,在求其平均值,對演算法的準確性進行估計。

2. 極大似然估計:極大似然估計,只是一種概率論在統計學中的應用,它是引數評估的方法之一。說的 已知某個隨機樣本滿足某種概率分布,但是其中具體的引數不清楚,引數估計通過若干次實驗,觀察其結果,利用結果推出引數的大概值。極大似然估計是建立在這樣的思想上的:已知某個引數能使這個樣本出現的概率最大。我們當然不會再去選擇其他其他小概率的樣本,所以乾脆就把這個引數作為估計的真實值。

3.後驗概率:資訊理論的基本概念之一在乙個通訊系統中,在收到某個訊息之後,接收端所了解到的該訊息傳送的概率稱為後驗證概率。後驗概率是指在得到」結果 「的資訊後重新修正的概率,如貝葉斯公式中的。是執果尋因的問題。後驗概率和先驗概率有著不可分割的聯絡,後驗的計算要以先驗概率為基礎,其實說白了後驗概率其實就是條件概率。

5.歸納學習:從樣例中學習是乙個歸納過程,也叫歸納學習

6.假設空間:我們可以把學習過程看做乙個在所有假設(hypothsis)組成的空間中進行搜尋的過程,搜尋的目標是找到與訓練集「匹配」(fit)的假設。假設的表示一旦確定,假設空間及其規模大小就確定了。

機器學習基本概念

什麼是學習?如果乙個系統能夠通過執行某個過程改進它的效能,這就是學習。赫爾伯特 西蒙 什麼是機器學習?對於某給定的任務 t 在合理的效能度量方案 p的前提下,電腦程式可以通過自主學習任務 t 的經驗 e 隨著提供合適,優質,大量的經驗 e 該程式對於任務 t的效能逐步提高。任務,經驗,效能 什麼是統...

機器學習基本概念

1.基本的概念 領域集 乙個任意的集合 集合中的例項是我們希望能夠貼上標籤的資料。的元素稱為例項。標籤集 學習器所追求的結果集合。可以為,器想要得到的最終資料。訓練資料 帶標籤的領域及元素集合,通常會組成乙個區域性聚合s,也叫作訓練集。2.機器學習的一般流程 採集資料 標記 訓練 得到 器 乙個學習...

機器學習基本概念

1.基本概念 訓練集 測試集 特徵值 監督式學習 非監督學習 半監督學習 分類 回歸 2.概念學習 概念學習是指從某個布林函式的輸入輸出訓練樣例中推斷出該布林函式。3.樣例 天氣 溫度 濕度 風力 水溫 預報 享受運動 1 晴 暖 普通 強 暖 一樣 是 2 晴 暖 大 強 暖 一樣 是 3 雨 冷...