ML 基本概念

2021-09-11 03:12:31 字數 956 閱讀 4454

機器學習最早是由一位人工智慧領域的先驅arthur samuel在2023年提出來的。本意指的是一種讓計算機在不經過明顯程式設計的情況下,對資料進行學習,並且做出**的方法,屬於電腦科學領域的乙個子集。公認的世界上第乙個自我學習專案就是samuel跳棋遊戲

在機器學習領域,有監督學習和無監督學習是兩種常用的方法。有監督學習是通過現有訓練資料集進行建模,再用模型對新的資料樣本進行分類或者回歸分析的機器學習方法。在監督式學習中,訓練資料集一般包含樣本特徵變數及分類標籤,機器使用不同的演算法通過這些資料推斷出分類的方法,並用於新的樣本中。目前有監督學習演算法已經比較成熟,並且在很多領域都有很好的表現

無監督學習或者說非監督式學習,則是在沒有訓練資料集的情況下,對沒有標籤的資料進行分析並建立合適的模型,以便給出問題解決方案的方法。在無監督學習當中,常見的兩種任務型別是資料轉換聚類分析

分類和回歸是有監督學習中兩個最常見的方法。對於分類來說,機器學習的目標是對樣本的類標籤進行**,判斷樣本屬於哪乙個分類,結果是離散的數值

回歸分析來說,其目標是要**乙個連續的資料或者是範圍

在有監督學習中,我們會在訓練資料集上建立乙個模型,之後會把這個模型用於新的,之前從未見過的資料中,這個過程稱為模型的泛化

那麼我們用什麼樣的標準來判斷乙個模型的泛化是比較好的,還是比較差的呢?

我們可以使用測試資料集對模型的表現進行評估。如果你在訓練資料集上使用了乙個非常複雜的模型,以至於這個模型在擬合訓練資料集時表現非常好,但是在測試資料集的表現非常差,說明模型出現了過擬合的問題

相反,如果模型過於簡單,連訓練資料集的特點都不能完全考慮到的話,那麼這樣的模型在訓練資料集和測試資料集的得分都會非常的差,這個時候我們說模型出現了欠擬合的問題

而只有模型在訓練資料集和測試資料集得分都比較高的情況下,我們才會認為模型對資料擬合的程度剛剛好,同時泛化的表現也會更出色

ML 基本概念

ml 基本概念 一.機器學習的起源 機器學習最早是由一位人工智慧領域的先驅arthur samuel在1959年提出來的。本意指的是一種讓計算機在不經過明顯程式設計的情況下,對資料進行學習,並且做出 的方法,屬於電腦科學領域的乙個子集。公認的世界上第乙個自我學習專案就是samuel跳棋遊戲 二.有監...

ML筆記 機器學習基本概念

監督學習 以已知結果的資料集作為訓練樣本。基本流程 輸入資料 特徵工程 模型訓練 模型部署 模型應用。監督學習的目的在於學習乙個由輸入到輸出的對映,這一對映由模型來表示,也就是說學習的目的就在於找到最好的這樣的模型。模型屬於由輸入空間到輸出空間的對映集合,這個集合就是假設空間。假設空間的確定意味著學...

基本概念 C 基本概念

由於工作中需要用到c 編寫的一些工具,有時候需要根據需求修改或者定製工具,所以現在不得不學習一下c 的基礎語法,此為筆記,不成章法!機器語言 組合語言 高階語言 面向過程的程式設計方法 物件導向的程式設計方法 泛型程式設計方法 1 演算法設計 2 源程式編輯 3 編譯 4 連線 5 執行除錯 輸入裝...