機器學習入門基本概念

2021-08-14 03:11:02 字數 1369 閱讀 1615

資料集(data set)

示例(instance)

屬性(attribute),又稱特徵(feature)

樣本空間(sample space)

特徵向量(feature vector)

維數(dimensionality)

標記(label)

學習(learning)

訓練資料(training data)

回歸(regression)

如果**的是連續值,例如**西瓜的成熟度 ,它必然是個大於0的小數值,比如成熟度為0.9,0.75,抑或是根據房屋面積,使用年限兩個特徵**某個房屋的價值,類似這種**稱為回歸。回歸有些不好理解,可以理解為擬合吧,根據已有資料集,得到一條曲線f,然後再來乙個xm,帶到 f 中,得到ym 。

分類(classification)

如果我們要**的是離散值,等於0,1,2,3等這類離散值,例如 好瓜,壞瓜,稱此類學習任務為分類。如果分類的結果為兩類,又稱此分類為二分類,通常稱其中乙個為正類(positive class),另乙個為反類(negative class)。它還有乙個很奇怪的名字,叫邏輯回歸,雖然是帶著回歸二字,實際是分類,注意此處。

聚類(clustering)

沒有標記的記錄集,並且我們還想學習這類資料集,比如想從裡頭挖出點有用的東西來。然後我們根據某些特徵和演算法將訓練中的西瓜分成若干組,自動形成了幾簇,這些簇可能對應一些潛在的概念,比如淺色瓜,深色瓜,本地瓜,這些概念我們都是事先不知道的。

監督學習(supervised learning)

帶有標記資訊的,回歸和分類屬於。

非監督學習(unsupervised learning)

無標記資訊的,聚類屬於。

泛化能力(generalization):

學得的模型用於新樣本的能力,是非常重要的能力。

引起泛化能力不足的乙個原因是過擬合,過擬合導致在測試集上表現非常好,但是在新來的資料集上表現非常差。

歸納偏好(inductive bias)

歸納偏好(inductive bias),機器學習演算法在學習過程中對某種型別假設的偏好。

任何乙個有效的機器學習演算法必有其歸納偏好,否則它將被假設空間中看似在訓練集上等效的假設所迷惑,而無法生成確定的學習結果,這也是機器學習中非常重要的概念,舉例說明。

機器學習入門 1 基本概念

很多人剛接觸機器學習或神經網路的時候,被一些名詞給弄糊塗了,什麼人工智慧,機器學習,統計機器學習,神經網路,深度學習等。所以學習機器學習的第一步,是要理清楚這幾者的關係。為此,我利用了乙個圖來顯示出幾者的關係。其中,機器學習是人工智慧領域的乙個分支,也是最能夠體現出智慧型的乙個分支。神經網路是機器學...

機器學習基本概念

什麼是學習?如果乙個系統能夠通過執行某個過程改進它的效能,這就是學習。赫爾伯特 西蒙 什麼是機器學習?對於某給定的任務 t 在合理的效能度量方案 p的前提下,電腦程式可以通過自主學習任務 t 的經驗 e 隨著提供合適,優質,大量的經驗 e 該程式對於任務 t的效能逐步提高。任務,經驗,效能 什麼是統...

機器學習基本概念

1.基本的概念 領域集 乙個任意的集合 集合中的例項是我們希望能夠貼上標籤的資料。的元素稱為例項。標籤集 學習器所追求的結果集合。可以為,器想要得到的最終資料。訓練資料 帶標籤的領域及元素集合,通常會組成乙個區域性聚合s,也叫作訓練集。2.機器學習的一般流程 採集資料 標記 訓練 得到 器 乙個學習...