機器學習入門基本概念

資料集（data set）

示例（instance）

屬性（attribute），又稱特徵（feature）

樣本空間（sample space）

特徵向量（feature vector）

維數（dimensionality）

標記（label）

學習（learning）

訓練資料（training data）

回歸（regression）

如果**的是連續值，例如**西瓜的成熟度，它必然是個大於0的小數值，比如成熟度為0.9，0.75，抑或是根據房屋面積，使用年限兩個特徵**某個房屋的價值，類似這種**稱為回歸。回歸有些不好理解，可以理解為擬合吧，根據已有資料集，得到一條曲線f，然後再來乙個xm，帶到 f 中，得到ym 。

分類（classification）

如果我們要**的是離散值，等於0,1,2,3等這類離散值，例如好瓜，壞瓜，稱此類學習任務為分類。如果分類的結果為兩類，又稱此分類為二分類，通常稱其中乙個為正類（positive class），另乙個為反類（negative class）。它還有乙個很奇怪的名字，叫邏輯回歸，雖然是帶著回歸二字，實際是分類，注意此處。

聚類（clustering）

沒有標記的記錄集，並且我們還想學習這類資料集，比如想從裡頭挖出點有用的東西來。然後我們根據某些特徵和演算法將訓練中的西瓜分成若干組，自動形成了幾簇，這些簇可能對應一些潛在的概念，比如淺色瓜，深色瓜，本地瓜，這些概念我們都是事先不知道的。

監督學習（supervised learning）

帶有標記資訊的，回歸和分類屬於。

非監督學習（unsupervised learning）

無標記資訊的，聚類屬於。

泛化能力（generalization）:

學得的模型用於新樣本的能力，是非常重要的能力。

引起泛化能力不足的乙個原因是過擬合，過擬合導致在測試集上表現非常好，但是在新來的資料集上表現非常差。

歸納偏好(inductive bias)

歸納偏好（inductive bias），機器學習演算法在學習過程中對某種型別假設的偏好。

任何乙個有效的機器學習演算法必有其歸納偏好，否則它將被假設空間中看似在訓練集上等效的假設所迷惑，而無法生成確定的學習結果，這也是機器學習中非常重要的概念，舉例說明。

機器學習入門 1 基本概念

很多人剛接觸機器學習或神經網路的時候，被一些名詞給弄糊塗了，什麼人工智慧，機器學習，統計機器學習，神經網路，深度學習等。所以學習機器學習的第一步，是要理清楚這幾者的關係。為此，我利用了乙個圖來顯示出幾者的關係。其中，機器學習是人工智慧領域的乙個分支，也是最能夠體現出智慧型的乙個分支。神經網路是機器學...

機器學習基本概念

什麼是學習？如果乙個系統能夠通過執行某個過程改進它的效能，這就是學習。赫爾伯特西蒙什麼是機器學習？對於某給定的任務 t 在合理的效能度量方案 p的前提下，電腦程式可以通過自主學習任務 t 的經驗 e 隨著提供合適，優質，大量的經驗 e 該程式對於任務 t的效能逐步提高。任務，經驗，效能什麼是統...

機器學習基本概念

1.基本的概念領域集乙個任意的集合集合中的例項是我們希望能夠貼上標籤的資料。的元素稱為例項。標籤集學習器所追求的結果集合。可以為，器想要得到的最終資料。訓練資料帶標籤的領域及元素集合，通常會組成乙個區域性聚合s，也叫作訓練集。2.機器學習的一般流程採集資料標記訓練得到器乙個學習...

機器學習入門基本概念

機器學習入門 1 基本概念

機器學習基本概念

機器學習基本概念

相關推薦