機器學習筆記(一)

2021-08-07 09:53:47 字數 801 閱讀 5981

總結自 《機器學習》 周志華

基本術語:

資料:類似日常生活中的經驗,記錄關於乙個事件或物件的描述

屬性或特徵:反映事件或物件在某方面的表現或性質的事項,eg:顏色、根蒂

屬性值:屬性上的取值,eg:烏黑、青綠

屬性空間(樣本空間、輸入空間):屬性構成的空間,eg:用顏色、根蒂構成乙個關於西瓜的二維空間系,可以粗略的描述每乙個西瓜。

模型:泛指從資料中學得的結果

學習或訓練:從資料中產生模型的過程

訓練資料:訓練過程中使用的資料

學習演算法:從資料中產生模型的演算法

樣本:包含屬性的具體事例

示例:訓練過程中使用的樣本

標記:關於示例結果的資訊

樣例:擁有標記資訊的示例

測試:學得模型後對樣本進行**的過程

分類:**的是離散值(需要標記資訊)

回歸:**的是連續值(需要標記資訊)

聚類:將訓練集中的物件自動分成若干組(聚類前不知道標記資訊)

監督學習:訓練資料有標記資訊

無監督學習:訓練資料無標記資訊

版本空間:滿足訓練集測試的「假設」的集合

歸納偏好:機器學習演算法在學習過程中對某種型別假設的偏好

nft定理(沒有免費的午餐 no free lunch theorem):在所有問題同等重要時,學習演算法的誤差期望都是相同的

nft定理的意義:脫離具體問題討論學習演算法的優劣是沒有意義的,只有在針對具體問題時學習演算法才能體現出差異

機器學習筆記(一) 了解機器學習

1 人工智慧是我們想要達成的目標,機器學習是想要達成目標的手段,深度學習就是機器學習的其中乙個方法。2 機器學習,根據你提供的資料尋找乙個function,如下圖,輸入一段語音知道是 how are you 輸入貓的知道是 貓 怎樣找出這個function呢?第一,要有一系列的function,即模...

機器學習筆記(一)

機器學習筆記 1,2課 一.線性回歸模型 1.數學模型 對於乙個具體的問題,x1,x2 是我們所選取的特徵,h x 是我們所建立的模型,其中有n 1個引數。我們希望所建立的數學模型可以很好的刻畫實際問題,而我們所擁有的就是訓練資料集。很自然的,我們希望數學模型可以較好的表述訓練資料集的情況。雖然對訓...

機器學習筆記(一)

統計學習三要素 模型 策略和演算法。模型分類有幾種,監督非監督,引數非引數等。監督學習又分為生成方法和判別方法。生成模型有 樸素貝葉斯和隱馬爾科夫。判別模型有 k近鄰,感知機,決策樹,邏輯回歸,em,svm,boost,crf.引數模型 引數個數固定,與訓練資料無關。非引數模型 引數個數依賴於訓練資...