周志華 機器學習 筆記(零) 概念

2021-08-18 18:40:15 字數 693 閱讀 7801

模型(model):泛指從資料中學得的結果。

訓練資料(training data):訓練過程中使用的資料。

訓練樣本(training sample):訓練資料中的每個樣本。

訓練集(training set):訓練樣本組成的集合。

假設(hypothesis):學得模型對應了關於資料的某種潛在的規律。

真相/真實(ground-truth):這種潛在規律的自身。

假設空間:所有假設組成的空間。

歸納偏好:學習演算法自身在乙個可能很龐大的假設空間中對假設進行選擇的啟發式或」價值觀「。

若欲測的是離散值,例如「好瓜」 「壞瓜」,此類學習任務稱為「分類」(classification);若欲**的是連續值,例如西瓜成熟度0.95、0.37此類學習任務稱為「回歸」(regression)。

**任務是希望通過對訓練集進行學習,建立乙個從輸入空間x到輸出空間y的對映f:x->y

學習過程看作乙個在所有假設(hypothesis)組成的空間中進行搜尋的過程,搜尋目標就是找到與訓練集「匹配」(fit)的假設,既能夠將訓練集中的瓜判斷正確的假設。

機器學習周志華筆記

1,監督學習 分類 回歸 無監督學習 聚類 2,決策樹 根據資訊增益的大小來確定節點 資訊熵 描述事務確定性程度的值 需要多少個bit來描述資訊 ent d pklog2pk 資訊增益 資訊熵 某個屬性劃分的平均資訊熵 該屬性劃分純度 3,支援向量機中對超平面的理解 劃分超平面用以下線性方程表示 w...

周志華 機器學習 筆記

學習演算法自身的歸納偏好與問題是否相配,往往會起到決定作用。對於上面這句話 你的輸入資料被怎麼處理,最終得到什麼結果,我認為偏好指的就是這個處理的過程。線性非線性?那些feature忽略掉?怎麼利用這些資料?更具體一些,你用網路處理,還是傳統方法,資料的分布和你的處理方法相符嗎?沒有免費的午餐定理 ...

周志華機器學習筆記(一)

新人一枚,既是機器學習的初學者,也是首次發部落格。謹以此記錄我的學習體會,做一些總結。望與大家共同學習 共同進步。文中若有內容錯誤或有措詞不嚴謹之處,望大家不吝指出。謝謝!根據上圖我們可以用乙個三維空間來了解以下幾個基本術語。屬性與屬性值 屬性反映事件或物件在某方面的表現或性質的事項,在此圖表示為軸...