機器學習筆記之緒論

2021-08-17 22:49:42 字數 796 閱讀 7528

1.1引言

機器學習所研究的主要內容,是關於在計算機上從資料中產生「模型」(model)的演算法,即「學習演算法」(learning algorithm).

1.2基本術語

資料集(data set),其中每條記錄是關於乙個事件或物件的描述,稱為乙個「示例」(instance)或「樣本」(sample),"特徵向量」.

反映事件或物件在某方面的表現或性質的事項,稱為「屬性」(attribute)或「特徵」(feature);

屬性上的取值,稱為「屬性值」(attribute value).

屬性張成的空間稱為「屬性空間」(attribute space)、「樣本空間」(sample space)、「輸入空間」.

**的是離散值,此類學習任務稱為分類(classification);**的是連續值,此類學習任務稱為回歸(regression)。

根據訓練資料是否擁有標記資訊,學習任務大致分為兩類:監督學習(supervised learning)和無監督學習(unsupervised learning)。

分類和回歸屬於監督學習,聚類(clustering)屬於無監督學習。

學得模型適用於新樣本的能力,稱為泛化(generalization)能力。

1.3假設空間

從樣例學習是乙個歸納過程,稱為歸納學習。

1.4假設偏好

機器學習演算法在學習過程中對某種型別假設的偏好,稱為歸納偏好。簡稱偏好。

「奧卡姆剃刀」是一種最基本的準則,選擇最簡單的那個。

1.6應用現狀

機器學習提供資料分析能力。機器學習和資料庫是資料探勘的兩大支撐。

《機器學習》之 緒論

學習的定義 對於某類任務t和效能度量p,如果乙個電腦程式在t上以p衡量的效能隨著經驗e而自我完善,那麼我們稱這個電腦程式在從經驗e中學習。設計乙個學習系統 選取訓練經驗的型別,關鍵屬性是訓練經驗能否為系統的決策提供直接或間接的反饋 學習器可以在多大的程度上控制訓練樣例序列 訓練樣例的分布能多好地表示...

機器學習導論筆記 緒論

監督學習 給定輸入x和輸出y,任務是學習從輸入到輸出的對映。方法是,先假定某個依賴於一組引數的函式,優化引數,使得逼近誤差最小。型別包括回歸和分類。非監督學習 只有輸入資料,我們的目標是發現輸入資料中的規律,輸入空間存在著某種結構使得特定的模式比其他模式更易出現,我們對其進行密度估計。聚類是密度估計...

《機器學習》筆記(一) 緒論

機器學習定義 機器學習是對依據經驗提公升自身效能或豐富自身知識的各種演算法和系統的系統性研究。機器學習 原料 任務 模型及特徵,模型佔據中心地位。正確特徵 正確模型 完成任務 任務與學習問題的區別 任務 通過模型來完成 學習問題 學習任務 通過能夠產生模型的學習演算法來解決 機器學習方法的核心 依據...