機器學習緒論

1.1引言

喧鬧的教室突然變得鴉雀無聲，沒有抬頭的你第一反應就是老闆進了教室，趕緊就收起了手裡的手機。

結果抬頭一看，老闆果真進來了；或者有時候抬頭一看，什麼也沒有，大家哈哈一笑。

為什麼？為什麼你沒抬頭看就想到會是老闆進來了？

因為你以前有過相同或者相似的經歷，也就是「經驗」。

所以你再一次經歷的時候，會根據經驗**到結果，並做出相應的反應。

與此相似的事情有很多，

我們看到天空變陰，颳起冷風，會知道馬上要下雨了，如果要出門的話會想到要拿上傘。

我們能做出這些判斷，是因為我們已經經歷過很多次了，積累了許多「經驗」。

正是對這些經驗的利用，來對新情況做出判斷的。

我們的父母家人總是自稱「過來人」的身份，並常說「吃的鹽比你吃的飯都多」。

我們思考其實質，其實就是說的他們經歷過我們沒有經歷過的事情，他們有「經驗」。

而獲得經驗的過程中難免會吃虧走彎路，也是一點一點學，最後才變得經驗豐富。

運動員同樣也是，需要一點一點學習，需要多次的訓練，

才能積累更多的經驗，在處理相同的事情時才能做出正確的判斷。

所以，獲得經驗的過程也就是「學習」的過程，也就是「訓練」的過程。

我們人類是這樣基於經驗處理事情的，而且這的確是乙個不錯的方式。

我們希望賦予機器人類的智慧型——人工智慧，就想能不能讓機器掌握這種基於經驗處理問題的方式。

答案是肯定的，並且已經有了很多先例。

那麼首先就需要讓機器獲得經驗，而獲得經驗的過程也就是學習的過程，所以就叫做「機器學習」。

在機器的世界裡，「經驗」的是以「資料」的形式存在的。

1.2基本術語

【獲得資料：要進行機器學習，首先要有資料】

假定我們收集了一批關於西瓜的資料：

每對括號都是一條關於乙個西瓜的記錄，「$=$」意思為「是」

屬性 / 特徵

$\swarrow\qquad\quad\downarrow\qquad\quad\searrow$

（色澤=青綠；根蒂=蜷縮；敲聲=濁響）　　　　<-- 這條是乙個「示例」 / 「樣本」

（色澤=烏黑；根蒂=稍蜷；敲聲=沉悶）　　　　<-- 這是另乙個「示例」 / 「樣本」

（色澤=淺白；根蒂=硬挺；敲聲=清脆）　　　　<-- 這又是乙個「示例」 / 「樣本」

……想象還有很多……

——————————————————————————————————————————

例如我們把「色澤」，「根蒂」，「敲聲」作為三個座標軸，則它們張成乙個用於描述西瓜的三維空間，每個西瓜都可以在這個空間中找到自己的座標位置。

一般地，令 $d=$ 表示包含 $m$ 個示例的資料集，每個示例由 $d$ 個屬性描述（例如上面的西瓜資料使用了三個屬性），

則每個示例$x_i=(x_,x_,...,x_)$ 是 $d$ 維樣本空間 $\mathcal$ 中的乙個向量，$x_i\in \mathcal$ ，

其中 $x_$ 是 $x_i$ 在第 $j$ 個屬性上的取值，（例如上述第3個西瓜在第2個屬性上的值是「硬挺」），

$d$ 稱為樣本 $x_i$ 的「維數」（$dimensionality$）

【開始訓練：有了資料，就開始訓練資料獲取經驗】

這個過程通過執行某個學習演算法來完成。

1.3假設空間

1.4歸納偏好

機器學習緒論

機器學習所研究的主要內容就是從資料中產生模型，也就是學習演算法，給學習演算法提供經驗資料，基於這些資料訓練出新模型，在面對新的情況時，該模型會給我們提供相應的判斷。即從資料中產生模型，由模型作出相應的判斷和基本術語 1 資料集 2 示例樣本 3 屬性 4 屬性空間樣本空間 5 特徵向量 6 維...

機器學習緒論

機器學習是通過計算的手段，利用經驗來改善系統自身的效能。在計算機的世界裡就是由計算機從資料中產生模型的演算法。個人理解機器學習是對某一物件提取其特徵，大量物件特徵的提取，組成乙個樣本集，找出特徵和我們關注結果之間的聯絡，該聯絡由計算機學習或訓練得到。再給乙個物件的作為輸出，我們通過該聯絡能夠得出正...

《機器學習》之緒論

學習的定義對於某類任務t和效能度量p,如果乙個電腦程式在t上以p衡量的效能隨著經驗e而自我完善，那麼我們稱這個電腦程式在從經驗e中學習。設計乙個學習系統選取訓練經驗的型別，關鍵屬性是訓練經驗能否為系統的決策提供直接或間接的反饋學習器可以在多大的程度上控制訓練樣例序列訓練樣例的分布能多好地表示...

機器學習 緒論

機器學習 緒論

機器學習 緒論

《機器學習》之 緒論

相關推薦

機器學習緒論

機器學習緒論

機器學習緒論

《機器學習》之緒論