機器學習 緒論

2022-08-29 07:42:09 字數 1629 閱讀 7353

1.1引言

喧鬧的教室突然變得鴉雀無聲,沒有抬頭的你第一反應就是老闆進了教室,趕緊就收起了手裡的手機。

結果抬頭一看,老闆果真進來了;或者有時候抬頭一看,什麼也沒有,大家哈哈一笑。

為什麼?為什麼你沒抬頭看就想到會是老闆進來了?

因為你以前有過相同或者相似的經歷,也就是「經驗」。

所以你再一次經歷的時候,會根據經驗**到結果,並做出相應的反應。

與此相似的事情有很多,

我們看到天空變陰,颳起冷風,會知道馬上要下雨了,如果要出門的話會想到要拿上傘。

我們能做出這些判斷,是因為我們已經經歷過很多次了,積累了許多「經驗」。

正是對這些經驗的利用,來對新情況做出判斷的。

我們的父母家人總是自稱「過來人」的身份,並常說「吃的鹽比你吃的飯都多」。

我們思考其實質,其實就是說的他們經歷過我們沒有經歷過的事情,他們有「經驗」。

而獲得經驗的過程中難免會吃虧走彎路,也是一點一點學,最後才變得經驗豐富。

運動員同樣也是,需要一點一點學習,需要多次的訓練,

才能積累更多的經驗,在處理相同的事情時才能做出正確的判斷。

所以,獲得經驗的過程也就是「學習」的過程,也就是「訓練」的過程。

我們人類是這樣基於經驗處理事情的,而且這的確是乙個不錯的方式。

我們希望賦予機器人類的智慧型——人工智慧,就想能不能讓機器掌握這種基於經驗處理問題的方式。

答案是肯定的,並且已經有了很多先例。

那麼首先就需要讓機器獲得經驗,而獲得經驗的過程也就是學習的過程,所以就叫做「機器學習」。

在機器的世界裡,「經驗」的是以「資料」的形式存在的。

1.2基本術語

【獲得資料:要進行機器學習,首先要有資料】

假定我們收集了一批關於西瓜的資料:

每對括號都是一條關於乙個西瓜的記錄,「$=$」意思為「是」

屬性 / 特徵

$\swarrow\qquad\quad\downarrow\qquad\quad\searrow$

(色澤=青綠;根蒂=蜷縮;敲聲=濁響)    <-- 這條是乙個「示例」 / 「樣本」

(色澤=烏黑;根蒂=稍蜷;敲聲=沉悶)    <-- 這是另乙個「示例」 / 「樣本」

(色澤=淺白;根蒂=硬挺;敲聲=清脆)    <-- 這又是乙個「示例」 / 「樣本」

……想象還有很多……

——————————————————————————————————————————

例如我們把「色澤」,「根蒂」,「敲聲」作為三個座標軸,則它們張成乙個用於描述西瓜的三維空間,每個西瓜都可以在這個空間中找到自己的座標位置。

一般地,令 $d=$ 表示包含 $m$ 個示例的資料集,每個示例由 $d$ 個屬性描述(例如上面的西瓜資料使用了三個屬性),

則每個示例$x_i=(x_,x_,...,x_)$ 是 $d$ 維樣本空間 $\mathcal$ 中的乙個向量,$x_i\in \mathcal$ ,

其中 $x_$ 是 $x_i$ 在第 $j$ 個屬性上的取值,(例如上述第3個西瓜在第2個屬性上的值是「硬挺」),

$d$ 稱為樣本 $x_i$ 的「維數」($dimensionality$)

【開始訓練:有了資料,就開始訓練資料獲取經驗】

這個過程通過執行某個學習演算法來完成。

1.3假設空間

1.4歸納偏好

機器學習 緒論

機器學習所研究的主要內容就是從資料中產生模型,也就是學習演算法,給學習演算法提供經驗資料,基於這些資料訓練出新模型,在面對新的情況時,該模型會給我們提供相應的判斷。即從資料中產生模型,由模型作出相應的判斷和 基本術語 1 資料集 2 示例 樣本 3 屬性 4 屬性空間 樣本空間 5 特徵向量 6 維...

機器學習 緒論

機器學習是通過計算的手段,利用經驗來改善系統自身的效能。在計算機的世界裡就是由計算機從資料中產生模型的演算法。個人理解 機器學習是對某一物件提取其特徵,大量物件特徵的提取,組成乙個樣本集,找出特徵和我們關注結果之間的聯絡,該聯絡由計算機學習或訓練得到。再給乙個物件的作為輸出,我們通過該聯絡能夠得出正...

《機器學習》之 緒論

學習的定義 對於某類任務t和效能度量p,如果乙個電腦程式在t上以p衡量的效能隨著經驗e而自我完善,那麼我們稱這個電腦程式在從經驗e中學習。設計乙個學習系統 選取訓練經驗的型別,關鍵屬性是訓練經驗能否為系統的決策提供直接或間接的反饋 學習器可以在多大的程度上控制訓練樣例序列 訓練樣例的分布能多好地表示...