李巨集毅機器學習 一 引言

2021-10-04 07:15:23 字數 2043 閱讀 4547

最近幾年人工智慧這個詞總是時不時地出現在我們視野裡,確切來說它也並不是什麼新詞兒,它在2023年代就被提出來了。它代表著我們人類的乙個長期目標,那便是希望機器可以和人一樣聰明。

可是人們卻不太清楚如何做這件事,不太清楚如何讓機器擁有智慧型,變得和人一樣聰明。直到2023年代,有了機器學習。顧名思義,機器學習就是讓機器擁有學習的能力。那麼,它和人工智慧有什麼關係呢?人工智慧是我們想要達成的目標,而機器學習是為了達成目標使用的手段。深度學習是機器學習中的一種方法。

那麼在有機器學習,深度學習之前,我們是如何做人工智慧呢?

生物學的知識告訴我們,生物的行為取決於先天的本能或後天學習的結果。

舉例來說,河狸築壩的能力是天生的。

它的築壩行為是這樣的:

我們之前做人工智慧就是這樣的,設定好機器的先天本能,通常是一些由人類確定的規則。

看起來也不錯,似乎也能完成不少任務。但也存在很大的問題,我們很難考慮到所有的規則。對於上述的聊天機械人,我們不太可能想到所有的響應規則。這就導致了機器永遠無法超過它的創造者。它的所有行為都在我們定義的規則之下,也就是說它沒有freestyle

我們的目的是研究真正的機器學習。那麼,什麼是真正的機器學習呢?

簡單來說就是寫程式讓機器有學習的能力。接下來,我們就給它提供資料以供其學習。比如在語音識別中,

告訴機器這段語音是「hi」。

這段語音是「how are you」。

我們可以機器提供大量的語音資料,並告訴它每段語音的內容。通過不斷地學習,它逐漸若有所得。於是,當我們給它一段語音(之前可能從來沒有聽過),它會告訴我們內容是什麼。

過程如下所示:

影象識別也是類似的過程:

機器學習可以看成是從資料中找到乙個函式。

舉個例子,我們要進行影象識別,通過給機器的資料,機器學習演算法可以得到乙個函式。當將影象輸入給該函式時,它能輸出該影象對應的類別。

那麼如何得到這個函式呢?我們有很多可以選擇的模型,比如神經網路,svm,決策樹等等。每個模型內都包含了很多函式(模型可能有很多引數,引數是可以變化的)。

這麼多函式選擇哪乙個呢?所以我們還得有乙個評價指標,當把資料丟給模型後能夠衡量函式的好壞。知道了函式的好壞之後,自然要選擇最好的函式。

如上圖所示,函式f1自然好於f2。同時也可以看到,這些資料有個特點,就是每個資料都給出了函式的輸入和函式期望得到的值。

在這種情景下的機器學習叫做監督學習。找到了最好的函式之後,我們就可以用它來測試,看它是否有舉一反三的能力。整個流程如下:

所以總結一下,機器學習大致可以分為三步:

李巨集毅機器學習 Introduction

人工智慧是我們想要達到的目標,即讓機器和人一樣智慧型。而機器學習是方法,讓機器從資料中學習,從而得到智慧型的方法。智慧型是什麼呢?對於人類智慧型而言,根據霍華德 加德納的多元智慧型理論,人類的智慧型分為以下七種智慧型 這不僅涵蓋了現在人工智慧的研究領域,計算機視覺 語音識別 自然語言處理等。而且也指...

李巨集毅機器學習課程筆記 5 1深度學習之引言

目錄和機器學習一樣 確定模型 model 函式集 function set 在深度學習中就是定義乙個神經網路。不同的連線會構成多樣的網路結構。確定如何評價函式的好壞 如果是多分類,那和classification一章中一樣,計算每個樣本 結果與ground truth的交叉熵,然後求和,即為loss...

李巨集毅機器學習attack model 學習筆記

loss函式及限制條件 無目標攻擊 l 負的 y 與y true 交叉熵 輸入的x 使y 與y true越遠越好 有目標攻擊 輸入的x 使y 與y true越遠越好且y 與y false越近越好 限制條件 x與x0距離需要小於乙個值,不被發現,否則攻擊就無意義 攻擊的目標是x在乙個小的變化內使模型失...