什麼是機器學習

2022-08-25 15:54:30 字數 1420 閱讀 7697

本文主要通過乙個典型的例子介紹什麼是機器學習以及機器學習裡常見的一些概念。

乙個顧客想申請招商銀行信用卡,招商銀行讓這個顧客填寫一些基本資料,假設整個申請表一共只有五項(真實的申請表會被這五個選項要多得多)。性別女

年齡23

工作年限

0.5年收入

10萬負債

1萬假如你是招商銀行信用卡負責人,你會給她發放信用卡嗎?實際上你想知道的是給她發放信用卡對銀行有好處還是壞處。你可能有點摸不著頭腦,不知道到底是給不給這位顧客傳送信用卡,正在焦頭爛額之時,領導又來**了:「張某某上上個月刷了一萬塊,還款日都過去半個月了,怎麼還不見他還錢?當初是怎麼通過他的審核給他傳送信用卡的?blabla。。。」這時候你多麼希望手上掌握乙個非常完美的公式,只要用這個公式一算,得到乙個分數,就知道是不是應該給張某某,李某某。。。發放信用卡啊,而且這個完美的公式的確很完美,不會犯錯誤。無奈你根本找不到這個公式,於是你想憑藉自己的聰明才智攢乙個公式出來,所以你想整理一下已經擁有行用卡的顧客的消費資料,希望根據這些資料發明乙個公式,而且這個公式跟那個完美的公式長得越像越好。

從這個例子,我們引出一些基本概念:

輸入所有可能取值的集合。上面的例子,輸入實際上是乙個五維的向量,所以輸入空間就是這個向量所有的可能取值。

輸出所有可能取值的集合。上面的例子,輸出空間就是是和否,或者有好處,有壞處...

輸入空間和輸出空間可以是同乙個空間,也可以是不同的空間,通常輸出空間遠小於輸入空間。

就是例子中的完美公式。

例子中已經擁有信用卡的顧客的消費資料。

例子中發明的公式就是乙個假設。

我們期望的是「假設」和「目標函式」長得越像越好,那到底「假設」長什麼樣呢?

假設1:年收入大於8萬就發放信用卡,小於8萬就不發。

假設2:女性就發放信用卡,否則不發。

。。。假設n:。。。

所有上面的那些假設就構成了假設空間,一般假設空間裡的假設有無窮多個。

在李航博士的統計學習方法裡,假設又可以叫模型,如果模型是乙個線性模型,那模型對應的假設空間就是所有線性函式構成的函式集合。

有了模型的假設空間,接下來需要考慮的是採取什麼樣的準則選擇最優的模型。一般都是先定義好風險損失函式,採取最小化損失函式的策略。

演算法是指學習模型的具體計算方法,一般如我們常說的梯度下降法,牛頓法,向後傳播演算法等等。

機器學習問題的型別

通過上述的機器學習問題的例項,你一定已經意識到一些相似性之處。這種技能很有價值,因為擅長從現象看本質,使得你可以高效的思考需要的資料和可嘗試的演算法型別。

關於機器學習,有一些常見的分類。以下這些分類,是我們在研究機器學習時碰到的大多問題都會參考的典型。

[1]: 統計學習方法 李航著

[2]: 機器學習基石 

[3]: 

什麼是機器學習

機器學習 machine learning 是研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。它是人工智慧的核心,是使計算機具有智慧型的根本途徑,其應用遍及人工智慧的各個領域,它主要使用歸納 綜合而不是演譯。學習能力是智慧型行為的乙個非常重...

什麼是機器學習

廣州的天氣總是陰晴不定,經常上午陽光燦爛,下午突然烏雲密布,狂風亂作,然後就是傾盆大雨。每次看見烏雲和大風,人們就知道要下大雨了。為什麼我們看見烏雲感受到大風,就知道要下雨了呢?我們能做出這些有效的預判,是因為我們已經積累了許多經驗,而通過對經驗的利用,就能對新情況做出有效 那麼,這樣利用經驗做出判...

什麼是機器學習?

簡單的一句話 讓機器從資料中學習,進而得到乙個更加符合現實規律的模型,通過對模型的使用使得機器比以往表現的更好,這就是機器學習。詳解 資料 從現實生活抽象出來的一些事物或者規律的特徵進行數位化得到。學習 在資料的基礎上讓機器重複執行一套特定的步驟 學習演算法 進行事物特徵的萃取,得到乙個更加逼近於現...