機器學習小概論

2021-10-17 03:49:27 字數 1541 閱讀 4779

機器學習發展歷程

人類一直試圖讓機器具有智慧型,也就是人工智慧(artificial intelligence)。從上世紀50年代,人工智慧的發展經歷了「推理期」,通過賦予機器邏輯推理能力使機器獲得智慧型,當時的ai程式能夠證明一些著名的數學定理,但由於機器缺乏知識,遠不能實現真正的智慧型。因此,70年代,人工智慧的發展進入「知識期」,即將人類的知識總結出來教給機器,使機器獲得智慧型。在這一時期,大量的專家系統問世,在很多領域取得大量成果,但由於人類知識量巨大,故出現「知識工程瓶頸」。

無論是「推理期」還是「知識期」,機器都是按照人類設定的規則和總結的知識運作,永遠無法超越其創造者,其次人力成本太高。於是,一些學者就想到,如果機器能夠自我學習問題不就迎刃而解了嗎!機器學習(machine learning)方法應運而生,人工智慧進入「機器學習時期」。「機器學習時期」也分為三個階段,80年代,連線主義較為流行,代表工作有感知機(perceptron)和神經網路(neural network)。90年代,統計學習方法開始佔據主流舞台,代表性方法有支援向量機(support vector machine),進入21世紀,深度神經網路被提出,連線主義捲土從來,隨著資料量和計算能力的不斷提公升,以深度學習(deep learning)為基礎的諸多ai應用逐漸成熟。

因此,人工智慧是追求目標,機器學習是實現手段,深度學習是其中一種方法。

機器學習

機器學習是一類演算法的總稱,這些演算法企圖從大量歷史資料中挖掘出其中隱含的規律,並用於**或者分類,更具體的說,機器學習可以看作是尋找乙個函式,輸入是樣本資料,輸出是期望的結果,只是這個函式過於複雜,以至於不太方便形式化表達。需要注意的是,機器學習的目標是使學到的函式很好地適用於「新樣本」,而不僅僅是在訓練樣本上表現很好。學到的函式適用於新樣本的能力,稱為泛化(generalization)能力。

機器學習步驟

通常學習乙個好的函式,分為以下三步:

1、選擇乙個合適的模型,這通常需要依據實際問題而定,針對不同的問題和任務需要選取恰當的模型,模型就是一組函式的集合。

2、判斷乙個函式的好壞,這需要確定乙個衡量標準,也就是我們通常說的損失函式(loss function),損失函式的確定也需要依據具體問題而定,如回歸問題一般採用歐式距離,分類問題一般採用交叉熵代價函式。

3、找出「最好」的函式,如何從眾多函式中最快的找出「最好」的那乙個,這一步是最大的難點,做到又快又準往往不是一件容易的事情。常用的方法有梯度下降演算法,最小二乘法等和其他一些技巧(tricks)。

學習得到「最好」的函式後,需要在新樣本上進行測試,只有在新樣本上表現很好,才算是乙個「好」的函式。

機器學習路線圖

機器學習概論

目前,工作中的事情相對少一點,富餘時間比較足,因此,可以拿出一部分時間用來學習下機器學習方面的理論知識與實踐知識。這樣做主要出於兩個方面的目的,一方面是想通過本次整理的系列來增強與梳理自己在機器學習領域中的理解,梳理出自己在機器學習領域中的方 另一方面,提公升自己的實際工作效率。好了,以上說明了本次...

機器學習概論

假如現在有n個房子的面積大小與 我們想通過這些資料得出乙個模型,這個模型的作用是,當我輸入這n個房子之外的其它房子的面積時,模型可以 出它們的 很好,這就是高中學過的線性回歸!機器學習按學習方式可分為 監督學習 無監督學習 強化學習 按演算法可分為 傳統機器學習 深度學習 強化學習 監督學習的任務是...

機器學習 機器學習概論

3 模型評估與模型選擇 4.具體應用 統計學習 是關於計算機基於 資料 構建概率統計模型並運用模型對資料進行 分析 統計學習的三要素 模型在監督學習中,模型就是所要學習的條件概率分布或決策函式。這在後面的章節中會重點介紹。策略 評價模型的標準 用損失函式和代價函式來度量 錯誤的程度。1 幾種損失函式...