機器學習小概論

機器學習發展歷程：

人類一直試圖讓機器具有智慧型，也就是人工智慧（artificial intelligence）。從上世紀50年代，人工智慧的發展經歷了「推理期」，通過賦予機器邏輯推理能力使機器獲得智慧型，當時的ai程式能夠證明一些著名的數學定理，但由於機器缺乏知識，遠不能實現真正的智慧型。因此，70年代，人工智慧的發展進入「知識期」，即將人類的知識總結出來教給機器，使機器獲得智慧型。在這一時期，大量的專家系統問世，在很多領域取得大量成果，但由於人類知識量巨大，故出現「知識工程瓶頸」。

無論是「推理期」還是「知識期」，機器都是按照人類設定的規則和總結的知識運作，永遠無法超越其創造者，其次人力成本太高。於是，一些學者就想到，如果機器能夠自我學習問題不就迎刃而解了嗎！機器學習（machine learning）方法應運而生，人工智慧進入「機器學習時期」。「機器學習時期」也分為三個階段，80年代，連線主義較為流行，代表工作有感知機（perceptron）和神經網路（neural network）。90年代，統計學習方法開始佔據主流舞台，代表性方法有支援向量機（support vector machine），進入21世紀，深度神經網路被提出，連線主義捲土從來，隨著資料量和計算能力的不斷提公升，以深度學習（deep learning）為基礎的諸多ai應用逐漸成熟。

因此，人工智慧是追求目標，機器學習是實現手段，深度學習是其中一種方法。

機器學習

機器學習是一類演算法的總稱，這些演算法企圖從大量歷史資料中挖掘出其中隱含的規律，並用於**或者分類，更具體的說，機器學習可以看作是尋找乙個函式，輸入是樣本資料，輸出是期望的結果，只是這個函式過於複雜，以至於不太方便形式化表達。需要注意的是，機器學習的目標是使學到的函式很好地適用於「新樣本」，而不僅僅是在訓練樣本上表現很好。學到的函式適用於新樣本的能力，稱為泛化（generalization）能力。

機器學習步驟

通常學習乙個好的函式，分為以下三步：

1、選擇乙個合適的模型，這通常需要依據實際問題而定，針對不同的問題和任務需要選取恰當的模型，模型就是一組函式的集合。

2、判斷乙個函式的好壞，這需要確定乙個衡量標準，也就是我們通常說的損失函式（loss function），損失函式的確定也需要依據具體問題而定，如回歸問題一般採用歐式距離，分類問題一般採用交叉熵代價函式。

3、找出「最好」的函式，如何從眾多函式中最快的找出「最好」的那乙個，這一步是最大的難點，做到又快又準往往不是一件容易的事情。常用的方法有梯度下降演算法，最小二乘法等和其他一些技巧（tricks）。

學習得到「最好」的函式後，需要在新樣本上進行測試，只有在新樣本上表現很好，才算是乙個「好」的函式。

機器學習路線圖

機器學習小概論

機器學習概論

機器學習概論

機器學習機器學習概論

機器學習小概論

機器學習概論

機器學習概論

機器學習 機器學習概論

相關推薦

機器學習機器學習概論