機器學習基本概念

//2019/6/26 澳門城市大學機器學習課堂隨筆

機器學習的主要議題是如何實現和優化機器的自我學習。從語義層次看，機器學習是指計算機能模擬人的學習行為，通過學習獲取知識和技能，不斷改善效能，實現自我完善。

例1：西洋雙陸棋

該系統通過

100多萬次以上與自己對弈的方法學習了下西洋雙陸棋的策略，並已達到人類世界冠軍的水平，成為博弈類機器學習領域的最典型的應用案例之一。

例2：機械人駕駛學習

該系統使用學習到的策略在高速公路上以每小時

70英里的速度自動行駛了

90英里，成為動態控制類機器學習的成功案例之一。

如果乙個計算機系統在完成某一類任務

t的效能

p能夠隨著經驗

e而改進，則稱該

系統在從經驗e中學習，並將此系統稱為

乙個學習系統。

需要注意的是，與其他人工智慧技術不同，機器學習中的「智慧型」

並不是「

預定義」

的，而是計算機系統自己從「經驗

」中通過自主學習

（1）資料探勘：從大量資料中發現可能包含的有價值的規律。例如，生物

dna資訊挖掘；（

2）自動化處理：在某些困難的領域中，人們可能還不具有開發高效演算法所需的知識。例如，人臉識別；（

3）動態控制：電腦程式必須動態地適應變化的領域。例如，生產過程控制；（

4 （5）人機協同：汽車輔助自動駕駛與人工駕駛的結合等。

（1）訓練經驗能否為系統的決策提供直接或間接的反饋。

直接反饋：機器從直接經驗（直接給出的訓練經驗）中學習。以

td-gammon

系統（西洋雙陸棋學習）為例，我們可以找到乙個由各種棋盤狀態和相應的正確走子組成的資料集作為訓練經驗，並讓機器從直接訓練經驗中學習。

間接反饋：機器從間接經驗（間接給出的訓練經驗）中學習。以

td-gammon

系統（西洋雙陸棋學習）為例，我們可能找到乙個由過去對弈序列及其勝負結果組成的資料集作為訓練經驗，並讓機器通過評估

「每一次走的貢獻程度。

（2）訓練集的分布是否與實際資料集具有相似的分布。

一般情況下，訓練集的分布與實際資料集的分布越相似，學習的結果就越為可靠。以

td-gammon

系統（西洋雙陸棋學習）為例，假如計算機下跳棋學習系統的目的是參加世界錦標賽（即

p為該系統將來在世界錦標賽上的勝率），那麼用計算機自己跟自己下跳棋的方式進行學習是不夠的，其訓練集（所用的訓練例）不能代表實際資料集（在世界錦標賽上遇到的可能棋局）。

我們可以把機器學習的任務歸結為發現目標函式(t)的可操作描述。

在許多實際問題的結果過程中，學習目標函式

(t)是乙個十分困難的任務，無法找到準確的目標函式

(t)因此，我們一般採用

函式逼近（）的方法，僅希望學習到乙個近似的目標函式v。

所以，學習目標函式的演算法通常稱為函式近似演算法。

由於理想的目標函式

(t)很難找到。

目標函式(t)的表示是指它的近似函式

(v)的表示方法。

以td-gammon系統（西洋雙陸棋學習）為例，我們可以採用線性組合、決策表、二次多項式函式、人工神經網路等多種方式

a估計訓練值

b調整權值

機器學習基本概念

什麼是學習？如果乙個系統能夠通過執行某個過程改進它的效能，這就是學習。赫爾伯特西蒙什麼是機器學習？對於某給定的任務 t 在合理的效能度量方案 p的前提下，電腦程式可以通過自主學習任務 t 的經驗 e 隨著提供合適，優質，大量的經驗 e 該程式對於任務 t的效能逐步提高。任務，經驗，效能什麼是統...

機器學習基本概念

1.基本的概念領域集乙個任意的集合集合中的例項是我們希望能夠貼上標籤的資料。的元素稱為例項。標籤集學習器所追求的結果集合。可以為，器想要得到的最終資料。訓練資料帶標籤的領域及元素集合，通常會組成乙個區域性聚合s，也叫作訓練集。2.機器學習的一般流程採集資料標記訓練得到器乙個學習...

機器學習基本概念

1.基本概念訓練集測試集特徵值監督式學習非監督學習半監督學習分類回歸 2.概念學習概念學習是指從某個布林函式的輸入輸出訓練樣例中推斷出該布林函式。3.樣例天氣溫度濕度風力水溫預報享受運動 1 晴暖普通強暖一樣是 2 晴暖大強暖一樣是 3 雨冷...

機器學習基本概念

機器學習基本概念

機器學習基本概念

機器學習基本概念

相關推薦