機器學習（Mitchell）1

day 1

機器學習所關注的問題是：計算機如何根據經驗的累加提公升自己的效能？

定義：對於某類任務 t 和效能度量 p，如果乙個電腦程式在 t 上以 p 衡量的效能隨著經驗 e 而自我完善，那麼我們稱這個電腦程式在從經驗 e 學習。

定義乙個學習問題：

任務的種類，衡量任務提公升的標準，檢驗的**。

選取訓練經驗的類別：訓練經驗是否能給訓練決策提供直接或者間接的反饋。（信用配分：考慮每一次走子對最終的結果的貢獻程度。但由於其期間變數太多，不準確。所以一般考慮直接訓練反饋。）

學習器可以在多大程度上控制訓練樣例序列：訓練經驗是以超乎學習器控制的隨機過程提供的；學習器可向施教者提出不同型別的查詢；以及學習器通過自動探索環境來蒐集訓練樣例。這些主要是將學習器與施教者之間的相互關係。

訓練樣例的分布能多好地表示例項分布，而最終系統的效能 p 是通過後者來衡量的

：是指由於訓練經驗與最終測試的的樣例分布不同，導致學習效果不好。【舉例來說，你學習了乙個學期的量子力學，結果期末考試考的全都是量子電動力學，雖然你的學習方法木有問題，學習到的東西也沒錯，但你的學習目標卻沒拿到。】

v代表目標函式，其包含乙個重要的權衡過程。越有表徵力的描述越有更多更明顯的資料。

最小均方法（lms方法）：即通過調整權重，減小訓練資料誤差。

至此，學習系統的設計就完工了，其包含四個模組：

執行系統（performing system）：用學會的目標函式解決給定的任務。

鑑定器（critic）：以對弈的路線或者歷史記錄作為輸入，輸出目標函式的一系列訓練樣例，每乙個訓練樣例對應路線中的某個棋盤狀態和目標函式給這個樣例的評估值vtrain

泛化器（generalizer），它以訓練樣例作為輸入，輸出乙個假設，作為它對目標函式的估計。它從特定的訓練樣例中泛化，猜測乙個一般函式，使其能夠覆蓋這些樣例以及樣例之外的情形。在我們的例子中，泛化器對應 lms 演算法，輸出假設是用學習到的權值 w0 ,..., w6描述的函式vˆ。

實驗生成器（experiment generator），它以當前的假設（當前學到的函式）作為輸入，輸出乙個新的問題（例如，最初的棋局）供執行系統去探索。它的角色是挑選新的練習問題，以使整個系統的學習速率最大化。在我們的例子中，實驗生成器採用了非常簡單的策略：它總是給出乙個同樣的初始棋局來開始新的一盤棋。更完善的策略可能致力於精心設計棋子位置以探索棋盤空間的特定區域。

自始至終，本書都貫穿著這種把學習問題視為搜尋問題的看法，從而通過搜尋策略和學習器探索的搜尋空間的內在結構來刻畫學習方法。

機器學習致力於研究建立能夠根據經驗自我提高處理效能的電腦程式。本章的要點包括：

•• 機器學習從不同的學科吸收概念，包括人工智慧，概率和統計，計算複雜性，資訊理論，心理學和神經生物學、控制論、以及哲學。

• 乙個完整定義的學習問題需要乙個明確界定的任務、效能度量標準以及訓練經驗的**。

• 機器學習演算法的設計過程中包含許多選擇，包括選擇訓練經驗的型別、要學習的目標函式、該目標函式的表示形式、以及從訓練樣例中學習目標函式的演算法。

• 學習的過程即搜尋的過程，搜尋包含可能假設的空間，使得到的假設最符合已有的訓練樣例和其他先驗的約束或知識。本書的大部分內容圍繞著搜尋各種假設空間（例如，包含數值函式、神經網路、決策樹、符號規則的空間）的不同學習方法，和理論上這些搜尋方法在什麼條件下會收斂到最佳假設。

有很多關於機器學習最新研究成果的優秀資源可供閱讀。相關的雜誌包括《機器學習》（machine learning），《神經計算》（neural computation），《神經網路》（neural networks），《美國統計協會期刊》（journal of the american statistical association）和《ieee 模式識別和機器智慧型學報》（ieee transactions on pattern analysis and machine intelligence）。也有大量的年會覆蓋了機器學習的各個方面，包括國際機器學習會議(icml)，神經資訊處理系統

(nips)，計算學習理論會議(cclt)，國際遺傳演算法會議(icga)，國際知識發現和資料探勘會議(ickdd)，歐洲機器學習會議(ecml)等。

第一章主要是序言，講了西洋棋學習的演算法以及實現。

機器學習（Mitchell）1

機器學習 1

機器學習 1

機器學習（1）

機器學習（Mitchell）1

機器學習 1

機器學習 1

機器學習（1）

相關推薦