強化學習的資料

2021-08-17 15:45:47 字數 601 閱讀 8769

**：

隨著deepmind和alphago的成功，強化學習(reinforcement learning)日益受到關注。然而，在一些機器學習入門課程中，並沒有專題討論強化學習。希望這個問題能夠成為知乎上對於強化學習嚴肅討論的乙個起點。也非常希望強化學習方面的研究者分享一下這個領域的研究現狀和展望。

以下為一些強化學習的相關學習資源：

1. udacity課程1：machine learning: reinforcement learning，以及更深入的udacity課程2：reinforcement learning

4. stanford開發的入門課程作業－簡化版無人車駕駛：car tracking (cs221 ai: principles and techniques)

5.cs 294: deep reinforcement learning, fall 2015 cs 294 deep reinforcement learning, fall 2015。課程安排和資料很好。推薦最為rl高階學習。

注：以上berkeley和stanford的課程專案都是精心開發的課程作業，已經搭建好了基礎**，學習者可專注於實現核心演算法，並且有自動評分程式(auto-grader)可以自測。

強化學習強化學習基礎

為了應對車載網路中通訊環境快速變化的難題，可以使用強化學習進行解決，這裡對強化學習的基礎進行整理。主要的應用場景為車載網路中資源分配問題。本文源自莫煩python 強化學習章節，有需要請查閱原文 20200413補充了一些內容，來自這篇部落格，是李巨集毅的深度強化學習的筆記。強化學習的主要構成有 a...

強化學習 1 1 0 強化學習介紹

abstract 本文介紹reinforcement learning的具體特點和與其他機器學習演算法不同之處，本文是乙個骨架性的文章，所有專有名詞都保持英文原始單詞，具體內容會在後續中給出詳細解答。keywords reinforcement learning，situation，action，e...

強化學習系列1 強化學習簡介

2015年10月，alphago在和歐洲冠軍進行的圍棋賽上獲得了5 0的完勝，其後的深度強化學習也隨之火了起來。從本期開始開個新坑，一步步把強化學習的內容捋一遍。強化學習 reinforcement learning 是用來解決連續決策問題的一種方法。針對的模型是馬爾科夫決策過程 markov de...