初識強化學習,什麼是強化學習?

2021-10-19 13:15:33 字數 597 閱讀 5830

相信很多人都聽過「機器學習」和「深度學習」,但是聽過「強化學習」的人可能沒有那麼多,那麼,什麼是強化學習呢?強化學習是機器學習的乙個子領域,它可以隨著時間的推移自動學習到最優的策略。

在我們不斷變化的紛繁複雜的世界裡,從更廣的角度來看,即使是單純的靜態的輸入-輸出型問題也會變成動態的問題。例如,對於乙個簡單的監督式學習任務——貓狗分類。你收集到了一些訓練資料,然後用你最喜歡的深度學習框架寫了乙個分類網路進行訓練,很快模型收斂,效果拔群,因此你將這個模型部署上線,過了一段時間一些狗的狗毛修剪方式發生了改變,並且有一大部分狗的模型不能正確識別,因此需要更新訓練資料然後重新訓練模型。

上面這個例子是為了說明即使最簡單的機器學習問題也有乙個隱藏的維度因素——時間,而時間這個維度經常被忽視,但很可能會對生產系統造成較大問題。

強化學習(reinforcement learning,rl)是一種將這種額外維度(通常是時間,但也不一定)融入學習的方法,比起機器學習中的其他領域,它更接近人們對人工智慧的普遍認知,並且也是最接近人類學習的一種學習方式。下面就簡要介紹一下機器學習中的幾種學習方式。

相信很多人都對監督學習很熟悉,它所需要解決的問題是:給定一組樣例對,如何構建乙個函式,將輸入對映到輸出?以下是一些監督學習的例子:

強化學習1 什麼是強化學習

強化學習 reinforcement learning,rl 一般也稱作增強學習,和心理學 動物行為的研究等領域有比較久的淵源。心理學中,強化 指生物受到外界環境中的某些刺激後,自覺或者不自覺調整應對策略,達到趨利避害。舉個例子。馬戲團訓練動物時 比方說猴子 訓導員首先會發出某種指令 比方說抬一下手...

強化學習 強化學習基礎

為了應對車載網路中通訊環境快速變化的難題,可以使用強化學習進行解決,這裡對強化學習的基礎進行整理。主要的應用場景為車載網路中資源分配問題。本文源自莫煩python 強化學習章節,有需要請查閱原文 20200413補充了一些內容,來自這篇部落格,是李巨集毅的深度強化學習的筆記。強化學習的主要構成有 a...

強化學習 1 1 0 強化學習介紹

abstract 本文介紹reinforcement learning的具體特點和與其他機器學習演算法不同之處,本文是乙個骨架性的文章,所有專有名詞都保持英文原始單詞,具體內容會在後續中給出詳細解答。keywords reinforcement learning,situation,action,e...