dopamine谷歌 重磅開源強化學習 工具箱

2021-09-10 22:49:48 字數 402 閱讀 2543

多巴胺是強化學習演算法快速原型製作的研究框架。

多巴胺是強化學習演算法快速原型製作的研究框架。它旨在滿足乙個小的,易於理解的**庫的需求,使用者可以自由地嘗試瘋狂的想法(推測性研究)。

本著這些原則的精神,第乙個版本專注於支援應用於atari 2600遊戲的最先進的單gpu rainbow**(hessel等,2018)(bellemare et al。,2013) 。具體來說,我們的rainbow**實現了hessel等人認為最重要的三個元件。:

n步bellman更新(參見例如mnih等,2016)

有關其他詳細資訊,請參閱我們的 文件。

這不是google的官方產品。

谷歌發布開源Dopamine 2 0

2019 02 10 18 41 46 去年八月,谷歌發布了 dopamine,這是一款靈活的強化學習框架。初始版本專注於特定型別的 rl 研究 基於 arcade 學習環境 乙個成熟的 易於理解的基準 和四個基於值的 dqn c51 rainbow 的簡化版本以及隱式分位數網路 實現的。據官方部落...

重磅 阿里雲文件開源

文件開源的前世今生 開源專案一直是很多開發者的寵兒。通過開源,開發者集思廣益,共同管理 分享 學習某個產品及其 通過精英式的管理方式,誕生了很多款優秀的開源軟體,長期以來在軟體市場佔據這獨特的地位。但是對於it行業,產品文件開源還是新鮮事物。不管是在傳統的通訊行業,還是在飛速發展的網際網路行業,文件...

谷歌800多款開源字型

更重要的是,作為開發者,您可以通過 api,在您的網路應用中動態式地查詢有哪些字型可以使用,以及隨時調入各種字型資源,讓您的網頁和應用更加漂亮。class video iframe height 258.75 width 345 frameborder 0 allowfullscreen src s...