強化學習環境配置Ubuntu18 04

最近開始學習強化學習，要配置相關環境。主要涉及到gym、mujoco、baselines。

最開始的時候發現想要完整安裝gym就得安裝mujoco，而mujoco又不是免費的，還得申請什麼的，感覺太麻煩了，就暫時選擇了gym的最小安裝。

後來學習到dqn時發現要用到baselines，但用pip直接安裝時卻提示了和mujoco相關的錯誤。

然後選擇了下面這篇文章的方法

【強化學習】gym+baselines+mujoco+mujoco_py安裝配置

進入虛擬環境，用git直接轉殖

conda activate gymlab #寫你自己的虛擬環境名稱

git clone

進入baselines資料夾，用pip進行完全安裝

cd baselines
pip install -e '.[all]'

發現並沒有提醒mujoco的問題，不過也出現了其他的一些問題，但相對而言容易解決些。

其中乙個是執行gcc的錯誤，那就安裝gcc

sudo apt install gcc

sudo apt install libopenmpi-dev

對此，在知乎文章深度強化學習環境安裝(gym,mujoco,mujoco_pybaselines)中也談到了這個問題並給出了解決方案。

至此，baselines安裝完畢。如果之後再遇到要安裝mujoco的問題，再來參考這幾篇文章。

【openai-gym】gym安裝

【強化學習】gym+baselines+mujoco+mujoco_py安裝配置

強化學習環境配置（ubuntu16.04）—gym、mujoco、mujoco-py、baselines安裝與測試

深度強化學習環境安裝(gym,mujoco,mujoco_pybaselines)

強化學習1

這是第一篇強化學習的學習筆記，會覆蓋幾個基本的概念。程式本身，接受環境的訊號，作出行動，影響環境，形成乙個閉環。價值函式，通過value來評估哪一些狀態和動作是好的，選擇那些能夠提高value的動作和狀態。動作，當agent觀察到環境的狀態後，可以作出一些行動去影響環境，比如自動駕駛的汽車看到路面的...

強化學習系列1 強化學習簡介

2015年10月，alphago在和歐洲冠軍進行的圍棋賽上獲得了5 0的完勝，其後的深度強化學習也隨之火了起來。從本期開始開個新坑，一步步把強化學習的內容捋一遍。強化學習 reinforcement learning 是用來解決連續決策問題的一種方法。針對的模型是馬爾科夫決策過程 markov de...

強化學習1 什麼是強化學習

強化學習 reinforcement learning,rl 一般也稱作增強學習，和心理學動物行為的研究等領域有比較久的淵源。心理學中，強化指生物受到外界環境中的某些刺激後，自覺或者不自覺調整應對策略，達到趨利避害。舉個例子。馬戲團訓練動物時比方說猴子訓導員首先會發出某種指令比方說抬一下手...

強化學習環境配置Ubuntu18 04

強化學習1

強化學習系列1 強化學習簡介

強化學習1 什麼是強化學習

相關推薦