強化學習環境配置Ubuntu18 04

2021-10-19 08:00:08 字數 955 閱讀 8783

最近開始學習強化學習,要配置相關環境。主要涉及到gym、mujoco、baselines。

最開始的時候發現想要完整安裝gym就得安裝mujoco,而mujoco又不是免費的,還得申請什麼的,感覺太麻煩了,就暫時選擇了gym的最小安裝。

後來學習到dqn時發現要用到baselines,但用pip直接安裝時卻提示了和mujoco相關的錯誤。

然後選擇了下面這篇文章的方法

【強化學習】gym+baselines+mujoco+mujoco_py安裝配置

進入虛擬環境,用git直接轉殖

conda activate gymlab  #寫你自己的虛擬環境名稱

git clone

進入baselines資料夾,用pip進行完全安裝

cd baselines

pip install -e '.[all]'

發現並沒有提醒mujoco的問題,不過也出現了其他的一些問題,但相對而言容易解決些。

其中乙個是執行gcc的錯誤,那就安裝gcc

sudo apt install gcc
sudo apt install libopenmpi-dev
對此,在知乎文章深度強化學習環境安裝(gym,mujoco,mujoco_pybaselines)中也談到了這個問題並給出了解決方案。

至此,baselines安裝完畢。如果之後再遇到要安裝mujoco的問題,再來參考這幾篇文章。

【openai-gym】gym安裝

【強化學習】gym+baselines+mujoco+mujoco_py安裝配置

強化學習環境配置(ubuntu16.04)—gym、mujoco、mujoco-py、baselines安裝與測試

深度強化學習環境安裝(gym,mujoco,mujoco_pybaselines)

強化學習1

這是第一篇強化學習的學習筆記,會覆蓋幾個基本的概念。程式本身,接受環境的訊號,作出行動,影響環境,形成乙個閉環。價值函式,通過value來評估哪一些狀態和動作是好的,選擇那些能夠提高value的動作和狀態。動作,當agent觀察到環境的狀態後,可以作出一些行動去影響環境,比如自動駕駛的汽車看到路面的...

強化學習系列1 強化學習簡介

2015年10月,alphago在和歐洲冠軍進行的圍棋賽上獲得了5 0的完勝,其後的深度強化學習也隨之火了起來。從本期開始開個新坑,一步步把強化學習的內容捋一遍。強化學習 reinforcement learning 是用來解決連續決策問題的一種方法。針對的模型是馬爾科夫決策過程 markov de...

強化學習1 什麼是強化學習

強化學習 reinforcement learning,rl 一般也稱作增強學習,和心理學 動物行為的研究等領域有比較久的淵源。心理學中,強化 指生物受到外界環境中的某些刺激後,自覺或者不自覺調整應對策略,達到趨利避害。舉個例子。馬戲團訓練動物時 比方說猴子 訓導員首先會發出某種指令 比方說抬一下手...