用Caffe基於DQN玩Atari遊戲

2021-07-11 12:09:47 字數 2136 閱讀 6381

2023年deepmind 在nips上發表playing atari with deep reinforcement learning 一文,提出了dqn(deep q network)演算法,實現端到端學習玩atari遊戲,即只有畫素輸入,看著螢幕玩遊戲。deep mind就憑藉這個應用以6億美元被google收購。由於dqn的開源,在github上湧現了大量各種版本的dqn程式。這裡實現一種用caffe實現的版本,詳細描述一下環境配置和執行過程。

dqn-in-the-caffe

caffe

ale最新的是0.5.1版本,但是一直有問題,建議使用0.4.4版本,ale安裝教程和使用教程在安裝包裡面manual.pdf。

安裝sdl 按照manual.pdf

$path/ale_0.4.4/ale_0_4$ cp makefile.unix makefile

開啟sdl

use_sdl := 1

$path/ale_0.4.4/ale_0_4$ make

make all

make test

make runtest

make distribute

caffe的環境配置這裡不做介紹

protoc src/caffe/proto/caffe.proto –cpp_out=.

mkdir include/caffe/proto

mv src/caffe/proto/caffe.pb.h include/caffe/proto

pythonpath=」/home/ajay/pylearn2:/home/ajay/pylearn2/pylearn2/scripts:/usr/local/caffe/python/caffe:$pythonpath」

export pythonpath

修改cmake配置

option(cpu_only "use cpu only for caffe" off)

option(use_cudnn "use cudnn for caffe" off)

option(use_sdl "use sdl for ale" on)

include_directories(your_path/caffe-dqn/include)

include_directories(/usr/local/cuda-7.0/include)

include_directories(your_path/ale_0.4.4/ale_0_4/src)

link_directories(your_path/caffe-dqn/build/lib)

link_directories(your_path/ale_0.4.4/ale_0_4)

mkdir build

cd build

cmake ..

make

如果成功會顯示if everything works the last two lines will be

linking cxx executable dqn

[100%] built target dqn

接下來需要找乙個遊戲檔案breakout.bin

將breakout.bin,dqn_solver.prototxt,dqn.prototxt放在build下

your_path/dqn-in-the-caffe-master/build$ ./dqn

如果用gpu就將其開啟

option(cpu_only 「use cpu only for caffe」 on)

cmake ..

make

./dqn -gpu

訓練好後測試

dqn推薦系統 基於強化學習DQN的智慧型體信任增強

基於強化學習 dqn的智慧型體信任增強 亓法欣童向榮 於雷 期刊名稱 計算機研究與發展 年卷 期 2020 057 006 摘要 信任推薦系統是以社交網路為基礎的一種重要推薦系統應用 其結合用 戶之間的信任關係對使用者進行專案推薦 但之前的研究一般假定使用者之間的信任 值固定無法對使用者信任及偏好的...

人臉識別 基於Caffe

0 jpg 0 修改部分 example home jh face detect data home jh face detect tools caffe安裝目錄 build tools train data root home jh face detect train val data root ...

Caffe實踐 基於Caffe的人臉識別實現

深度學習深似海 尤其是在影象人臉識別領域,最近幾年的頂會和頂刊常常會出現沒有太多的理論創新的文章,但是效果擺在那邊。deepid是深度學習方法進行人臉識別中的乙個簡單,卻高效的乙個網路模型,其結構的特點可以概括為兩句話 1 訓練乙個多個人臉的分類器,當訓練好之後,就可以把待測試影象放入網路中進行提取...