深度強化學習控制移動機械人

2021-08-02 10:09:21 字數 641 閱讀 3924

****:[email protected]

使用深度強化學習控制移動機械人在複雜環境中避障、收集物品到指定點。所用到的演算法包括dqn、deuling-ddqn、a3c、ddpg、naf。

1. 實驗環境:

ros、gazebo

2. 移動機械人模型

安裝有kinect的pioneer3移動機械人

機械人從kinect獲取state,通過reward訓練出合適的action。

問題:

解決方案:

多移動機械人非同步訓練。(相同思想的**deep reinforcement learning for robotic manipulation with asynchronous off-policy updates)

即,多個移動機械人(collector threads)負責收集樣本,乙個training thread負責訓練網路。

移動機械人需要避開障礙物(或其他機械人)同時收集綠色的方塊到達出口。

src="" width="800" height="500">

部分**:

移動機械人專案概述

之前有一篇關於機械臂專案 這一篇,就讓我來總結一下搭建乙個完整的移動機械人所需的知識及步驟吧,小小拙見,有問題請及時指正 這裡我還是不太想寫成大部分參考書上的那樣,什麼執行系統啊驅動系統啊。現在打字的我其實只是個工程師,不是在寫書或者 只是想用最簡單的話,描述給不是ai或者機械人領域的人聽,一如既往...

移動機械人 考綱複習

文末有考試技巧與考試說明 腿式幾種常見輪子型別,特點,和自由度數目 移動機械人機動性概念 典型輪式機械人機動性判定 機械人是完整性還是非完整性系統判斷 移動機械人感測器分類及其特點 常用本體感受式感測器和外感受感測器 引起移動機械人定位誤差的主要 基於概率地圖定位方法的思想和原理 markov lo...

移動機械人學 學習(一)移動機械人應用和分類

地面自主移動機械人 a 設計在室內或者室外,進行物料搬運,例如現代物流的很多倉庫 一般在醫院或者商場導購中常見,結合語音識別,人臉識別等技術,實現人機互動 例如電子科大的羽毛球機械人,日本研發的桌球機械人等,有幸與電子科大初代研發羽毛球機械人團隊交流過,並且了解整機工作流程 此類機械人在市場上常見於...