谷歌發布深度學習新演算法,適用於真實機械人的技能學習

2021-09-30 18:53:04 字數 439 閱讀 9980

2019-01-22 15:11:28

通過這種名叫sac(柔性致動/評價)的強化學習演算法,機械人能很快地完成技能學習任務

谷歌發布深度學習新演算法

近期,谷歌大腦和伯克利的研究人員通過長時間的研究,發布了一款最新的深度學習演算法,並發表在了一篇最新發布的**上。通過這種名叫sac(柔性致動/評價)的強化學習演算法,機械人能很快地完成技能學習任務。

據作者表示,作為目前高效的model-free演算法,這款演算法十分適用於真實世界中的機械人任務學習。在這篇文章中,將詳細比較sac與前沿強化學習演算法的效能,並利用多個實際任務作為例子來展示最新演算法的能力。這一演算法還包含完整詳細的原始碼實現供研究者學習和使用。

摘編:谷歌部落格

GAN,無監督深度學習新前景方法(1,2)

撰寫本手冊,主要和大家來 gans這樣一種最具前景的無監督學習方法。雖然生成對抗網路gans generative adversarial networks 已經被提出來好幾年了,但我依然對它非常懷疑。儘管生成對抗網路已經在 64x64 解析度的影象上取得了巨大的進步,卻依然無法打消我的疑慮,於是,...

如何學習新的知識

對於最近的一些網際網路行業的裁員新聞,時刻給我們敲醒警鐘。在技術迭代更新的技術浪潮中,如何繼續保持自己的核心競爭力呢?我們要做到與時俱進,不斷更新自己的知識技能儲備,並靈活運用到工作中。當然還有一點尤為重要,那就是要不斷培分析問題 解決問題的能力。為什麼需要a 什麼是a 怎麼使用a 使用時注意的問題...

OpenAI公布強化學習新演算法,可控制複雜機械人

近日,openai 發布了一種新型的強化學習演算法 近端策略優化 proximal policy optimization,簡稱 ppo 這種演算法不但在效能上比肩甚至超過當前最先進的方法,而且更容易實現和除錯。由於 ppo 易於使用並且效能優秀,openai 已將其設為預設的強化學習演算法。近端策...