谷歌發布深度學習新演算法，適用於真實機械人的技能學習

2019-01-22 15:11:28

通過這種名叫sac（柔性致動/評價）的強化學習演算法，機械人能很快地完成技能學習任務

谷歌發布深度學習新演算法

近期，谷歌大腦和伯克利的研究人員通過長時間的研究，發布了一款最新的深度學習演算法，並發表在了一篇最新發布的**上。通過這種名叫sac（柔性致動/評價）的強化學習演算法，機械人能很快地完成技能學習任務。

據作者表示，作為目前高效的model-free演算法，這款演算法十分適用於真實世界中的機械人任務學習。在這篇文章中，將詳細比較sac與前沿強化學習演算法的效能，並利用多個實際任務作為例子來展示最新演算法的能力。這一演算法還包含完整詳細的原始碼實現供研究者學習和使用。

摘編：谷歌部落格

GAN,無監督深度學習新前景方法（1,2）
撰寫本手冊，主要和大家來 gans這樣一種最具前景的無監督學習方法。雖然生成對抗網路gans generative adversarial networks 已經被提出來好幾年了，但我依然對它非常懷疑。儘管生成對抗網路已經在 64x64 解析度的影象上取得了巨大的進步，卻依然無法打消我的疑慮，於是，...

如何學習新的知識
對於最近的一些網際網路行業的裁員新聞，時刻給我們敲醒警鐘。在技術迭代更新的技術浪潮中，如何繼續保持自己的核心競爭力呢？我們要做到與時俱進，不斷更新自己的知識技能儲備，並靈活運用到工作中。當然還有一點尤為重要，那就是要不斷培分析問題解決問題的能力。為什麼需要a 什麼是a 怎麼使用a 使用時注意的問題...

OpenAI公布強化學習新演算法，可控制複雜機械人
近日，openai 發布了一種新型的強化學習演算法近端策略優化 proximal policy optimization，簡稱 ppo 這種演算法不但在效能上比肩甚至超過當前最先進的方法，而且更容易實現和除錯。由於 ppo 易於使用並且效能優秀，openai 已將其設為預設的強化學習演算法。近端策...

谷歌發布深度學習新演算法，適用於真實機械人的技能學習

GAN,無監督深度學習新前景方法（1,2）

如何學習新的知識

OpenAI公布強化學習新演算法，可控制複雜機械人

相關推薦