一萬小時計畫 十二月一日總結

2022-07-11 10:57:10 字數 513 閱讀 2512

deep reinforcement learning course : with sonic the hedgehog,

deep reinforcement learning with pytorch:

reinforce詳解:

相關**:

ddpg演算法詳解:

策略梯度:

onpolicy off policy 區別:和off-policy,策略,後者則不是。&text=-greedy,則是on-policy。&text=)%ef%bc%8c%e6%9b%b4%e6%96%b0%e7%9a%84%e6%97%b6%e5%80%99%e6%98%af0,%ef%bc%8c%e5%88%99%e6%98%afoff%2dpolicy%e3%80%82。

td演算法詳解:

dqn演算法:

no module named ...解決辦法:

應用隨機過程:概率模型導論

凸優化以及隨機過程,cs285.

數學相關知識:

**相關:

練習一萬小時

隨著暢銷書 異類 的流行,練習一萬小時成天才 這個口號現在是盡人皆知。也許仍然有不少人相信那些不世出的天才必有天生的神秘能力,但科學家通過大量的調查研究已經達成共識,那就是所有頂級高手都是練出來的。不但如此,最近幾年的科學進展,人們可能第一次擁有了乙個關於怎樣煉成天才的統一理論。i0 i c6 s2...

一萬小時定律

這其實是一篇雞湯文章,和技術無關,又和技術有關。為什麼分享這麼乙個東西呢?因為我常被問到,作為乙個初學者,怎麼能成為了乙個大資料領域的專家?參加培訓速成?還是其他?其實沒啥好方法,花1萬個小時吧。我個人不喜歡雞湯類,成功類的文章 定律,唯獨對時間管理類的雞湯特別有感覺。今天要講講一萬小時定律,這還是...

怎樣練習一萬小時。

怎樣練習一萬小時。頂級的高手都是練出來的。大師的成長需要長時間的苦練,每天練習3個小時,完成一萬小時需要十年時間,但這僅僅是達到時間水平的最低要求。乙個人成長過程 新手 一般專家 世界大師。刻意練習 1 只在 學習區 練習真正的練習不是為了完成運動量,練習的精髓是要堅持的做自己做不好的事情。人的知識...