強化學習第三四章

2022-08-05 00:33:17 字數 836 閱讀 7333

1、梯度下降選擇固定步長可能產生的情況:收斂、發散、重複的在兩個數之間跳躍

2、np.zeros_like(x)  生成乙個shape和x一樣的全為0的陣列

3、plt.counter畫等高線圖

4、tensorflow的scope  變數命名空間

(1)若tf.variable(初始值,name=' ')這種方式,每乙個scope都會對名字產生影響

若tf.variable_scope('123')這種方式, 只有variable_scoope這種會對名字產生影響

(2)在同乙個scope內,當同樣名字的name_scope再次被宣告的時候,scope的名字不會直接被復用,而是會通過改名建立全新的scope

當同樣名字的variable_scope再次宣告的時候,scope直接復用了

5、tensorflow進行圖運算之前需要:(1)創立回話層with tf.session() as sess (2)初始化所有的變數sess.run(global_variables_initializer())

(3) sess.run([運算1,運算2],feed_dict={})   feed_dict是輸入引數

若要訪問計算圖,兩步 (1)graph=tf.get_default_graph()  (2) print(graph.get_operations())

6、當使用加操作的時候,若用c=a+b,get_operations 輸出得到的是「add:0",若用c=tf.add(a,b,'c'),輸出得到的才是乙個叫c的變數,通過graph.get_tensor_by_name可以訪問的到,盡可能為每乙個option起好名字

7、還存在的問題:共軛梯度方法和自然梯度方法

作業系統第三 四章作業

3.5 可以考慮將乙個就緒 掛起態的程序降低一定數量的優先順序,只有當就緒 掛起態在被降低優先順序後仍比最高優先順序的程序高時,才會被選做執行.4.2 對於使用者級執行緒來說,作業系統不能去讀寫程序內部的執行緒,它的排程是以程序為單位的.4.5 不會繼續執行.因為當程序退出時,會帶走 核心級執行緒,...

強化學習 強化學習基礎

為了應對車載網路中通訊環境快速變化的難題,可以使用強化學習進行解決,這裡對強化學習的基礎進行整理。主要的應用場景為車載網路中資源分配問題。本文源自莫煩python 強化學習章節,有需要請查閱原文 20200413補充了一些內容,來自這篇部落格,是李巨集毅的深度強化學習的筆記。強化學習的主要構成有 a...

強化學習 1 1 0 強化學習介紹

abstract 本文介紹reinforcement learning的具體特點和與其他機器學習演算法不同之處,本文是乙個骨架性的文章,所有專有名詞都保持英文原始單詞,具體內容會在後續中給出詳細解答。keywords reinforcement learning,situation,action,e...