強化學習第三四章

1、梯度下降選擇固定步長可能產生的情況：收斂、發散、重複的在兩個數之間跳躍

2、np.zeros_like(x) 生成乙個shape和x一樣的全為0的陣列

3、plt.counter畫等高線圖

4、tensorflow的scope 變數命名空間

（1）若tf.variable(初始值,name=' ')這種方式，每乙個scope都會對名字產生影響

若tf.variable_scope('123')這種方式，只有variable_scoope這種會對名字產生影響

（2）在同乙個scope內，當同樣名字的name_scope再次被宣告的時候，scope的名字不會直接被復用，而是會通過改名建立全新的scope

當同樣名字的variable_scope再次宣告的時候，scope直接復用了

5、tensorflow進行圖運算之前需要：(1）創立回話層with tf.session() as sess （2）初始化所有的變數sess.run(global_variables_initializer())

(3) sess.run([運算1,運算2]，feed_dict={}) feed_dict是輸入引數

若要訪問計算圖，兩步（1）graph=tf.get_default_graph() (2) print(graph.get_operations())

6、當使用加操作的時候，若用c=a+b，get_operations 輸出得到的是「add:0"，若用c=tf.add(a,b,'c'),輸出得到的才是乙個叫c的變數，通過graph.get_tensor_by_name可以訪問的到，盡可能為每乙個option起好名字

7、還存在的問題：共軛梯度方法和自然梯度方法

作業系統第三四章作業

3.5 可以考慮將乙個就緒掛起態的程序降低一定數量的優先順序，只有當就緒掛起態在被降低優先順序後仍比最高優先順序的程序高時，才會被選做執行.4.2 對於使用者級執行緒來說,作業系統不能去讀寫程序內部的執行緒,它的排程是以程序為單位的.4.5 不會繼續執行.因為當程序退出時,會帶走核心級執行緒,...

強化學習強化學習基礎

為了應對車載網路中通訊環境快速變化的難題，可以使用強化學習進行解決，這裡對強化學習的基礎進行整理。主要的應用場景為車載網路中資源分配問題。本文源自莫煩python 強化學習章節，有需要請查閱原文 20200413補充了一些內容，來自這篇部落格，是李巨集毅的深度強化學習的筆記。強化學習的主要構成有 a...

強化學習 1 1 0 強化學習介紹

abstract 本文介紹reinforcement learning的具體特點和與其他機器學習演算法不同之處，本文是乙個骨架性的文章，所有專有名詞都保持英文原始單詞，具體內容會在後續中給出詳細解答。keywords reinforcement learning，situation，action，e...

強化學習第三四章

作業系統第三 四章作業

強化學習 強化學習基礎

強化學習 1 1 0 強化學習介紹

相關推薦

作業系統第三四章作業

強化學習強化學習基礎