神經結構自動設計

摘自《機器之心》

該結構使用了200個v100gpu，可能是伏特級的計算卡。

神經結構自動設計通常分為兩類：強化學習和進化演算法。強化學習中結構的元件選擇被認為是乙個行為，一系列的行為定義了乙個神經網路結構，開發集準確度用作獎賞。進化演算法中，通過變異和結構元件的重新聯合進行搜尋，有更好效能的結構會被挑選出來。這些方法工作於離散空間。

神經架構優化（neural architecture optimization,nao ）的核心是乙個編碼器模型，負責將神經網路架構對映到乙個連續表示，在連續表示上建立乙個回歸模型來逼近架構的最終效能，這裡值得注意的是，回歸模型類似於之前研究中的效能**器 [4, 27, 11]。新方法與之的區別在於如何利用效能**器：之前的研究 [27] 使用效能**器作為啟發來選擇已生成的架構，以加速搜尋過程，而新方法直接優化模組，並通過梯度下降獲得更好網路的連續表示（圖 1 中間底部黑色箭頭）。然後利用優化的表示來產生**效能更好的新神經網路架構。為了實現這一點，nao 的另乙個關鍵模組被設計成解碼器，從連續表示中恢復離散架構（圖 1 右側紅框箭頭）。解碼器是配備了注意力機制的 lstm 模型，可以實現精準恢復。這三個元件（即編碼器、效能**器和解碼器）在多工設定中接受聯合訓練，這有利於連續表示：恢復架構的解碼器目標能進一步改善架構嵌入的質量，更有效地**效能。

演算法：輸入：初始候選結構集x，初始結構集xeval = x。結構效能s為空集。種子結構數目k，步長yita，優化次數l。

第一步：訓練包含於x的每個結構x，估計以獲取開發集效能seval=，將seval併入s以擴大s；

第二步：使用x和s，通過最小化損失，訓練編碼器e，效能**器f和解碼器；

第三步：從x中挑選效能最好的k個結構，構成種子結構集xseed；

第四步：對於xseed中的每個結構，基於編碼器e和效能**器f獲得乙個更好的表示ex`。定義表示增強集e`=；

第五步：使用解碼器從ex`解碼x`，將這些新結構組成乙個新結構集，設定為xeval，使用該結構集擴張x。

重複以上過程，直到迭代完成。

挑選最好效能的結構。

神經結構自動設計

神經網路設計摘要

神經網路設計原則

神經網路設計過程

神經結構自動設計

神經網路設計 摘要

神經網路設計原則

神經網路設計過程

相關推薦

神經網路設計摘要