IBM 神經網路突變自動選擇AI優化演算法

wistuba表示，這套進化演算法系統能將選擇適當的機器學習架構的時間縮減至幾個小時，讓每個人都能有條件對深度學習網路架構進行優化。

新智元 2018/09/07 10:34字型：宋

機器學習系統並非是「生而平等」的。沒有一種演算法能應對所有的機器學習任務，這就讓尋找最優的機器學習演算法成為一項艱鉅又耗時的工作。不過這個問題現在有希望解決了，最近ibm的研究人員開發了一套能夠自動選擇ai優化演算法的系統。

ibm愛爾蘭研究院的資料科學家martin wistuba,在其近日發表的部落格文章中介紹了自己開發的這套系統。他聲稱，該系統將自動選擇優化ai演算法的速度提公升了5萬倍，錯誤率僅上公升了0.6%。

wistuba表示，這套進化演算法系統能將選擇適當的機器學習架構的時間縮減至幾個小時，讓每個人都能有條件對深度學習網路架構進行優化。

面向機器學習的神經網路突變演算法

該方法將卷積神經網路架構視為神經細胞序列，然後應用一系列突變，以找到一種結構，可以提公升給定資料集和機器學習任務的神經網路的效能。

這種方法大大縮短了網路訓練時間。這些突變會改變網路結構，但不會改變網路的**，網路的結構變化可能包括新增新的層、新增新連線或擴充套件核心或現有層。

保留原函式的神經網路突變示例。右側的體系結構是突變後的網路，但與左側的體系結構具有相同的**結果（由相同顏色表示）

實驗評估：速度提公升5萬倍，錯誤率僅上公升0.6%

實驗中，研究人員將新神經進化方法與cifar-10和cifar-100資料集上的影象分類任務的其他幾種方法進行了比較。這些資料集通常用於訓練機器學習和計算機視覺演算法的影象集。

與最先進的人工設計架構、基於強化學習的架構搜尋方法、以及基於進化演算法的其他自動化方法的結果相比，結構突變演算法在分類錯誤上稍高出前幾種方法，但耗時要少得多，比其他方法快了50000倍，錯誤率最多僅比基準資料集cifar-10上的最有力競爭對手高出0.6％。

下圖所示為演算法的優化過程。在圖2中，每個點代表不同的結構，連線線代表突變。不同顏色所示為每個結構的精度，x軸表示時間。可以看到，準確率在前10個小時內迅速上公升，之後緩慢上公升、最後趨於穩定。

深度學習網路設計的進化演算法優化

圖示為隨時間推移，進化演算法的優化過程

下圖所示為隨著時間的推移，深度學習網路結構的演變情況。

網路結構隨時間的演變，圖中某些中間狀態未顯示

實際上，自動演算法選擇並不新鮮。谷歌在智慧型手機面部識別和目標檢測上也在使用這類方法，如果ibm這一的系統效能確實如其所言，它可能代表著該領域內的一次重大進步。

將來，研究人員希望將這種優化整合到ibm的雲服務中，並將其提供給客戶。此外還計畫將其擴充套件到更大的資料集上，如imagenet和其他型別的資料，如時間序列和文字、自然語言處理任務等。

wistuba將於9月在愛爾蘭都柏林舉行的歐洲機器學習和資料庫知識發現會議（ecml-pkdd）會議上介紹這種方法。