IBM 神經網路突變自動選擇AI優化演算法

2021-08-27 13:42:03 字數 1702 閱讀 3935

wistuba表示,這套進化演算法系統能將選擇適當的機器學習架構的時間縮減至幾個小時,讓每個人都能有條件對深度學習網路架構進行優化。

新智元 2018/09/07 10:34字型:宋

機器學習系統並非是「生而平等」的。沒有一種演算法能應對所有的機器學習任務,這就讓尋找最優的機器學習演算法成為一項艱鉅又耗時的工作。不過這個問題現在有希望解決了,最近ibm的研究人員開發了一套能夠自動選擇ai優化演算法的系統。

ibm愛爾蘭研究院的資料科學家martin wistuba,在其近日發表的部落格文章中介紹了自己開發的這套系統。他聲稱,該系統將自動選擇優化ai演算法的速度提公升了5萬倍,錯誤率僅上公升了0.6%。

wistuba表示,這套進化演算法系統能將選擇適當的機器學習架構的時間縮減至幾個小時,讓每個人都能有條件對深度學習網路架構進行優化。

面向機器學習的神經網路突變演算法

該方法將卷積神經網路架構視為神經細胞序列,然後應用一系列突變,以找到一種結構,可以提公升給定資料集和機器學習任務的神經網路的效能。

這種方法大大縮短了網路訓練時間。這些突變會改變網路結構,但不會改變網路的**,網路的結構變化可能包括新增新的層、新增新連線或擴充套件核心或現有層。

保留原函式的神經網路突變示例。右側的體系結構是突變後的網路,但與左側的體系結構具有相同的**結果(由相同顏色表示)

實驗評估:速度提公升5萬倍,錯誤率僅上公升0.6%

實驗中,研究人員將新神經進化方法與cifar-10和cifar-100資料集上的影象分類任務的其他幾種方法進行了比較。這些資料集通常用於訓練機器學習和計算機視覺演算法的影象集。

與最先進的人工設計架構、基於強化學習的架構搜尋方法、以及基於進化演算法的其他自動化方法的結果相比,結構突變演算法在分類錯誤上稍高出前幾種方法,但耗時要少得多,比其他方法快了50000倍,錯誤率最多僅比基準資料集cifar-10上的最有力競爭對手高出0.6%。

下圖所示為演算法的優化過程。在圖2中,每個點代表不同的結構,連線線代表突變。不同顏色所示為每個結構的精度,x軸表示時間。可以看到,準確率在前10個小時內迅速上公升,之後緩慢上公升、最後趨於穩定。

深度學習網路設計的進化演算法優化

圖示為隨時間推移,進化演算法的優化過程

下圖所示為隨著時間的推移,深度學習網路結構的演變情況。

網路結構隨時間的演變,圖中某些中間狀態未顯示

實際上,自動演算法選擇並不新鮮。谷歌在智慧型手機面部識別和目標檢測上也在使用這類方法,如果ibm這一的系統效能確實如其所言,它可能代表著該領域內的一次重大進步。

將來,研究人員希望將這種優化整合到ibm的雲服務中,並將其提供給客戶。此外還計畫將其擴充套件到更大的資料集上,如imagenet和其他型別的資料,如時間序列和文字、自然語言處理任務等。

wistuba將於9月在愛爾蘭都柏林舉行的歐洲機器學習和資料庫知識發現會議(ecml-pkdd)會議上介紹這種方法。

模糊神經網路 第41期 AI演算法 模糊神經網路

關注人工智慧教師,拓展人工智慧教育新認知 演算法在人工智慧 ai 領域非常重要,我們需要把實際問題抽象成數學問題,再讓機器對數學問題進行求解。而演算法的選擇直接導致了能否解決問題,以及以多少成本解決問題。第01期 什麼是人工智慧 第3期 圖靈測試 第5期 神經網路 第8期 機器學習 第10期 大資料...

AI 機器學習 13 神經網路 RNN

什麼時候用?文字 音訊分析。永標準的神經網路用來解決這些問題時的缺點?1.標準的神經網路,輸入樣本長度固定的。這個可以處理序列訊號長度不同的情況。比如輸入文字,第一次輸入20個詞,第二次輸入30個詞。rnn用輸出序列解決這個問題。2.標準神經網路無法共享特徵。比如一句話裡有兩個相同的詞,李雷 第乙個...

人工神經網路基礎 為什麼神經網路選擇了「深度」?

現在提到 神經網路 和 深度神經網路 會覺得兩者沒有什麼區別,神經網路還能不是 深度 deep 的嗎?我們常用的 logistic regression 就可以認為是乙個不含隱含層的輸出層啟用函式用 sigmoid logistic 的神經網路,顯然 logistic regression 就不是 ...