掌握地球？智慧型機器帶來的真正風險

翻譯：吳蕾、霍靜、任傑

當人們問我是做什麼工作的時候，我總是非常困惑如何回答才好。「人工智慧」這個答覆吧，我覺得太寬泛了，而「影象識別」似乎又太專業了。不過呢，還是下面這個問題令我真正抓狂：

人工智慧會掌控整個地球嗎？

對於一名從事於機器智慧型研究的專業人士來說，這個問題太讓我惱火了。我也不想去抱怨懷疑論者，事實上大部分人都覺得人工智慧是一種神秘，而且有著無窮無盡陰謀詭計的玩意兒，最終它們會把人類滅絕，因為，它能夠在我們狂看一晚evan goldberg編導的電影之後，就**到下一部我們將**的影片將會是《sausage party》(《香腸派對》)。

「然而，大多數人並沒有意識到，無論我們認為自己多麼有個性，多麼特殊，從普遍意義上來看，人們還是遵循一些普遍行為模式的。只要經過足夠多訓練，計算機就可以輕鬆識別出人們的行為模式。」

1.受控環境 2.監督

我們看到了google的人工圍棋選手alphago打敗了人類最厲害的圍棋選手，計算機象棋的問題很早以前就已經解決了，而最近又有很多**在**doom遊戲比賽中擊敗人類的話題。事實上，在遊戲裡面，你能夠完全掌控操作環境、能夠實施的行為以及可能產生的結果，這使得建模變得相當容易。而一旦我們能夠將遊戲環境進行建模，下一步任務就是模擬和學習。實際上，這些理論早就已經成熟了，正是近年來計算機硬體的發展使大規模機器學習得以實現，才能夠令alphago這類技術在實現層面上獲得重大突破。

監督式受控環境表示對於每乙個行為，你能夠估計出可能受到的懲罰，從而能夠有效地從錯誤中積累經驗，而遊戲正是這種監督式受控環境的完美表達。還有乙個例子就是我們剛才提到的電影**，可以理解為有乙個很大的樣本，裡面存在「使用者」和「影片」兩類資料，還有乙個給定的使用者選擇模型。通過這些，我們就能進行下一次看什麼電影的**。

在監督式受控環境中，我們知道會得到何種資訊，並能夠對類似的資訊加以處理。我們可以對這類目標建立「表達法」（representation），在我們需要進行**的時候，這些「表達法」能夠幫助我們最終確定準確的計算模型。這是通用學習型別中的乙個非常狹窄的子類，也是和我們人類差不多的一類智慧型方式。

圖注：分類器概觀

然而，大部分的人類行為並非監督式的，而是在與環境互動的基礎上建立的邏輯和直覺。人類的基本活動，比如說識別物體，理解物理過程都是時常發生的事情。通常，我們通過與事物的互動能習得很多的新知。

在當前階段，這對於計算機來說還是很難達到的水平。現在如果你要一台機器能認識所有你給的裡面的汽車，你必須告訴機器先去看那些，還得告訴它你的汽車是什麼樣子的。當你給機器看了大量汽車時，它就能認出汽車了。這就是監督式學習，在它尚未理解看什麼東西的時候，你得教它汽車是什麼樣子的。

現在，計算機科學家在努力使這種學習變成幾乎無需監督的，即非監督式學習。最終，我們希望機器能夠理解物體和景象的概念本身，而不需要特地去調教它。

當前大多數研究的重心在於非監督式學習，解決這個問題更加困難。誠然，我們的機器看上去更聰明了，不過大多數都是在監督式受控環境中的情況。首先我們必須能令機械人在非監督的環境下正常工作，然後再考慮系統在非受控的情形下執行，這樣才更為接近人類的智慧型。

「儘管，現在**機器滅絕人類，或者是機械人的『不良企圖』仍為時尚早。然而，人工智慧更嚴峻的威脅正悄然逼近，這可能造成極其嚴重的後果」。

早先通過觀察特定的特性的演算法稱為決策樹分割資料，圖源：維基百科

在這個會議的最初討論時，我導師曾提到了乙個問題，令我第一次真正質疑人工智慧的可用性。早期傳統的人工智慧技術的演算法很容易理解，比如說，我們要造乙個機器來測量人的身高和體重，並告訴他們是不是超重了。這個很簡單，我們只需要計算出這個人的體重指數(body mass index, bmi)，如果超過了特定閾限，那就是超重。這是人工智慧的原型演算法。如果我說某人肥胖，這是必須要有合理的判斷的（而不是熊孩子罵人），這個人的bmi確實是落在超重人群的平均bmi範圍裡。

現在大多數的機器已經不是這麼簡單了，它們採用大量複雜的資料作為輸入（比如高畫質晰度的），經過非常精細粒度的演算法來完成輸出。這樣的話，簡單的閾限或決策樹的方法就不夠用了。漸漸地，系統採用了一套廣為人知的深度學習演算法，去識別和學習大量資料，用類似於人類的方式去細化模板。

圖注：典型的深度學習模型。它包含了若干個互相連通傳播資訊的神經元(圓圈)，這與已發現的人腦運作模式十分相似

這些系統效能非常好，但是學習過程很慢，因為需要很多資料來學習。

「但是，有個問題：一旦它們給了我們結果，不管正確與否，我們並不知道機器是怎麼得到這個結果的。」

這個聽起來並不是那麼要緊—在開始的時候，在機器學習系統裡面，我們有兩種型別的資料—特徵和標籤。特徵是觀察到的變數，標籤是我們需要**的。舉個例子，在之前的肥胖症檢測器中，我們的特徵是人的身高和體重，標籤是每個人的超重或者健康指標。為了從中檢測癌症細胞，特徵是若干張器官的影象，標籤是有沒有癌症細胞。

癌症檢測演算法會先掃瞄這組

機器學習演算法一般會這樣解決問題，先給每個特徵配置權重，相加，最後基於所得的和來做決定。比如，如果你要**乙個蘋果是不是壞了，你會先看蘋果的氣味、顏色，如果觸控一下那麼就還有它的質感，最後大腦會配置給這些特徵不同的權重。

假如蘋果爛了，光憑顏色乙個特徵就可以解決問題了

計算機遵循類似的想法，只不過權重是通過不同的優化演算法算出來的。但是，在深度學習中，我們並不確定我們想用哪些具體的特徵，更不用說配置權重。所以我們怎麼辦？我們讓計算機自己學習選出最好的特徵群，把它們用最佳方式組合來做決定，從某種意義上模擬人類大腦的做法。

這個主意給我們帶來驚人的結果—在計算機視覺領域（這個領域研究如何讓計算機理解影象資料），尤其是隨著高效gpu和新框架的出現，使學習基本的影象級別的概念變得小菜一碟。但是，要注意的是—我們討論的這些機器通過學習選出的特徵，物理意義並不像傳統方法那麼直觀。

這些例子展示了計算機從中尋找的東西—看上去它們在檢測形狀，但是對於非影象資料，並不是這麼直觀。

大部分人不覺得這是個問題—從技術角度在現階段這並不是乙個大問題，因為現在人工智慧解決的任務都是具體的，比如從中辨認人物和物體、臉部追蹤以及合成聲音頻號。我們大致知道演算法在學習什麼樣的物體（事實上，這個展示是這個方面的乙個最近的發展）。但是，當我們使用深度學習來處理那些有更多風險的**的時候，每個**都需要合情合理，可以解釋。

設想你是一家銀行，你有所有客戶詳細的交易資訊和信用歷史。你使用乙個複雜的深度學習演算法來找出拖欠貸款者。既然你已經有了乙個大型資料庫囊括使用者的各類行為模式資訊，演算法解決這個問題可能會給出很高的準確率，但是，一旦你懷疑未來的拖欠者，你並不確切的知道到底是什麼引起了懷疑，對於**的解釋變得非常困難。

大部分的深度學習系統沒有好的技術去理解它們的決策能力，這個也是研究的熱點。對於某些與特定任務相關的深度網路，尤其在計算機視覺，我們在理解這些系統上已經有了很大的進步—對其較好的定位，理解是什麼激發產生了一種演算法以及演算法是否確實（按照我們的理解）這麼做了。但是總的來說，還是有很大的空間需要提高。

機器學習有個很嚴重的缺陷—為了把訊號和雜訊分開，需要很多人工處理。或者用專業的話說，過擬合。我說這個專業詞的意思是，當乙個模型要擬合乙個特定的資料集，用以**新的未知的資料，它可能對於已知資料擬合的過於完美。所以導致的結果是，當應用於現實世界的時候，它就不會那麼準確。

具體來講，模型不是學習在這個世界中確實存在的模式，而是學習已經採集資料集的模式。有幾種方式可以理解過擬合，對於感興趣的人現實中有很多的關於過擬合的例子。乙個簡單的例子就是在你居住的地方是夏天，所以你把自己的行李箱裝滿了夏天的衣服，結果在阿姆斯特丹只有11度，你在那裡只能冷的瑟瑟發抖。

該圖反映了過擬合的情況，即，最後一幅圖顯然對噪音也進行了擬合

這個問題的反響會隨著深度學習在推斷任務中的應用增加而迅速加大。比如，我們看到很多研究關於醫療影象** – 這個應用需要更多的可解釋性和可理解性。除此之外，假如**任務的批量太大不可能去人工檢查**結果，我們就需要系統來幫我們理解和調整機器學習到底做了什麼。

這個威脅剛剛出現，但是這個方面的研究需要更多的時間，來找到更好的解決辦法。但是，我們必須意識到模型可解釋性的重要性，尤其當我們建立模型是為了讓生活變得更好。

我想用乙個例子來結尾：如果乙個人撞車了，我們可以找出原因，來理解事故是怎麼發生的 – 也許司機喝醉了，也許路人正邊端著熱飲邊發簡訊呢。

但是如果無人駕駛車撞到另外一輛車，致一名乘客死亡，我們去找誰呢？原因又是什麼呢？你怎麼保證它不會再發生呢？

掌握地球？智慧型機器帶來的真正風險

物聯網和智慧型地球的智慧型

智慧型地球歐巴馬的新戰略？

智慧型外呼機械人為你帶來快速高效邀約

掌握地球？智慧型機器帶來的真正風險

物聯網和智慧型地球的智慧型

智慧型地球 歐巴馬的新戰略？

智慧型外呼機械人為你帶來快速高效邀約

相關推薦

智慧型地球歐巴馬的新戰略？