二十年不敵三天

前日，《自然》雜誌刊登了谷歌deepmind團隊的新成果，名為alphazero（暫譯：阿爾法元）的機器系統僅訓練3天就戰勝了alphago lee，比分100：0，後者就是戰敗李世石的那套。

經過40天訓練後，alpha zero又以89：11戰勝了alpha master，即橫掃柯潔的那套。

更令人震驚的是，alpha zero的設計理念和系統配置完全和lee/master不同，它不依託於人類的先驗成果，完全靠自我對弈學習下棋。此前，lee/master都是用上千盤人類業餘和專業棋手的棋譜進行訓練。

阿爾法元只需要在4個tpu上，花三天時間，自己左右互搏490萬棋局。而它的哥哥阿法狗，需要在48個tpu上，花幾個月的時間，學習三千萬棋局，才打敗人類。

原因就是突破了原有系統的束縛，建立了新的機器邏輯系統。更深層次的，這個機器的邏輯系統可以自我更迭，其速度會超出人類的想象。

那麼什麼是tpu 呢？

google的處理器命名為「tensor processing unit」(tpu)，因為它能加速其第二代人工智慧系統tensorflow的執行，而且效率也大大超過gpu——google的深層神經網路就是由

tensorflow引擎驅動的。

google的處理器將是自產自銷，不會對外**，但仍會對intel、nvidia這樣的大客戶產生巨大衝擊，因為隨著越來越多的企業採用google雲服務，採購處理器並自建伺服器/資料中心的會越來越少。

對於這一進步，人類圍棋現世界第一柯潔以及前世界冠軍古力分別發表看法，柯潔稱：「乙個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」

古力也慨嘆「20年不抵3天，我們的傷感，人類的進步」。

對於人類來說，解放了人類。人類的發展讓科學家所需的基礎知識越來越多，愛因斯坦26歲就解決了光電效應、迎來了著名的「愛因斯坦奇蹟年」。可是現在物理方向的研究人員，往往26歲還沒有完成基礎知識的積累，更別說在年輕的時候有所突破了。矛盾的是，往往學習完了基礎知識也會過了大腦最適宜產出的年齡了。是時間限制了人類的進步，隨著人類的發展，毫無疑問地想產生突破所需的基礎知識會越來越多，以此更替阻礙人類的進步。而機器的學習是迅速的，成果是可以迅速讀取的，快速而有效，解放了人類的大腦。

我們對機器學習的發展充滿期待。比如，商用可控核聚變，將讓人類探索宇宙變成了可能。相信通過人工智慧，人類生活水平的上公升、文明程度的提高將指日可待。

二十年不敵三天

長沙IT二十年

二十年返校與會 Homework

Beyond 二十年搖滾之累

二十年不敵三天

長沙IT二十年

二十年返校與會 Homework

Beyond 二十年搖滾之累

相關推薦