二十年不敵三天

2021-08-09 14:48:06 字數 1154 閱讀 2845

前日,《自然》雜誌刊登了谷歌deepmind團隊的新成果,名為alphazero(暫譯:阿爾法元)的機器系統僅訓練3天就戰勝了alphago lee,比分100:0,後者就是戰敗李世石的那套。

經過40天訓練後,alpha zero又以89:11戰勝了alpha master,即橫掃柯潔的那套。

更令人震驚的是,alpha zero的設計理念和系統配置完全和lee/master不同,它不依託於人類的先驗成果,完全靠自我對弈學習下棋。此前,lee/master都是用上千盤人類業餘和專業棋手的棋譜進行訓練。

阿爾法元只需要在4個tpu上,花三天時間,自己左右互搏490萬棋局。而它的哥哥阿法狗,需要在48個tpu上,花幾個月的時間,學習三千萬棋局,才打敗人類。

原因就是突破了原有系統的束縛,建立了新的機器邏輯系統。更深層次的,這個機器的邏輯系統可以自我更迭,其速度會超出人類的想象。

那麼什麼是tpu 呢?

google的處理器命名為「tensor processing unit」(tpu),因為它能加速其第二代人工智慧系統tensorflow的執行,而且效率也大大超過gpu——google的深層神經網路就是由

tensorflow引擎驅動的。

google的處理器將是自產自銷,不會對外**,但仍會對intel、nvidia這樣的大客戶產生巨大衝擊,因為隨著越來越多的企業採用google雲服務,採購處理器並自建伺服器/資料中心的會越來越少。

對於這一進步,人類圍棋現世界第一柯潔以及前世界冠軍古力分別發表看法,柯潔稱:「乙個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」

古力也慨嘆「20年不抵3天,我們的傷感,人類的進步」。

對於人類來說,解放了人類。人類的發展讓科學家所需的基礎知識越來越多,愛因斯坦26歲就解決了光電效應、迎來了著名的「愛因斯坦奇蹟年」。可是現在物理方向的研究人員,往往26歲還沒有完成基礎知識的積累,更別說在年輕的時候有所突破了。矛盾的是,往往學習完了基礎知識也會過了大腦最適宜產出的年齡了。是時間限制了人類的進步,隨著人類的發展,毫無疑問地想產生突破所需的基礎知識會越來越多,以此更替阻礙人類的進步。而機器的學習是迅速的,成果是可以迅速讀取的,快速而有效,解放了人類的大腦。

我們對機器學習的發展充滿期待。比如,商用可控核聚變,將讓人類探索宇宙變成了可能。相信通過人工智慧,人類生活水平的上公升、文明程度的提高將指日可待。

長沙IT二十年

古語有云 近代中國,湖南獨撐半邊天 近代中國以來,多少仁人志士從湖湘這片熱土出發,在中華大地上,揮毫潑墨,為中華民族的繁榮昌盛做出了不可磨滅的貢獻。而今天,隨著網際網路時代的到來,長沙,這座歷史悠久的文化名城,不僅僅是中國網際網路人才的基地,更是成為已經逐漸成為中南地區具有足夠影響力的實力的產業新城...

二十年返校與會 Homework

尊敬的各位女士們 先生們,大家晚上好,我很榮幸能收到邀請參與今天的盛會。收到邀請函的我先是感動然後是吃驚,怎會邀請我呢。畢竟,我沒能在事業上有所成就,在畢業後也未對母校做貢獻。遠不如邀請諸多成功人士,像我這樣乙個畢業後回鄉賣炒飯的學生又怎有顏面回校演講呢。現在,我想我體會到了來自母校的深意。六十年來...

Beyond 二十年搖滾之累

beyond 二十年搖滾之累 懂得樂理的人可心關心諸如黃家駒的結他在全亞洲或全中國的圈內排行老幾之類的問題,可以思考他與喬沙翠雅尼或愛力克 詹森的差距到底有多少 beyond的fans內部與非fans之間經常有這樣的爭論,結論當然是沒有結論。攻擊者最有力的 是指斥beyond根本就是偽搖滾,真的搖滾...