谷歌人工智慧破解圍棋比賽 首次完勝歐洲冠軍

2022-10-05 14:36:12 字數 2199 閱讀 1827

新浪科技訊 1月28日上午訊息,谷歌今日宣布在人工智慧領域的重要進展:開發出一款能夠在圍棋中擊敗職業選手的程式——alphago,該程勳能夠通過機器學習的方式掌握比賽技巧。

人工智慧挑戰圍棋有多難?

計算機和人類競賽在棋模擬賽中已不罕見,在三子棋、跳棋和西洋棋等棋類上,計算機都先後完成了對人類的挑戰。但對擁有2500多年歷史的圍棋而言,計算機在此之前從未戰勝過人類。圍棋看起來棋盤簡單、規則不難,縱橫各19九條等距離、垂直交叉的平行線,共構成1919(361)個交叉點。比賽雙方交替落子,目的是在棋盤上佔據盡可能大的空間。

在極簡主義的遊戲表象之下,圍棋具有令人難以置信的深度和微妙之處。當棋盤為空時,先手擁有361個可選方案。在遊戲進行當中,它擁有遠比西洋棋iuwdrfzaog更多的選擇空間,這也是為什麼人工智慧、機器學習的研發者們始終希望在此取得突破的原因。

就機器學習的角度而言,圍棋的計算最大有3361種局面,大致的體量是1017www.cppcns.com0,而已經觀測到的宇宙中,原子的數量才1080。西洋棋最大只有2155種局面,稱為夏農數,大致是1047。

「機器學習」**人類行為

傳統的人工智慧方法是將所有可能的走法構建成一棵搜尋樹 ,但這種方法對圍棋並不適用。此次谷歌推出的alphago,將高階搜尋樹與深度神經網路結合在一起。這些神經網路通過12個處理層傳遞對棋盤的描述,處理層則包含數百萬個類似於神經的連線點。

其中乙個神經網路「決策網路」(policy network)負責選擇下一步走法,另乙個神經網路「值網路」(「value network)則**比賽勝利方。谷歌方面用人類圍棋高手的三千萬步圍棋走法訓練神經網路,與此同時,alphago也自行研究新戰略,在它的神經網路之間執行了數千局圍棋,利用反覆試驗調整連線點,這個流程也稱為鞏固學習(reinforcement learning)。通過廣泛使用google雲平台,完成了大量研究工作。

alphago所使用的神經網路結構示意圖

征服圍棋對於谷歌來說有重要意義。alphago不僅是遵循人工規則的「專家」系統,它還通過「機器學習」自行掌握如何贏得圍棋比賽。谷歌方面希望運用這些技術解決現實社會最嚴峻、最緊迫的問題——從氣候建模到複雜www.cppcns.com的災難分析。

在具體的機器訓練上,決策網路的方式是輸入人類圍棋專家的比賽,到系統可以**57%人類行動為止,此前最好成績是44%。此後alphago通過在神經網路內部進行比賽的方式(可以簡單理解成和自己下棋),開始學習自主探索新的圍棋策略。目前alphago的決策網路可以擊敗大多數具有龐大搜尋樹的最先進的圍棋程式。

值網路也是通過自己和自己下棋的方式來訓練。目前值網路可以評估每一步棋能夠有多大勝算。這在此前被認為是不可能的。

alphago戰績驚人

實際上,目前alphago已經成為最優秀的人工智慧圍棋程式。在與其他程式的對弈中,alphago用一台機器就取得了500場的勝利,甚至有過讓對手4手後獲勝的紀錄。去年10月5日-10月9日,谷歌安排alphago與歐洲圍棋冠軍fan hui(樊麾:法國國家圍棋隊總教練)閉門比賽,谷歌以5-0取勝。

alphago與歐洲圍棋冠軍樊麾的5局較量

公開的比賽將在今年三月舉行,alphago將在南韓首爾與南韓圍棋選手李世石九段一決高下,李世石是近10年來獲得世界第一頭銜最多的棋手,谷歌為此提供了100萬美元作為獎金。李世石表示很期待此次對決,並且有信心獲得勝利。

此外,alphago的發布,也是deep mind在2023年1月被谷歌收購以來首次發聲。在被收購之前,這家位於倫敦的人工智慧領域的公司還獲得了特斯拉和spacex創始人馬斯克的投資。

人機對弈誰將勝?

值得一提的是,上一次著名的人機對弈要追溯到2023年。當時ibm公司研發的超級計算機「深藍」戰勝了西洋棋冠軍卡斯巴羅夫。不過西洋棋的演算法要比圍棋簡單得多。西洋棋中取勝只需「殺死」國王,而圍棋中則用數子或比目的方法計算勝負,並不是簡單地殺死iuwdrfzaog對方棋子。此前,「深藍」計算機的設計人2023年發表文章指出,他相信十年內能有超級電腦在圍棋上戰勝人類。

該專案並未給ibm帶來可以銷售的產品,但卻讓我們意識到:基礎科學研究所面臨的巨大挑戰是值得我們去迎接的,雖然企業在這方面的收益還無法量化。

隨著頂級科技公司爭相在產品中融入智慧型技術,谷歌並不是唯一一家研究圍棋ai的公司,facebook對圍棋人工智慧的研究整合此前也亮相最新的計算技術:深卷積神經網路(deep convolutional neural networks)和蒙特卡洛樹搜尋(monte carlo tree search),前者利用類似於大腦的演算法來學習和識別棋盤上各種模式的重要性,而後者相當於一種超前思維,用於計算詳細的戰略步驟程式設計客棧。

谷歌的終極目標「人工智慧」

服務還沒有為谷歌創造太多營收,但它們絕對不是錦上添花的業務。卡爾認為,這些網路應用代表著根本性的變革,意味著從桌面到網路的巨大轉變,未來將重新定義計算和谷歌的業務模式。為了讓人們更容易理解這場變革,卡爾特別舉了乙個類似的例子 電力的發展。他認為,真正的電力創新並不是湯姆斯 愛迪生 thomas ed...

繼人工智慧攻陷圍棋,德州撲克也淪陷了

相對於圍棋,德州撲克的非完美資訊給了人工智慧更大的壓力。繼alphago披著 master 在中韓圍棋界大獲全勝後,德州撲克也不幸淪陷,只不過這次的主角並不是alphago。近日,來自加拿大alberta大學 捷克charles大學 布拉格捷克理工大學的10位研究員在arxiv 乙個收集物理學 數學...

谷歌今天將其人工智慧引擎開源了

前 不久谷歌剛剛發布的google photo讓人們驚嘆。它可以自動收集識別你的相片,並提供驚人的搜尋能力。比如你輸入 墓碑 google能挖出你幾年前你一次掃墓的 即使你當時並沒有給這張 作出任何標記。這只是google的人工智慧服務的冰山一角。在此之前,google搜尋 google翻譯等應用的...