AlphaGo Zero 阿爾法元 簡介

2021-08-10 18:43:22 字數 759 閱讀 3308

阿爾法元是deepmind圍棋軟體alphago的乙個版本。alphago團隊於2023年10月19日在「 自然 」 雜誌上發表了一篇文章,介紹了alphago zero,這個版本不用學習人類的遊戲資料,比之前的版本更強大。alphago zero 在三天內通過自我對弈擁有了超過了alphago lee的實力,贏得100比0,在21天內達到了alphago master的水平,並在40天內超過了所有舊版本。它的學習從零開始,且單純基於與自己的對弈。人類的輸入沒有超出遊戲規則以外的任何指導、資料以及內部知識。

alphago zero僅用到一張神經網路,這張網路經過訓練,專門**程式自身的棋步和棋局的贏家,在每次自我對弈中進步。新程式只使用一台機器和4個tpu。ai)培養人工智慧不從人類專家獲得的資料集,對於具有超人技能的ai的發展具有重大意義,因為專家資料通常是昂貴的,不可靠的或不適用於機器的。deepmind聯合創始人兼首席執行官demis hassabis表示,alphago zero功能強大,因為它「不再受人類知識的限制」。

根據hassabis的說法,alphago的演算法可能對於需要通過巨大的可能性空間(如蛋白質摺疊或精確模擬化學反應)進行智慧型搜尋的領域最有利。 alphago的技術在難以模擬的領域(例如學習如何駕駛汽車)可能不太有用。

以上

AlphaGo Zero演算法簡介

alphago zero 引起巨大社會轟動 只告訴機器圍棋的基本規則,但是不告訴它人類摸索了上千年才總結出來的定式等圍棋戰術,讓機器完全依靠自學,打敗人類。這個題目不僅新鮮,而且熱辣。上週 deepmind alphago 人工智慧圍棋團隊的一篇新 題目是 mastering the game of...

阿爾法羅密歐

1983年,alfa 33型 1984年,alfa 90型 alfa 75型及164型。alfa romeo也正式成為fiat集團旗下一員 進入新世紀,alfa romeo在保留了傳統的藝術特質後有更加巨集偉的發展目標。2002年日內瓦車展,由喬治亞羅設計的最新brera跑車反響強烈,再次向世人展示...

AlphaGo zero 概述和引言翻譯

人工智慧的乙個長期目標是可以學習到在具有挑戰領域超越人類的演算法,最近,阿爾法圍棋成為第乙個在圍棋遊戲中擊敗世界冠軍的程式。在阿爾法圍棋的樹搜尋中,使用深度神經網路來評估當前形勢和選擇落子位置。這些神經網路由人類專家的棋譜指導學習訓練,並通過自我博弈來強化學習。在這裡,我們引入了一種沒有使用人類的資...