AlphaGo Zero 阿爾法元簡介

阿爾法元是deepmind圍棋軟體alphago的乙個版本。alphago團隊於2023年10月19日在「自然」雜誌上發表了一篇文章，介紹了alphago zero，這個版本不用學習人類的遊戲資料，比之前的版本更強大。alphago zero 在三天內通過自我對弈擁有了超過了alphago lee的實力，贏得100比0，在21天內達到了alphago master的水平，並在40天內超過了所有舊版本。它的學習從零開始，且單純基於與自己的對弈。人類的輸入沒有超出遊戲規則以外的任何指導、資料以及內部知識。

alphago zero僅用到一張神經網路，這張網路經過訓練，專門**程式自身的棋步和棋局的贏家，在每次自我對弈中進步。新程式只使用一台機器和4個tpu。ai）培養人工智慧不從人類專家獲得的資料集，對於具有超人技能的ai的發展具有重大意義，因為專家資料通常是昂貴的，不可靠的或不適用於機器的。deepmind聯合創始人兼首席執行官demis hassabis表示，alphago zero功能強大，因為它「不再受人類知識的限制」。

根據hassabis的說法，alphago的演算法可能對於需要通過巨大的可能性空間（如蛋白質摺疊或精確模擬化學反應）進行智慧型搜尋的領域最有利。 alphago的技術在難以模擬的領域（例如學習如何駕駛汽車）可能不太有用。

以上

AlphaGo Zero 阿爾法元簡介

AlphaGo Zero演算法簡介

阿爾法羅密歐

AlphaGo zero 概述和引言翻譯

AlphaGo Zero 阿爾法元 簡介

AlphaGo Zero演算法簡介

阿爾法羅密歐

AlphaGo zero 概述和引言翻譯

相關推薦

AlphaGo Zero 阿爾法元簡介