Google 專注於推進AI研究的子公司 DeepMind 昨日發佈了新版本的 AlphaGo 程序,這套系統名為「AlphaGo Zero」。其成功擊敗了去年戰勝韓國圍棋選手李世石的 DeepMind 軟件 AlphaGo Lee。

據悉,AlphaGo Zero 利用一種名為「強化學習」的機器學習技術,可以在與自己遊戲中吸取教訓。它僅用了三天時間就自行掌握了圍棋的下法,還發明了更好的棋步。這期間,除了被告知圍棋的基本規則,它未獲得人類的幫助。並在三天後成功擊敗去年在圍棋界叱詫風雲的 AlphaGo Lee,戰績為 100 比 0。

用了3日時間已經擊敗 AlphaGo Lee,21日時間已經擊敗 AlphaGo Master(今年擊敗柯潔的AI),40日成了世上最頂級棋手。

與舊版本的 AlphaGo 相比,AlphaGo Zero 的 AI 智能化主要不是根據已知的人類發展戰略進步,而是經過軟件自身的訓練不斷更新自己的遊戲知識,使自己變得越來越強,而這種做法能使軟件的上限非常之高,它能夠自己創造知識。

目前,AlphaGo Zero 的核心是一組連在一起形成人造神經網絡的「神經元」。對於棋局的每個回合,神經網絡會觀察棋子在棋盤上的位置,並推算接下來的棋步以及這些棋步讓全盤獲勝的概率。每次對弈後,它會更新神經網絡,讓棋藝更精進。而這種設定也讓 AlphaGo Zero 在圍棋比賽中拋除雜念,變得更加純淨。

專家指出,以 AlphaGo Zero 的自學能力及推盤演算能力,如用於醫學研究或科技研究,可能可以解決不少絕症或者未曾解決的科學問題。

立即 Follow:Qooah IG (@qooah),八掛產品發佈會現場,睇盡靚靚 Show Girls

編輯推薦

發表意見

發表意見

最新文章

最強手提機 SMACH Z,性能是 PS4 2倍,玩“芒享”冇難度

隨著智能手機的發展,對手提機造成了不小的影響。但是...

Surface Pro 7 整體規格及價格一次過曝光

根據 WinFuture 的報導,微軟將會在10月...

唔使食炒價仲有得平,出 iPhone 11 系列信用卡回贈 $550!

iPhone 11 系列即將喺 9 月 20 日正...

Adidas X 星戰,推出 X-WING 特別版 Ultra Boost

早在2010年, Adidas 就推出 X翼戰機(...

vivo TWS Earphone 曝光,採用高通晶片的藍牙耳機

據報導,vivo NEX 3 5G旗艦將會在9月1...