導航:首頁 > 網路問題 > 圍棋ai用的什麼神經網路

圍棋ai用的什麼神經網路

發布時間:2025-01-24 09:53:29

① AlphaGo主要使用的技術是什麼

AlphaGo主要使用的技術是專家系統。

Alphago屬於人工智慧應用領域中的計算機博弈。阿爾法圍棋(AlphaGo)是第一個擊敗人類職業圍棋選手、第一個戰勝圍棋世界冠軍的人工智慧機器人,由谷歌(Google)旗下DeepMind公司戴密斯·哈薩比斯領銜的團隊開發。其主要工作原理是「深度學習」。

2017年7月18日,教育部、國家語委在北京發布《中國語言生活狀況報告(2017)》,「阿爾法圍棋」入選2016年度中國媒體十大新詞。

操作過程

阿爾法圍棋(AlphaGo)為了應對圍棋的復雜性,結合了監督學習和強化學習的優勢。它通過訓練形成一個策略網路(policy network),將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分布。

然後,訓練出一個價值網路(value network)對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標准,預測所有可行落子位置的結果。

這兩個網路自身都十分強大,而阿爾法圍棋將這兩種網路整合進基於概率的蒙特卡羅樹搜索(MCTS)中,實現了它真正的優勢。新版的阿爾法圍棋產生大量自我對弈棋局,為下一代版本提供了訓練數據,此過程循環往復。

② 阿爾法圍棋的程序原理

谷歌為AlphaGo設計了兩個神經網路:「決策網路」(policy network)負責選擇下一步走法, 「值網路」(value network)則預測比賽勝利方,用人類圍棋高手的三千萬步圍棋走法訓練神經網路。與此同時,AlphaGo也自行研究新戰略,在它的神經網路之間運行了數千局圍棋,利用反復試驗調整連接點,完成了大量研究工作。

閱讀全文

與圍棋ai用的什麼神經網路相關的資料

熱點內容
悅盒連接無線網路 瀏覽:163
中國電信改移動網路 瀏覽:286
如果網線沒接好網路會出什麼問題 瀏覽:589
疫情期間網路異常活躍 瀏覽:843
網路打車平台投訴找哪個部門 瀏覽:680
搶單軟體顯示網路異常是咋回事 瀏覽:786
網路分析儀測量相位校準設置 瀏覽:254
mp3電腦傳歌需要網路嗎 瀏覽:28
不能拉黑的網路電話哪個好 瀏覽:264
周口下樓無線網路管理中心 瀏覽:694
網路欺詐金額多少錢才能立案 瀏覽:746
如何做一張網路虛擬電話卡 瀏覽:44
如何打開共享網路搜索 瀏覽:28
如何看待網路的普及和危害 瀏覽:536
蘋果xr玩游戲網路卡頓 瀏覽:366
邢台淘寶網路運營電話多少 瀏覽:539
手機的網路經常斷開 瀏覽:573
黑鯊手機wifi網路連接受限 瀏覽:361
怎麼查看同一網路下的其他電腦 瀏覽:71
網路核相儀公司有哪些 瀏覽:177

友情鏈接