導航:首頁 > 網路問題 > 圍棋ai用的什麼神經網路

圍棋ai用的什麼神經網路

發布時間:2025-01-24 09:53:29

① AlphaGo主要使用的技術是什麼

AlphaGo主要使用的技術是專家系統。

Alphago屬於人工智慧應用領域中的計算機博弈。阿爾法圍棋(AlphaGo)是第一個擊敗人類職業圍棋選手、第一個戰勝圍棋世界冠軍的人工智慧機器人,由谷歌(Google)旗下DeepMind公司戴密斯·哈薩比斯領銜的團隊開發。其主要工作原理是「深度學習」。

2017年7月18日,教育部、國家語委在北京發布《中國語言生活狀況報告(2017)》,「阿爾法圍棋」入選2016年度中國媒體十大新詞。

操作過程

阿爾法圍棋(AlphaGo)為了應對圍棋的復雜性,結合了監督學習和強化學習的優勢。它通過訓練形成一個策略網路(policy network),將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分布。

然後,訓練出一個價值網路(value network)對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標准,預測所有可行落子位置的結果。

這兩個網路自身都十分強大,而阿爾法圍棋將這兩種網路整合進基於概率的蒙特卡羅樹搜索(MCTS)中,實現了它真正的優勢。新版的阿爾法圍棋產生大量自我對弈棋局,為下一代版本提供了訓練數據,此過程循環往復。

② 阿爾法圍棋的程序原理

谷歌為AlphaGo設計了兩個神經網路:「決策網路」(policy network)負責選擇下一步走法, 「值網路」(value network)則預測比賽勝利方,用人類圍棋高手的三千萬步圍棋走法訓練神經網路。與此同時,AlphaGo也自行研究新戰略,在它的神經網路之間運行了數千局圍棋,利用反復試驗調整連接點,完成了大量研究工作。

閱讀全文

與圍棋ai用的什麼神經網路相關的資料

熱點內容
有線電視有個無線網路連接不上 瀏覽:449
筆記本連接wifi後卻顯示無網路 瀏覽:461
網路卡頓手機信號不好 瀏覽:541
手機網路共享給電腦穩定嗎 瀏覽:271
怎麼設置拒收網路簡訊 瀏覽:855
網路連接列印機顯示11b錯誤 瀏覽:997
世界上第一個網路出現在哪個國家 瀏覽:575
移動網路的分層覆蓋 瀏覽:815
中公研究生網路課程如何 瀏覽:37
怎樣設置網路高級 瀏覽:196
蘇州網路設備軟體 瀏覽:96
華為手機網路制式4g是什麼意思 瀏覽:658
請問網路電視怎麼樣看衛視 瀏覽:3
網路持續連接 瀏覽:229
2021網路安全專業高校 瀏覽:943
福田電腦網路布線 瀏覽:292
網安大隊網路安全排查整改報告 瀏覽:558
機頂盒外部網路設置 瀏覽:57
網路游戲大全免費下載手機版 瀏覽:944
受限制或無連接網路圖標 瀏覽:629

友情鏈接