- +1
阿法狗2.0版來了!這次人工智能要正式摒棄人類棋譜

據@央視CCTV5報道,谷歌旗下Deepmind公司近日在德國慕尼黑的DLD創新大會上正式宣布,將推出真正的2.0版AlphaGo。
新版“阿法狗”將正式摒棄人類棋譜,只靠計算機自身深度學習的方式成長——即探索“深度學習”方式的極限,臻至“圍棋之神”的境界。
2.0版的AlphaGo,將通過數學模型下的自我對局和深度學習,下出真正屬于人工智能(AI)的圍棋。

在2017年開年,化身Master的阿法狗風卷殘云完成60勝,唯一一場平局還是因為對弈者掉線。
當時“棋圣”聶衛平就表示:“圍棋遠不像我們想象的那么簡單,還有巨大的空間等著我們人類去挖掘。阿法狗也好,Master也罷,都是‘圍棋上帝’派來給人類引路的。”
而柯潔則說他一夜無眠,“人類千年的實戰演練進化,計算機卻告訴我們,人類全都是錯的……”
既然人類的圍棋智慧如今落入下風,那么人工智能會帶來怎么樣的圍棋變革呢?
DeepMind公司其實早已有過設想——拋棄人類棋譜套路,走AI自己的路。

該公司創始人哈薩比斯此前在一次采訪中曾透露,他們的團隊正在嘗試訓練一個沒有學習過人類棋譜的人工智能。
而當Master大殺四方后,也有外界猜測,Master是否也未曾研習人類棋譜。
但無論是人類套路還是自成一派,阿法狗更可怕的還是它的學習能力。
在2015年10月,阿法狗在與歐洲冠軍樊麾的對弈中就在公平的情況下以5比0完勝。樊麾在接受媒體采訪時認為,阿法狗的可怕在于“從不犯錯”。

在樊麾與阿法狗的五盤大戰棋譜被放上網絡后,就有不少圍棋業余高手在網絡上發表評論,其中不少人認為樊麾這次的棋下得并不出色。
但當時《自然》雜志就寫道,“人類在下棋時有一個劣勢,在長時間比賽后,他們會犯錯,但機器不會。而且人類或許一年能玩1000局,但機器一天就能玩100萬局。”
“圍棋AI的學習能力非常強大,就像當初‘深藍’第一次輸給了卡斯帕羅夫,但不到一年第二次對弈就贏了比賽。”

據《自然》雜志介紹,阿法狗的核心是兩種不同的深度神經網絡:“策略網絡”(policy network)和 “值網絡”(value network)。它們的任務在于合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋。
更恐怖的是它的“進化”深度學習能力,用了2000萬局的對子對弈進行訓練,每一次都能提升棋力。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司