▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

騰訊“絕藝”全勝戰(zhàn)績(jī)奪世界圍棋AI冠軍,曾對(duì)柯潔13連勝

澎湃新聞?dòng)浾?王心馨
2017-03-20 08:42
來源:澎湃新聞
? 能見度 >
字號(hào)

3月19日,第10屆日本UEC杯計(jì)算機(jī)圍棋大賽在日本東京都日本電氣通信大學(xué)(UEC)落幕,騰訊人工智能實(shí)驗(yàn)室(騰訊AI Lab)研發(fā)的圍棋人工智能程序“絕藝”(英文名:FineArt) 在最終的決賽中,戰(zhàn)勝了日本“棋手”DeepZenGO,以11戰(zhàn)全勝戰(zhàn)績(jī)獲得這次比賽冠軍。

“絕藝”戰(zhàn)勝DeepZenGO

UEC杯始創(chuàng)于2007年,與普通圍棋賽不同,參賽選手不是人類,而是人工智能,每年在日本舉行,是最具傳統(tǒng)和權(quán)威的計(jì)算機(jī)圍棋大賽。UEC杯每年邀請(qǐng)各國高水平AI齊聚東京比賽,促進(jìn)相關(guān)學(xué)術(shù)及科技的交流。日本的DeepZenGo、法國的“瘋石”(Crazy Stone)、美國Facebook公司的“黑暗森林”(Dark Forest)等著名計(jì)算機(jī)圍棋程序曾先后在UEC杯折桂獲獎(jiǎng)。

比賽現(xiàn)場(chǎng)

說到圍棋AI比賽,必定繞不開曾戰(zhàn)勝過人類棋手李世石的AlphaGo。不過,據(jù)澎湃新聞了解,此次DeepMind公司的AlphaGo團(tuán)隊(duì)與去年一樣,并未選擇參賽。

“絕藝”背后的人工智能

據(jù)騰訊介紹,“絕藝”的名字取自唐代詩人杜牧的送別詩《重送絕句》:“絕藝如君天下少,閑人似我世間無。別后竹窗風(fēng)雪夜,一燈明暗覆吳圖。”為了開發(fā)圍棋人工智能,騰訊人工智能實(shí)驗(yàn)室組建了一支13人的團(tuán)隊(duì),花了近一年的時(shí)間打造“絕藝”。

“絕藝”現(xiàn)場(chǎng)比賽圖

“很高興絕藝能夠在UEC杯奪冠,這是非常難得的寶貴經(jīng)驗(yàn)。絕藝不同于其他實(shí)驗(yàn)室AI,它得益于世界超一流棋手的指導(dǎo),通過不斷與高手交流及學(xué)習(xí),一步步成長(zhǎng)起來。我們希望,通過絕藝能夠讓更多人關(guān)注、喜愛進(jìn)而傳承圍棋這一傳統(tǒng)文化。”騰訊公司副總裁、騰訊AI Lab負(fù)責(zé)人姚星在賽后接受媒體采訪時(shí)說。

騰訊AI Lab負(fù)責(zé)人姚星在賽后接受媒體采訪

“絕藝”的研發(fā)始于2016年1月。當(dāng)時(shí)姚星在騰訊內(nèi)部給工程師發(fā)了一條消息:有沒有信心做圍棋AI,如果圍棋不行,先做象棋AI也行。

隨后,騰訊人工智能實(shí)驗(yàn)室高級(jí)總監(jiān)、專家工程師劉永升經(jīng)過調(diào)研,在2016年3月做出了第一個(gè)DEMO(測(cè)試版)。到2016年3月下旬,騰訊內(nèi)部圍棋AI正式立項(xiàng),項(xiàng)目名稱weigo。不過那時(shí),AlphaGo已經(jīng)以4:1的成績(jī)戰(zhàn)勝了韓國棋手李世石。

關(guān)于AlphaGo背后的算法,F(xiàn)acebook“黑暗森林”圍棋軟件的開發(fā)者田淵棟曾介紹過,AlphaGo這個(gè)系統(tǒng)主要由四個(gè)部分組成:一是走棋網(wǎng)絡(luò),給定當(dāng)前局面,預(yù)測(cè)/采樣下一步的走棋;二是快速走子,目標(biāo)和第一步一樣,但在適當(dāng)犧牲走棋質(zhì)量的條件下,速度要比第一步快1000倍;三是估值網(wǎng)絡(luò),給定當(dāng)前局面,估計(jì)是白勝還是黑勝;四是蒙特卡洛樹搜索,研發(fā)者將游戲中所有的可能性表示成一棵樹,樹的第N層就代表著游戲中的第N步。樹的node(節(jié)點(diǎn))數(shù)是隨著樹的深度成指數(shù)增長(zhǎng)的,不考慮剪枝,每個(gè)node都需要進(jìn)行估值。把以上這4個(gè)部分連起來,形成一個(gè)完整的系統(tǒng)。

AlphaGo之后,Crazy Stone、DeepZenGo等紛紛在自己的程序中加入了深度學(xué)習(xí)模塊。騰訊推出的“絕藝”也采用了相似的策略。據(jù)騰訊官方介紹,“絕藝”的算法基于策略網(wǎng)絡(luò)與價(jià)值網(wǎng)絡(luò)兩大核心,并提升了價(jià)值網(wǎng)絡(luò)的精度。

除了背后算法相似外,“絕藝”也采取了AlphaGo曾經(jīng)使用的訓(xùn)練策略,即學(xué)習(xí)了大量的人類棋譜,又進(jìn)行了自我博弈學(xué)習(xí),以及通過與人類選手對(duì)戰(zhàn),增加自己的“戰(zhàn)斗經(jīng)驗(yàn)值”。

2016年11月,“絕藝”正式登錄騰訊圍棋(野狐圍棋)平臺(tái),在與多名人類一線頂尖棋手過招后,絕藝曾閉關(guān)過一段時(shí)間,在大幅度提升了價(jià)值網(wǎng)絡(luò)的精度后,一度以刑天的ID再度亮相。

“絕藝”在騰訊圍棋平臺(tái)上的戰(zhàn)績(jī)。 騰訊 圖

根據(jù)騰訊圍棋(野狐圍棋)提供的數(shù)據(jù),截至2017年3月9日,“絕藝”與柯潔、古力、聶衛(wèi)平、范廷鈺、時(shí)越、井山裕太、樸廷桓、元晟溱等共計(jì)超過100位知名人類棋手有過交鋒,在509局對(duì)局中“絕藝”388勝121負(fù),勝率達(dá)76.23%。“絕藝”執(zhí)白的對(duì)局有259局,其勝率達(dá)到71.43%,“絕藝”執(zhí)黑的對(duì)局有250局,其勝率達(dá)81.2%。

具體到個(gè)人對(duì)弈結(jié)果,“絕藝”與柯潔對(duì)弈21局,“絕藝”取得16勝5負(fù)的戰(zhàn)績(jī)。其中柯潔曾拿到過4連勝,而“絕藝”則取得過對(duì)柯潔的13連勝,其中“絕藝”執(zhí)白7局取得5局勝利,“絕藝”執(zhí)黑14場(chǎng)取得11局的勝利。“絕藝”與第18屆農(nóng)心杯的終結(jié)者、中國名將范蘊(yùn)若共對(duì)弈38局,范蘊(yùn)若勝12局負(fù)26局,勝率為31.6%。

“絕藝”與人類棋手的對(duì)弈結(jié)果。 騰訊 圖

結(jié)束UEC杯比賽后,3月26日,“絕藝”還將參加由UEC杯衍生出的“電圣戰(zhàn)”。“電圣戰(zhàn)”是由UEC杯的勝出者,對(duì)陣人類頂尖棋手,由日本棋院與電氣通信大學(xué)于2013年創(chuàng)辦。屆時(shí),“絕藝”將挑戰(zhàn)日本新銳棋手一力遼。

冠軍背后是計(jì)算資源的較量

在今年的UEC杯比賽中,共有30位人工智能“棋手”參賽。3月18日預(yù)賽,采用循環(huán)積分賽制,“絕藝”以7局全勝戰(zhàn)績(jī)進(jìn)入16強(qiáng)。3月19日決賽,采用淘汰制,“絕藝”以4連勝的成績(jī)戰(zhàn)勝日本DeepZenGo獲冠軍。

“絕藝”預(yù)賽戰(zhàn)績(jī)

UEC杯比賽用時(shí)每方30分鐘,平均下來20秒左右就要落子,因此參賽程序的計(jì)算能力對(duì)比賽成績(jī)有著至關(guān)重要的作用。根據(jù)賽制,UEC杯對(duì)硬件配置沒有強(qiáng)制性要求,比賽時(shí)并不是所有的程序都使用統(tǒng)一的硬件配置。雖然要求參賽者必須報(bào)告機(jī)器功耗,但特別說明功率在1000W以上的,可以通過特別許可參賽。

比賽過程中,各家人工智能“棋手”通過手里的筆記本電腦,把比賽數(shù)據(jù)發(fā)送到各自的服務(wù)器計(jì)算平臺(tái)上進(jìn)行比賽。有意思的是,因?yàn)樾枰?lián)網(wǎng)發(fā)送數(shù)據(jù),在3月18日的比賽過程中,還發(fā)生了因?yàn)閿嗑W(wǎng)而導(dǎo)致比賽暫停的情況。

UEC杯的快棋賽制其實(shí)是對(duì)人工智能“棋手”背后計(jì)算資源的考驗(yàn)。“絕藝”的背后是騰訊,而DeepZenGo由日本公司DWANGO提供背后支持,DWANGO也是日本著名視頻網(wǎng)站NICONICO動(dòng)畫的母公司。得益于各自團(tuán)隊(duì)的強(qiáng)大支持,“絕藝”和DeepZenGo兩者在預(yù)賽中一路過關(guān)斬將,并沒有遭遇什么抵抗就打進(jìn)了決賽。決賽中兩位對(duì)手的交鋒成為此屆比賽的最大看點(diǎn)。

下圍棋并非AlphaGo的最終目的

2016年年初,DeepMind在《自然》雜志上發(fā)表的關(guān)于AlphaGo的論文,介紹了圍棋人工智能背后的算法。此后,許多人工智能圍棋程序的開發(fā)都基于AlphaGo的研究。換句話說,“絕藝”、DeepZenGo等都是去年那個(gè)AlphaGo的跟隨者。

不過,現(xiàn)在的AlphaGo已經(jīng)不再是當(dāng)初的那個(gè)AlphaGo了。從2016年12月29日晚起,升級(jí)后的AlphaGo改名為“Master”、接連“踢館”著名在線圍棋網(wǎng)站弈城網(wǎng)和野狐網(wǎng)。截至2017年1月4日,Master斬獲了60連勝,擊敗15位世界冠軍,其中包括中國、韓國、日本各自的“當(dāng)今第一人”柯潔、樸廷桓和井山裕太。

斬獲60連勝后,DeepMind聯(lián)合創(chuàng)始人之一戴密斯·哈撒比斯(Demis Hassabis)更是在推特上激動(dòng)發(fā)聲:“在非正式測(cè)試結(jié)束后,我們期待在今年安排一些標(biāo)準(zhǔn)時(shí)長(zhǎng)的正式比賽”。此前有媒體報(bào)道,今年4月份,中國棋手柯潔將有機(jī)會(huì)在烏鎮(zhèn)與AlphaGo進(jìn)行比賽。

但對(duì)于AlphaGo的母公司DeepMind而言,參加圍棋比賽并不是其開發(fā)AlphaGo的最終目的。DeepMind公司曾公布過自己2017年的三大目標(biāo):實(shí)現(xiàn)算法突破,提升社會(huì)影響,建立倫理規(guī)范。利用AlphaGo背后的算法發(fā)掘出可以運(yùn)用于社會(huì)福祉的新科學(xué)知識(shí),由此來解決人類的氣候、能源和醫(yī)療健康等問題。

    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋
            主站蜘蛛池模板: 蓝田县| 镇雄县| 井研县| 滦南县| 叙永县| 清苑县| 牡丹江市| 棋牌| 冀州市| 龙口市| 湖南省| 奉节县| 剑川县| 永顺县| 仁化县| 会同县| 金阳县| 蓬安县| 鲁山县| 靖安县| 河津市| 开鲁县| 海原县| 中宁县| 桃园县| 临桂县| 上栗县| 清水河县| 焉耆| 江阴市| 徐水县| 陕西省| 宁波市| 定襄县| 涪陵区| 黄骅市| 谢通门县| 治县。| 镇宁| 谷城县| 阳原县|