▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

雖然完敗于德?lián)淙斯ぶ悄埽祟惻剖謪s靠“認(rèn)慫”偷了幾局

澎湃新聞見習(xí)記者 虞涵棋
2017-04-10 12:45
來源:澎湃新聞
? 能見度 >
字號

“我跟它(AI)打就一直認(rèn)慫。”北京千山劇影視傳媒有限公司董事長、中國“龍之隊”隊員童舟這樣向澎湃新聞(www.kxwhcb.com)介紹他曾連勝德?lián)銩I四場的“心得”。

雖然5月份在烏鎮(zhèn),圍棋“當(dāng)今第一人”柯潔將與AlphaGo上演圍棋界人機對戰(zhàn)的終極一戰(zhàn),但創(chuàng)新工場CEO李開復(fù)在4月5日斷言柯潔毫無勝算,比起來,4月6日到10日舉行的德州撲克人機大戰(zhàn)表演賽尚有10%的可能成為人類歷史上贏得人機對戰(zhàn)的絕唱。

這場德?lián)浔硌葙愑蓜?chuàng)新工場與海南生態(tài)軟件園聯(lián)合主辦,比賽雙方為由杜悅、許朝軍、張淮、童舟、朱亞希、王天健共六位人類牌手組成的中國“龍之隊”和李開復(fù)母校美國卡內(nèi)基梅隆大學(xué)(CMU)開發(fā)的德?lián)淙斯ぶ悄芟到y(tǒng)Libratus,比賽獎金為200萬元人民幣。

4月10日中午,在海南澄邁的比賽場地,室外陽光明媚,室內(nèi)人類收獲了相當(dāng)慘淡的賽果。在33000手牌后,6名牌手共計輸給人工智能Libratus792327分,可謂完敗。

但在個人戰(zhàn)績上,人類牌手還是創(chuàng)造了一些亮點的:點點網(wǎng)、啪啪創(chuàng)始人許朝軍曾收獲前三場連勝的“開門紅”,而童舟自第三場結(jié)束,即第2比賽日中午向隊友打賭必勝AI后,斬獲了從第四場到第七場的四連勝。在個人最終戰(zhàn)績上,童舟也是輸?shù)淖钌俚摹?/p>

那么,是什么給了童舟信心,讓他在三場之后撂下狠話的呢?童舟在接受澎湃新聞(www.kxwhcb.com)專訪時透露,他總結(jié)了第1比賽日后就找到了AI的幾個漏洞,并不斷示弱,引誘AI前來“偷雞”,由此反敗為勝。不過,AI每天都會修復(fù)前一天的漏洞,人類牌手只能重新開始尋找新的漏洞。

“跟AI完全不是在打德?lián)洹?/strong>

簡單來說,德?lián)涫峭婕矣米约菏种械?張底牌和牌桌上的5張公共牌進(jìn)行組合,選出5張湊成最大的牌型(各種牌型有固定的大小順序,如5張同花順比4張同樣數(shù)字加一張單牌要大)。而牌桌上的5張公共牌分3個環(huán)節(jié)翻開,分別為翻牌(flop)、轉(zhuǎn)牌(turn)、河牌(river)。在翻牌的不同階段玩家都有加注的機會。

而最基本的下注策略有兩種,一是詐唬下注(bluffing),又稱為“偷雞”,即以嚇退對方蓋牌為目的的加注;二是價值下注(value bet),即在手中的牌有把握比對方大的時候,以引誘對方跟注而贏得更多籌碼為目的的下注。

童舟告訴澎湃新聞(www.kxwhcb.com),他在第一天時完全按照和人類對戰(zhàn)的方式和AI打,結(jié)果發(fā)現(xiàn)無論是詐唬還是價值下注都討不到便宜,輸?shù)煤軕K。后來,他發(fā)現(xiàn)AI有一些漏洞,“也不完全是漏洞,更準(zhǔn)確地說是一些套路。”

這些套路是指AI打牌會出現(xiàn)一些重復(fù)的模式,使人類有跡可循。童舟發(fā)現(xiàn)“AI河牌加注1/5底池的時候基本上是在偷雞”,這樣人類牌手就可以抓住這些機會。

不過,AI每天晚上都似乎會修復(fù)前一日比賽中出現(xiàn)的“漏洞”,改變風(fēng)格。幸運的是,童舟在第二天也同樣會抓到AI新的漏洞。

雖然這樣能夠有贏過AI的機會,但童舟也無奈地表示,這樣完全不像是在玩德?lián)淞耍龅木褪恰坝伤谥鲗?dǎo),跟著它的路子,慢慢的它的漏洞就會暴露出來,然后就利用這個誤導(dǎo)它。”另一件令他無奈的事是,AI雖然會被人抓住“偷雞”的機會,但它是個防守非常穩(wěn)健的選手,“想讓它輸很難,你贏它贏不多,如果你想贏它很多就會輸更多。”因此,童舟一直把底池控制得很小,不敢和AI“對飆”。

不過,盡管有這些可循的痕跡,“龍之隊”隊員依然稱贊AI是個非常優(yōu)秀的德?lián)溥x手,甚至超過了人類所能理解的打法。一方面,AI讀牌方面的計算很強,“只要它覺得比你大一點點,它就會打價值(下注),只有國外一些頂級的牌手會這么做,很多中國人就過牌了。 ”童舟說道。

另一方面,AI下注非常大膽。有時候AI起手底牌很差,人類選手按照理性計算肯定會棄牌,但AI多次拿著很差的底牌(比如3和6)大膽冒進(jìn),結(jié)果在轉(zhuǎn)牌或河牌階段上演大逆轉(zhuǎn)(河牌真的開出了一張6),令人類選手匪夷所思,拍案叫絕,仿佛AI真的能猜到未翻開的牌一樣。

AI開發(fā)者:可能不會做多人德?lián)洌粚σ痪褪亲詈玫?/strong>

那么,德?lián)銩I神乎其技的牌技究竟是基于怎樣的算法實現(xiàn)的呢?它與實現(xiàn)圍棋的AI路徑有何不同?這次與人類對戰(zhàn)的人工智能Libratus的開發(fā)者之一,美國卡內(nèi)基梅隆大學(xué)(CMU)計算機系教授托馬斯?桑德霍姆(Tuomas Sandholm)的博士生諾姆?布朗(Noam Brown)在接受澎湃新聞專訪時說道,Libratus并沒有使用時髦的深度學(xué)習(xí),但在殘局計算上下足了功夫。

事實上,世界范圍內(nèi)有好幾個團(tuán)隊都撲在開發(fā)德?lián)銩I,而加拿大阿爾伯塔大學(xué)的一個團(tuán)隊更是在今年1月初搶先發(fā)表論文,宣布他們的Deepstack成為首個擊敗人類牌手的德?lián)銩I。諾姆承認(rèn),這些團(tuán)隊實現(xiàn)德?lián)銩I的核心路徑是相同的,都是一種名為“虛擬遺憾最小化”(counterfactual regret minimization)的算法。

但諾姆對他們的Libratus非常自信,認(rèn)為它能在機器對戰(zhàn)中完勝其他的德?lián)銩I。這是因為,他們不僅充分在算法中運用了博弈論的知識,更將AI的殘局計算能力大大強化了。“和圍棋不一樣,圍棋是越下越簡單的,殘局階段計算量更小。但德?lián)溟_到轉(zhuǎn)牌和河牌階段,局面更為復(fù)雜,存在的可能性更多。”諾姆說道。

值得一提的是,開發(fā)團(tuán)隊并沒有使用深度學(xué)習(xí)訓(xùn)練機器。阿爾法狗在學(xué)習(xí)數(shù)千萬張人類棋譜后才開始進(jìn)入“左右互搏”的自我對弈階段,在AI上稱為強化學(xué)習(xí)(reinforcement learning)。而Libratus的開發(fā)者只是向它描述了德?lián)涞挠螒蛞?guī)則,就開始由它通過強化學(xué)習(xí)的方法自己摸索德?lián)鋺?yīng)該怎么打。因此,Libratus的打法完全脫離人類經(jīng)驗,天馬行空,在人類牌手看來十分激進(jìn)。

Libratus接連在單挑中戰(zhàn)勝中美德?lián)涓呤郑饨缍奸_始關(guān)心AI離掌握多人德?lián)溥€有多遠(yuǎn)。然而,諾姆卻透露,他們可能并不會去做多人德?lián)洹R驗椋谒麄兛磥恚嗳说聯(lián)涑^了純粹競技的范圍,因此很難根據(jù)戰(zhàn)績來評估AI的水平。諾姆打了個比方,奧運會并沒有超過兩支隊伍的比賽,“因為你無法控制別的對手相互之間的互動,就算你自己做出的選擇是完美理性的,結(jié)果可能也體現(xiàn)不出來。”

桑德霍姆教授則笑著說,“為什么要玩多人德?lián)洌恳粚σ挥肋h(yuǎn)是最好的游戲!”。

盡管德?lián)銩I代表的“高情商”、“會欺騙”、“會博弈”的人工智能打開了通往更多現(xiàn)實場景應(yīng)用的大門,不過,在近期,桑德霍姆和諾姆團(tuán)隊還是會專注完善一對一德?lián)洹!斑@畢竟是我們的招牌嘛。”諾姆說道。

“龍之隊”稍有不服

除了博弈論和殘局計算之外,此次的冠軍Libratus還有一個秘訣:它會在每一個比賽日結(jié)束后回顧這一天的對戰(zhàn)經(jīng)歷,找出曾被人類利用的“套路”,并自我清除。也正因為如此,“龍之隊”的一位助理向澎湃新聞(www.kxwhcb.com)透露,Libratus團(tuán)隊并未提供每天的比賽數(shù)據(jù),這讓人類團(tuán)隊每晚在復(fù)盤上花了更多精力,也更難通過數(shù)據(jù)來分析AI的打法,形成針對性策略。

上述消息人士說道,“龍之隊”首次亮相就遭遇了AI。鑒于Libratus曾在1月份連續(xù)20個比賽日中擊敗了四名頂尖美國高手,因此他們原本就不抱有勝算,只是想盡力一搏,如果能有一名人類牌手僥幸領(lǐng)先,當(dāng)然再好不過。然而,AI團(tuán)隊不提供比賽數(shù)據(jù)的做法令他們稍有不服。甚至,在第1個比賽日,桑德霍姆教授沒有提供最后的勝負(fù)情況,因為一天的比賽運氣成分很大,他并不想讓“人類牌手打敗AI”成為新聞噱頭。該消息人士說道,“當(dāng)然,即使提供給我們數(shù)據(jù),大概也是輸,但這樣會輸?shù)酶姆诜N夷芨械剿麄兎浅OM鸄I贏,但雙方在更平等的起點上,AI的勝利也會更令人信服。當(dāng)然,整體來說,AI牌打得非常好,我們經(jīng)常會對它的一些打法感到很佩服,確實很高明。”

    校對:劉威
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋
            主站蜘蛛池模板: 中江县| 临邑县| 句容市| 西林县| 吉安市| 修文县| 扬中市| 疏附县| 成武县| 湟源县| 怀集县| 盘山县| 浦城县| 五华县| 自贡市| 肃宁县| 育儿| 林周县| 保亭| 大新县| 久治县| 通江县| 项城市| 油尖旺区| 永宁县| 菏泽市| 绥宁县| 乐陵市| 丹东市| 丽江市| 噶尔县| 宣威市| 固阳县| 渝中区| 洪洞县| 丹棱县| 高雄市| 论坛| 湘阴县| 阳江市| 延边|