▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

馬斯克的OpenAI自主學習機器人完勝人類Dota玩家

微信公眾號“新智元”
2017-08-12 13:11
科學湃 >
字號

OpenAI的機器人剛剛在Dota2 1v1比賽中戰(zhàn)勝了人類頂級職業(yè)玩家Dendi。以建設安全的通用人工智能為己任的OpenAI,通過“Self-Play”的方式,從零開始訓練出了這個機器人。

Dota2 淪陷

繼橫掃頂級的人類國際象棋大師和圍棋大師后,計算機如今在風靡全球的電子游戲Dota2中戰(zhàn)勝了世界級的職業(yè)玩家。此前未被披露的此場對決發(fā)生于Valve獎金高達2400萬美元的Dota2國際邀請賽“The International”。

Dendi(圖左)在賽前與OpenAI的團隊交流。

在這場一對一的對戰(zhàn)中,OpenAI設計的一款機器人擊敗了職業(yè)玩家Danylo “Dendi” Ishutin,Dendi在此前的職業(yè)生涯中已贏得累計735449.4美元的獎金。OpenAI的機器人在首場對戰(zhàn)中用時十分鐘擊敗了Dendi,之后Dendi在第二局對戰(zhàn)中退出并拒絕再戰(zhàn)第三局。

Dendi

“請放過我吧,”賽間Dendi對機器人對手這樣說道。

Elon Musk發(fā)表推文稱贊OpenAI的戰(zhàn)績,并稱其為“在電子競技領域首個擊敗人類頂級玩家的機器人”。

OpenAI在電子競技領域首度擊敗人類頂級玩家。這比國際象棋及圍棋等游戲要復雜得多。

OpenAI的CTO Greg Brockman在賽前介紹稱這一款機器人通過數千次的加以指導的自我對決進行訓練,并稱該機器人已經擊敗了數個Dota 2的職業(yè)玩家。Brockman在博客中稱:“過去幾周內,我們的機器人已經戰(zhàn)勝過包括 SumaiL(世界頂級1v1選手)及Arteezy(世界頂級overall選手)等多個頂級玩家”。

“自我對決”的理念是OpenAI研發(fā)的關鍵。這是一種AI系統(tǒng)學習解決極其復雜任務的有效方法:與太弱或太強的對手對戰(zhàn),它都無法從中學到東西,但自身反倒是有價值的對手。Brockman介紹道:“你可以看到AI從完全的隨機狀態(tài)一步步發(fā)展到如今的頂級水平”。

AI公司慣常用電子競技游戲來測試他們的技術,如谷歌的DeepMind攻克“星際2”,微軟的AI團隊今日則宣稱他們在吃豆人游戲中獲取高分。

OpenAI并未打算就此停止征戰(zhàn)的腳步。他們希望在明年的參與正式的五對五比賽。與此同時他們也對外發(fā)布了此機器人,所以任何人有興趣均可與之對戰(zhàn)。第一個擊敗此機器人的玩家則可獲得Valve專設的賞金。

我們創(chuàng)造了在Dota2 1v1比賽中能夠擊敗世界頂尖職業(yè)選手的AI。其完全是用self-play的方式訓練,沒有使用模仿學習(imitation learning)或樹搜索。這對構建在混亂、包含人類行為在內的復雜場景下能夠完成well-defined goals的AI 系統(tǒng)是重要一步。

Dota 1v1是含有隱藏信息的復雜游戲。代理需要學習計劃、進攻、花招以及誤導對手。選手技巧和手速(每分鐘動作)的關聯(lián)不那么強烈,實際上,我們的AI“手速”只是一般人類選手的水平。

想要在Dota中取勝,要求選手培養(yǎng)出對對手的直覺,并采取相應的策略。在上述視頻中,你能看到,我們的機器人已經通過完全的self-play學會了預測其他選手的動作,并在不熟悉的場景下即興發(fā)揮,以及如何作用于選手的單位。

完全通過Self-Play的方式訓練,從零達到世界頂級水平

OpenAI的目標是建設安全的通用人工智能。對于AI來說,Dota是一個非常理想的試驗場,競爭激烈,游戲復雜。如果想在這門游戲中獲得成就,就必須推進現(xiàn)有技術,實現(xiàn)技術突破。我們現(xiàn)在開發(fā)了一個AI,能夠在Dota的1v1比賽中擊敗頂尖職業(yè)選手。

Dota的規(guī)則非常復雜,如果是用規(guī)則方法,那么構建出的AI一定是個蹩腳的player。所以,我們完全采用的是自我游戲(self-play)的訓練方法。剛開始訓練時,AI對于自己所處的世界全無認識,而只是和自己的copy比賽,這也就意味著它和它的對手永遠是旗鼓相當的。它用這個方法一點點地提升,直到達到了世界上最優(yōu)秀的職業(yè)運動員的水平。The International(TI)是Dota的世界錦標賽,吸引了世界各地20000名觀眾來觀看職業(yè)運動員爭奪2400萬獎金。在TI上,我們派出AI和其中的多位高手進行了比賽,在比賽中,AI展現(xiàn)出了很強的魯棒性和技巧,許多職業(yè)選手希望能持續(xù)和我們的AI比賽,并考慮要把它當做是一種訓練手段。

現(xiàn)在的這支研究團隊。

下一步研究將是5v5比賽,我們希望做出5個相互協(xié)作的AI,擊敗人類戰(zhàn)隊。另外,我們也期待嘗試把AI和人類放在同一戰(zhàn)隊中,協(xié)作取得勝利。 

(本文首發(fā)于微信公眾號“新智元”,澎湃新聞獲授權轉發(fā)。原標題:【攻陷Dota2】馬斯克的OpenAI自學習機器人完虐人類最強玩家)

    校對:張艷
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯(lián)網新聞信息服務許可證:31120170006

            增值電信業(yè)務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋
            主站蜘蛛池模板: 江源县| 巍山| 福海县| 咸宁市| 洪泽县| 林芝县| 集安市| 龙口市| 闸北区| 克什克腾旗| 晋宁县| 北安市| 东源县| 尖扎县| 红河县| 岑巩县| 枝江市| 延庆县| 刚察县| 象州县| 昭通市| 崇信县| 拉萨市| 海原县| 明星| 白玉县| 丰顺县| 会理县| 逊克县| 黑河市| 舒城县| 来安县| 轮台县| 夏津县| 伊金霍洛旗| 大埔县| 丹棱县| 嘉定区| 韶山市| 盖州市| 平昌县|