- +1
DeepMind的Genie 2能夠生成可以互動的游戲世界
谷歌的AI研究機構DeepMind,公布了一款能夠生成多種游戲3D世界的模型。
這款名為Genie 2的模型是DeepMind早前發布的Genie模型的升級版,能夠根據一張圖片和文字描述(如“一個可愛的類人機器人在樹林中”)生成一個互動的實時場景。它與李飛飛的World Labs公司和以色列初創公司Decart正在研發的模型類似。
DeepMind表示,Genie 2可以生成各種各樣的3D世界,包括那些玩家可以通過鍵盤或鼠標進行跳躍、游泳等互動的世界。該模型經過大量視頻數據訓練,能夠模擬物體互動、動畫、光照、物理效果、反射以及NPC(非玩家角色)的行為。

許多由Genie 2生成的場景,看起來就像3A游戲畫面,這可能與訓練數據中包含了熱門游戲的實況視頻有關。然而,出于競爭等原因,DeepMind并未透露其數據來源的具體細節。
與此同時,版權問題也引發了關注。作為谷歌的子公司,DeepMind可以自由訪問YouTube,谷歌此前也表示,它的服務條款允許使用YouTube視頻進行模型訓練。但Genie 2是否是在未經授權的情況下復制它所“觀看”的游戲?這一問題還需要法院判定。
DeepMind指出,Genie 2可以生成多個視角的連貫世界,包括第一人稱視角和等距視角等,最長可持續一分鐘,大多數情況下持續10到20秒。
“Genie 2能夠根據鍵盤操作做出智能反應,識別并正確移動角色。”DeepMind在博客中寫道,“例如,我們的模型能夠正確判斷,箭頭鍵應該控制機器人而非樹木或云朵。”

像Genie 2這樣的“世界模型”能夠模擬游戲和3D環境,但常常存在分辨率低、場景一致性差以及生成失真等問題。例如,Decart的Minecraft模擬器Oasis就存在分辨率低的問題,并且會快速“忘記”關卡布局。
然而,Genie 2能夠記住視野之外的場景部分,并在這些部分重新出現在視野中時準確地呈現出來(World Labs的模型也具有類似功能)。
不過,用Genie 2創建的游戲并不會特別有趣,因為它們會每分鐘左右重置玩家的進度。這也是DeepMind將該模型定位為研究和創作工具的原因——一個用于打造“互動體驗”和評估AI智能體的工具。
“憑借Genie 2的跨分布泛化能力,概念藝術和圖紙可以轉化為完全互動的環境?!盌eepMind表示,“通過使用Genie 2快速創建豐富多樣的環境供AI智能體使用,我們的研究人員能夠設計出訓練中未見過的評估任務?!?/p>
創意人員可能對這一技術感到復雜,尤其是視頻游戲行業的從業者。根據《連線》雜志的最新調查,像動視暴雪(Activision Blizzard)等大型公司,因裁員而大量引入AI來提升生產效率并彌補人員流失。
盡管如此,谷歌依然加大了在世界模型領域的投入,這有可能成為AI領域的下一大突破。今年10月,DeepMind聘請了曾負責OpenAI視頻生成器Sora開發的Tim Brooks,來研究視頻生成技術和世界模擬器。兩年前,實驗室還從Meta挖走了Tim Rockt?schel,他因在《NetHack》等游戲中的“開放性”實驗而著名。
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司