- +1
李飛飛空間智能首個模型誕生!一張圖可生成交互式3D場景
作為AI領(lǐng)域影響力最大的女性和華人之一 ,AI學(xué)者、斯坦福大學(xué)教授李飛飛在當(dāng)?shù)貢r間12月2日公布了她第一個創(chuàng)業(yè)項目World Labs的成果——能用單張靜態(tài)圖片生成3D世界的AI產(chǎn)品。
雖然已有眾多AI工具可以將照片轉(zhuǎn)換為3D模型和場景,而World Labs稱,他們所生成場景的獨(dú)特之處在于它們具有交互性,而且是可修改的。
“(我們的技術(shù))能讓你走進(jìn)任何一張圖像,并以3D的形式對其進(jìn)行探索。” World Labs在一篇博客文章中寫道。
紐約大學(xué)助理教授謝賽寧在社交平臺上表示,“想象是生成式的,控制是3D的。”

World Labs官網(wǎng)演示的步驟
此外,該工具也支持調(diào)整攝像機(jī)的位置和視野、更改對象顏色,通過3D場景結(jié)構(gòu)創(chuàng)建聚光燈特效、創(chuàng)建自動運(yùn)行的動態(tài)效果等交互方式。
據(jù)了解,World Labs的系統(tǒng)屬于一類新興的人工智能范疇,即 “世界模型”,能夠模擬游戲和3D環(huán)境。不過,現(xiàn)有的多數(shù)模型存在著偽影和一致性方面的問題。例如,初創(chuàng)公司Decart的Minecraft模擬世界模型Oasis就存在分辨率低下、容易“遺忘”場景布局等問題。
World Labs提到,大多數(shù)生成模型預(yù)測的是像素,而預(yù)測3D場景則具有許多優(yōu)勢,比如場景更加持久,一旦生成,它就會一直存在。即使把視線移開然后又回來,場景也不會改變。此外,用戶可以實時控制、實時移動場景。用戶可以仔細(xì)觀察花朵的細(xì)節(jié),也可以偷看角落里露出的物體。
“大多數(shù)生成式AI工具生成的都是圖像或視頻等二維內(nèi)容,” World Labs表示,“而生成三維內(nèi)容能夠提升操控性和一致性。這將改變我們制作電影、游戲、模擬器以及物理世界其他數(shù)字呈現(xiàn)形式的方式。”
目前,World Labs已經(jīng)對公眾開放了Waitlist候補(bǔ)名單申請,不過作為開發(fā)和測試的一部分,有的創(chuàng)作者已經(jīng)受邀并將其整合到了現(xiàn)有的工作流程中。例如,內(nèi)容創(chuàng)作者埃里克·索洛里奧(Eric Solorio)發(fā)現(xiàn),這項技術(shù)完美地填補(bǔ)了他創(chuàng)作過程中的空白,可以“讓角色布置和精確的鏡頭調(diào)度變得更容易”。
不過,World Labs在博客中說明,目前披露的只是“3D原生生成AI未來的一個縮影”。AI工具仍有改進(jìn)的空間,例如用戶的移動范圍仍然受限于較小的區(qū)域,一旦超出邊界就會遇到限制。有時還會出現(xiàn)渲染錯誤,例如物體之間會以不自然的方式混合在一起。
據(jù)Tech Crunch報道, World Labs已從包括AI大牛Geoffrey Hinton、Jeff Dean、谷歌前CEO Eric Schmidt等在內(nèi)的投資者處籌集了2.3億美元的投資,現(xiàn)公司估值超過10億美元,計劃在2025年推出首款正式產(chǎn)品。
World Labs于今年1月成立,由李飛飛和賈斯汀·約翰遜(Justin Johnson)、克里斯托夫·拉斯納(Christoph Lassner)和本·米爾登霍爾(Ben Mildenhall)聯(lián)合創(chuàng)立,三人均在AI領(lǐng)域擁有豐富的經(jīng)驗。其中賈斯汀·約翰遜是李飛飛的博士生,現(xiàn)為密歇根大學(xué)的助理教授,World Labs目前總部位于舊金山,擁有20名員工。
在李飛飛的構(gòu)想里,“所有空間智能的生物所具備的行動能力,是與生俱來的。因為,它能夠?qū)⒏兄c行動進(jìn)行關(guān)聯(lián)。”她曾表示,“如果想讓AI超越其自身當(dāng)前的能力,我們需要的是,不僅僅能夠看到、會說話的AI,而且是一個可以行動的AI。”
然而,《連線》雜志的記者曾指出,World Labs的愿景與此前迅速消退的熱炒概念“元宇宙”有些相似。對此,World Labs的創(chuàng)始人則解釋說,元宇宙之所以短暫,是因為當(dāng)時的熱潮基于一些有前景的硬件,但缺乏真正的互動內(nèi)容,而他們認(rèn)為,世界模型或能夠填補(bǔ)這一空白。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司