- +1
我測了12個小時的RunwayGen3,發現這就是AI視頻的No.1
原創 數字生命卡茲克 數字生命卡茲克
眾多AI視頻創作者翹首以盼的Runway的Gen3,終于面向部分超級合作者開放了。
我的好基友@閑人一坤也是第一時間拿到了內測資格,我就直接把號要來了。
我從中午到凌晨,跑了12個小時,幾百個Case。
發現我之前開的香檳,沒開早。
先放幾個我覺得還不錯的case。



Runway Gen3,在模型質量上,還是能把Luma和可靈拉開一些差距,特別是審美上。雖然也就是70分跟60分的區別,但至少,在模型質量上,確實是我認為的當今No.1。
不過,現在只上了文生視頻,圖生和那些可控工具還沒上。
給我急急急急急急急急急急急急急急急急死了。
在我跟坤哥瞎吉爾一頓跑了快100個case之后,我決定還是偏系統性地測一下,這個系統只是比瞎跑系統一點,肯定比不過南洋理工或者上海人工智能實驗室那種專業級別的測試,所以別杠我,杠就是你對= =
測試的構筑方法上,其實我之前想了蠻久的,去年我其實規劃過一版測試維度,大類上有語義理解、畫面細節質量、運動質量、鏡頭移動質量、一致性、衰減性等等。
然后比如在運動幅度上,又可以拆為:人臉五官運動質量、人物肢體運動質量、動物運動質量、剛體運動質量、流體運動質量等等。
寫完以后我就覺得太扯淡了,不是這個劃分扯淡,是我的人力有點扯淡。真要這么跑一遍,那我就好幾天啥事都不用干了。
所以現在,為了達到成本與效率最優解,我就非常簡單粗淺地,按風格去劃分,分為:
寫實風格、動畫風格、科幻風格、玄幻風格、抽象風格。
每個風格里面跑10~15個prompt,每個prompt roll三遍,雖然只有文生視頻,但其實也基本能看出來模型整體質量和特征了。
而寫prompt這活,當然是交給AI去干了。
畢竟有公式可以套:
Prompt = 鏡頭語言+光影+主體描述+主體運動+場景+氛圍。
然后我就讓GPT根據公式和規則,給我哐哐哐的寫了幾噸的prompt。

再把這些prompt,扔到gen3里面跑case。

目前只能用文生視頻,其他的功能都還沒上。在最下面可以切換生成視頻的片段長度,可選5s和10s兩種。
生成速度非常的快,親測10s的基本也就1分半就能跑出來,這個可比Luma好多了,那玩意動不動十幾分鐘。

而文章礙于篇幅,我就每個風格,展示5個有代表性的case,讓大家一睹為快。
(注:在gen3中生成視頻我使用的都是英文,下面的是為了方便大家看所以所有prompt才都翻譯成了中文)
一.寫實風格
寫實風格測試的東西很簡單,主要就是看現實城市街景、自然風光、室內場景等,也看看人物的面部表情、光影效果、細節紋理等。
核心還是現實世界的寫實。
1. 特寫鏡頭,溫暖的晚霞,一位長發飄逸、面帶溫柔微笑的年輕女子,坐在咖啡館的露臺上,輕啜咖啡,背景中是模糊的城市景觀和人群交通,氛圍放松而舒適。

這個可以看到杯子是變形的,手的位置也很奇怪。除了這兩問題之外,其他都還挺穩。
2. 中景鏡頭,刺眼的正午陽光,施工現場的工人們穿著安全裝備操作起重機,背景中聳立著摩天大樓,氛圍動態而繁忙。

這個問題就非常多了,肢體變形,人物消失,穿過了明明在遠方的桿子,摩天大樓的細節也有問題。
3.低角度鏡頭,戲劇性的側面光,一位專業廚師在繁忙的廚房里切菜,周圍蒸汽彌漫,鍋碗瓢盆懸掛,氛圍緊張而專注。

地獄難度,涉及到切菜也就是人、刀、菜的三者交互,所以基本都跟魔法一樣,不能看。
4.傾斜鏡頭,傍晚的街燈,一位音樂家在繁華的街角彈吉他,行人匆匆而過,商店門面上明亮的霓虹燈,氛圍熱鬧而充滿活力。

算是很能夸的一個鏡頭了,人物主體是非常穩定的。但是背景過于復雜,很明顯的BUG就是剛開始的車開過去的時候,有個粉衣服的人是跟車合為一體的。
5.極限特寫鏡頭,自然光線,一位畫家的手在調色板上混合顏色,背景是畫布和畫架,手指上沾有顏料,氛圍專注而富有創造力。

很棒的一個鏡頭。是能明顯感受到有因果關系的,手和筆會影響顏料,還有粘連的效果。雖然肯定沒法跟現實世界比,但是已經很不錯了。
總結:寫實風格整體看,還是人物特寫和風景最穩,一旦涉及到全景或者中景,當人物沒有足夠的面積空間時,肢體變形就極為嚴重,但是如果不涉及到人物與物體的交互,那穩定性還是非常強的。
而Runway有一說一,在光影的審美上,是真的強。畢竟電影出身,審美是真舒服。
二.動畫風格
主要就是看對各種風格的包容度以及審美,比如2D、3D、皮克斯、吉卜力等等。
1.特寫鏡頭,柔和的晨光,一位粉色頭發、大眼睛的年輕女孩,日式動漫風格,望著窗外,櫻花在空中飄落,背景是傳統的日本房屋,氛圍寧靜且懷舊。

風格倒是正常,櫻花飄地也很好看,就是人物動態太少,跟寫實比差太多了,基本沒有任何表演可言。
2.中景鏡頭,夕陽余暉,一位未來派機器人和一個人類女孩,3D動畫風格,走在霓虹燈閃爍的街道上,周圍是全息標志和飛行汽車,城市景觀中高聳的建筑,氛圍鮮活且高科技。

我真不是故意嚇大家才把這個傳上來的,是他真的BUG的有特點,因為我跑出來好多前后不分的視頻,這個就是典型代表。
3.高角度鏡頭,明亮的正午陽光,一群充滿活力的玩具復活,皮克斯風格,在一個孩子色彩繽紛的臥室里,玩具車和動作人物四處移動,氛圍愉快且充滿活力。

奇奇怪怪的鏡頭,風格也不是皮克斯的典型風格,物體也都是莫名其妙的出來,最后小熊突然變成積木飛了那一瞬間我是真沒繃住。
4.跟蹤鏡頭,柔和的黃昏光,一位勇敢的少女戰士,手持發光的劍,幻想動漫風格,跑過一片迷人的森林,周圍是神話生物和古老遺跡,氛圍史詩且冒險。

除了手上那把劍不知道是個什么玩意,也沒有神話生物和古老遺跡啥的,都挺好。
5.越肩鏡頭,昏暗的室內燈光,一位年輕的巫師手持魔法書,中世紀動漫風格,在宏偉的圖書館中施法,書架上擺滿了古老的書籍和魔法神器,氛圍神秘且魔幻。

最后的那一下特效帥炸了,就是人物的臉變形了,從一個異瞳萌妹不知道是個什么玩意,而且也不是越肩視角,不過越肩視角這個就不強求了,沒幾個能畫出來的。
總結:動畫風格整體化上,其實都挺差勁的,吉卜力、3D、美漫啥的效果表現都極差,整體審美、物理動態也比寫實差很多,明顯感受到了數據集的不足,runway整體還是非常的偏寫實和電影的。
三.科幻風格
我自己最喜歡的風格,主要看模型的數據集和泛化能力,能不能把一些很科幻的場景表現出來。應該也是我跑得最多的case,好像文檔里放了將近20個。
1.廣角鏡頭,霓虹城市燈光反射在金屬表面,一個巨型機甲從一個流線型車輛變形為高聳的機器人,齒輪和面板無縫轉換,背景中有未來感的摩天大樓和飛行汽車,氛圍緊張且高科技。

我是有多想不開才會讓AI給我跑變形金剛。但是他居然變了出來,雖然整體都很奇怪,但是至少是變了,這個prompt理解是猛的。
2.中景鏡頭,鮮艷的藍色和銀色調,兩臺機甲陷入史詩般的戰斗,迅速交換打擊并發射能量武器,四周是煙霧和爆炸的破壞性城市戰場,氛圍充滿動感和動作感。

真的,帥炸了,我愛慘了,這打架是正兒八經會打起來的啊,真的會爆炸啊!科幻還是得runway啊!
3.跟蹤鏡頭,昏暗的走廊,一群太空海軍陸戰隊小心翼翼地穿過廢棄的飛船,燈光閃爍和詭異的聲音,氛圍緊張且懸疑。

整體都很穩,氛圍和質感也無敵,就是有個人出BUG卡門里了。
4.廣角鏡頭,旋轉的五彩斑斕的漩渦,一個流線型的時間旅行飛船快速穿過隧道,周圍是光線和能量軌跡,氛圍令人興奮且超凡脫俗。

這光影,這質感,想哭,我的新片子,想馬上就要開始做了!!!
5.特寫鏡頭,強烈對比的照明,一個宇航員在空間站外漂浮,背景中可見地球和月亮,星星在頭盔面罩上反射,氛圍寂靜且孤立。

這種大特寫,必然穩定,人物還有眼球表演,只能說,牛逼。
總結:沒啥可說的,在科幻領域上,runway就是No.1,其他都得靠邊站。我的新片子,已經開始準備了,有點興奮的睡不著覺了。
四.玄幻風格
跟科幻一樣,也偏想象,很吃數據集和泛化。主要就是看魔法、神話世界啥的。
1.特寫鏡頭,柔和溫暖的燈光,一位年輕的女巫師,眼睛發光,手持頂端有水晶的法杖,長袍上有復雜的符文,背景是迷人的森林,氛圍魔法且寧靜。

所有的一切都很穩,除了只有三根手指,否則就是完美的。
2.越肩鏡頭,昏暗的火炬光,一個盜賊在黑暗地牢里撬開一扇巨大的華麗門鎖,周圍是古老的符號和蜘蛛網,氛圍緊張且秘密。

很有趣的一個是人走過火的時候,手上真的有東西被點著了。當然BUG問題很大,門最后變成了現代門。而且頂上出來了游戲的方位條,感覺是扒了刺客信條的數據集。
3.廣角鏡頭,月光之夜,一個覆蓋著發光符文的巨型石像從密林中出現,樹木搖晃,腳下的地面開裂,背景是古老的遺跡,氛圍神秘且不祥。

有一種憨批巨像的即視感,除了人物丑,沒啥其他的問題。
4.傾斜鏡頭,月光之夜,一群精靈在神圣的樹林中進行儀式,發光的符文和魔法能量在他們周圍旋轉,古老的樹木和星空,氛圍神秘且敬畏。

雕像造型上非常克蘇魯魔幻的一段,最后的光效非常華麗,runway不愧是電影出身,這小特效做得一個比一個頂。
5.廣角鏡頭,夢幻般的燈光,一座古老的城堡坐落在懸崖上,周圍環繞著旋轉的霧氣,天空中一條龍翱翔,中世紀幻想風格,氛圍壯麗且神秘。

龍的畫面面積太小了,所以還是那個問題,風控變形,其他都很準,也很理解語義。
總結:玄幻相比之下,沒有runway的科幻那么長板,還是會弱一些,適合做西方玄幻,中國玄幻不好測,等出圖生視頻了再測,效果不一定有可靈強。
五.抽象風格
抽象風格其實就是測試抽象的幾何圖形、色彩斑斕的空間、不規則形狀等等,主要關注形狀、顏色、運動和情感,而不是具體的物體或場景。
1.特寫鏡頭,明亮霓虹色與暗背景形成鮮明對比,分形圖案有節奏地擴展和收縮,氛圍強烈且令人著迷。

我是沒想到gen3的分形藝術能做的這么穩這么好。
2.低角度鏡頭,鮮明的黑白色調,銳利的角形圖案不規則地移動,創造出混亂和迷失方向的感覺。

這就是藝術,沒啥可說的,最后有點不穩了。
3.搖攝鏡頭,明亮的彩色粒子旋轉并匯聚成抽象的形態,營造出一種生動的運動和興奮感。

想起了我以前用C4D做的粒子效果,辛辛苦苦渲半天,還真不如這個。
4.跟蹤鏡頭,流動的金屬表面反射環境光,形狀在移動中拉伸和彎曲,營造出一種未來主義的超現實感。

液體金屬質感無敵,這以后誰還做特效啊= =
5.廣角鏡頭,鮮艷顏色的漸變平滑融合,重疊的半透明幾何圖形緩慢旋轉,營造出一種平靜和流動的感覺。

無敵,這顏色漸變,再調調能追上蘋果了。
總結:gen3的抽象藝術,是我完全沒想到能做到這么好的程度,對AE包裝這塊的沖擊可能會有點大,這種特效以后都不用做了,AI直出。
寫在最后
上面的case,只是部分。
所有的其他case,我都放在了飛書文檔里,想要看全部的,關注我公眾號后,后臺私信"gen3"就有了。
Runway這一波,還是展現了自己作為老牌公司的實力,整整六年時間的沉淀。
就像他們老板自己說的那樣。

一夜成名,從不存在。
這背后是時間、精力、金錢的積累,是在低谷期在睡不著覺的時候的瘋狂的煎熬。
所以,才有了今天的Runway。
誰沒有過低谷,誰沒有過煎熬呢,但是他們撐了過來,用這六年在電影工業和AI技術上的積累,做出了比同行高一等審美和技術力的大模型。
前方的路,還很漫長。
他們當然也有可能有無數的挑戰。
但是,至少在今天。
他們就是我心中那實至名歸的。
No.1。
原標題:《我測了12個小時的RunwayGen3,發現這就是AI視頻的No.1。》
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司