下載客戶端

登錄

我測了12個小時的RunwayGen3，發現這就是AI視頻的No.1

2024-07-01 14:37

來源：澎湃新聞·澎湃號·湃客

原創數字生命卡茲克數字生命卡茲克

眾多AI視頻創作者翹首以盼的Runway的Gen3，終于面向部分超級合作者開放了。

我的好基友@閑人一坤也是第一時間拿到了內測資格，我就直接把號要來了。

我從中午到凌晨，跑了12個小時，幾百個Case。

發現我之前開的香檳，沒開早。

先放幾個我覺得還不錯的case。

Runway Gen3，在模型質量上，還是能把Luma和可靈拉開一些差距，特別是審美上。雖然也就是70分跟60分的區別，但至少，在模型質量上，確實是我認為的當今No.1。

不過，現在只上了文生視頻，圖生和那些可控工具還沒上。

給我急急急急急急急急急急急急急急急急死了。

在我跟坤哥瞎吉爾一頓跑了快100個case之后，我決定還是偏系統性地測一下，這個系統只是比瞎跑系統一點，肯定比不過南洋理工或者上海人工智能實驗室那種專業級別的測試，所以別杠我，杠就是你對= =

測試的構筑方法上，其實我之前想了蠻久的，去年我其實規劃過一版測試維度，大類上有語義理解、畫面細節質量、運動質量、鏡頭移動質量、一致性、衰減性等等。

然后比如在運動幅度上，又可以拆為：人臉五官運動質量、人物肢體運動質量、動物運動質量、剛體運動質量、流體運動質量等等。

寫完以后我就覺得太扯淡了，不是這個劃分扯淡，是我的人力有點扯淡。真要這么跑一遍，那我就好幾天啥事都不用干了。

所以現在，為了達到成本與效率最優解，我就非常簡單粗淺地，按風格去劃分，分為：

寫實風格、動畫風格、科幻風格、玄幻風格、抽象風格。

每個風格里面跑10~15個prompt，每個prompt roll三遍，雖然只有文生視頻，但其實也基本能看出來模型整體質量和特征了。

而寫prompt這活，當然是交給AI去干了。

畢竟有公式可以套：

Prompt = 鏡頭語言+光影+主體描述+主體運動+場景+氛圍。

然后我就讓GPT根據公式和規則，給我哐哐哐的寫了幾噸的prompt。

再把這些prompt，扔到gen3里面跑case。

目前只能用文生視頻，其他的功能都還沒上。在最下面可以切換生成視頻的片段長度，可選5s和10s兩種。

生成速度非常的快，親測10s的基本也就1分半就能跑出來，這個可比Luma好多了，那玩意動不動十幾分鐘。

而文章礙于篇幅，我就每個風格，展示5個有代表性的case，讓大家一睹為快。

（注：在gen3中生成視頻我使用的都是英文，下面的是為了方便大家看所以所有prompt才都翻譯成了中文）

一.寫實風格

寫實風格測試的東西很簡單，主要就是看現實城市街景、自然風光、室內場景等，也看看人物的面部表情、光影效果、細節紋理等。

核心還是現實世界的寫實。

1. 特寫鏡頭，溫暖的晚霞，一位長發飄逸、面帶溫柔微笑的年輕女子，坐在咖啡館的露臺上，輕啜咖啡，背景中是模糊的城市景觀和人群交通，氛圍放松而舒適。

這個可以看到杯子是變形的，手的位置也很奇怪。除了這兩問題之外，其他都還挺穩。

2. 中景鏡頭，刺眼的正午陽光，施工現場的工人們穿著安全裝備操作起重機，背景中聳立著摩天大樓，氛圍動態而繁忙。

這個問題就非常多了，肢體變形，人物消失，穿過了明明在遠方的桿子，摩天大樓的細節也有問題。

3.低角度鏡頭，戲劇性的側面光，一位專業廚師在繁忙的廚房里切菜，周圍蒸汽彌漫，鍋碗瓢盆懸掛，氛圍緊張而專注。

地獄難度，涉及到切菜也就是人、刀、菜的三者交互，所以基本都跟魔法一樣，不能看。

4.傾斜鏡頭，傍晚的街燈，一位音樂家在繁華的街角彈吉他，行人匆匆而過，商店門面上明亮的霓虹燈，氛圍熱鬧而充滿活力。

算是很能夸的一個鏡頭了，人物主體是非常穩定的。但是背景過于復雜，很明顯的BUG就是剛開始的車開過去的時候，有個粉衣服的人是跟車合為一體的。

5.極限特寫鏡頭，自然光線，一位畫家的手在調色板上混合顏色，背景是畫布和畫架，手指上沾有顏料，氛圍專注而富有創造力。

很棒的一個鏡頭。是能明顯感受到有因果關系的，手和筆會影響顏料，還有粘連的效果。雖然肯定沒法跟現實世界比，但是已經很不錯了。

總結：寫實風格整體看，還是人物特寫和風景最穩，一旦涉及到全景或者中景，當人物沒有足夠的面積空間時，肢體變形就極為嚴重，但是如果不涉及到人物與物體的交互，那穩定性還是非常強的。

而Runway有一說一，在光影的審美上，是真的強。畢竟電影出身，審美是真舒服。

二.動畫風格

主要就是看對各種風格的包容度以及審美，比如2D、3D、皮克斯、吉卜力等等。

1.特寫鏡頭，柔和的晨光，一位粉色頭發、大眼睛的年輕女孩，日式動漫風格，望著窗外，櫻花在空中飄落，背景是傳統的日本房屋，氛圍寧靜且懷舊。

風格倒是正常，櫻花飄地也很好看，就是人物動態太少，跟寫實比差太多了，基本沒有任何表演可言。

2.中景鏡頭，夕陽余暉，一位未來派機器人和一個人類女孩，3D動畫風格，走在霓虹燈閃爍的街道上，周圍是全息標志和飛行汽車，城市景觀中高聳的建筑，氛圍鮮活且高科技。

我真不是故意嚇大家才把這個傳上來的，是他真的BUG的有特點，因為我跑出來好多前后不分的視頻，這個就是典型代表。

3.高角度鏡頭，明亮的正午陽光，一群充滿活力的玩具復活，皮克斯風格，在一個孩子色彩繽紛的臥室里，玩具車和動作人物四處移動，氛圍愉快且充滿活力。

奇奇怪怪的鏡頭，風格也不是皮克斯的典型風格，物體也都是莫名其妙的出來，最后小熊突然變成積木飛了那一瞬間我是真沒繃住。

4.跟蹤鏡頭，柔和的黃昏光，一位勇敢的少女戰士，手持發光的劍，幻想動漫風格，跑過一片迷人的森林，周圍是神話生物和古老遺跡，氛圍史詩且冒險。

除了手上那把劍不知道是個什么玩意，也沒有神話生物和古老遺跡啥的，都挺好。

5.越肩鏡頭，昏暗的室內燈光，一位年輕的巫師手持魔法書，中世紀動漫風格，在宏偉的圖書館中施法，書架上擺滿了古老的書籍和魔法神器，氛圍神秘且魔幻。

最后的那一下特效帥炸了，就是人物的臉變形了，從一個異瞳萌妹不知道是個什么玩意，而且也不是越肩視角，不過越肩視角這個就不強求了，沒幾個能畫出來的。

總結：動畫風格整體化上，其實都挺差勁的，吉卜力、3D、美漫啥的效果表現都極差，整體審美、物理動態也比寫實差很多，明顯感受到了數據集的不足，runway整體還是非常的偏寫實和電影的。

三.科幻風格

我自己最喜歡的風格，主要看模型的數據集和泛化能力，能不能把一些很科幻的場景表現出來。應該也是我跑得最多的case，好像文檔里放了將近20個。

1.廣角鏡頭，霓虹城市燈光反射在金屬表面，一個巨型機甲從一個流線型車輛變形為高聳的機器人，齒輪和面板無縫轉換，背景中有未來感的摩天大樓和飛行汽車，氛圍緊張且高科技。

我是有多想不開才會讓AI給我跑變形金剛。但是他居然變了出來，雖然整體都很奇怪，但是至少是變了，這個prompt理解是猛的。

2.中景鏡頭，鮮艷的藍色和銀色調，兩臺機甲陷入史詩般的戰斗，迅速交換打擊并發射能量武器，四周是煙霧和爆炸的破壞性城市戰場，氛圍充滿動感和動作感。

真的，帥炸了，我愛慘了，這打架是正兒八經會打起來的啊，真的會爆炸啊！科幻還是得runway啊！

3.跟蹤鏡頭，昏暗的走廊，一群太空海軍陸戰隊小心翼翼地穿過廢棄的飛船，燈光閃爍和詭異的聲音，氛圍緊張且懸疑。

整體都很穩，氛圍和質感也無敵，就是有個人出BUG卡門里了。

4.廣角鏡頭，旋轉的五彩斑斕的漩渦，一個流線型的時間旅行飛船快速穿過隧道，周圍是光線和能量軌跡，氛圍令人興奮且超凡脫俗。

這光影，這質感，想哭，我的新片子，想馬上就要開始做了！！！

5.特寫鏡頭，強烈對比的照明，一個宇航員在空間站外漂浮，背景中可見地球和月亮，星星在頭盔面罩上反射，氛圍寂靜且孤立。

這種大特寫，必然穩定，人物還有眼球表演，只能說，牛逼。

總結：沒啥可說的，在科幻領域上，runway就是No.1，其他都得靠邊站。我的新片子，已經開始準備了，有點興奮的睡不著覺了。

四.玄幻風格

跟科幻一樣，也偏想象，很吃數據集和泛化。主要就是看魔法、神話世界啥的。

1.特寫鏡頭，柔和溫暖的燈光，一位年輕的女巫師，眼睛發光，手持頂端有水晶的法杖，長袍上有復雜的符文，背景是迷人的森林，氛圍魔法且寧靜。

所有的一切都很穩，除了只有三根手指，否則就是完美的。

2.越肩鏡頭，昏暗的火炬光，一個盜賊在黑暗地牢里撬開一扇巨大的華麗門鎖，周圍是古老的符號和蜘蛛網，氛圍緊張且秘密。

很有趣的一個是人走過火的時候，手上真的有東西被點著了。當然BUG問題很大，門最后變成了現代門。而且頂上出來了游戲的方位條，感覺是扒了刺客信條的數據集。

3.廣角鏡頭，月光之夜，一個覆蓋著發光符文的巨型石像從密林中出現，樹木搖晃，腳下的地面開裂，背景是古老的遺跡，氛圍神秘且不祥。

有一種憨批巨像的即視感，除了人物丑，沒啥其他的問題。

4.傾斜鏡頭，月光之夜，一群精靈在神圣的樹林中進行儀式，發光的符文和魔法能量在他們周圍旋轉，古老的樹木和星空，氛圍神秘且敬畏。

雕像造型上非常克蘇魯魔幻的一段，最后的光效非常華麗，runway不愧是電影出身，這小特效做得一個比一個頂。

5.廣角鏡頭，夢幻般的燈光，一座古老的城堡坐落在懸崖上，周圍環繞著旋轉的霧氣，天空中一條龍翱翔，中世紀幻想風格，氛圍壯麗且神秘。

龍的畫面面積太小了，所以還是那個問題，風控變形，其他都很準，也很理解語義。

總結：玄幻相比之下，沒有runway的科幻那么長板，還是會弱一些，適合做西方玄幻，中國玄幻不好測，等出圖生視頻了再測，效果不一定有可靈強。

五.抽象風格

抽象風格其實就是測試抽象的幾何圖形、色彩斑斕的空間、不規則形狀等等，主要關注形狀、顏色、運動和情感，而不是具體的物體或場景。

1.特寫鏡頭，明亮霓虹色與暗背景形成鮮明對比，分形圖案有節奏地擴展和收縮，氛圍強烈且令人著迷。

我是沒想到gen3的分形藝術能做的這么穩這么好。

2.低角度鏡頭，鮮明的黑白色調，銳利的角形圖案不規則地移動，創造出混亂和迷失方向的感覺。

這就是藝術，沒啥可說的，最后有點不穩了。

3.搖攝鏡頭，明亮的彩色粒子旋轉并匯聚成抽象的形態，營造出一種生動的運動和興奮感。

想起了我以前用C4D做的粒子效果，辛辛苦苦渲半天，還真不如這個。

4.跟蹤鏡頭，流動的金屬表面反射環境光，形狀在移動中拉伸和彎曲，營造出一種未來主義的超現實感。

液體金屬質感無敵，這以后誰還做特效啊= =

5.廣角鏡頭，鮮艷顏色的漸變平滑融合，重疊的半透明幾何圖形緩慢旋轉，營造出一種平靜和流動的感覺。

無敵，這顏色漸變，再調調能追上蘋果了。

總結：gen3的抽象藝術，是我完全沒想到能做到這么好的程度，對AE包裝這塊的沖擊可能會有點大，這種特效以后都不用做了，AI直出。

寫在最后

上面的case，只是部分。

所有的其他case，我都放在了飛書文檔里，想要看全部的，關注我公眾號后，后臺私信"gen3"就有了。

Runway這一波，還是展現了自己作為老牌公司的實力，整整六年時間的沉淀。

就像他們老板自己說的那樣。

一夜成名，從不存在。

這背后是時間、精力、金錢的積累，是在低谷期在睡不著覺的時候的瘋狂的煎熬。

所以，才有了今天的Runway。

誰沒有過低谷，誰沒有過煎熬呢，但是他們撐了過來，用這六年在電影工業和AI技術上的積累，做出了比同行高一等審美和技術力的大模型。

前方的路，還很漫長。

他們當然也有可能有無數的挑戰。

但是，至少在今天。

他們就是我心中那實至名歸的。

No.1。

原標題：《我測了12個小時的RunwayGen3，發現這就是AI視頻的No.1。》

閱讀原文

特別聲明

本文為澎湃號作者或機構在澎湃新聞上傳并發布，僅代表該作者或機構觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#Runway

掃碼下載澎湃新聞客戶端

澎湃矩陣

澎湃新聞微博
澎湃新聞公眾號
澎湃新聞抖音號
派生萬物開放平臺
IP SHANGHAI
SIXTH TONE

新聞報料

報料熱線: 021-962866
報料郵箱: news@thepaper.cn

滬ICP備14003370號

滬公網安備31010602000299號

互聯網新聞信息服務許可證：31120170006

增值電信業務經營許可證：滬B2-2017116

? 2014-2025 上海東方報業有限公司

反饋

▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

我測了12個小時的RunwayGen3，發現這就是AI視頻的No.1

掃碼下載澎湃新聞客戶端