▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

我測了12個小時的RunwayGen3,發現這就是AI視頻的No.1

2024-07-01 14:37
來源:澎湃新聞·澎湃號·湃客
字號

原創 數字生命卡茲克 數字生命卡茲克

眾多AI視頻創作者翹首以盼的Runway的Gen3,終于面向部分超級合作者開放了。

我的好基友@閑人一坤也是第一時間拿到了內測資格,我就直接把號要來了。

我從中午到凌晨,跑了12個小時,幾百個Case。

發現我之前開的香檳,沒開早。

先放幾個我覺得還不錯的case。

Runway Gen3,在模型質量上,還是能把Luma和可靈拉開一些差距,特別是審美上。雖然也就是70分跟60分的區別,但至少,在模型質量上,確實是我認為的當今No.1。

不過,現在只上了文生視頻,圖生和那些可控工具還沒上。

給我急急急急急急急急急急急急急急急急死了。

在我跟坤哥瞎吉爾一頓跑了快100個case之后,我決定還是偏系統性地測一下,這個系統只是比瞎跑系統一點,肯定比不過南洋理工或者上海人工智能實驗室那種專業級別的測試,所以別杠我,杠就是你對= =

測試的構筑方法上,其實我之前想了蠻久的,去年我其實規劃過一版測試維度,大類上有語義理解、畫面細節質量、運動質量、鏡頭移動質量、一致性、衰減性等等。

然后比如在運動幅度上,又可以拆為:人臉五官運動質量、人物肢體運動質量、動物運動質量、剛體運動質量、流體運動質量等等。

寫完以后我就覺得太扯淡了,不是這個劃分扯淡,是我的人力有點扯淡。真要這么跑一遍,那我就好幾天啥事都不用干了。

所以現在,為了達到成本與效率最優解,我就非常簡單粗淺地,按風格去劃分,分為:

寫實風格、動畫風格、科幻風格、玄幻風格、抽象風格。

每個風格里面跑10~15個prompt,每個prompt roll三遍,雖然只有文生視頻,但其實也基本能看出來模型整體質量和特征了。

而寫prompt這活,當然是交給AI去干了。

畢竟有公式可以套:

Prompt = 鏡頭語言+光影+主體描述+主體運動+場景+氛圍。

然后我就讓GPT根據公式和規則,給我哐哐哐的寫了幾噸的prompt。

再把這些prompt,扔到gen3里面跑case。

目前只能用文生視頻,其他的功能都還沒上。在最下面可以切換生成視頻的片段長度,可選5s和10s兩種。

生成速度非常的快,親測10s的基本也就1分半就能跑出來,這個可比Luma好多了,那玩意動不動十幾分鐘。

而文章礙于篇幅,我就每個風格,展示5個有代表性的case,讓大家一睹為快。

(注:在gen3中生成視頻我使用的都是英文,下面的是為了方便大家看所以所有prompt才都翻譯成了中文)

一.寫實風格

寫實風格測試的東西很簡單,主要就是看現實城市街景、自然風光、室內場景等,也看看人物的面部表情、光影效果、細節紋理等。

核心還是現實世界的寫實。

1. 特寫鏡頭,溫暖的晚霞,一位長發飄逸、面帶溫柔微笑的年輕女子,坐在咖啡館的露臺上,輕啜咖啡,背景中是模糊的城市景觀和人群交通,氛圍放松而舒適。

這個可以看到杯子是變形的,手的位置也很奇怪。除了這兩問題之外,其他都還挺穩。

2. 中景鏡頭,刺眼的正午陽光,施工現場的工人們穿著安全裝備操作起重機,背景中聳立著摩天大樓,氛圍動態而繁忙。

這個問題就非常多了,肢體變形,人物消失,穿過了明明在遠方的桿子,摩天大樓的細節也有問題。

3.低角度鏡頭,戲劇性的側面光,一位專業廚師在繁忙的廚房里切菜,周圍蒸汽彌漫,鍋碗瓢盆懸掛,氛圍緊張而專注。

地獄難度,涉及到切菜也就是人、刀、菜的三者交互,所以基本都跟魔法一樣,不能看。

4.傾斜鏡頭,傍晚的街燈,一位音樂家在繁華的街角彈吉他,行人匆匆而過,商店門面上明亮的霓虹燈,氛圍熱鬧而充滿活力。

算是很能夸的一個鏡頭了,人物主體是非常穩定的。但是背景過于復雜,很明顯的BUG就是剛開始的車開過去的時候,有個粉衣服的人是跟車合為一體的。

5.極限特寫鏡頭,自然光線,一位畫家的手在調色板上混合顏色,背景是畫布和畫架,手指上沾有顏料,氛圍專注而富有創造力。

很棒的一個鏡頭。是能明顯感受到有因果關系的,手和筆會影響顏料,還有粘連的效果。雖然肯定沒法跟現實世界比,但是已經很不錯了。

總結:寫實風格整體看,還是人物特寫和風景最穩,一旦涉及到全景或者中景,當人物沒有足夠的面積空間時,肢體變形就極為嚴重,但是如果不涉及到人物與物體的交互,那穩定性還是非常強的。

而Runway有一說一,在光影的審美上,是真的強。畢竟電影出身,審美是真舒服。

二.動畫風格

主要就是看對各種風格的包容度以及審美,比如2D、3D、皮克斯、吉卜力等等。

1.特寫鏡頭,柔和的晨光,一位粉色頭發、大眼睛的年輕女孩,日式動漫風格,望著窗外,櫻花在空中飄落,背景是傳統的日本房屋,氛圍寧靜且懷舊。

風格倒是正常,櫻花飄地也很好看,就是人物動態太少,跟寫實比差太多了,基本沒有任何表演可言。

2.中景鏡頭,夕陽余暉,一位未來派機器人和一個人類女孩,3D動畫風格,走在霓虹燈閃爍的街道上,周圍是全息標志和飛行汽車,城市景觀中高聳的建筑,氛圍鮮活且高科技。

我真不是故意嚇大家才把這個傳上來的,是他真的BUG的有特點,因為我跑出來好多前后不分的視頻,這個就是典型代表。

3.高角度鏡頭,明亮的正午陽光,一群充滿活力的玩具復活,皮克斯風格,在一個孩子色彩繽紛的臥室里,玩具車和動作人物四處移動,氛圍愉快且充滿活力。

奇奇怪怪的鏡頭,風格也不是皮克斯的典型風格,物體也都是莫名其妙的出來,最后小熊突然變成積木飛了那一瞬間我是真沒繃住。

4.跟蹤鏡頭,柔和的黃昏光,一位勇敢的少女戰士,手持發光的劍,幻想動漫風格,跑過一片迷人的森林,周圍是神話生物和古老遺跡,氛圍史詩且冒險。

除了手上那把劍不知道是個什么玩意,也沒有神話生物和古老遺跡啥的,都挺好。

5.越肩鏡頭,昏暗的室內燈光,一位年輕的巫師手持魔法書,中世紀動漫風格,在宏偉的圖書館中施法,書架上擺滿了古老的書籍和魔法神器,氛圍神秘且魔幻。

最后的那一下特效帥炸了,就是人物的臉變形了,從一個異瞳萌妹不知道是個什么玩意,而且也不是越肩視角,不過越肩視角這個就不強求了,沒幾個能畫出來的。

總結:動畫風格整體化上,其實都挺差勁的,吉卜力、3D、美漫啥的效果表現都極差,整體審美、物理動態也比寫實差很多,明顯感受到了數據集的不足,runway整體還是非常的偏寫實和電影的。

三.科幻風格

我自己最喜歡的風格,主要看模型的數據集和泛化能力,能不能把一些很科幻的場景表現出來。應該也是我跑得最多的case,好像文檔里放了將近20個。

1.廣角鏡頭,霓虹城市燈光反射在金屬表面,一個巨型機甲從一個流線型車輛變形為高聳的機器人,齒輪和面板無縫轉換,背景中有未來感的摩天大樓和飛行汽車,氛圍緊張且高科技。

我是有多想不開才會讓AI給我跑變形金剛。但是他居然變了出來,雖然整體都很奇怪,但是至少是變了,這個prompt理解是猛的。

2.中景鏡頭,鮮艷的藍色和銀色調,兩臺機甲陷入史詩般的戰斗,迅速交換打擊并發射能量武器,四周是煙霧和爆炸的破壞性城市戰場,氛圍充滿動感和動作感。

真的,帥炸了,我愛慘了,這打架是正兒八經會打起來的啊,真的會爆炸啊!科幻還是得runway啊!

3.跟蹤鏡頭,昏暗的走廊,一群太空海軍陸戰隊小心翼翼地穿過廢棄的飛船,燈光閃爍和詭異的聲音,氛圍緊張且懸疑。

整體都很穩,氛圍和質感也無敵,就是有個人出BUG卡門里了。

4.廣角鏡頭,旋轉的五彩斑斕的漩渦,一個流線型的時間旅行飛船快速穿過隧道,周圍是光線和能量軌跡,氛圍令人興奮且超凡脫俗。

這光影,這質感,想哭,我的新片子,想馬上就要開始做了!!!

5.特寫鏡頭,強烈對比的照明,一個宇航員在空間站外漂浮,背景中可見地球和月亮,星星在頭盔面罩上反射,氛圍寂靜且孤立。

這種大特寫,必然穩定,人物還有眼球表演,只能說,牛逼。

總結:沒啥可說的,在科幻領域上,runway就是No.1,其他都得靠邊站。我的新片子,已經開始準備了,有點興奮的睡不著覺了。

四.玄幻風格

跟科幻一樣,也偏想象,很吃數據集和泛化。主要就是看魔法、神話世界啥的。

1.特寫鏡頭,柔和溫暖的燈光,一位年輕的女巫師,眼睛發光,手持頂端有水晶的法杖,長袍上有復雜的符文,背景是迷人的森林,氛圍魔法且寧靜。

所有的一切都很穩,除了只有三根手指,否則就是完美的。

2.越肩鏡頭,昏暗的火炬光,一個盜賊在黑暗地牢里撬開一扇巨大的華麗門鎖,周圍是古老的符號和蜘蛛網,氛圍緊張且秘密。

很有趣的一個是人走過火的時候,手上真的有東西被點著了。當然BUG問題很大,門最后變成了現代門。而且頂上出來了游戲的方位條,感覺是扒了刺客信條的數據集。

3.廣角鏡頭,月光之夜,一個覆蓋著發光符文的巨型石像從密林中出現,樹木搖晃,腳下的地面開裂,背景是古老的遺跡,氛圍神秘且不祥。

有一種憨批巨像的即視感,除了人物丑,沒啥其他的問題。

4.傾斜鏡頭,月光之夜,一群精靈在神圣的樹林中進行儀式,發光的符文和魔法能量在他們周圍旋轉,古老的樹木和星空,氛圍神秘且敬畏。

雕像造型上非常克蘇魯魔幻的一段,最后的光效非常華麗,runway不愧是電影出身,這小特效做得一個比一個頂。

5.廣角鏡頭,夢幻般的燈光,一座古老的城堡坐落在懸崖上,周圍環繞著旋轉的霧氣,天空中一條龍翱翔,中世紀幻想風格,氛圍壯麗且神秘。

龍的畫面面積太小了,所以還是那個問題,風控變形,其他都很準,也很理解語義。

總結:玄幻相比之下,沒有runway的科幻那么長板,還是會弱一些,適合做西方玄幻,中國玄幻不好測,等出圖生視頻了再測,效果不一定有可靈強。

五.抽象風格

抽象風格其實就是測試抽象的幾何圖形、色彩斑斕的空間、不規則形狀等等,主要關注形狀、顏色、運動和情感,而不是具體的物體或場景。

1.特寫鏡頭,明亮霓虹色與暗背景形成鮮明對比,分形圖案有節奏地擴展和收縮,氛圍強烈且令人著迷。

我是沒想到gen3的分形藝術能做的這么穩這么好。

2.低角度鏡頭,鮮明的黑白色調,銳利的角形圖案不規則地移動,創造出混亂和迷失方向的感覺。

這就是藝術,沒啥可說的,最后有點不穩了。

3.搖攝鏡頭,明亮的彩色粒子旋轉并匯聚成抽象的形態,營造出一種生動的運動和興奮感。

想起了我以前用C4D做的粒子效果,辛辛苦苦渲半天,還真不如這個。

4.跟蹤鏡頭,流動的金屬表面反射環境光,形狀在移動中拉伸和彎曲,營造出一種未來主義的超現實感。

液體金屬質感無敵,這以后誰還做特效啊= =

5.廣角鏡頭,鮮艷顏色的漸變平滑融合,重疊的半透明幾何圖形緩慢旋轉,營造出一種平靜和流動的感覺。

無敵,這顏色漸變,再調調能追上蘋果了。

總結:gen3的抽象藝術,是我完全沒想到能做到這么好的程度,對AE包裝這塊的沖擊可能會有點大,這種特效以后都不用做了,AI直出。

寫在最后

上面的case,只是部分。

所有的其他case,我都放在了飛書文檔里,想要看全部的,關注我公眾號后,后臺私信"gen3"就有了。

Runway這一波,還是展現了自己作為老牌公司的實力,整整六年時間的沉淀。

就像他們老板自己說的那樣。

一夜成名,從不存在。

這背后是時間、精力、金錢的積累,是在低谷期在睡不著覺的時候的瘋狂的煎熬。

所以,才有了今天的Runway。

誰沒有過低谷,誰沒有過煎熬呢,但是他們撐了過來,用這六年在電影工業和AI技術上的積累,做出了比同行高一等審美和技術力的大模型。

前方的路,還很漫長。

他們當然也有可能有無數的挑戰。

但是,至少在今天。

他們就是我心中那實至名歸的。

No.1。

原標題:《我測了12個小時的RunwayGen3,發現這就是AI視頻的No.1。》

閱讀原文

    本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            主站蜘蛛池模板: 社旗县| 余干县| 大安市| 韶关市| 张家口市| 南召县| 息烽县| 东平县| 巴林左旗| 许昌市| 安溪县| 邳州市| 曲周县| 湾仔区| 封开县| 焦作市| 莱州市| 德钦县| 罗江县| 繁昌县| 凤庆县| 郎溪县| 太白县| 琼海市| 利津县| 罗平县| 柏乡县| 肥西县| 瑞金市| 乌审旗| 大化| 阿鲁科尔沁旗| 渭源县| 山阴县| 邢台县| 三江| 三门县| 永定县| 金华市| 井陉县| 正镶白旗|