- +1
馬上評|輸入《繁花》,Sora能演出爺叔看向阿寶的表情嗎
北京時間2月16日凌晨,OpenAI發布了文生視頻大模型Sora及多個樣例視頻。相比于此前的類似應用,Sora更加強大,一經宣布便在全球網絡世界產生巨大反響,好評如潮,熱度不斷。Sora仍在快速迭代中,是一個移動的靶子,我在這里作為一名文科(傳播學)教授,僅從媒介學角度對Sora做出一些試探性的分析,這些分析也許明天就過時了,因此聊作一時和一家之言。
Sora:“畫出不可畫者”(super-media)
此前的ChatGPT 是文生文,Midjourney 是文生圖,Pika 和Runaway等是文生視頻,Sora 可以基于文字、圖像和視頻提示(prompts)生成視頻,但是相對于此前類似應用,Sora生成的視頻時間更長(60秒),可以變換視角(平行或無人機視角)和焦距(微距、特寫、近景和遠景等)、清晰度(高至1084K)和長寬比,還能根據用戶提示依據物理原理對視頻中的內容向過去或未來推演,以及表達出如孤獨、熱鬧等情感色彩。
Sora能實現如此強大的效果,技術基礎有很多,但最重要的包括基于英偉達NVIDIA RTX的虛擬引擎Unreal Engine 5,它實現了對各種“元素型媒介”的靜態和動態的模擬,包括交通場景、物理原理(水、牛奶、云、雪等的流動)和材料表面(玻璃、金屬、木材、磚瓦、織物和皮草等)。
人類如何再現云、水、火、土等自然元素,一直是一個極具挑戰性的技術難題。彼得斯在《奇云》中引用藝術史學家休伯特·達米西(Hubert Damisch)在《論云》(Théorie du nuage,1972)一書中的論述指出:云如霧如氣的特點給繪畫帶來了特殊挑戰,因為它飄忽不定,缺乏邊界,讓文藝復興時興起的“點—線—面”幾何透視原理無效。達·芬奇認為,繪畫不能忽視如灰燼、泥土和云彩這樣的難以表現的物體,它們都是“沒有面的體”。
云讓我們想起一個古老的哲學悖論(sorites paradox)——多少粒沙子可以算“一堆沙子”?其從量變到質變的分界線在哪里?對之我們根本無法確定。和聲音及音樂一樣,云的存在體現于其消失的過程中,它流動不居、意義深遠卻又含混不清,因此云能激發繪畫才智,是對創作者如何使用媒介(各類筆、墨、顏料和書寫表面)“畫出不可畫者”、“傳播不可傳播者”之能力的考驗。繪畫和攝影中記錄云的歷史,就是人類努力去捕捉那些既感性又抽象之物的歷史。彼得斯認為,云、水、火、土等自然元素能引發媒介實踐和媒介研究中的一個基本問題(problematic):在使用現有符號系統和媒介都無效時,我們如何去記錄存在于時間之流中的變幻莫測、模糊不清和稍縱即逝之物?這個問題一直困擾著眾多藝術家、技術家和研究者
今天,UE5和Sora的出現卻將以上問題化為烏有。通過Sora,OpenAI終于大聲宣布:看,這個媒介表征難題已經不復存在!這就是為什么我們在OpenAI公布的視頻中幾乎處處都看到水(地中海城堡邊的潮水、咖啡杯中的船)、云(坐在云朵中閱讀的青年)和雪(金毛狗在雪中的玩耍)等。
達米西指出,“中國有著一個強大的畫云(cloud painting)的傳統;與歐洲人相比,中國人并不那么焦慮或意圖超越;在中國畫中,云多半與山脈和海洋相處融洽,而不是要高于山海之上”。我認為,如“水”一樣,“云”作為“沒有面的體”,類似于不可編碼的默會知識,恰可作為象征中國傳播實踐和思想的典型意象。今天,既然Sora已經解決了此前“不可表征”的技術難題,不遠的未來它也很有可能將一切此前“不可畫出和不可傳播的”默會知識變成顯性知識。這讓我們不禁遐思,東西方文化溝通的障礙也許很快會被克服?
Sora: 世界模擬器(world-modeling media)
有些人高呼Sora導致了“物理規律的消失和現實的消失”,我認為恰恰相反,Sora證明了物理規律的強大和現實的堅韌。
Sora作為一種強大的媒介,當然具有現實建構能力。我們可以根據媒介類型和它們在相關社會中滲透的廣度和深度來區分社會階段:“無媒介的社會”(比如口語社會)、“有媒介的社會”(比如文字和印刷社會)、“媒介社會”(比如廣播、電影和電視社會)和“媒介化社會”(互聯網、社交媒體和元宇宙和人工智能社會)。在“有媒介的社會”,媒介僅僅是社會的一部分,它的主要功能是表征(represent)現實;但是在“媒介化社會”,媒介成為一種環境包裹著我們。此時媒介就能建構(construct)現實——一個事件或人物如果不存在于媒介之中(不被媒體報道),就相當于不存在。這里我們可以模仿貝克萊“存在就是被感知”的名言說,“存在就是被媒介報道”,或者“存在就是被媒介化(mediated)”。Sora是“媒介化社會”的原因和結果,所以說它建構了現實當然沒錯。
但Sora的強大之處并非它扭曲了物理規律和真實現實,而是它理解、學習、順應和利用了它們。Sora背后的原理非常復雜,我作為一個文科教授讀了半天技術文檔都沒特別弄懂,也許我根本弄不懂。但它使我想起了人工智能的先驅之一諾伯特·維納的提出的控制論。在二戰期間,控制論被用來指導計算機捕捉和分析敵軍轟炸機的體積、質量、所處的位置、飛行速度和方向等信息,然后這些信息被自動輸入高射炮,并根據物理規律從轟炸機過去的位置預測其下一刻的位置,以指引高射炮的自動瞄準和射擊。這里,控制論幫助高射炮實現了時空操縱。類似的,Sora 操縱了所謂“時空patches”, 甚至因具有“涌現”(emergence)能力——能夠模擬物理世界中的人、動物和環境。這也許就是為什么說Sora具有如易經八卦一樣的“一生二、二生三、三生萬物”的建構和模擬世界的能力。它也因此被稱為“世界模型”(world model)或者“世界模擬器”(world simulator)。OpenAI將這個世界模擬器取名為Sora——它的日文意思是“天空”。我理解為,這里的“天空”指“大氣(層)”。正因為有大氣層,才有了適合人類居住的地球(世界)。正如大氣層是地球的模擬器(constructer/enabler)一樣,Sora將成為人類建構各種“小世界”的模擬器。
Sora:建構元宇宙 (meta-media)
我曾指出元宇宙的本質是數字孿生,包括人、物和環境的數字孿生,從而最終建構出一個與現實世界平行且交互的世界。我們此前用夢境、口語、圖畫、文字、鋼筋水泥建構出各種想象的和真實的世界,包括遠古的巖洞壁畫、荷馬史詩、曹雪芹筆下的大觀園以及動畫和現實中的迪士尼樂園和環球影城。
Sora 所基于的技術,如芯片算力、算法以及圖形渲染引擎UE 5等,都是建設元宇宙的基礎設施,因此我認為它的出現是向著元宇宙方向的邁進。我曾將元宇宙定義為:一個由具有強大記錄能力和傳輸能力的媒介支撐的3D網絡生態,用戶遠程登錄其中后可以實現遙在(teleport/telepresence),從而能如在網下世界一樣在3D網絡空間中進行各種交互活動。這個被稱為元宇宙的3D網絡空間既可以是大寫的單數(Metaverse),更應是小寫的復數(metaverses)。換句話說,它既可以是“大型元宇宙服務提供商”(Metaverse Service Provider)提供的龐大制作,也可以是普通用戶自己制作后在以上平臺上免費或收費提供給其他用戶的小制作和小體驗,或稱為“全息體驗媒介產品”(holograms)。
在不久以前,為制作這類元宇宙“自媒體”產品,用戶還需要使用AutoCAD、Omniverse或Horizon World(類似于2D媒體時代的生產工具Photoshop 或Premiere)等3D工具。和此前古代和現代的藝術高手一樣,今天普通人通過簡單的文字描述,使用Sora就可以將自己的想象高效和逼真地可視化,創造自己的元宇宙。
因此,Sora出現的意義和500多年前印刷術、100多年前的“火腿電臺”(ham radio)、20年前的Web2.0(以社交媒體為代表)的意義是一樣的——它們可能彌合人與人之間在擁有元宇宙生成技術上的鴻溝(技術鴻溝),因而可能彌合相應的技能鴻溝,進而可能將所有人都平等地置于僅憑自己的頭腦和創意取勝的競技場上。盡管這一設想可能過于樂觀,但我們畢竟向這一天的到來靠近了許多。
Sora:冷媒介?熱媒介?(cold media, hot media)
Sora讓我們能簡便絲滑地從文、圖和簡單的視頻生成復雜和逼真的新視頻,這很容易讓我們忽視不同媒介介質在傳播效果上的差異。舉例說明,一名聽眾聽不懂舒伯特的某個小提琴曲,去問他是何意。舒伯特沒有說話,只是拿起小提琴又拉了一遍;此人仍然聽不懂,舒伯特仍然不說話,再拉了一遍。此人仍然滿臉疑惑,請舒伯特解釋曲子的意思。最后舒伯特說,曲子就是曲子,何須文字?然后離場而去。類似的,同樣是文字,《六經》精簡濃縮,氣象萬千,含義無窮,而后人對《六經》的注釋洋洋灑灑,但具體而狹隘。因此何者意義更豐富?是“《六經》注我”還是“我注《六經》”?由此看,在Midjourney, Stable Diffusion、DALL-E 等文生圖和Sora文生視頻的轉換過程中,是增加了意義還是刪減了意義?例如,一位讀者認為,閱讀《紅樓夢》文字版與看電視劇給她以相當不同的感覺;電視劇刪掉了原著中很難視覺呈現的細節,少了原著的原汁原味。她說,“電視劇看到的是具體的畫面,閱讀小說更多是激發自己的思考與感悟。” 這就是為什么《紅樓夢》會有許多人百看不厭,甚至去手抄它,珍藏它,考據它,辨析它,爭論它,以至于產生“紅學”的原因。我們讀莎士比亞的作品,百人百議,“一千個讀者眼中就有一千個哈姆萊特”,道理也類通。
麥克盧漢區分了冷媒介和熱媒介。冷媒介具有低清晰度(模糊性)、高包容度和高受眾參與度;熱媒介具有高清晰度、低包容性,或者說低受眾參與度。文字屬于冷媒介,視頻屬于熱媒介。在Sora文生視頻的過程中,存在于抽象和模糊的文字中的萬千氣象也被圖片和視頻具體化和清晰化了,因此也造成了豐富意義的損失。此時,文字讀者就被轉化成了視頻觀眾,喪失了能動性和參與性。這顯然利弊參半。
Sora:貧媒介?富媒介?(poor media, rich media)
目前看,Sora將對影視制作、廣告業、短視頻業和大學影視專業的人才培養形成進一步的沖擊。以上行業分工精細,環節眾多,包括舞美、化妝、道具到燈光、攝像、攝影,從演員、編劇、劇務和動畫特效等。現在這些環節面臨著被精簡優化的壓力。但我認為Sora并不能完全代替現實拍攝、制作和真人表演。
使用AI建構一個新的現實需要其具有極強大的細節控制能力。目前Sora生成的視頻還不能做到完全精確,有的細節破綻人的肉眼就可以識別,例如東京街頭姑娘邁步時的左右腳不太自然,人在搬椅子時椅子竟然會漂浮在空中,籃球會穿過籃筐的邊筐而過,幾只小狗會不斷地變幻出更多的效果,人咬了一口餅干但餅干上沒有咬痕等;有的破綻通過其他AI能識別,例如有人用谷歌Gemini 分析Sora生成的視頻,發現東京的飄雪過于均勻,從而判斷其可能是AI生成的。當然,這些問題在Sora的不斷迭代中都很快能如破解物理題一樣地得到解決。但是目前看,Sora能接受的“提示詞”主要是可以被輕松視覺化的描述性文字,但抽象的、概念性的文字或觀點能否視覺化,如何視覺化,這是Sora下一步需要回答的問題。
更重要的是,正是文字媒介與視覺媒介(圖片和視頻)之間的差異讓我們作為用戶很難以文字提示通過Sora的“人工智能黑箱”來精確地控制和輸出我們想要的圖片或視頻。我們說“一圖勝千言”,反過來這也意味著即使是通過“千言”也無法精確達到一張圖片更別說一個視頻的效果了。比如,在熱播劇《繁花》中,90歲的游本昌老師扮演的“爺叔”看到穿上精致西裝的寶總就仿佛看到了年輕時的自己。他短短幾秒的面部表情和眼神注視,仿佛訴盡了自己一生的悲喜,也看哭了無數人。我很難想象,用多少以及什么樣的文字作為提示詞才能讓Sora 精確地輸出“爺叔”如此登峰造極的表演效果。Sora表面的無所不能恰恰再一次證明了如游本昌先生這樣的老戲骨對于一部情感劇的不可或缺。
1986年,美國傳播學者Richard Daft 和 Robert Lengel 提出了“媒介豐富度理論”(Media Richness)。該理論認為,不同媒介在信息豐富度上有差異,可從四個維度來區分:媒介傳遞多重線索的能力(例如聲音的變化、手勢等)、反饋的即時性(媒介使接收者對信息做出反應的速度)、語言的多樣性(例如文字、數學公式和藝術表達等)以及媒介的個性化定制能力(例如針對不同受眾定制內容)。目前看,提示詞文字可以說是貧媒介,Sora輸出的視頻似乎是富媒介(按照前述麥克盧漢的冷媒介和熱媒介之分,其實未必)。然而,《繁花》中的“爺叔”用他有著90多年大上海閱歷的大腦操縱自己的數十塊面部肌肉和深如海洋般的眼神,對著“阿寶”展現出(可視化)他內心的澎湃情感時,在“爺叔的臉”這一富媒介面前,Sora的視頻輸出只能算得上非常貧瘠的媒介了。
實際上,基于金宇澄先生的同名原著的電視劇 《繁花》聚焦于20世紀90年代初,講述了以阿寶為代表的小人物在時代浪潮下抓住機遇、施展才華,憑借迎難而上的勇氣和腳踏實地的魄力改寫命運、自我成長的故事。劇情充滿著引人入勝的欲望、挑戰和沖突(人物與自我、與他人和與社會),包括追求 (幸福生活) 、冒險、自我證明、復仇、救贖、蛻變、重生、自我發現等。此劇的人物刻畫也相當精彩,每個身處其中的普通人都選擇了向商業對手挑戰,向技術變革挑戰,向個體命運挑戰,哪怕失敗也不放棄,笑對人生起伏。這些欲望、挑戰和沖突都是人類經久不衰的主題, 因而使得電視劇具有了普遍性, 在作者、人物和觀眾三者之間形成一種共情,導致了《繁花》電視劇的熱播和熱議。
這也意味著,即使Sora可以高效地和逼真地輸出很多個某一類型的長達60秒或以上的視頻片段,即使這些視頻片段能讓某些自媒體或普通用戶更便利更廉價地創作,某些類型的視頻片段的表演仍然只有像游本昌先生這樣的專業老戲骨才能勝任;能將這些片段以符合觀眾接受心理的方式流暢編織起來、講述一個如《繁花》一樣精彩和賣座的故事的,目前也仍然只能是由專業的講故事高手通過專業(同時也是昂貴)的設備才能實現。盡管人類創造力的高峰已經被Sora等人工智能技術重重包圍,步步逼近,但最高處的紅旗仍將獵獵招展,高高飄揚。
Sora:舊媒介?新媒介?(old media, new media)
自2007年第一部iPhone智能手機發布(“iPhone時刻”)開始,人類的數字內容生產的“視覺轉向”(a visual turn)就啟動了。智能手機微小而便攜,極不利于內容(尤其是文字內容)的生產,而特別有利于內容(尤其是視頻內容)的消費。隨著智能手機在攝影攝像上的能力越來越強,年輕人的短視頻制作和消費能力也越來越強,文字閱讀理解和表達能力則越來越弱。此時,文字儼然已經成為過時的舊媒介。
但ChatGPT、Midjourney, Stable Diffusion 和Sora的出現似乎告訴我們,文字并沒有老去,而是突然華麗轉身,成為“一生萬物”的媒介之母。
文字本身就具有多媒體潛能。德國媒介學者弗里德里克·基特勒(Friedrich Kittler)認為,古希臘字母表具有如今天數字計算機一樣強大的多媒體能力,能通過單一的“代碼”從整體上捕捉、傳播和呈現出人類的存有經驗。他甚至將使用文字者比喻成坐在駕駛艙里的飛行員或游戲機屏幕前的玩家,可以隨心所欲地操縱“代碼”表達自己的體驗。而“閱讀”是“讀者從小坐在母親膝上學會的一種制造‘內在幻覺’(inner hallucination)的技巧。通過它,讀者能將文字拆解成音視頻甚至氣味和味道流媒體。”這也意味著,文字(例如計算機編程語言)實際上是多媒體的基礎媒介。
相對于擬音的古希臘字母,中國的漢字更加具有多媒體特性。首先是各種形聲漢字,然后是歷代文人對形聲漢字的創造性使用,如白居易的名詩《琵琶行》“大弦嘈嘈如急雨,小弦切切如私語;嘈嘈切切錯雜彈,大珠小珠落玉盤”;王維的“人閑桂花落,夜靜春山空;月出驚山鳥,時鳴春澗中”;現代詩人卞之琳的《斷章》“你站在橋上看風景,看風景的人在樓上看你。明月裝飾了你的窗子,你裝飾了別人的夢”。這些詩歌雖為文字,但無不字中有聲,有畫,有情。在形聲漢字、對它們的創造性應用的基礎上,再加上敘事性(narrativity)后,文字變成了有情節的故事,因此就有創造世界(text as world)的奇幻能力。
Sora的橫空出世告訴我們,即使在“視頻為王”的今天,影視業和短視頻從業者仍然不能拋棄文字,而要精通文字表達。比如要寫出這樣的提示詞,高超的文字能力必不可少:
“猛犸象。未來幾個月誰都可以生成,提示語是:幾只巨大的長毛猛犸象穿過被雪覆蓋的草甸,它們長而柔軟的毛在風中輕輕搖曳,遠處的樹木被白雪覆蓋,壯觀的雪山在遠處若隱若現,午后陽光透過稀薄的云層,高懸在遠方的太陽營造出一片溫暖的輝光。低角度的攝像機捕捉到了這些龐大毛茸茸哺乳動物的美麗瞬間,攝影技術精湛,景深效果迷人。”
我們一直認為媒介技術是線性“向前發展的”,“茍日新,日日新”,除舊布新。然而,本雅明認為,時間不是一以貫之的線性連續體,而是充滿裂縫和捷徑——不妨說充滿“蟲洞”(wormhole)。通過這些蟲洞,歷史并非總是以單線展開,而可以以星羅棋布、群星燦爛的方式呈現,“現在”與“過去”的某個時刻之間總是存在暗合。比如過去的時尚(格子襯衣、絡腮胡子和喇叭褲)死亡了,無處可尋,但在未來某個時候,它們又突然流行起來。正如有人指出,人類的存在也許是為了引出人工智能、賽博人乃至最終替代人類的硅基生命,我們今天認為已經是舊媒體的,也許會通過蟲洞“回到未來”成為未來的新媒體。ChatGPT和Sora作為嶄新的新媒介復活和強化了我們以為的舊媒介——文字。
Sora:真媒介?假媒介?(true media, fake media)
Sora輸出的視頻幾乎可以以假亂真,是否會造成深度偽造(deepfake)和假新聞(fake news)泛濫?媒體和大眾該如何應對?
確實,人工智能技術被用于多模態的內容生產(AIGC)固然可以降本增效,但同時也引入了深度偽造和假新聞的風險。最近美國巨星Taylor Swift就被“深度偽造”出色情內容,引發輿論關注。美國政府尤其關注基于AI深度偽造的假新聞對2024總統大選的干預。通過Sora用戶可以用文字描述“某明星或某新聞人物作出某些行為”,并生成逼真的視頻,這對新聞真實性和受眾認知的危害程度更大。
如果整個信息市場假冒偽劣產品盛行,公眾該會怎么辦呢?歷史告訴我們,在難以獲得事實的時候,人們一般會逐漸發明出以下機制來過濾信息:(1)增加信源數量并比較這些不同信源,從中解讀出可能的真相;(2)加入到社區中,借助集體智慧來共同分析、解讀和判斷各種信息可能的真假;(3)從甄別信息本身轉移到甄別信源,并憑著對信源的信賴來選擇相信哪些信息。
這意味著,當市場上充滿著難辨真假的信息時,媒體機構作為信源的公信力將變得更加重要,它們也因此要更加珍惜自己的羽毛。如果自媒體通過AIGC產生很多低質量信息,機構型媒體就不應該將自己自媒體化,反而尤其要堅持自己的操守進行差異化競爭,以更多的更權威的事實來對沖自媒體的虛擬。如果一個機構型媒體,一方面缺乏新聞現場的視覺信息,另一方面卻因為要滿足視頻發布的壓力或無法抵御流量的誘惑而使用Sora配上了虛擬的視頻,結果讓讀者/觀眾誤以為真,從而造成誤信誤傳,這首先是這個機構型媒體自身不顧自己的品牌形象逾越了真實與虛擬之間的界限的問題,而不是讀者/受眾是否具有識別真假視頻的能力問題。
對于媒體而言,視頻記者和編輯的工作是否會被替代?新聞從業者應該如何適應“Sora時代”?我認為,新聞報道追求真實(facts),而Sora幾乎全是虛擬(fictions),因此我認為和chatGPT不同,Sora從本質上它對新聞業應用面不廣,甚至只有壞處沒有好處,除非新聞業淪為“創意業”。我想,Sora唯一可以被新聞業利用的也許是記者建構在新聞事實基礎上的新聞現場的情景再現。
“視頻記者”這四個字中重要的不是“視頻”而是“記者”。如果記者沒有腳力、眼力、腦力和筆力,而僅僅滿足于坐在空調房里進行網絡內容搜索和拼湊,或者不斷使用人工智能炮制內容,那么這些記者在任何時候都應該被人工智能替代。
還需要指出的是,新聞業不能將對“新聞”的追逐異化成對“技術”的追逐。毋庸置疑,新聞業一直以來對技術保持高度敏感,這很有必要。例如在19世紀,路透社和美聯社先后爭相使用鴿子、汽船、電報和電話等新媒體,其目的盡可能縮短“新聞的爆發”與“新聞為受眾接受到”兩者間的時間差。我認為,新聞機構的采納新媒體技術的指導原則應該是“技術服務新聞”而不是相反。新媒介技術如果有利于更好地報道新聞,則應該盡快采納,如果不利于更好地報道新聞,則應暫緩采納。在各種“虛擬現實”技術盛行的今天,新聞業應該更加堅守“現實”本身。如果主動放棄自己的“現實”陣地不加區別地擁抱虛擬現實,這是新聞業自毀長城的失敗,而不是虛擬現實技術所向披靡的成功。
對于Sora帶來的隱憂,管理部門應該如何應對?我認為,技術革新在以加速度進行,管理注定會滯后。讓事情更為棘手的是,從平臺算法開始到現在的人工智能,由于涉及海量數據、極為復雜的算法以及眾多用戶與chagGPT及Sora的個性化互動,即使時人工智能專家(比如OpenAI CEO Altman)也無法精確預測和解釋人工智能給出的每一個輸出背后的原因。這給對AI的規制帶來了前所未有的挑戰。
Sora目前還沒有對大眾開放,估計要到美國總統大選之后。Open AI將對Sora生成的視頻設置類似于對DALL-E的限制:禁止暴力、色情、盜用真人形象和已知藝術家的創作風格;它還將在生成的視頻中嵌入代碼以將其與人工拍攝的視頻區別開來。但從文字開始,媒介技術就是生產復制品(化身、幻影、鬼魂)的工具,也因此帶來了版權侵害和偽造的風險。我們要從技術生產者、政策制定者、新聞媒體、教育機構和用戶等多方面共同規制AIGC。人工智能體現了人類的聰明才智,如何揚長避短地規制人工智能,需要人類發揮出相同甚至更多聰明才智。這是對人類智慧的巨大考驗。目前來看,Sora還不會對我國帶來什么風險。不過我覺得,對新技術的規制永遠要基于數據風險防控和人工智能收益之間的平衡。
結語: “天空”雖美,仍需一樹《繁花》
加拿大媒介學者麥克盧漢說,媒介是人體的延申。德國媒介學者基特勒對此不同意。他認為,菜刀或至多汽車,也許可以說是人體的延申,但計算機的工作原理跟人體的工作原理完全不一樣,因此說計算機是人體的延申就顯得人類有些自不量力了。到目前為止,主要的面向普通用戶的AI技術,包括ChatGPT、Midjourney, Stable Diffusion、DALL-E、Gemini和Sora等,即使是技術專家在我們普通人面前就著技術文檔講解三個小時,我們也根本不會明白它們的技術原理。AI早已成為技術黑箱,OpenAI也必然是ClosedAI。 所以我以上的所有分析都是一名文科教授都是建立在OpenAI目前公布的Sora視頻和它的公開宣稱之上的,少不了主觀臆測成分。很有可能,2月16日以來我們經歷的關于Sora的火爆情形只是OpenAI通過Sora生成一個長達幾天的逼真視頻。你也許會問,這一切難道是假的?怎么可能?是呀,怎么可能是假的呢?但在我們日益被人工智能包圍的深度媒介化社會中,笛卡爾的反問在回響:即使你看到的一切也許是真的,但你如何能排除它是假的的可能呢?—— 你如何排除“缸中大腦”的可能?是的,我不能排除,但因為我有身體,因為我忘不了“爺叔”的臉,我仍然堅信:“天空”(Sora)雖美,仍需一樹《繁花》。(作者系復旦大學新聞學院傳播學系教授、博導)





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司