- +1
大模型企業擁抱開源,視頻模型集體加入
2月18日,昆侖萬維(300418)開源首個面向AI短劇創作的視頻生成模型SkyReels-V1,及基于視頻基座模型的表情動作可控算法SkyReels-A1。
針對當前全球AI視頻生成模型和產品不開源、用不到、費用高、不好用等痛點,昆侖萬維此次開源的兩款模型和算法,可幫助解決傳統短劇制作面臨的挑戰,如線下拍劇涵蓋劇本創作、選演員、場景布景、分鏡創作、拍攝、后期處理等復雜流程,大模型有助于縮減成本。

SkyReels-V1針對表演細節打標,利用好萊塢級別數據訓練微調。
據介紹,為提升表情生成、肢體生成的可控表演效果,SkyReels-V1針對表演細節打標,利用好萊塢級別數據訓練微調。針對人物微表情、人物表演細節、場景描述、光影、畫面構圖等進行更精細的技術升級。為了實現更加精準可控的人物視頻生成,昆侖萬維開源了基于視頻基座模型的表情動作可控算法SkyReels-A1,支持視頻驅動的電影級表情捕捉,能夠基于任意人體比例生成高度逼真的人物動態視頻,以及皮膚肌理、身體動作跟隨等多維度細節的深度還原。
同日,大模型企業階躍星辰與吉利汽車集團聯合開源兩款多模態大模型,包括開源視頻生成模型階躍Step-Video-T2V、開源語音交互大模型階躍Step-Audio。階躍星辰表示,此次聯合開源旨在促進大模型技術的共享與創新,推動人工智能普惠發展。
據階躍星辰介紹,階躍Step-Video-T2V模型參數量達300億,可直接生成204幀、540P分辨率的視頻。階躍Step-Video-T2V在復雜運動、美感人物、視覺想象力、基礎文字生成、原生中英雙語輸入和鏡頭語言等方面能力突出。
上海對外經貿大學人工智能與變革管理研究院副院長、上海開源信息技術協會秘書長張國鋒此前對澎湃科技表示,開源是數字經濟公共基礎設施,開源在物理世界萌芽發展、逐步壯大,成為數字經濟創新創業主導模式,這是歷史趨勢。作為社會創新方法論的開源降低了創新創業門檻,激發了創業熱情,將改變軟件的產業鏈和供應鏈,改變游戲規則。DeepSeek讓人們看到了開源的重要性,開源項目將雨后春筍般涌現,2025年是開源大發展之年,一場波瀾壯闊的開源社會運動正在開展。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司