- +1
昔日王者Suno被超越,全球首個音樂推理大模型Mureka O1震撼發布

作者|冰拿鐵
編輯|星奈
媒體|AI大模型工場
還記得去年全網刷屏的“謝帝謝帝我要Diss你”嗎?當下,朋友說要寫歌懟你時,別以為他們在過嘴癮——AI音樂大模型正讓每個嘴炮王者動動手指,即可秒變創作鬼才:
隨著AI重構音樂創作生態,樂理、和聲、編曲等專業鴻溝則正被技術填平,讓小白也能爆改“AI音樂家”,用音樂傳情達意,無論是“寫歌diss你”,還是深情款款的“想把我唱給你聽”,都能在AI加持下分分鐘實現。基于此,AI音樂也被AIGC行業視為極具潛力的落地場景,相關概念股的市場熱度持續水漲船高。
然而,這樣一個“大眾”賽道,布局者卻寥寥無幾,尤其是國內,存在巨大空白待填補。好在昆侖萬維等頭號玩家在產業爆發前夜,即敏銳預判到其潛力,并基于自身在AI、音樂等領域的深耕與積淀,搶先完成占位:
去年四月,昆侖萬維發布了第一代音樂生成模型Mureka V1(SkyMusic),并在此后一年持續打磨技術,迭代升級,把“自己卷自己”演繹得淋漓盡致。
3月26日,昆侖萬維震撼發布全新基座模型:Mureka V6,并同步發布了全球首個采用 CoT 技術的音樂模型Mureka O1,在強大推理模型賦能下,Mureka O1會在音樂生成過程中加入思考與自我批判,顯著提升音樂品質、音樂創作效率和靈活性。

而無論是Mureka V6還是O1模式,可支持的歌曲創作曲風和情緒均涉及20余種,包括爵士/Jazz、電子/electronic、流行/pop、鄉村country等;情緒涵蓋快樂、放縱、神秘、充滿活力、悲傷等,能想到的風格無所不包!

Mureka V6進入界面

Mureka O1進入界面
這讓行業感嘆,隨著“會思考的AI莫扎特”上線,過去AI音樂生成的“黑箱創作”、節奏斷層、風格混亂、樂器編排打架等問題將大幅減少,音樂界終于迎來了自己的“DeepSeek時刻”。
與此同時,《Mureka》AI音樂人MV全網首發,給網友帶來一場春日視聽盛宴。

《Mureka》AI音樂人MV全網首發,歌手:Mureka;該作品由AI生成,其中音樂由Mureka生成,視頻由SkyReels技術支持生成。
那么,“會思考的音樂家”表現如何?我們一起來看看吧!
一、零幀起手、多語言覆蓋、“氛圍感”BGM神器……“AI音樂家”Mureka強得可怕!
AI時代,不僅音樂無國界,音樂家也沒有門檻了!一番體驗下來,最驚艷我的是,Mureka上手性強、極易操作,是“零幀起手”的端到端創作神器,支持歌詞、作曲、編曲、人聲全流程生成,音樂小白也可以將自身情感注入AI生成的框架中,通過簡單的流程生成滿意的作品,這將極大地拓展音樂創作者群體,讓普通人有機會參與到音樂創作中來,促進音樂內容的多樣化和個性化。
比如,動動手指,即可給朋友生成一首講述雙方友情的春日詩,暖她一整年~

當開車上高速時,也可以來一首“充滿自由氣息的仿佛在公路旅行的流行搖滾”,一鍵擁有獨屬自己的《Take Me Home, Country Roads》!

再輸入“在人來人往的城市里,置身于餐廳中悠閑的品嘗美食時播放的爵士歌曲”,就是這么Chill~

EMO時,生成一首“深夜的酒吧在迷幻的燈光下黯然神傷聽到的靈魂歌曲”:

半夜失眠,輾轉反側,思念已分手三年的前女友,這時不如化憂傷為音樂,把傷感釀成詩,一鍵生成“懷念曾經的感情的傷感RB”:

同時,輸入場景描述性Prompt,即可生成與特定場景完美契合的完整背景音樂。比如,選擇Mureka V6模型,選擇「純音樂」創作功能,在文本框內輸入「Latin song」,點擊「創作」,Mureka快速為我們生成一首拉丁風純音樂,仿佛置身于海灘,感受到熱情且愜意的度假氛圍。真·氛圍感神器!

而對于“提示詞詞窮”的零基礎小白,Mureka還貼心準備了提示詞模板,如“一首悠閑浪漫的歌曲,講述與心上人的深夜對話”一首充滿力量的主題曲,強烈的嗓音和鼓舞人心的節拍”……化身用戶最強嘴替。
此前很多用戶自我調侃,自己用AI時像極了“說不明白訴求的甲方”。而Mureka預判了用戶的預判,激活用戶潛意識里的靈感,讓其直呼“對對對,我就是要這種感覺來著!”

同時,Mureka還有歌曲參考(Reference Fuction)模式,即將音樂本身作為提示,用戶可直接上傳音頻或Youtube鏈接作為創作提示,讓Mureka“有樣學樣”,最快速度get用戶心水歌曲的精髓。
比如,以《知否知否》為參考,上傳古詩詞歌詞,讓AI把古詩詞《行香子》《漠漠春陰酒半酣》唱出來,結果可見,AI音樂感情充沛、旋律動人,已跨越“可用性”門檻,進入“高音質”階段,突破了以往AI音樂局限于背景音或機械合成的瓶頸,使得AI音樂從輔助工具升級為創作伙伴,并不斷拓展藝術邊界,詩樂相和,讓古詩詞完成多樣藝術表達。

也可以玩梗,以《好運來》為參考曲目,給自家張姐麻辣燙店定制店歌。感受下這歡快の小曲,張姐聽了瞬間喜笑顏開,立省大額推廣費:

當然,在全球化時代,Mureka V6 還支持美歐亞主流10種語言(線上支持中英葡西日韓)的歌詞與音樂生成,涵蓋多種風格與流派,滿足全球用戶需求。
如下,中文表現可圈可點:

外語歌也不遜色,音色可控且保持一致性,不會讓聽眾“出戲”,在人聲音質、自然度等維度,一如既往地維持業內領先的SOTA水平

此外,Mureka還支持音軌分離下載,提供音樂生成的獨立的人聲、伴奏等多軌輸出,方便用戶后續混音與二次創作,讓音樂專業玩家狂喜,開啟“無限DIY”模式。
一番體驗下來,流程簡單、風格多樣的Mureka“人如其名”:據悉,Mureka名字的含義是Eureka flows music (尤里卡時刻),其中,Eureka源自希臘語的感嘆詞,意為我發現了,常用于表達靈感噴涌的時刻。
如今,Mureka加持下,每個創作者、音樂愛好者都能不斷迎接自己的“尤里卡時刻”,并在音樂靈感爆發時快速將其落地,并創作出屬于自己風格的歌曲。
那么,讓用戶實現“音樂自由”背后,有著哪些硬核技術支撐?
二、極致體驗背后:AI音樂的SOTA級玩家,帶來哪些技術顛覆?
在技術上,Mureka以先行者和領頭羊的姿態打出明牌。此前,業界關于音樂領域的算法工作非常少,只有少數幾個團隊公開了自己的工作成果。而此次,Mureka團隊以論文形式公開了Mureka O1的實現原理:

項目主頁:MusiCoT.github.io
具體而言,作為中國首個實現音樂AIGC SOTA的大模型,Mureka集成了在自然語言處理和音頻生成技術上的最新突破,使得AI音樂創作表現達到新高度:
其中,在Mureka V6中,引入自研 ICL(in-context learning)技術,使得聲場更加開闊,人聲質感和混音設計進一步強化。當然,重頭戲還在后面,即首次在音樂生成領域應用先進的Chain-of-Thought(CoT)技術的Mureka O1,讓AI音樂神器化身“會思考的AI莫扎特”:
Mureka O1 是基于 Mureka V6 之上的推理優化版本,包含了Mureka團隊最新發布的音樂生成領域的創新研究成果——MusiCoT,采取思維鏈Chain-of-Thought (CoT)方法。不同于傳統自回歸模型逐步生成音頻,MusiCoT首次在細粒度音頻token預測前預生成整體音樂結構,大幅提升生成音樂的結構連貫性與樂器編排精準度。
通俗地說,不會深度思考推理的AI音樂模型像沒有圖紙的施工隊,直接開始砌磚頭,逐段生成音樂片段,容易導致副歌和主歌風格不搭、鼓點突然消失等問題,就像房子蓋到一半發現廁所沒留水管。
思維鏈則爆改流程為“先通過縝密思考,畫個藍圖再施工”,規劃整首歌的“結構藍圖”,比如前奏用鋼琴引入,主歌部分加入貝斯,副歌疊加弦樂和鼓,間奏來段吉他solo……相當于先確定哪里是客廳、哪里是臥室,再基于架構逐塊生成具體旋律。就像按圖紙精準施工,確保每個樂器的出現時機、音量大小都嚴絲合縫,避免了傳統模型“打架子鼓時突然插進嗩吶”的違和感,減少錯拍、樂器沖突等車禍現場,特別適合需要精細控制結構的商用創作,比如游戲配樂或影視OST。
如此一來,通過逐步反饋與優化機制,Mureka顯著提升了歌詞旋律契合度、演唱準確性和藝術表現力,同時保持了低延時音樂生成。
同時,MusiCoT基于CLAP模型,無需人工標注即具備高擴展性,并顯著提高了生成音樂的可解釋性和質量,讓AI進化成“舉一反三的作曲小天才”。
如今,Mureka O1在與Suno V4等主流系統的客觀評測中表現卓越,不僅保持了低延遲音樂生成,還顯著提升了歌詞旋律契合度、演唱準確性和藝術表現力,在發音唱對率、樂段準確率、文本相關度、制作質量等客觀指標中,Mureka V6都顯著優于Suno V4。


Mureka O1在文本生成音樂的客觀測評中得分(來源:Mureka官方測評)
當然,音樂作為“靈魂按摩器”,最重要的還是聽感。在最新的音樂評測中,Mureka O1展現出卓越的音樂品質,在最終的整體聽感評測超過了Suno V4。其中,Mureka O1在樂器演奏法多樣性和配器設計方面明顯超越Suno V4,在音質、人聲質感及BGM質感上也實現了顯著提升。

Mureka O1在主觀測評中展現出卓越的音樂品質,整體聽感評測超越Suno V4(來源:Mureka官方測評)
沒有實感?放一個Mureka O1與Suno V4的對比,自行感受“降維打擊”級音質:

悅耳無需多言!綜上所述,MusiCoT正為高保真AI音樂生成開辟全新路徑,推動音樂AI創作邁入結構化時代。
三、用戶價值、商業價值兩開花:以音樂為媒,構建“數字巴別塔”!
值得一提的是,除了遙遙領先的音質外,Mureka還是全球首個開放API服務的AI音樂生成平臺。秉承“期待AI音樂能在多種場景下創造更大的價值”的愿景,Mureka同時開放兩大類共計五種API服務,不僅包括音樂音頻生成API(兩種),還有語音合成API(三種)。無論是開發者,還是音樂平臺,都可以將Mureka的音樂生成能力無縫集成到自己的產品或平臺中,應用AI音樂功能拓展自己的商業價值。
對于企業而言,Mureka可以輔助音樂、視頻、播客、廣告等場景中的UGC/PGC音樂創作,讓企業以極低的成本,用自己創作的版權音樂,訓練屬于自己的音樂模型,用于發布會、宣傳MV等商業場景,降本增效;
而對于個人創作者來說,創造力將進一步得到釋放。正如《AI紅利:創作者解鎖萬億市場》中指出,創意將是AI時代最好的生意,AI必將重塑創作者經濟,解鎖一個萬億規模的藍海市場——AI淘汰的是機器式創作,但會放大人類獨有的創造力:“未來最好的行業將是內容行業,那些具備思想深度、情感共鳴能力和文化洞察力的創作者,將借助AI工具釋放更大的創造力,成為新時代的贏家。”
這和昆侖萬維戰略思路不謀而合。昆侖萬維對音樂領域AIGC的探索,早在2021年就已經開始。昆侖萬維董事長兼CEO方漢認為,AI音樂生成技術的出現,并不是為了“切走音樂行業的蛋糕”,而是使非專業人士也能輕松創作出具有一定水準的音樂作品,提高行業整體的生產力和創新能力。
基于此,昆侖萬維喊出“All in AGI與AIGC”——早在2022年12月時,昆侖萬維就正式發布了「昆侖天工」AIGC全系列算法與模型,并宣布模型開源,成為國內第一個全身心投入到AIGC開源社區的公司。從音樂到視頻進行大量研發投入,目的就是降低創作門檻,實現通用人工智能,讓每個人更好地塑造和表達自我。
這也符合行業發展的大勢所趨,即從“狂卷基礎模型”到“落地為王”。如今,以AI音樂為代表的AIGC勢不可擋,存在巨大產業藍海:在我國,《2024中國音樂產業發展總報告》顯示,2023年中國數字音樂產業規模達到893.45億元,中國網絡音樂用戶規模達到7.26億。政策層面,《“十四五”文化產業發展規劃》明確提出,推動人工智能技術與文化創作、傳播、消費深度融合,促進文化產業的智能化轉型,釋放利好信號;
放眼全球,根據Fortune Business Insights數據,2023年全球數字音頻工作站(DAW, Digital Audio Workstation)市場規模高達約30億美元,預計2026年約70%的DAW企業將使用AI技術輔助音樂創作。
這也在Mureka的用戶群體中得到了驗證,目前,有超過 100 個國家和地區的用戶用Mureka。值得一提的是,作為最早開拓海外市場的中國企業之一,昆侖萬維當前業務已覆蓋全球一百多個國家和地區,全球平均月活躍用戶近4億,覆蓋AGI與AIGC、信息分發、元宇宙、社交娛樂及游戲等多個領域,讓行業看到了昆侖萬維“以AIGC為媒,構建數字巴別塔”的潛力:
在西方傳說中,人類在洪水之后試圖建造一座“通天塔”,然而,由于語言多樣性帶來的隔閡,人類由言語不通演變成相互起了沖突,最終“高聳入云的塔轟然倒塌”。
而如今,AI時代,新的“數字巴別塔”在人類精神平原上重新矗立——前有DeepSeek以開源促進AI普惠浪潮涌動、讓世界驚嘆“中國時刻”,后有昆侖萬維以前沿技術為槳,以音樂等世界通用語言為帆,“浮舟滄海,立馬昆侖”,探索AIGC應用邊界。一言以蔽之,頭部企業正立足中國、揚帆世界,駛向人類文明融合互鑒的新彼岸。
文中音頻試聽及視頻鏈接:https://mp.weixin.qq.com/s/mr0SyBi4TLbKYAaN0D9-DA
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司