下載客戶端

登錄

昔日王者Suno被超越，全球首個音樂推理大模型Mureka O1震撼發布

2025-03-27 11:58

來源：澎湃新聞·澎湃號·湃客

作者｜冰拿鐵

編輯｜星奈

媒體｜AI大模型工場

還記得去年全網刷屏的“謝帝謝帝我要Diss你”嗎？當下，朋友說要寫歌懟你時，別以為他們在過嘴癮——AI音樂大模型正讓每個嘴炮王者動動手指，即可秒變創作鬼才：

隨著AI重構音樂創作生態，樂理、和聲、編曲等專業鴻溝則正被技術填平，讓小白也能爆改“AI音樂家”，用音樂傳情達意，無論是“寫歌diss你”，還是深情款款的“想把我唱給你聽”，都能在AI加持下分分鐘實現。基于此，AI音樂也被AIGC行業視為極具潛力的落地場景，相關概念股的市場熱度持續水漲船高。

然而，這樣一個“大眾”賽道，布局者卻寥寥無幾，尤其是國內，存在巨大空白待填補。好在昆侖萬維等頭號玩家在產業爆發前夜，即敏銳預判到其潛力，并基于自身在AI、音樂等領域的深耕與積淀，搶先完成占位：

去年四月，昆侖萬維發布了第一代音樂生成模型Mureka V1（SkyMusic），并在此后一年持續打磨技術，迭代升級，把“自己卷自己”演繹得淋漓盡致。

3月26日，昆侖萬維震撼發布全新基座模型：Mureka V6，并同步發布了全球首個采用 CoT 技術的音樂模型Mureka O1，在強大推理模型賦能下，Mureka O1會在音樂生成過程中加入思考與自我批判，顯著提升音樂品質、音樂創作效率和靈活性。

而無論是Mureka V6還是O1模式，可支持的歌曲創作曲風和情緒均涉及20余種，包括爵士/Jazz、電子/electronic、流行/pop、鄉村country等；情緒涵蓋快樂、放縱、神秘、充滿活力、悲傷等，能想到的風格無所不包！

Mureka V6進入界面

Mureka O1進入界面

這讓行業感嘆，隨著“會思考的AI莫扎特”上線，過去AI音樂生成的“黑箱創作”、節奏斷層、風格混亂、樂器編排打架等問題將大幅減少，音樂界終于迎來了自己的“DeepSeek時刻”。

與此同時，《Mureka》AI音樂人MV全網首發，給網友帶來一場春日視聽盛宴。

《Mureka》AI音樂人MV全網首發，歌手：Mureka；該作品由AI生成，其中音樂由Mureka生成，視頻由SkyReels技術支持生成。

那么，“會思考的音樂家”表現如何？我們一起來看看吧！

一、零幀起手、多語言覆蓋、“氛圍感”BGM神器……“AI音樂家”Mureka強得可怕！

AI時代，不僅音樂無國界，音樂家也沒有門檻了！一番體驗下來，最驚艷我的是，Mureka上手性強、極易操作，是“零幀起手”的端到端創作神器，支持歌詞、作曲、編曲、人聲全流程生成，音樂小白也可以將自身情感注入AI生成的框架中，通過簡單的流程生成滿意的作品，這將極大地拓展音樂創作者群體，讓普通人有機會參與到音樂創作中來，促進音樂內容的多樣化和個性化。

比如，動動手指，即可給朋友生成一首講述雙方友情的春日詩，暖她一整年~

當開車上高速時，也可以來一首“充滿自由氣息的仿佛在公路旅行的流行搖滾”，一鍵擁有獨屬自己的《Take Me Home, Country Roads》！

再輸入“在人來人往的城市里，置身于餐廳中悠閑的品嘗美食時播放的爵士歌曲”，就是這么Chill~

EMO時，生成一首“深夜的酒吧在迷幻的燈光下黯然神傷聽到的靈魂歌曲”：

半夜失眠，輾轉反側，思念已分手三年的前女友，這時不如化憂傷為音樂，把傷感釀成詩，一鍵生成“懷念曾經的感情的傷感RB”：

同時，輸入場景描述性Prompt，即可生成與特定場景完美契合的完整背景音樂。比如，選擇Mureka V6模型，選擇「純音樂」創作功能，在文本框內輸入「Latin song」，點擊「創作」，Mureka快速為我們生成一首拉丁風純音樂，仿佛置身于海灘，感受到熱情且愜意的度假氛圍。真·氛圍感神器！

而對于“提示詞詞窮”的零基礎小白，Mureka還貼心準備了提示詞模板，如“一首悠閑浪漫的歌曲，講述與心上人的深夜對話”一首充滿力量的主題曲，強烈的嗓音和鼓舞人心的節拍”……化身用戶最強嘴替。

此前很多用戶自我調侃，自己用AI時像極了“說不明白訴求的甲方”。而Mureka預判了用戶的預判，激活用戶潛意識里的靈感，讓其直呼“對對對，我就是要這種感覺來著！”

同時，Mureka還有歌曲參考（Reference Fuction）模式，即將音樂本身作為提示，用戶可直接上傳音頻或Youtube鏈接作為創作提示，讓Mureka“有樣學樣”，最快速度get用戶心水歌曲的精髓。

比如，以《知否知否》為參考，上傳古詩詞歌詞，讓AI把古詩詞《行香子》《漠漠春陰酒半酣》唱出來，結果可見，AI音樂感情充沛、旋律動人，已跨越“可用性”門檻，進入“高音質”階段，突破了以往AI音樂局限于背景音或機械合成的瓶頸，使得AI音樂從輔助工具升級為創作伙伴，并不斷拓展藝術邊界，詩樂相和，讓古詩詞完成多樣藝術表達。

也可以玩梗，以《好運來》為參考曲目，給自家張姐麻辣燙店定制店歌。感受下這歡快の小曲，張姐聽了瞬間喜笑顏開，立省大額推廣費：

當然，在全球化時代，Mureka V6 還支持美歐亞主流10種語言（線上支持中英葡西日韓）的歌詞與音樂生成，涵蓋多種風格與流派，滿足全球用戶需求。

如下，中文表現可圈可點：

外語歌也不遜色，音色可控且保持一致性，不會讓聽眾“出戲”，在人聲音質、自然度等維度，一如既往地維持業內領先的SOTA水平

此外，Mureka還支持音軌分離下載，提供音樂生成的獨立的人聲、伴奏等多軌輸出，方便用戶后續混音與二次創作，讓音樂專業玩家狂喜，開啟“無限DIY”模式。

一番體驗下來，流程簡單、風格多樣的Mureka“人如其名”：據悉，Mureka名字的含義是Eureka flows music （尤里卡時刻），其中，Eureka源自希臘語的感嘆詞，意為我發現了，常用于表達靈感噴涌的時刻。

如今，Mureka加持下，每個創作者、音樂愛好者都能不斷迎接自己的“尤里卡時刻”，并在音樂靈感爆發時快速將其落地，并創作出屬于自己風格的歌曲。

那么，讓用戶實現“音樂自由”背后，有著哪些硬核技術支撐？

二、極致體驗背后：AI音樂的SOTA級玩家，帶來哪些技術顛覆？

在技術上，Mureka以先行者和領頭羊的姿態打出明牌。此前，業界關于音樂領域的算法工作非常少，只有少數幾個團隊公開了自己的工作成果。而此次，Mureka團隊以論文形式公開了Mureka O1的實現原理：

項目主頁：MusiCoT.github.io

具體而言，作為中國首個實現音樂AIGC SOTA的大模型，Mureka集成了在自然語言處理和音頻生成技術上的最新突破，使得AI音樂創作表現達到新高度：

其中，在Mureka V6中，引入自研 ICL（in-context learning）技術，使得聲場更加開闊，人聲質感和混音設計進一步強化。當然，重頭戲還在后面，即首次在音樂生成領域應用先進的Chain-of-Thought（CoT）技術的Mureka O1，讓AI音樂神器化身“會思考的AI莫扎特”：

Mureka O1 是基于 Mureka V6 之上的推理優化版本，包含了Mureka團隊最新發布的音樂生成領域的創新研究成果——MusiCoT，采取思維鏈Chain-of-Thought （CoT）方法。不同于傳統自回歸模型逐步生成音頻，MusiCoT首次在細粒度音頻token預測前預生成整體音樂結構，大幅提升生成音樂的結構連貫性與樂器編排精準度。

通俗地說，不會深度思考推理的AI音樂模型像沒有圖紙的施工隊，直接開始砌磚頭，逐段生成音樂片段，容易導致副歌和主歌風格不搭、鼓點突然消失等問題，就像房子蓋到一半發現廁所沒留水管。

思維鏈則爆改流程為“先通過縝密思考，畫個藍圖再施工”，規劃整首歌的“結構藍圖”，比如前奏用鋼琴引入，主歌部分加入貝斯，副歌疊加弦樂和鼓，間奏來段吉他solo……相當于先確定哪里是客廳、哪里是臥室，再基于架構逐塊生成具體旋律。就像按圖紙精準施工，確保每個樂器的出現時機、音量大小都嚴絲合縫，避免了傳統模型“打架子鼓時突然插進嗩吶”的違和感，減少錯拍、樂器沖突等車禍現場，特別適合需要精細控制結構的商用創作，比如游戲配樂或影視OST。

如此一來，通過逐步反饋與優化機制，Mureka顯著提升了歌詞旋律契合度、演唱準確性和藝術表現力，同時保持了低延時音樂生成。

同時，MusiCoT基于CLAP模型，無需人工標注即具備高擴展性，并顯著提高了生成音樂的可解釋性和質量，讓AI進化成“舉一反三的作曲小天才”。

如今，Mureka O1在與Suno V4等主流系統的客觀評測中表現卓越，不僅保持了低延遲音樂生成，還顯著提升了歌詞旋律契合度、演唱準確性和藝術表現力，在發音唱對率、樂段準確率、文本相關度、制作質量等客觀指標中，Mureka V6都顯著優于Suno V4。

Mureka O1在文本生成音樂的客觀測評中得分（來源：Mureka官方測評）

當然，音樂作為“靈魂按摩器”，最重要的還是聽感。在最新的音樂評測中，Mureka O1展現出卓越的音樂品質，在最終的整體聽感評測超過了Suno V4。其中，Mureka O1在樂器演奏法多樣性和配器設計方面明顯超越Suno V4，在音質、人聲質感及BGM質感上也實現了顯著提升。

Mureka O1在主觀測評中展現出卓越的音樂品質，整體聽感評測超越Suno V4（來源：Mureka官方測評）

沒有實感？放一個Mureka O1與Suno V4的對比，自行感受“降維打擊”級音質：

悅耳無需多言！綜上所述，MusiCoT正為高保真AI音樂生成開辟全新路徑，推動音樂AI創作邁入結構化時代。

三、用戶價值、商業價值兩開花：以音樂為媒，構建“數字巴別塔”！

值得一提的是，除了遙遙領先的音質外，Mureka還是全球首個開放API服務的AI音樂生成平臺。秉承“期待AI音樂能在多種場景下創造更大的價值”的愿景，Mureka同時開放兩大類共計五種API服務，不僅包括音樂音頻生成API（兩種），還有語音合成API（三種）。無論是開發者，還是音樂平臺，都可以將Mureka的音樂生成能力無縫集成到自己的產品或平臺中，應用AI音樂功能拓展自己的商業價值。

對于企業而言，Mureka可以輔助音樂、視頻、播客、廣告等場景中的UGC/PGC音樂創作，讓企業以極低的成本，用自己創作的版權音樂，訓練屬于自己的音樂模型，用于發布會、宣傳MV等商業場景，降本增效；

而對于個人創作者來說，創造力將進一步得到釋放。正如《AI紅利：創作者解鎖萬億市場》中指出，創意將是AI時代最好的生意，AI必將重塑創作者經濟，解鎖一個萬億規模的藍海市場——AI淘汰的是機器式創作，但會放大人類獨有的創造力：“未來最好的行業將是內容行業，那些具備思想深度、情感共鳴能力和文化洞察力的創作者，將借助AI工具釋放更大的創造力，成為新時代的贏家。”

這和昆侖萬維戰略思路不謀而合。昆侖萬維對音樂領域AIGC的探索，早在2021年就已經開始。昆侖萬維董事長兼CEO方漢認為，AI音樂生成技術的出現，并不是為了“切走音樂行業的蛋糕”，而是使非專業人士也能輕松創作出具有一定水準的音樂作品，提高行業整體的生產力和創新能力。

基于此，昆侖萬維喊出“All in AGI與AIGC”——早在2022年12月時，昆侖萬維就正式發布了「昆侖天工」AIGC全系列算法與模型，并宣布模型開源，成為國內第一個全身心投入到AIGC開源社區的公司。從音樂到視頻進行大量研發投入，目的就是降低創作門檻，實現通用人工智能，讓每個人更好地塑造和表達自我。

這也符合行業發展的大勢所趨，即從“狂卷基礎模型”到“落地為王”。如今，以AI音樂為代表的AIGC勢不可擋，存在巨大產業藍海：在我國，《2024中國音樂產業發展總報告》顯示，2023年中國數字音樂產業規模達到893.45億元，中國網絡音樂用戶規模達到7.26億。政策層面，《“十四五”文化產業發展規劃》明確提出，推動人工智能技術與文化創作、傳播、消費深度融合，促進文化產業的智能化轉型，釋放利好信號；

放眼全球，根據Fortune Business Insights數據，2023年全球數字音頻工作站（DAW, Digital Audio Workstation）市場規模高達約30億美元，預計2026年約70%的DAW企業將使用AI技術輔助音樂創作。

這也在Mureka的用戶群體中得到了驗證，目前，有超過 100 個國家和地區的用戶用Mureka。值得一提的是，作為最早開拓海外市場的中國企業之一，昆侖萬維當前業務已覆蓋全球一百多個國家和地區，全球平均月活躍用戶近4億，覆蓋AGI與AIGC、信息分發、元宇宙、社交娛樂及游戲等多個領域，讓行業看到了昆侖萬維“以AIGC為媒，構建數字巴別塔”的潛力：

在西方傳說中，人類在洪水之后試圖建造一座“通天塔”，然而，由于語言多樣性帶來的隔閡，人類由言語不通演變成相互起了沖突，最終“高聳入云的塔轟然倒塌”。

而如今，AI時代，新的“數字巴別塔”在人類精神平原上重新矗立——前有DeepSeek以開源促進AI普惠浪潮涌動、讓世界驚嘆“中國時刻”，后有昆侖萬維以前沿技術為槳，以音樂等世界通用語言為帆，“浮舟滄海，立馬昆侖”，探索AIGC應用邊界。一言以蔽之，頭部企業正立足中國、揚帆世界，駛向人類文明融合互鑒的新彼岸。

文中音頻試聽及視頻鏈接：https://mp.weixin.qq.com/s/mr0SyBi4TLbKYAaN0D9-DA

特別聲明

本文為澎湃號作者或機構在澎湃新聞上傳并發布，僅代表該作者或機構觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#昆侖萬維