- +1
MiniMax發(fā)布新一代語音大模型
近日,AI獨角獸MiniMax稀宇極智發(fā)布新一代語音大模型Speech-02,宣布該模型在國際最權(quán)威的兩項語音評測榜單Artificial Analysis(全球知名AI基準(zhǔn)測試機構(gòu))和Hugging Face TTS Arena (抱抱臉文本轉(zhuǎn)語音競技場)上,超越OpenAI、ElevenLabs等國際巨頭,登上雙榜榜首。

國際權(quán)威語音評測榜單Artificial Analysis 來源:以下圖片均由Minimax方提供
據(jù)介紹,Speech-02在語音模型核心技術(shù)指標(biāo):字錯率WER和相似度SIM等客觀指標(biāo)上取得了SOTA結(jié)果,用戶盲聽主觀評價反饋也顯示其更自然、真實。
與Seed-TTS、CosyVoice 2和真實音頻相比,Speech-02在中英文的零樣本語音克隆中均實現(xiàn)了更低的字錯率(Word Error Rate, WER),表明其發(fā)音錯誤率更低且更清晰穩(wěn)定。在SIM方面,Speech-02在所有24種測試語言中均顯著優(yōu)于ElevenLabs的multilingual_v2模型,前者生成的語音更逼近真人輸出。

Hugging Face TTS Arena 評測榜單
值得關(guān)注的是,Speech-02性能登頂?shù)耐瑫r,其商用定價僅為全球頭部語音模型ElevenLabs的四分之一,具有高性能和性價比雙重優(yōu)勢。目前,MiniMax已在文旅導(dǎo)覽、金融服務(wù)、語音助手、AI教育等領(lǐng)域應(yīng)用其大模型服務(wù)。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司