MiniMax發布開源混合架構推理模型M1

澎湃新聞記者喻琰

2025-06-17 16:24

來源：澎湃新聞

6月17日，上海AI獨角獸MiniMax正式開源推理模型MiniMax-M1（以下簡稱“M1”）。MiniMax稱，這是全球首個開放權重的大規模混合注意力推理模型。憑借混合門控專家架構（Mixture-of-Experts，MoE）與 Lightning Attention 的結合，M1在性能表現和推理效率方面實現了顯著突破。實測數據顯示，M1系列在長上下文理解、代碼生成等生產力場景中超越多數閉源模型，僅微弱差距落后于頂尖閉源系統。

開源報告截圖來源：MiniMax提供

M1支持目前業內最高100萬token上下文輸入，同時支持最多8萬token輸出。成本表現方面，在進行8萬Token的深度推理時，M1所需的算力僅為DeepSeek R1的約30%；生成10萬token時，推理算力只需要DeepSeek R1的25%。MiniMax表示，M1整個強化學習階段只用到512塊H800三周時間，租賃成本為53.74萬美元。

天使投資人、資深人工智能專家郭濤向澎湃科技（www.kxwhcb.com）分析認為，目前國內大模型市場格局早已形成，大模型競爭不僅僅是技術的競爭，而是算力、數據、應用場景等整個生態的競爭。此次MiniMax更新填補了開源領域長上下文技術的空白，更以“開源+場景化”路徑打破技術壟斷，為國產大模型邁向實用化樹立新標桿。

責任編輯：宦艷紅

圖片編輯：施佳慧

校對：劉威

澎湃新聞報料：021-962866

澎湃新聞，未經授權不得轉載

我要舉報

#MiniMax #AI獨角獸