- +1
MiniMax發布開源混合架構推理模型M1
澎湃新聞記者 喻琰
字號
6月17日,上海AI獨角獸MiniMax正式開源推理模型MiniMax-M1(以下簡稱“M1”)。MiniMax稱,這是全球首個開放權重的大規模混合注意力推理模型。憑借混合門控專家架構(Mixture-of-Experts,MoE)與 Lightning Attention 的結合,M1在性能表現和推理效率方面實現了顯著突破。實測數據顯示,M1系列在長上下文理解、代碼生成等生產力場景中超越多數閉源模型,僅微弱差距落后于頂尖閉源系統。

開源報告截圖 來源:MiniMax提供
M1支持目前業內最高100萬token上下文輸入,同時支持最多8萬token輸出。成本表現方面,在進行8萬Token的深度推理時,M1所需的算力僅為DeepSeek R1的約30%;生成10萬token時,推理算力只需要DeepSeek R1的25%。MiniMax表示,M1整個強化學習階段只用到512塊H800三周時間,租賃成本為53.74萬美元。
天使投資人、資深人工智能專家郭濤向澎湃科技(www.kxwhcb.com)分析認為,目前國內大模型市場格局早已形成,大模型競爭不僅僅是技術的競爭,而是算力、數據、應用場景等整個生態的競爭。此次MiniMax更新填補了開源領域長上下文技術的空白,更以“開源+場景化”路徑打破技術壟斷,為國產大模型邁向實用化樹立新標桿。
責任編輯:宦艷紅
圖片編輯:施佳慧
校對:劉威
澎湃新聞報料:021-962866
澎湃新聞,未經授權不得轉載
+1
收藏
我要舉報





查看更多
澎湃矩陣
新聞報料
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司
反饋