阿里千問3系列發布并開源：稱成本大幅下降，性能超越DeepSeek-R1

澎湃新聞記者胡含嫣

2025-04-29 11:04

來源：澎湃新聞

備受期待的千問3.0在五一節前面世。

4月29日凌晨，阿里巴巴宣布開源新一代通義千問模型Qwen3（簡稱千問3），包含2款參數規模分別為30B和235B的混合專家（MoE）模型，以及大小從0.6B到32B的6款密集模型。據介紹，千問3模型家族是國內首個混合推理模型系列，235B模型的參數量僅為DeepSeek-R1的三分之一，成本大幅下降，性能全面超越R1、OpenAI-o1等全球頂尖模型，登頂全球最強開源模型。

在本次開源的系列模型中，旗艦模型Qwen3-235B-A22B的總參數量為235B，激活僅需22B。千問3預訓練數據量達到36T，和千問2.5相比翻了兩倍，并在后訓練階段進行多輪強化學習，將非思考模式整合到思考模型中。同時，千問3的部署成本大幅下降，僅需4張H20即可部署千問3滿血版，顯存占用僅為性能相近模型的三分之一。

在推理、指令遵循、工具調用、多語言能力等方面，千問3的性能均大幅增強：在奧數水平的AIME25測評中，千問3以81.5分的成績刷新開源紀錄；在考察代碼能力的LiveCodeBench評測中，千問3的表現甚至超過Grok3；在評估模型人類偏好對齊的ArenaHard測評中，千問3的分數超越了OpenAI-o1和DeepSeek-R1。

千問3旗艦版和32B版本在部分基準測試中的得分。來源：通義千問

為了迎接智能體Agent和大模型應用的集中爆發，千問3也在這方面提供了支持。在評估模型Agent能力的BFCL評測中，千問3創下70.8的新高，超越Gemini2.5-Pro、OpenAI-o1等頂尖模型。同時，千問3原生支持MCP（模型上下文協議），并具備強大的工具調用（function calling）能力，將大大降低編碼復雜性。

對于開發者而言，千問3醞釀已久的發布為開源領域帶來新的動力。和前代一樣，千問3系列模型依舊采用寬松的Apache2.0協議開源，首次支持119多種語言，全球開發者、研究機構和企業均可免費在魔搭社區、HuggingFace等平臺下載模型并商用，或通過阿里云百煉調用千問3的API服務。個人用戶可立即通過通義APP直接體驗，夸克也即將全線接入千問3。

有業內人士在經過實測后指出，千問3在邏輯推理、寫作等方面的表現都不錯，在生成復雜代碼、數學推理等方面，思考模式的表現明顯好于非思考模式。通義千問團隊表示，未來計劃從多個維度提升模型，以實現幾個關鍵目標，包括擴展數據規模、增加模型大小、延長上下文長度、拓寬模態范圍、推進強化學習以進行長周期推理。

今年以來，通義千問團隊表現活躍，先后開源發布旗艦模型Qwen2.5-Max、推理模型QwQ-32B和首個全模態大模型Qwen2.5-Omni。目前，阿里通義已開源200余個模型，全球下載量超3億次；千問衍生模型數超10萬個，已超越美國Llama，成為全球第一開源模型。

責任編輯：孫扶

圖片編輯：金潔

校對：施鋆

澎湃新聞報料：021-962866

澎湃新聞，未經授權不得轉載

我要舉報

#通義千問 #阿里云 #AI #人工智能