阿里千問(wèn)3系列發(fā)布并開(kāi)源：稱(chēng)成本大幅下降，性能超越DeepSeek-R1

澎湃新聞?dòng)浾?胡含嫣

2025-04-29 11:04

來(lái)源：澎湃新聞

備受期待的千問(wèn)3.0在五一節(jié)前面世。

4月29日凌晨，阿里巴巴宣布開(kāi)源新一代通義千問(wèn)模型Qwen3（簡(jiǎn)稱(chēng)千問(wèn)3），包含2款參數(shù)規(guī)模分別為30B和235B的混合專(zhuān)家（MoE）模型，以及大小從0.6B到32B的6款密集模型。據(jù)介紹，千問(wèn)3模型家族是國(guó)內(nèi)首個(gè)混合推理模型系列，235B模型的參數(shù)量?jī)H為DeepSeek-R1的三分之一，成本大幅下降，性能全面超越R1、OpenAI-o1等全球頂尖模型，登頂全球最強(qiáng)開(kāi)源模型。

在本次開(kāi)源的系列模型中，旗艦?zāi)Ｐ蚎wen3-235B-A22B的總參數(shù)量為235B，激活僅需22B。千問(wèn)3預(yù)訓(xùn)練數(shù)據(jù)量達(dá)到36T，和千問(wèn)2.5相比翻了兩倍，并在后訓(xùn)練階段進(jìn)行多輪強(qiáng)化學(xué)習(xí)，將非思考模式整合到思考模型中。同時(shí)，千問(wèn)3的部署成本大幅下降，僅需4張H20即可部署千問(wèn)3滿(mǎn)血版，顯存占用僅為性能相近模型的三分之一。

在推理、指令遵循、工具調(diào)用、多語(yǔ)言能力等方面，千問(wèn)3的性能均大幅增強(qiáng)：在奧數(shù)水平的AIME25測(cè)評(píng)中，千問(wèn)3以81.5分的成績(jī)刷新開(kāi)源紀(jì)錄；在考察代碼能力的LiveCodeBench評(píng)測(cè)中，千問(wèn)3的表現(xiàn)甚至超過(guò)Grok3；在評(píng)估模型人類(lèi)偏好對(duì)齊的ArenaHard測(cè)評(píng)中，千問(wèn)3的分?jǐn)?shù)超越了OpenAI-o1和DeepSeek-R1。

千問(wèn)3旗艦版和32B版本在部分基準(zhǔn)測(cè)試中的得分。來(lái)源：通義千問(wèn)

為了迎接智能體Agent和大模型應(yīng)用的集中爆發(fā)，千問(wèn)3也在這方面提供了支持。在評(píng)估模型Agent能力的BFCL評(píng)測(cè)中，千問(wèn)3創(chuàng)下70.8的新高，超越Gemini2.5-Pro、OpenAI-o1等頂尖模型。同時(shí)，千問(wèn)3原生支持MCP（模型上下文協(xié)議），并具備強(qiáng)大的工具調(diào)用（function calling）能力，將大大降低編碼復(fù)雜性。

對(duì)于開(kāi)發(fā)者而言，千問(wèn)3醞釀已久的發(fā)布為開(kāi)源領(lǐng)域帶來(lái)新的動(dòng)力。和前代一樣，千問(wèn)3系列模型依舊采用寬松的Apache2.0協(xié)議開(kāi)源，首次支持119多種語(yǔ)言，全球開(kāi)發(fā)者、研究機(jī)構(gòu)和企業(yè)均可免費(fèi)在魔搭社區(qū)、HuggingFace等平臺(tái)下載模型并商用，或通過(guò)阿里云百煉調(diào)用千問(wèn)3的API服務(wù)。個(gè)人用戶(hù)可立即通過(guò)通義APP直接體驗(yàn)，夸克也即將全線(xiàn)接入千問(wèn)3。

有業(yè)內(nèi)人士在經(jīng)過(guò)實(shí)測(cè)后指出，千問(wèn)3在邏輯推理、寫(xiě)作等方面的表現(xiàn)都不錯(cuò)，在生成復(fù)雜代碼、數(shù)學(xué)推理等方面，思考模式的表現(xiàn)明顯好于非思考模式。通義千問(wèn)團(tuán)隊(duì)表示，未來(lái)計(jì)劃從多個(gè)維度提升模型，以實(shí)現(xiàn)幾個(gè)關(guān)鍵目標(biāo)，包括擴(kuò)展數(shù)據(jù)規(guī)模、增加模型大小、延長(zhǎng)上下文長(zhǎng)度、拓寬模態(tài)范圍、推進(jìn)強(qiáng)化學(xué)習(xí)以進(jìn)行長(zhǎng)周期推理。

今年以來(lái)，通義千問(wèn)團(tuán)隊(duì)表現(xiàn)活躍，先后開(kāi)源發(fā)布旗艦?zāi)Ｐ蚎wen2.5-Max、推理模型QwQ-32B和首個(gè)全模態(tài)大模型Qwen2.5-Omni。目前，阿里通義已開(kāi)源200余個(gè)模型，全球下載量超3億次；千問(wèn)衍生模型數(shù)超10萬(wàn)個(gè)，已超越美國(guó)Llama，成為全球第一開(kāi)源模型。

責(zé)任編輯：孫扶

圖片編輯：金潔

校對(duì)：施鋆

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#通義千問(wèn)#阿里云 #AI #人工智能