阿里開源首個“混合推理模型”：集成“快思考”、“慢思考”能力

實習生陳方迪澎湃新聞記者喻琰

2025-04-29 14:22

來源：澎湃新聞

? 未來2% >

阿里開源了其首個具備"快思考"與"慢思考"能力的混合推理大模型。

4月29日凌晨，阿里巴巴宣布開源新一代通義千問模型Qwen3（簡稱千問3），該模型集成了“快思考”與“慢思考”。阿里方面表示，Qwen3部署成本上較Deepseek等大模型顯著降低。

千問3旗艦版和32B版本在部分基準測試中的得分。來源：通義千問

據介紹，Qwen3系列采用的“混合專家（MoE）架構”，能夠模仿人類思考問題的方式，對復雜問題可多步驟“深度思考”，對簡單需求可低算力“秒回”答案，極大節省算力消耗。阿里稱，這種混合推理模型還能夠靈活滿足AI應用和不同場景對性能和成本的多樣需求。澎湃科技注意到，Anthropic和Alphabet的谷歌以及DeepSeek等其他開發者也在模型中采用了該架構。

自從DeepSeek發布以低成本高性能著稱的R1 模型搶占OpenAI風頭之后，近兩個多月以來，國內科技公司開始迅速向市場推出一系列成本較低的AI模型服務。比如，以百度、科大訊飛等為代表的國內科技企業也紛紛加注國產模型升級浪潮，密集推出低成本AI服務。百度發布新一代文心一言模型4.5和X1，多模態理解、文本和邏輯推理能力顯著提升；火山引擎正式發布豆包1.5深度思考模型，實現更低延遲；科大訊飛全新升級深度推理大模型訊飛星火X1。

當前，阿里巴巴正圍繞Qwen系列構建其AI戰略版圖。今年2月，阿里巴巴集團CEO吳泳銘提到，該公司的“首要目標”已轉向實現通用人工智能（AGI），即打造具有人類級認知能力的智能系統。未來三年，阿里將投入超過3800億元人民幣，用于建設云和AI硬件基礎設施，總額超過去十年總和。吳泳銘還表示，“阿里巴巴將加速云和AI硬件基礎設施建設，助推全行業生態發展。”

阿里云方面表示，阿里通義已開源200余個模型，全球下載量超3億次，Qwen衍生模型數超10萬個，已超越美國Llama，成為全球第一開源模型。

國際科技巨頭同樣也在加速模型優化布局。就在阿里開源通義千問模型Qwen3，29日，OpenAI 也發布了 ChatGPT 的多項功能更新，包括對購物功能的支持和優化。

從今天開始，當用戶搜索產品時，ChatGPT會提供一些推薦，展示這些產品的圖片和評論，并提供指向用戶購買產品的網頁的直接鏈接。目前，OpenAI 正在嘗試涵蓋時尚、美妝、家居用品和電子產品等類別。ChatGPT 這次更新對更多生活場景進行了優化，繼續朝著超級消費級應用的方向小步快跑。

責任編輯：沈關哲

圖片編輯：沈軻

校對：劉威

澎湃新聞報料：021-962866

澎湃新聞，未經授權不得轉載

我要舉報

#阿里巴巴 #MOE