- +1
阿里開源首個“混合推理模型”:集成“快思考”、“慢思考”能力
阿里開源了其首個具備"快思考"與"慢思考"能力的混合推理大模型。
4月29日凌晨,阿里巴巴宣布開源新一代通義千問模型Qwen3(簡稱千問3),該模型集成了“快思考”與“慢思考”。阿里方面表示,Qwen3部署成本上較Deepseek等大模型顯著降低。

千問3旗艦版和32B版本在部分基準測試中的得分。來源:通義千問
據介紹,Qwen3系列采用的“混合專家(MoE)架構”,能夠模仿人類思考問題的方式,對復雜問題可多步驟“深度思考”,對簡單需求可低算力“秒回”答案,極大節省算力消耗。阿里稱,這種混合推理模型還能夠靈活滿足AI應用和不同場景對性能和成本的多樣需求。澎湃科技注意到,Anthropic和Alphabet的谷歌以及DeepSeek等其他開發者也在模型中采用了該架構。
自從DeepSeek發布以低成本高性能著稱的R1 模型搶占OpenAI風頭之后,近兩個多月以來,國內科技公司開始迅速向市場推出一系列成本較低的AI模型服務。比如,以百度、科大訊飛等為代表的國內科技企業也紛紛加注國產模型升級浪潮,密集推出低成本AI服務。百度發布新一代文心一言模型4.5和X1,多模態理解、文本和邏輯推理能力顯著提升;火山引擎正式發布豆包1.5深度思考模型,實現更低延遲;科大訊飛全新升級深度推理大模型訊飛星火X1。
當前,阿里巴巴正圍繞Qwen系列構建其AI戰略版圖。今年2月,阿里巴巴集團CEO吳泳銘提到,該公司的“首要目標”已轉向實現通用人工智能(AGI),即打造具有人類級認知能力的智能系統。未來三年,阿里將投入超過3800億元人民幣,用于建設云和AI硬件基礎設施,總額超過去十年總和。吳泳銘還表示,“阿里巴巴將加速云和AI硬件基礎設施建設,助推全行業生態發展。”
阿里云方面表示,阿里通義已開源200余個模型,全球下載量超3億次,Qwen衍生模型數超10萬個,已超越美國Llama,成為全球第一開源模型。
國際科技巨頭同樣也在加速模型優化布局。就在阿里開源通義千問模型Qwen3,29日,OpenAI 也發布了 ChatGPT 的多項功能更新,包括對購物功能的支持和優化。
從今天開始,當用戶搜索產品時,ChatGPT會提供一些推薦,展示這些產品的圖片和評論,并提供指向用戶購買產品的網頁的直接鏈接。目前,OpenAI 正在嘗試涵蓋時尚、美妝、家居用品和電子產品等類別。ChatGPT 這次更新對更多生活場景進行了優化,繼續朝著超級消費級應用的方向小步快跑。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司