- +1
大模型之家2025年5月熱力榜:智能體正成為通往AGI的路徑

2025年5月,智能體再次成為行業熱議的焦點。以DeepSeek、騰訊、阿里等為代表的中國企業,正在推動智能體從概念走向實用,成為大模型產業化的重要突破口。
智能體作為具備感知、規劃、執行能力的AI系統,正在從單點任務執行者演進為多智能體協作體,具備自主決策、任務分解與工具調用能力。隨著多模態感知、MCP等關鍵技術的成熟,智能體正逐步跨越“可用”與“好用”的門檻,成為AI落地的關鍵路徑。
在《2025年5月大模型熱力榜》中,共收錄了260家大型模型及其所屬企業。在其中,百度、阿里、字節跳動等頭部科技企業,紛紛加大在智能體領域的投入,推出多款應用產品,鞏固了在榜單中的排名。DeepSeek憑借R1全新版本再次沖進榜單前列,騰訊憑借發布多款大模型以及應用產品成功進入榜單前三名。

5月,百度在AI和大模型領域多項技術突破與商業進展引發行業關注。2025Q1財報顯示,智能云業務同比增速達42%,核心營收超市場預期,智能云千帆大模型平臺升級后支持多模態與深度思考模型訓練,接入超100個主流模型,顯著降低企業AI應用門檻。蘿卜快跑無人駕駛服務累計提供超1100萬次出行,全球化布局加速。
21日,百度在萬象AI開發者大會上發布全球首個千億參數多模態大模型“文心·靈眸”,該模型集成視覺Transformer、語音編碼器與語義理解模塊,支持圖像生成、視頻理解等12種模態處理,并與美團合作推出智能配送大腦,使配送路徑規劃效率提升40%,異常訂單處理時間縮短至15秒。
同期,文心大模型X1 Turbo在5月20日百度AI Day上獲中國信通院最高級“4+級”評級,成為國內首款通過該測評的大模型,其在邏輯推理、代碼生成等24項能力評估中16項獲滿分,綜合性能超越DeepSeek R1等國際模型,調用成本僅為后者的25%。
不僅如此,百度旗下“通用超級智能體”心響App于5月悄然迎來了iOS端上線,與市面上以對話、寫作或翻譯為主的單功能AI應用不同,心響能夠通過主智能體調度多個子智能體,在復雜任務處理中實現自主規劃、執行與優化,“一站式”解決復雜任務。用戶僅需用自然語言表達目標,系統便可自動分解需求并完成執行,不僅提升了智能體的能力邊界,還大大降低了AI使用門檻。
此外,百度智能云千帆平臺升級后接入超100個主流模型,調用成本行業最低,企業已通過該平臺精調3.3萬個模型、開發77萬應用,形成“模型超市”生態。在應用落地層面,百度與昆侖芯合作的“文心一體機”集成AI加速芯片,推理延遲降至10毫秒,支持本地化部署;靈眸API平臺開放30余項多模態能力,日均調用量突破10億次,接入攜程、貝殼等200余家企業。
2025年5月,阿里云飛天企業版平臺通過融合智算能力,為金融、政務、能源等領域超千家頭部客戶提供“云+AI”協同服務,顯著提升GPU利用率與任務執行效率。同期,阿里云推出百煉專屬版平臺,集成飛天架構與多模態數據解析能力,支持政務、醫藥等垂直領域快速構建智能體應用,加速AI價值釋放。
在模型研發層面,阿里巴巴開源新一代混合推理模型Qwen3,性能超越Deepseek-R1、OpenAI-o1等模型,登頂全球開源模型榜單。此外,通義千問VL-Max模型優化數學推理與回復風格,并開放搶先體驗。
此外,阿里云通義萬相Wan2.1-VACE模型開源,成為業界功能最全的視頻生成與編輯模型。AI技術深度賦能淘寶天貓廣告工具、高德導航智能體、飛豬旅行AI等產品,覆蓋電商、物流、文旅等多場景。
DeepSeek在技術層面,R1模型完成R1-0528版本重要升級,該版本基于DeepSeek V3 Base模型,通過追加算力投入優化后訓練算法,顯著提升了推理深度與思維鏈能力,優化代碼生成、邏輯推理能力,上下文長度翻倍至128K,支持超長文本處理,數值計算精度顯著提升,推理深度大幅增強,邏輯鏈更貼近人類思維。同時,R1-0528將幻覺率降低45-50%。此外,DeepSeek與華為昇騰集群深度適配,海外開發團隊訓練成本降低50%以上,并攜手IBM、藍美視訊等推動“存儲+AI”解決方案落地,進一步拓展生態版圖。
5月,騰訊全面加速技術迭代與產業落地:21日,騰訊云AI產業應用峰會首次全景披露大模型戰略,宣布混元大模型矩陣全面升級,包括推出視覺深度推理模型混元T1 Vision和端到端語音通話模型混元Voice,并計劃上線實時視頻通話AI體驗。
混元大模型多模態能力顯著突破,上線圖像生成實現“毫秒級”生圖,3D生成技術憑借稀疏原生架構在可控性與超高清效果上實現代際飛躍,開源后Hugging Face下載量超160萬次。
此外,騰訊云智能體開發平臺同步升級,支持零代碼多Agent協同與工作流模式,大幅降低企業智能體搭建門檻;知識庫系列產品基于騰訊樂享和ima完成迭代,強化知識管理與應用能力。
字節跳動在火山引擎FORCE LINK AI創新巡展上發布了視覺語言多模態模型Seed1.5-VL,顯著提升了視覺定位與推理能力,并新增視頻理解及多模態智能體功能,進一步拓展了AI應用場景。同時,字節跳動的Seed團隊開源了基于模型為中心的代碼預訓練數據構建流水線,并推出了Seed-Coder系列模型,推動了代碼生成技術的進步。此外,字節跳動還推出了集成火山引擎豆包大模型的AI視頻編輯應用“剪小影”,降低了視頻創作門檻。
商湯科技多模態大模型「日日新V6」憑借62.96分的綜合得分,在通用語言能力榜單上與豆包1.5并列國內第一;在OpenCompass多模態測評中更以80.4分超越Gemini 2.5 Pro,登頂全球。依托多模態長思維鏈、全局記憶等技術,日日新V6在處理文本、圖像、視頻等復雜任務時展現出極高效率與低推理成本,已落地至具身智能、智慧教育等多個場景。
在行業生態上,商湯加速“模型+應用”一體化:與廣汽聯合量產落地輔助駕駛方案,與聽力熊共推教育AI助手,并聯合麒麟軟件打造國產辦公AI一體機,為政企客戶提供全棧式支持。面向開發者,商湯開源低代碼框架LazyLLM,十行代碼即可構建多Agent應用,其API性能排名全行業首位。
算力基建方面,SenseCore2.0大裝置算力規模達到2.3萬PetaFlops,全面支持大模型效率躍升。與聲網合作也將日日新嵌入音視頻服務,賦能智能面試等場景,2024年生成式AI業務收入同比翻倍,商湯正逐步從“技術領先”走向“生態主導”。
360在AI和大模型領域動作頻頻,展現出其在安全、技術落地與生態合作方面的多重布局。360納米AI連續3個月登頂國內AI產品增速榜,成為全球AI搜索引擎三強,其升級版“納米AI超級搜索”實現跨平臺搜索、多模態生成及閉環任務執行,最新版本強化“AI搜索”“智能體”等模塊的對話體驗。360集團創始人周鴻祎在公開演講中強調,2025年將是智能體爆發之年,大模型需進化為智能體以實現具體任務執行,360正通過智能體構建、生態協作與硬件融合,加速AI技術普惠與應用深化。
生態合作方面,360與智譜AI達成戰略合作,共研千億級大模型“360GLM”,形成“雙引擎”驅動布局,并推動大模型技術開源與場景化落地。
5月,科大訊飛在AI與大模型領域持續深耕教育場景并加速全球化布局。在武漢舉辦的2025世界數字教育大會上,科大訊飛展示了基于星火X1深度推理大模型的創新成果,包括支持3D立體圖形智能識別的AI黑板、具備跨時空資源匹配功能的“奇思妙問”豎屏,并聯合中國教科院正式啟動中小學科學教育智能導師項目,旨在通過構建“教學思維鏈”驅動的專用模型,實現智能輔教與個性化導學。
同期,科大訊飛公布其智慧教育業務已覆蓋全國32個省級行政區、超5萬所學校的1.3億師生,2024年相關營收達72.29億元,同比增長29.94%。此外,繼4月支持日本大阪世博會中國館后,科大訊飛5月持續推廣“AI孫悟空”多語種智慧導覽系統,該系統基于星火大模型實現中、日、英三語交互,成為國產AI技術出海的重要標桿。
5月7日,階躍星辰與ACE Studio聯合發布并開源音樂大模型ACE-Step(中文名:音躍),支持LoRA和ControlNet等多種微調方式,可靈活適配音頻編輯、人聲合成、伴奏生成、聲線克隆及風格遷移等下游任務。該模型通過降低音樂AI應用的開發門檻,為創作者和開發者提供更便捷的工具支持。
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司