大模型之家2025年5月熱力榜：智能體正成為通往AGI的路徑

2025-06-04 13:07

來源：澎湃新聞·澎湃號·湃客

2025年5月，智能體再次成為行業熱議的焦點。以DeepSeek、騰訊、阿里等為代表的中國企業，正在推動智能體從概念走向實用，成為大模型產業化的重要突破口。

智能體作為具備感知、規劃、執行能力的AI系統，正在從單點任務執行者演進為多智能體協作體，具備自主決策、任務分解與工具調用能力。隨著多模態感知、MCP等關鍵技術的成熟，智能體正逐步跨越“可用”與“好用”的門檻，成為AI落地的關鍵路徑。

在《2025年5月大模型熱力榜》中，共收錄了260家大型模型及其所屬企業。在其中，百度、阿里、字節跳動等頭部科技企業，紛紛加大在智能體領域的投入，推出多款應用產品，鞏固了在榜單中的排名。DeepSeek憑借R1全新版本再次沖進榜單前列，騰訊憑借發布多款大模型以及應用產品成功進入榜單前三名。

5月，百度在AI和大模型領域多項技術突破與商業進展引發行業關注。2025Q1財報顯示，智能云業務同比增速達42%，核心營收超市場預期，智能云千帆大模型平臺升級后支持多模態與深度思考模型訓練，接入超100個主流模型，顯著降低企業AI應用門檻。蘿卜快跑無人駕駛服務累計提供超1100萬次出行，全球化布局加速。

21日，百度在萬象AI開發者大會上發布全球首個千億參數多模態大模型“文心·靈眸”，該模型集成視覺Transformer、語音編碼器與語義理解模塊，支持圖像生成、視頻理解等12種模態處理，并與美團合作推出智能配送大腦，使配送路徑規劃效率提升40%，異常訂單處理時間縮短至15秒。

同期，文心大模型X1 Turbo在5月20日百度AI Day上獲中國信通院最高級“4+級”評級，成為國內首款通過該測評的大模型，其在邏輯推理、代碼生成等24項能力評估中16項獲滿分，綜合性能超越DeepSeek R1等國際模型，調用成本僅為后者的25%。

不僅如此，百度旗下“通用超級智能體”心響App于5月悄然迎來了iOS端上線，與市面上以對話、寫作或翻譯為主的單功能AI應用不同，心響能夠通過主智能體調度多個子智能體，在復雜任務處理中實現自主規劃、執行與優化，“一站式”解決復雜任務。用戶僅需用自然語言表達目標，系統便可自動分解需求并完成執行，不僅提升了智能體的能力邊界，還大大降低了AI使用門檻。

此外，百度智能云千帆平臺升級后接入超100個主流模型，調用成本行業最低，企業已通過該平臺精調3.3萬個模型、開發77萬應用，形成“模型超市”生態。在應用落地層面，百度與昆侖芯合作的“文心一體機”集成AI加速芯片，推理延遲降至10毫秒，支持本地化部署；靈眸API平臺開放30余項多模態能力，日均調用量突破10億次，接入攜程、貝殼等200余家企業。

2025年5月，阿里云飛天企業版平臺通過融合智算能力，為金融、政務、能源等領域超千家頭部客戶提供“云+AI”協同服務，顯著提升GPU利用率與任務執行效率。同期，阿里云推出百煉專屬版平臺，集成飛天架構與多模態數據解析能力，支持政務、醫藥等垂直領域快速構建智能體應用，加速AI價值釋放。

在模型研發層面，阿里巴巴開源新一代混合推理模型Qwen3，性能超越Deepseek-R1、OpenAI-o1等模型，登頂全球開源模型榜單。此外，通義千問VL-Max模型優化數學推理與回復風格，并開放搶先體驗。

此外，阿里云通義萬相Wan2.1-VACE模型開源，成為業界功能最全的視頻生成與編輯模型。AI技術深度賦能淘寶天貓廣告工具、高德導航智能體、飛豬旅行AI等產品，覆蓋電商、物流、文旅等多場景。

DeepSeek在技術層面，R1模型完成R1-0528版本重要升級，該版本基于DeepSeek V3 Base模型，通過追加算力投入優化后訓練算法，顯著提升了推理深度與思維鏈能力，優化代碼生成、邏輯推理能力，上下文長度翻倍至128K，支持超長文本處理，數值計算精度顯著提升，推理深度大幅增強，邏輯鏈更貼近人類思維。同時，R1-0528將幻覺率降低45-50%。此外，DeepSeek與華為昇騰集群深度適配，海外開發團隊訓練成本降低50%以上，并攜手IBM、藍美視訊等推動“存儲+AI”解決方案落地，進一步拓展生態版圖。

5月，騰訊全面加速技術迭代與產業落地：21日，騰訊云AI產業應用峰會首次全景披露大模型戰略，宣布混元大模型矩陣全面升級，包括推出視覺深度推理模型混元T1 Vision和端到端語音通話模型混元Voice，并計劃上線實時視頻通話AI體驗。

混元大模型多模態能力顯著突破，上線圖像生成實現“毫秒級”生圖，3D生成技術憑借稀疏原生架構在可控性與超高清效果上實現代際飛躍，開源后Hugging Face下載量超160萬次。

此外，騰訊云智能體開發平臺同步升級，支持零代碼多Agent協同與工作流模式，大幅降低企業智能體搭建門檻；知識庫系列產品基于騰訊樂享和ima完成迭代，強化知識管理與應用能力。

字節跳動在火山引擎FORCE LINK AI創新巡展上發布了視覺語言多模態模型Seed1.5-VL，顯著提升了視覺定位與推理能力，并新增視頻理解及多模態智能體功能，進一步拓展了AI應用場景。同時，字節跳動的Seed團隊開源了基于模型為中心的代碼預訓練數據構建流水線，并推出了Seed-Coder系列模型，推動了代碼生成技術的進步。此外，字節跳動還推出了集成火山引擎豆包大模型的AI視頻編輯應用“剪小影”，降低了視頻創作門檻。

商湯科技多模態大模型「日日新V6」憑借62.96分的綜合得分，在通用語言能力榜單上與豆包1.5并列國內第一；在OpenCompass多模態測評中更以80.4分超越Gemini 2.5 Pro，登頂全球。依托多模態長思維鏈、全局記憶等技術，日日新V6在處理文本、圖像、視頻等復雜任務時展現出極高效率與低推理成本，已落地至具身智能、智慧教育等多個場景。

在行業生態上，商湯加速“模型+應用”一體化：與廣汽聯合量產落地輔助駕駛方案，與聽力熊共推教育AI助手，并聯合麒麟軟件打造國產辦公AI一體機，為政企客戶提供全棧式支持。面向開發者，商湯開源低代碼框架LazyLLM，十行代碼即可構建多Agent應用，其API性能排名全行業首位。

算力基建方面，SenseCore2.0大裝置算力規模達到2.3萬PetaFlops，全面支持大模型效率躍升。與聲網合作也將日日新嵌入音視頻服務，賦能智能面試等場景，2024年生成式AI業務收入同比翻倍，商湯正逐步從“技術領先”走向“生態主導”。

360在AI和大模型領域動作頻頻，展現出其在安全、技術落地與生態合作方面的多重布局。360納米AI連續3個月登頂國內AI產品增速榜，成為全球AI搜索引擎三強，其升級版“納米AI超級搜索”實現跨平臺搜索、多模態生成及閉環任務執行，最新版本強化“AI搜索”“智能體”等模塊的對話體驗。360集團創始人周鴻祎在公開演講中強調，2025年將是智能體爆發之年，大模型需進化為智能體以實現具體任務執行，360正通過智能體構建、生態協作與硬件融合，加速AI技術普惠與應用深化。

生態合作方面，360與智譜AI達成戰略合作，共研千億級大模型“360GLM”，形成“雙引擎”驅動布局，并推動大模型技術開源與場景化落地。

5月，科大訊飛在AI與大模型領域持續深耕教育場景并加速全球化布局。在武漢舉辦的2025世界數字教育大會上，科大訊飛展示了基于星火X1深度推理大模型的創新成果，包括支持3D立體圖形智能識別的AI黑板、具備跨時空資源匹配功能的“奇思妙問”豎屏，并聯合中國教科院正式啟動中小學科學教育智能導師項目，旨在通過構建“教學思維鏈”驅動的專用模型，實現智能輔教與個性化導學。

同期，科大訊飛公布其智慧教育業務已覆蓋全國32個省級行政區、超5萬所學校的1.3億師生，2024年相關營收達72.29億元，同比增長29.94%。此外，繼4月支持日本大阪世博會中國館后，科大訊飛5月持續推廣“AI孫悟空”多語種智慧導覽系統，該系統基于星火大模型實現中、日、英三語交互，成為國產AI技術出海的重要標桿。

5月7日，階躍星辰與ACE Studio聯合發布并開源音樂大模型ACE-Step（中文名：音躍），支持LoRA和ControlNet等多種微調方式，可靈活適配音頻編輯、人聲合成、伴奏生成、聲線克隆及風格遷移等下游任務。該模型通過降低音樂AI應用的開發門檻，為創作者和開發者提供更便捷的工具支持。

特別聲明

本文為澎湃號作者或機構在澎湃新聞上傳并發布，僅代表該作者或機構觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#AI #大模型 #智能體