- +1
DeepSeek官宣R1升級:提升思維深度與推理能力,整體表現已接近國際頂尖模型

國產大模型公司深度求索(DeepSeek)發布詳細的升級公告,解釋DeepSeek-R1升級的具體情況。
5月29日,據DeepSeek公告,DeepSeek R1模型已完成小版本升級,當前版本為DeepSeek-R1-0528。用戶通過官方網站、APP或小程序進入對話界面后,開啟“深度思考”功能即可體驗最新版本。API也已同步更新,調用方式不變。
公告指出,DeepSeek-R1-0528使用2024年12月所發布的DeepSeek V3 Base模型作為基座,但在后訓練過程中投入了更多算力,顯著提升模型的思維深度與推理能力。更新后的R1模型在數學、編程與通用邏輯等多個基準測評中取得當前國內所有模型中首屈一指的優異成績,并且在整體表現上已接近其他國際頂尖模型,如o3與Gemini-2.5-Pro。
相較于舊版R1,新版模型在復雜推理任務中的表現有顯著提升。例如在AIME2025測試中,新版模型準確率由舊版的70%提升至87.5%。這一進步得益于模型在推理過程中的思維深度增強:在AIME2025測試集上,舊版模型平均每題使用12K tokens,而新版模型平均每題使用23Ktokens,表明其在解題過程中進行了更為詳盡和深入的思考。
DeepSeek表示,DeepSeek-R1-0528的思維鏈對于學術界推理模型的研究和工業界針對小模型的開發都將具有重要意義。
新版DeepSeek R1針對“幻覺”問題進行了優化。與舊版相比,更新后的模型在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低45-50%左右,能夠有效地提供更為準確、可靠的結果。
在舊版R1的基礎上,更新后的R1模型針對議論文、小說、散文等文體進行進一步優化,能夠輸出篇幅更長、結構內容更完整的長篇作品,同時呈現出更加貼近人類偏好的寫作風格。
據公告稱,當前模型的測評成績與OpenAI o1-high相當,但與o3-High以及Claude4 Sonnet仍有差距。
此次 R1更新后,官方網站、小程序、App端和API中的模型上下文長度仍為64K。如果用戶對更長的上下文長度有需求,可以通過其他第三方平臺調用上下文長度為128K的開源版本R1-0528模型。與舊版本的DeepSeek-R1保持一致,此次升級仍為開源模型,允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。
此前5月28日,DeepSeek在官方微信群發布消息稱,DeepSeekR1模型已完成“小版本試升級”,歡迎前往官方網頁、APP、小程序測試(打開深度思考),API接口和使用方式保持不變。
據網友測評顯示,此次升級效果令人驚艷。從社交媒體的反饋來看,網友最為關注的是此次DeepSeekR1更新后的思考時間變長。據測評顯示,此次DeepSeek單任務處理時長可達30-60分鐘。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司