- +1
DeepSeek更新了
5月28日,DeepSeek在官方交流群中公布,DeepSeek R1模型已完成小版本試升級。用戶可在官方網頁、APP、小程序測試(打開深度思考),API接口和使用方式保持不變。DeepSeek在開源社區Hugging Face也開源了新版R1模型(R1-0528)。

有網友對新版R1模型進行了測試,并表示Deepseek-R1-0528在競賽級編程的難度基準LiveCodeBench中的表現幾乎與OpenAI的o3模型相當。

社交網絡和信息網站City-data.com創始人Lech Mazur在社交媒體上表示,Deepseek-R1-0528在Extended NYT Connections基準測試中比原先的DeepSeek R1有了顯著改進,分數從38.6上升到49.8。在Thematic Generation基準測試中,Deepseek-R1-0528也優于DeepSeek R1,分數從1.80變為1.74,該分數越低越好。Thematic Generation基準測試衡量各種大模型如何有效地從一小組正例和反例中推斷出一個細分或特定的“主題”(類別/規則),然后在一組具有誤導性的候選項中檢測出哪一項真正符合該主題。

DeepSeek今年春節期間大火。3月份,DeepSeek V3模型完成小版本升級。新版V3模型借鑒DeepSeek R1模型訓練過程中所使用的強化學習技術,大幅提高了在推理類任務上的表現水平,在數學、代碼類相關評測集上取得了超過GPT-4.5的得分成績。在HTML等代碼前端任務上,新版V3模型生成的代碼可用性更高,視覺效果也更加美觀、富有設計感。在中文寫作任務方面,新版V3模型基于R1的寫作水平進行優化,同時提升中長篇文本創作的內容質量。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司