- +1
DeepSeek發布模型更新,新版本編程能力大大提升
3月24日晚間,杭州深度求索人工智能基礎技術研究有限公司(以下簡稱“深度求索”)發布了模型更新——DeepSeek-V3-0324。本次更新為DeepSeek V3模型的版本更新,并非市場此前一直期待的DeepSeek-V4或R2。目前已在Hugging Face上開源,并迅速登上了Trending榜單。據悉,其開源版本模型體積為6850億參數。
同日,DeepSeek在其官方交流群宣布稱,DeepSeek V3模型已完成小版本升級,該版本的最新模型也已經同步至官網、App 和小程序,關閉“深度思考”就可體驗。
此次發布的版本更新,在性能上,編程能力的優化成了最大亮點,新版本DeepSeek-V3-0324生成前端代碼的能力大大提升。
不少自媒體博主在社交平臺上發帖認為,DeepSeek-V3-0324 模型在前端代碼的生成能力上有了質的提升,審美方面也提升了不少,甚至有博主測評稱可以媲美 Claude 3.7 Sonnet思維鏈版本。有不少用戶開始嘗試將新模型與此前發布的模型結合解鎖新的玩法。有用戶稱用DeepSeek-V3-0324 模型嘗試編寫了800多行代碼,整個過程沒有出現任何故障?!斑@是免費的、開源的、超快的。很高興看到這些開源模型如何向大型科技公司施壓,以更低的成本構建更好的模型?!痹撐挥脩舴Q。
澎湃科技此前曾報道,初代DeepSeek-V3發布于2024年12月26日晚間,這款模型自上線后便以高性價比火速“出圈”。根據官方技術論文披露,DeepSeek-V3模型的總訓練成本為557.6萬美元,而GPT-4o等模型的訓練成本約為1億美元。深度求索表示,“這是一個全新的開始?!逼浜?,DeepSeek于2025年1月發布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,該模型在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司