
北京时间 3 月 24 日晚,DeepSeek 「突然」发布了模型更新。
但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。
目前,其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
深度求索微信官方公众号也确认,本次更新属于小版本升级,目前已经在官方网页、App 小程序等入口开放。
初代 V3 模型最为人所熟知的,可能还是「557.6万美金比肩Claude 3.5效果」的超级性价比。而更新后的模型由其新的 32KGPU 集群上改进的后训练提供支持。
截至目前,还没有任何关于新版 DeepSeek V3 的能力基准测试榜单出现,但有了 DeepSeek V3 发布即成为 Chatbot Arena 榜单前十中唯一一个开源模型的刷榜历史,还是在发布一小时后迅速吸引来全球用户对其测试体验。
根据目前最新的用户上手测试,新版 V3 模型前端编码能力的提升,是目前「感知最强」的部分。根据专业用户对新版 V3 的综合体验判断,V3-0324 的提升幅度大约相当于 Sonnet 3.5 到 Sonnet 3.6 的提升。
用户按照下面的提示词,同时对新版 V3 与 R1 下达任务,实际产出的效果已经出现巨大差异。
创建一个包含 CSS 和 JavaScript 的单个 HTML 文件,以生成一个动画天气卡片。卡片应通过不同的动画直观地表示以下天气条件:风:(例如,移动的云朵、摇曳的树木或风线)雨:(例如,落下的雨滴、形成的水坑)晴:(例如,闪耀的光线、明亮的背景)雪:(例如,落下的雪花、积雪)并排显示所有天气卡片。卡片应具有深色背景。在此单个文件中提供所有 HTML、CSS 和 JavaScript 代码。JavaScript 应包含一种在不同天气条件之间切换的方法(例如,一个函数或一组按钮),以演示每种天气的动画。
左侧是 DeepSeek 新版 V3 模型的生成结果,右侧为 R1 的生成结果。
除了编程能力,在其他用户的测试中,新版 V3 在多轮对话中体现出了更强的上下文理解能力。
从网友反馈的实测效果来看,V3-0324 有这些提升:
- 编码能力已经接近 Claude3.7 了,比之前的老版本 v3 能力要强;
- 提升幅度大约与 Sonnet 3.5 到 Sonnet 3.6 一样,甚至还要大一点;
- 与 R1 相比,V3-0324 在生成前端代码方面有了明显改进;
- 数学能力也有提升,能像推理模型一样能够解题。
当然,与往常一样,DeepSeek 也没有同时公开表示 R2 或者 V4 模型会在何时发布,但不少用户在体验过新版 V3 后,都觉得似乎 R2 的到来,也已经不远了。
还有一个让开源社区非常兴奋的改变。新版 V3 的开源许可与 R1 一样,也更新变成了 MIT 开源许可(MIT License),这意味着新版 V3 有着比初代 V3 更宽松的开源使用条件。
还没有评论,来说两句吧...