DeepSeek-V3-0324 代码能力又升级了

DeepSeek在昨晚（2025年3月24日）19点50分左右发布了它的 deepseek-v3-0324 版本。

DeepSeek-V3-0324 属于 V3 系列的小版本升级，但性能提升显著，尤其在代码生成、数学推理和长文本处理方面表现突出。以下是该模型的主要能力特点：

1. 强大的代码生成能力

接近 Claude 3.7 水平：在代码生成任务中，DeepSeek-V3-0324 表现接近 Claude 3.7 Sonnet，能够一次性生成 700 行无错误的代码，并优化前端开发（如 HTML/CSS/JavaScript）。
支持多种编程语言：包括 Python、C++、Java、Rust 等，并能提供调试建议。
物理模拟与复杂逻辑处理：在 20 个小球碰撞测试、火星任务模拟等任务中表现优异，甚至能正确渲染土星环等复杂图形。

2. 数学与逻辑推理能力提升

媲美专业推理模型：能解决此前仅推理模型（如 Claude 3.7）才能处理的逻辑问题，如“4 升水壶问题”。
数学竞赛题目表现优秀：在 AIME 2025 等数学竞赛题目测试中，表现接近人类专家水平。

3. 128K 长上下文处理

支持长文档分析、代码库理解，在多轮对话中保持更强的连贯性。

4. 开源与商业友好

MIT 许可证：相比前代更开放，允许自由修改、商业部署。
消费级设备可运行：通过 4-bit 量化，可在 512GB M3 Ultra Mac 上运行（20 token/s）。

5. 性能与效率优化

685B 参数（MoE 架构），每次推理仅激活 37B 参数，计算效率高。
FP8 低精度训练，降低计算成本，推理速度提升 3 倍。

6. 应用场景广泛

软件开发：快速生成高质量代码，提高开发效率。
学术研究：数学推理、论文分析。
教育与创意：编程教学、前端设计。

总体来看，DeepSeek-V3-0324 虽然被官方称为“小更新”，但实际性能提升显著，尤其在代码和数学领域已接近顶级闭源模型（如 Claude 3.7），同时保持开源优势，对开发者和企业极具吸引力。

在 Huggingface 模型讨论区，网友通过提示词复现了它的编码能力。如下任务是通过 DeepSeek 官网关闭深度搜索按钮后，生成的动态天气效果图：

提示词：

创建一个包含 CSS 和 JavaScript 的单个 HTML 文件，以生成一个动画天气卡片。卡片应通过不同的动画直观地表示以下天气条件：风：（例如，移动的云朵、摇曳的树木或风线）雨：（例如，落下的雨滴、形成的水坑）晴：（例如，闪耀的光线、明亮的背景）雪：（例如，落下的雪花、积雪）并排显示所有天气卡片。卡片应具有深色背景。在此单个文件中提供所有 HTML、CSS 和 JavaScript 代码。JavaScript 应包含一种在不同天气条件之间切换的方法（例如，一个函数或一组按钮），以演示每种天气的动画。

全文完。