此篇文章发布距今已超过1天,您需要注意文章的内容或图片是否可用!
虽然 deepseek-v3-0324 在各项得分上比 R1 要高,但最近的实际使用体验感觉 v3-0324 的代码理解能力还是比 R1 要弱。往往一个任务下去,v3-0324 会陷入问题-解答-问题的循环之中,代码质量不高。一边写bug,一边解bug,并伴随大量的token消耗。v3-0324 号称也有推理能力,但实际使用中发现它并没有思维链。代码生成速度很快,但出错的概率也不小。比如,使用 deepseek-v3-0324 模型处理如下文本的正则表达式解析。测试下来,deepseek模型无法正确处理温度解析:无论经过多少轮debug,deepseek-v3-0324 和 r1 都无法正确解析文件内容。转头将半成品代码交给Claude-3.7-Sonet,分分钟就把bug解决了。使用Claude-3.7-Sonnet处理后的数据如下: 推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
宙飒天下网
还没有评论,来说两句吧...