
即使没有等来 R2,也至少没有白等。
北京时间 3 月 24 日晚,深度求索(DeepSeek)突然推送了 DeepSeek-V3 模型升级版(V3-0324),有趣的是,他们依然延续了其「静默更新」的技术迭代的风格。

InfoQ 从 DeepSeek 官方微信群获悉,新模型已通过网页端、App 及小程序全面开放。 尽管并非传闻中的 V4 或 R2 版本,但此次更新凭借 6850 亿参数的开源模型和针对性优化,迅速引发全球开发者社区关注。

初代 V3 模型曾以 557.6 万美元训练成本媲美 Claude 3.5 效果的极致性价比震惊业界,而此次升级后的新版模型上线几小时内就吸引了大量开发者自发测试。

虽然 DeepSeek 尚未放出官方测试结果,但据 Reddit 平台上已经测试过新版模型的用户反馈,新版模型编码能力较之前有明显提升,对 JavaScript、TypeScript 等语言的代码补全和错误检测表现尤为突出,被开发者称为「感知最强升级」。

还有体验过的用户表示,新版本与其他版本的区别是对话时的语气、用词更像人类。 而更多的用户则表示仅仅放出来个小版本更新不够过瘾,期待早日见到 R2。 凭借初代 V3 发布时「唯一冲入 Chatbot Arena 前十的开源模型」的辉煌战绩,开源网站显示,其 6850 亿参数版本已提供完整权重下载,预计将显著降低企业 AI 应用门槛。

评论