【太平洋科技快讯】1 月 10 日消息,据外媒 The Information 昨日报道,DeepSeek 将在未来几周时间内发布新一代旗舰大模型,将具备更强的编程能力。

知情人士透露,这款模型代号 V4,是去年 DeepSeek V3 的迭代版,DeepSeek 内部的初步测试结果显示,V4 在代码生成能力优于 Claude、ChatGPT 等主流大模型。

值得一提的是,去年 12 月发布的 DeepSeek V3.2 模型强化了 Agent 能力并融入思考推理,在某些基准测试中甚至优于 OpenAI GPT-5 和谷歌 Gemini 3.0 Pro。
技术层面,DeepSeek 在去年 12 月 31 日公布了一篇论文,提出了名为 mHC(流形约束超连接)的新架构。该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题,同时保持性能增益,为基础模型的演进提出有希望的方向。