DeepSeek-V4预览版发布:开启百万上下文新时代

2026年4月24日

36

515

DeepSeek-V4预览版发布:开启百万上下文新时代

2026年4月24日,DeepSeek全新系列模型V4预览版本正式上线并同步开源。这一版本最显著的核心突破在于实现了百万字(1M)超长上下文处理能力,在Agent能力、世界知识和推理性能上均达到国内开源领域的领先水平。

技术创新:全新注意力机制

DeepSeek-V4提供两个版本以满足不同场景需求:Pro版本定位高性能旗舰,在Agentic Coding评测中达到开源模型最佳水平,世界知识储备仅稍逊于顶尖闭源模型Gemini-Pro-3.1,数学与代码推理能力超越所有已公开评测的开源模型;Flash版本则更轻量高效,适合对响应速度有较高要求的简单任务场景。

Agent能力专项优化

V4采用了创新的注意力机制设计,在token维度进行压缩,结合DSA稀疏注意力技术,实现了全球领先的长上下文处理能力。这项技术创新大幅降低了对计算资源和显存的需求,使得1M上下文不再是遥不可及的技术指标,而是可以真正普及应用的标配能力。

从现在开始,1M上下文将是DeepSeek所有官方服务的标配。

“DeepSeek”

API与部署

针对当前主流的Agent产品框架(如Claude Code、OpenClaw、OpenCode、CodeBuddy等),V4进行了专门的适配与优化。在代码生成、文档创建等任务场景中,实际表现均有明显提升。

目前DeepSeek API已同步上线V4-Pro与V4-Flash两个版本,支持OpenAI与Anthropic双接口标准。通过修改model参数即可调用新模型,最大上下文长度统一为1M,两个版本均支持思考模式与非思考模式。对于复杂Agent场景,建议启用思考模式并将强度设置为max。值得注意的是,旧有API接口将于三个月后(2026年7月24日)停止服务。模型权重已在HuggingFace和ModelScope平台开源,技术人员可自行下载部署。

如有侵权,请联系删除。

Related Articles

联系我们 获取方案
小墨 AI