DeepSeek 永久降价要做中国版 Claude Code

2026年5月25日

47

856

DeepSeek 永久降价要做中国版 Claude Code

2026年5月22日,DeepSeek 宣布 DeepSeek-V4-Pro 模型 API 永久降价至原价的四分之一。调整后的价格体系为:输入缓存命中价格从 0.1 元每百万 Tokens 降至 0.025 元,输入缓存未命中价格从 12 元每百万 Tokens 降至 3 元,输出价格从 24 元每百万 Tokens 降至 6 元。叠加默认 500 并发和服务提速,官方 API 对开发者和企业的吸引力进一步提升。

概述

让我们回顾一下这轮降价的时间线:4月24日,DeepSeek V4 预览版正式发布;4月25日,V4-Pro 开启 2.5 折优惠;4月26日,缓存命中价格调整为首发价的十分之一;4月28日,2.5 折优惠延期至5月31日;5月22日,V4-Pro 永久降价为原价的四分之一。时间线的关键之处在于:临时折扣变成了永久降价。这意味着大模型 API 的价格基准正在被重新改写。

低价背后的技术底气

价格下调最直接的影响,是把任务成本推到开发者决策的更前端。在代码场景里,一次任务可能要读取项目文件、分析日志、多轮修改、反复运行测试,Tokens 消耗很容易放大。长上下文、代码库分析、批量重构、自动测试、Agent 多轮执行这些高消耗场景,开始更接近个人开发者和小团队的预算范围。过去开发者选择 Claude、OpenAI 或 Gemini,主要看模型能力、稳定性、生态和使用习惯。但 DeepSeek 打骨折的永久降价,意味着在绝对的性价比面前,开发者使用习惯也是可以轻易改变的。

比起把 API 当成高毛利收费入口,DeepSeek 则更像是在用过硬的 Infra 实力压低推理成本,再用低价吸引开发者、应用和下游生态进入自己的轨道。

“行业观察”
🦞

JimoClaw — 桌面 AI Agent 工作台

让 AI 处理本地资料、操控浏览器,最终交付可直接使用的文档、表格与 PPT,而不只是一段回答。

下载桌面版

为什么必须做中国版 Claude Code

DeepSeek 的市场角色很清楚:用低价、开源和强推理能力,持续建立大模型市场的价格优势。一系列降价公告里,最值得关注的不只是输出价格下降,还有缓存命中价格下降。在大模型推理过程中,KV Cache 是一个关键成本项。模型处理长上下文时,需要把历史 tokens 对应的 Key 和 Value 存起来,后续生成时反复使用。上下文越长,需要保存和读取的缓存越多,对显存、带宽和存储系统的压力也越大。以 100 万 tokens 上下文、8 bit KV 精度为前提,DeepSeek V4 只需要约 5.48GB HBM,而 GLM5 约为 60GB,Qwen3-235B-A22B 约为 89GB。这意味着 DeepSeek 在长上下文和 Agent 任务上的成本优势是结构性的,而非仅仅依赖价格战。

低价策略的深层逻辑

最先被牵动的,是 AI 编程工具的订阅模式。市面主流 AI 编程工具均推出 Coding Plan 月付订阅,为用户提供代码补全、模型调用、Agent 执行等权益。AI 编程已从单次补全迭代为全流程 Agent 自动化编码,模型可独立完成代码修改、测试运行、报错修复,单次任务 Token 消耗大幅提升。当底层 API 大幅降价,Coding Plan 也必须找到新的支撑点。这个支撑点,更可能落在工程能力上——比如能不能更好地读懂项目结构,能不能精准选择上下文,能不能控制 tokens 消耗,能不能稳定修改代码,能不能处理 Git、终端、CI/CD。DeepSeek 资深研究员陈德里在招聘中提到,要从零开始构建 Code Harness。正如他所说:Model + Harness = Agent,模型负责理解和生成,Harness 负责把模型能力带入真实工程环境,相当于模型外面那套「执行系统」。DeepSeek 版 Claude Code 不能只给开发者一个对话框,而要给开发者一个能持续执行任务的工程系统。

🛡️

积墨 AI 安全隐患巡检系统

任务一键下达 · 隐患 AI 识别 · 整改全程留痕 · 报告一键生成。让安全巡检真正看得见、管得住、能闭环。

了解方案

如有侵权,请联系删除。

Related Articles

联系我们 免费试用
小墨 AI