跳转到主内容

模型与价格

以百万 tokens 为单位计量计费。Token 是模型处理自然语言文本的最小单位。

模型参数

deepseek-v4-flashdeepseek-v4-pro
API 地址 (OpenAI)https://api.deepseek.com
API 地址 (Anthropic)https://api.deepseek.com/anthropic
模型版本DeepSeek-V4-FlashDeepSeek-V4-Pro
思考模式非思考 / 思考(默认)
上下文窗口1,000,000 tokens
最大输出384,000 tokens

功能支持

功能v4-flashv4-pro
JSON 输出支持支持
工具调用支持支持
前缀续写 (Beta)支持支持
FIM 补全 (Beta)仅非思考模式仅非思考模式

价格明细

计费项(每百万 tokens)v4-flashv4-pro
输入(缓存命中)0.02 元0.025 元
输入(缓存未命中)1 元3 元
输出2 元6 元

并发限额

模型并发上限
deepseek-v4-flash2,500
deepseek-v4-pro500

* deepseek-chat 与 deepseek-reasoner 将于 2026/07/24 弃用,分别映射至 v4-flash 的非思考与思考模式。并发详情见限速文档。

计费说明

透明、按量、无隐藏费用

费用 = token 消耗量 × 单价。优先从赠送余额扣减,再扣充值余额。
  • 费用按实际 token 消耗计算,精确到千分之一元
  • 赠送余额优先扣除,充值余额随后
  • 价格可能调整,请定期查看本页获取最新信息
DeepSeek 保留对产品价格进行调整的权利。请依据实际用量按需充值。