DeepSeek V4 Model 详解:参数规模、能力与性能
DeepSeek V4 Model 将长上下文推到百万级并引入原生多模态与全新架构。本文对 DeepSeek V4 的参数规模、能力与性能做简要详解。

一、参数与架构
- 规模:V4 满血版约 1 万亿参数 MoE,激活参数约 320 亿;V4 Lite 约 200B,已发布。
- 上下文:从 128K 提升至 100 万 tokens,整库、长文档、多轮 Agent 更可用。
- 架构:Engram 条件记忆、DSA 稀疏注意力、mHC 改进超连接,在长上下文下控制成本、提升稳定性。
二、能力要点
- 原生多模态:文本、图像、视频统一建模,支持文生图、文生视频及跨模态推理。
- 代码:流出的 SWE-bench Verified 约 83.7%,具备工程全局思维。
- 成本:推理成本相对竞品有优势,利于 7×24 Agent 与规模化应用。
三、V4 Lite 与满血版
当前已发布 V4 Lite;满血版预计参数量与能力更高,具体以官方为准。DeepSeek V4 Model 的路线是长上下文 + 原生多模态 + 成本效率。
想直接体验 DeepSeek V4,可点下方按钮。