DeepSeek V4终于发布:1.6T参数+1M上下文,国产大模型跻身全球第一梯队
DeepSeek V4正式官宣:国产大模型的里程碑时刻
被行业调侃“Next Week”近3个月的DeepSeek V4,终于在2026年4月24日正式显露真身。这款新一代大模型的发布,标志着国产AI大模型正式跻身全球第一梯队。

本文内容综合自36氪报道,作者:周鑫雨,编辑:苏建勋、杨轩
核心参数亮点拉满,性能直追全球顶级水平
DeepSeek V4带来了多项突破性的参数升级:
- 最大参数量达到1.6T,采用MoE混合专家模型架构
- 支持1M超长上下文窗口,可一次性处理百万字级别的内容
- 针对Agent场景做了专门的性能优化,大幅提升多任务处理能力
- 独创稀疏注意力机制DSA,有效降低计算和显存需求

背后的挑战:从技术乌托邦到商业化的转身
DeepSeek V4之所以姗姗来迟,背后有着多重原因:一方面,团队将训练框架从英伟达GPU迁移到华为昇腾芯片,过程中遇到了不少适配挑战;另一方面,2025年年中DeepSeek曾遭遇一次较为严重的训练失败,导致进度延迟。
值得关注的是,DeepSeek目前已经正式开放融资窗口,目标是筹集更多资金用于更大参数规模模型的训练,以及顶尖人才的招募。随着R1和V4的相继发布,DeepSeek已经从一个偏理想主义的技术团队,快速转向重视产品和商业化的科技公司。

目前DeepSeek App已经上线了两种模式:专家模式由1.6T参数量的V4-pro提供支持,适合复杂推理任务;快速模式则由284B的V4-flash驱动,兼顾速度和成本。随着V4的正式落地,国产大模型在全球市场的竞争力将得到进一步提升。


