DeepSeek V4终于发布:1.6T参数+1M上下文,国产大模型跻身全球第一梯队

DeepSeek V4终于发布:1.6T参数+1M上下文,国产大模型跻身全球第一梯队

DeepSeek V4正式官宣:国产大模型的里程碑时刻

被行业调侃“Next Week”近3个月的DeepSeek V4,终于在2026年4月24日正式显露真身。这款新一代大模型的发布,标志着国产AI大模型正式跻身全球第一梯队。

DeepSeek V4发布

本文内容综合自36氪报道,作者:周鑫雨,编辑:苏建勋、杨轩

核心参数亮点拉满,性能直追全球顶级水平

DeepSeek V4带来了多项突破性的参数升级:

  • 最大参数量达到1.6T,采用MoE混合专家模型架构
  • 支持1M超长上下文窗口,可一次性处理百万字级别的内容
  • 针对Agent场景做了专门的性能优化,大幅提升多任务处理能力
  • 独创稀疏注意力机制DSA,有效降低计算和显存需求

DeepSeek V4性能测评

背后的挑战:从技术乌托邦到商业化的转身

DeepSeek V4之所以姗姗来迟,背后有着多重原因:一方面,团队将训练框架从英伟达GPU迁移到华为昇腾芯片,过程中遇到了不少适配挑战;另一方面,2025年年中DeepSeek曾遭遇一次较为严重的训练失败,导致进度延迟。

值得关注的是,DeepSeek目前已经正式开放融资窗口,目标是筹集更多资金用于更大参数规模模型的训练,以及顶尖人才的招募。随着R1和V4的相继发布,DeepSeek已经从一个偏理想主义的技术团队,快速转向重视产品和商业化的科技公司。

DeepSeek App模式

目前DeepSeek App已经上线了两种模式:专家模式由1.6T参数量的V4-pro提供支持,适合复杂推理任务;快速模式则由284B的V4-flash驱动,兼顾速度和成本。随着V4的正式落地,国产大模型在全球市场的竞争力将得到进一步提升。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
有新私信 私信列表
搜索