DeepSeek V4终于发布：1.6T参数+1M上下文，国产大模型跻身全球第一梯队

4月25日

ZiKX ᓚᘏᗢ官方

DeepSeek V4终于发布：1.6T参数+1M上下文，国产大模型跻身全球第一梯队

DeepSeek V4正式官宣：国产大模型的里程碑时刻

被行业调侃“Next Week”近3个月的DeepSeek V4，终于在2026年4月24日正式显露真身。这款新一代大模型的发布，标志着国产AI大模型正式跻身全球第一梯队。

DeepSeek V4发布

本文内容综合自36氪报道，作者：周鑫雨，编辑：苏建勋、杨轩

核心参数亮点拉满，性能直追全球顶级水平

DeepSeek V4带来了多项突破性的参数升级：

最大参数量达到1.6T，采用MoE混合专家模型架构
支持1M超长上下文窗口，可一次性处理百万字级别的内容
针对Agent场景做了专门的性能优化，大幅提升多任务处理能力
独创稀疏注意力机制DSA，有效降低计算和显存需求

DeepSeek V4性能测评

背后的挑战：从技术乌托邦到商业化的转身

DeepSeek V4之所以姗姗来迟，背后有着多重原因：一方面，团队将训练框架从英伟达GPU迁移到华为昇腾芯片，过程中遇到了不少适配挑战；另一方面，2025年年中DeepSeek曾遭遇一次较为严重的训练失败，导致进度延迟。

值得关注的是，DeepSeek目前已经正式开放融资窗口，目标是筹集更多资金用于更大参数规模模型的训练，以及顶尖人才的招募。随着R1和V4的相继发布，DeepSeek已经从一个偏理想主义的技术团队，快速转向重视产品和商业化的科技公司。

DeepSeek App模式

目前DeepSeek App已经上线了两种模式：专家模式由1.6T参数量的V4-pro提供支持，适合复杂推理任务；快速模式则由284B的V4-flash驱动，兼顾速度和成本。随着V4的正式落地，国产大模型在全球市场的竞争力将得到进一步提升。

利好利空

2 条回复 A文章作者 M管理员

更换删除

红豆布丁

7月8日

1.6T参数，有点猛啊
- 时光列车@红豆布丁
  
  7月8日
  
  参数是有点猛，期待实测

❯

解锁会员权限

个人中心

购物车

优惠劵

有新私信私信列表

搜索

客服

扫码打开当前页
官方群聊
关注公众号

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部