小米雷军:MiMo V2.5-Pro-UltraSpeed 首破万亿模型千token/s

📢 小米 MiMo 跑出”千 token/s”:雷军宣告万亿模型推理新纪录

6 月 10 日 · IT 之家 —— 小米 MiMo 团队联合 TileRT 发布 V2.5-Pro-UltraSpeed 模式,雷军亲自盖章:这是业内首次在 1 万亿参数模型上把输出速度顶到 1000 tokens/秒以上。

小米 MiMo V2.5-Pro-UltraSpeed 发布海报

  • 速度跨级:同等模型尺寸下,UltraSpeed 模式相比 MiMo-V2.5-Pro 输出速度提升约 10 倍,是行业首个突破”千 tokens/秒”门槛的万亿参数模型。
  • 价格策略:API 限时体验价为 MiMo-V2.5-Pro 的 3 倍——用 3 倍的钱换 10 倍的速度,性价比直接拉满。
  • 开放方式:采取申请制限时开放,窗口期为 2026 年 6 月 9 日至 6 月 23 日 23:59,资源紧俏,需排队。
  • 使用规则:每个账号每日最多成功进入队列 10 次,单次会话上限 30 分钟,空闲超 5 分钟自动释放资源。
  • 意义所在:大模型推理速度长期是落地瓶颈,万亿模型 + 千 tokens/s 意味着复杂 Agent、长上下文场景的响应体验可以接近”即时反馈”。

“这是业内首次在 1 万亿参数模型上突破 1000 tokens/秒的输出速度。” —— 小米创始人、董事长兼 CEO 雷军

雷军朋友圈介绍 MiMo UltraSpeed 模式

在大家还在卷模型参数和分数的当口,小米这次卷的是”用起来快不快”。万亿模型本身推理成本高、首 token 延迟大,能把吞吐推到千 tokens/秒级别,背后既考验底层推理引擎 TileRT 的工程能力,也意味着 MiMo 在国产大模型推理优化路线上又压上一注重码。对开发者而言,下一步可以关注的是 UltraSpeed 模式在长上下文、代码与 Agent 任务上的真实体感,以及限免窗口结束后正式定价会落在哪里。


0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
有新私信 私信列表
搜索