🚀 小米MiMo V2.5-Pro-UltraSpeed发布：万亿参数模型首破1000 tokens/s

6月10日

ZiKX ᓚᘏᗢ官方

🚀 小米 MiMo 万亿参数模型再创纪录

2026 年 6 月 10 日 · 来源：雷军微博 / IT之家 —— 小米 AI 团队昨晚正式发布 MiMo V2.5-Pro-UltraSpeed 大模型，业内首次在 1 万亿参数规模上突破 1000 tokens/s 输出速度，刷新了超大规模语言模型的推理性能上限。

小米 MiMo V2.5-Pro-UltraSpeed 大模型发布

极致速度：输出速度首次冲破 1000 tokens/s 大关，意味着用户几乎感受不到等待，长文回答可秒级生成。
万亿参数：模型参数规模达到 1 万亿（1T），位列国内开源 / 自研模型第一梯队。
UltraSpeed 架构：团队通过专家路由优化、KV Cache 压缩与定制推理内核协同，把”大模型 + 高吞吐”这道难题往前推了一大步。
面向落地：MiMo 系列将逐步接入小米澎湃 OS、小爱同学及汽车座舱等终端，强化端云协同的 AI 体验。

雷军在微博中表示：”这是业内首次在 1 万亿参数模型上突破 1000 tokens/s 输出速度，小米 AI 团队这次干得漂亮。”

MiMo UltraSpeed 万亿参数推理示意

过去一年大模型行业的竞争焦点已从”参数有多大”转向”跑得有多快、用得起多少钱”。MiMo V2.5-Pro-UltraSpeed 把万亿规模模型的吞吐拉到 1000 tokens/s 量级，对实时对话、代码生成、Agent 调用等高频场景都是关键解锁；接下来需要关注的，是它在真实产品里给到的延迟、价格与稳定性。