
🚀 小米 MiMo 万亿参数模型再创纪录
2026 年 6 月 10 日 · 来源:雷军微博 / IT之家 —— 小米 AI 团队昨晚正式发布 MiMo V2.5-Pro-UltraSpeed 大模型,业内首次在 1 万亿参数规模上突破 1000 tokens/s 输出速度,刷新了超大规模语言模型的推理性能上限。

- 极致速度:输出速度首次冲破 1000 tokens/s 大关,意味着用户几乎感受不到等待,长文回答可秒级生成。
- 万亿参数:模型参数规模达到 1 万亿(1T),位列国内开源 / 自研模型第一梯队。
- UltraSpeed 架构:团队通过专家路由优化、KV Cache 压缩与定制推理内核协同,把”大模型 + 高吞吐”这道难题往前推了一大步。
- 面向落地:MiMo 系列将逐步接入小米澎湃 OS、小爱同学及汽车座舱等终端,强化端云协同的 AI 体验。
雷军在微博中表示:”这是业内首次在 1 万亿参数模型上突破 1000 tokens/s 输出速度,小米 AI 团队这次干得漂亮。”

过去一年大模型行业的竞争焦点已从”参数有多大”转向”跑得有多快、用得起多少钱”。MiMo V2.5-Pro-UltraSpeed 把万亿规模模型的吞吐拉到 1000 tokens/s 量级,对实时对话、代码生成、Agent 调用等高频场景都是关键解锁;接下来需要关注的,是它在真实产品里给到的延迟、价格与稳定性。



