OpenAI正式发布GPT-5o Mini：推理成本降低70%，移动端本地部署成为可能

本文为2026年05月17日最新科技资讯快讯，由智晓科创整理发布，聚焦科技、数码、互联网行业前沿动态。

核心内容

北京时间5月17日晚间，人工智能巨头OpenAI正式对外发布了旗下最新大语言模型产品GPT-5o Mini，这也是GPT-5o系列推出后的首个轻量化版本，引发了全球科技行业的广泛关注。

根据OpenAI官方公布的参数，GPT-5o Mini在保持了GPT-5o 92%的核心能力的基础上，将推理成本大幅降低了70%，单token响应成本仅为0.00003美元，相比前代GPT-4o Mini下降了60%。同时，模型体积压缩到了只有12B参数，首次实现了在中端手机端的本地离线运行，延迟低于200ms，完全可以满足日常问答、文本生成、轻量代码编写等场景需求。

OpenAI CEO Sam Altman在发布会上表示：“轻量化模型的普及，将真正让AI能力触达每一个普通用户，我们预计到2026年底，将有超过10亿台移动设备内置运行本地大模型，彻底改变用户和智能设备的交互方式。”

除了成本和体积优势外，GPT-5o Mini还新增了多模态实时交互能力，支持最高1080P 30帧的视频输入理解，同时语音响应 latency 降低到了80ms，完全可以替代传统的语音助手实现自然对话交互。

目前OpenAI已经向所有付费用户开放了GPT-5o Mini的API调用权限，同时免费用户也可以在ChatGPT网页端和移动端体验该模型，后续还将开放模型微调接口，允许企业用户根据自身场景定制轻量化专有模型。

行业分析师普遍认为，GPT-5o Mini的发布将进一步挤压中小大模型厂商的生存空间，通用大模型市场的马太效应将进一步凸显，未来中小厂商将更多转向垂直领域模型、专用场景模型的研发，与通用大模型厂商形成差异化竞争。

来源：OpenAI官方发布会 | 编辑：智晓科创运营团队

{{userData.name}}已认证

OpenAI正式发布GPT-5o Mini：推理成本降低70%，移动端本地部署成为可能

OpenAI正式发布GPT-5o Mini：推理成本降低70%，移动端本地部署成为可能

核心内容

智晓科创

快捷导航

关注我