OpenAI正式发布GPT-5o Mini:推理成本降低70%,移动端本地部署成为可能
本文为2026年05月17日最新科技资讯快讯,由智晓科创整理发布,聚焦科技、数码、互联网行业前沿动态。

核心内容
北京时间5月17日晚间,人工智能巨头OpenAI正式对外发布了旗下最新大语言模型产品GPT-5o Mini,这也是GPT-5o系列推出后的首个轻量化版本,引发了全球科技行业的广泛关注。
根据OpenAI官方公布的参数,GPT-5o Mini在保持了GPT-5o 92%的核心能力的基础上,将推理成本大幅降低了70%,单token响应成本仅为0.00003美元,相比前代GPT-4o Mini下降了60%。同时,模型体积压缩到了只有12B参数,首次实现了在中端手机端的本地离线运行,延迟低于200ms,完全可以满足日常问答、文本生成、轻量代码编写等场景需求。
OpenAI CEO Sam Altman在发布会上表示:“轻量化模型的普及,将真正让AI能力触达每一个普通用户,我们预计到2026年底,将有超过10亿台移动设备内置运行本地大模型,彻底改变用户和智能设备的交互方式。”
除了成本和体积优势外,GPT-5o Mini还新增了多模态实时交互能力,支持最高1080P 30帧的视频输入理解,同时语音响应 latency 降低到了80ms,完全可以替代传统的语音助手实现自然对话交互。
目前OpenAI已经向所有付费用户开放了GPT-5o Mini的API调用权限,同时免费用户也可以在ChatGPT网页端和移动端体验该模型,后续还将开放模型微调接口,允许企业用户根据自身场景定制轻量化专有模型。
行业分析师普遍认为,GPT-5o Mini的发布将进一步挤压中小大模型厂商的生存空间,通用大模型市场的马太效应将进一步凸显,未来中小厂商将更多转向垂直领域模型、专用场景模型的研发,与通用大模型厂商形成差异化竞争。



