2026年Q2科技圈重磅：OpenAI GPT-5o Mini正式上线，推理成本直降70%

北京时间5月18日凌晨，OpenAI官方正式对外发布GPT-5o系列轻量化版本GPT-5o Mini，这是继今年3月GPT-5o上线后，OpenAI针对中小开发者和消费级场景推出的重磅产品，定价较原版本降低70%，引发行业广泛关注。

GPT-5o Mini发布海报

核心参数升级：更小体积更强性能

根据OpenAI官方公布的参数，GPT-5o Mini参数量仅为原版GPT-5o的1/8，但在多模态理解、代码生成、逻辑推理等核心能力上达到了原版92%的水平。尤其在实时语音交互场景下，响应延迟从原来的800ms降低至200ms，完全满足移动端、智能硬件等低功耗设备的部署需求。

OpenAI技术负责人在发布会上表示，本次优化主要得益于全新的稀疏注意力架构和量化压缩技术，在不损失核心能力的前提下实现了体积和算力需求的大幅下降，“这是大模型走向消费级硬件的关键一步，未来你家里的智能音箱、手表、甚至家电都能运行本地版的GPT-5o Mini”。

定价策略调整：开发者成本大幅降低

定价方面，GPT-5o Mini的API调用价格为每百万输入token 0.15美元，每百万输出token 0.6美元，相比原版GPT-5o的0.5美元/2美元的定价直接降低了70%。同时OpenAI还针对月调用量超过10亿token的企业客户提供最高30%的额外折扣，进一步降低了大模型应用的落地门槛。

国内多家AI应用开发商已经第一时间宣布接入GPT-5o Mini，包括字节跳动、百度等企业均表示将在旗下的智能助手、内容生成工具中优先使用该模型，预计相关产品的用户体验将在未来1-2个月内完成迭代升级。

行业影响：AI普惠时代加速到来

行业分析师普遍认为，GPT-5o Mini的发布标志着大模型产业正式从“比拼能力”进入“比拼成本”的新阶段。随着推理成本的持续下降，未来AI能力将像水电一样成为公共基础设施，大量中小开发者和传统行业都能以极低的成本用上先进的AI能力，进一步推动全行业的数字化转型。

值得关注的是，OpenAI同时宣布将在今年Q3开放GPT-5o Mini的本地部署授权，允许企业和开发者在自有服务器甚至边缘设备上部署模型，这一举措也将大幅缓解用户的数据安全顾虑，进一步拓展大模型的应用场景。

来源：OpenAI官方发布会 | 编辑：智晓科创

{{userData.name}}已认证

2026年Q2科技圈重磅：OpenAI GPT-5o Mini正式上线，推理成本直降70%

2026年Q2科技圈重磅：OpenAI GPT-5o Mini正式上线，推理成本直降70%

核心参数升级：更小体积更强性能

定价策略调整：开发者成本大幅降低

行业影响：AI普惠时代加速到来

智晓科创

快捷导航

关注我