2026年Q2科技圈重磅:OpenAI GPT-5o Mini正式上线,推理成本直降70%
北京时间5月18日凌晨,OpenAI官方正式对外发布GPT-5o系列轻量化版本GPT-5o Mini,这是继今年3月GPT-5o上线后,OpenAI针对中小开发者和消费级场景推出的重磅产品,定价较原版本降低70%,引发行业广泛关注。

核心参数升级:更小体积更强性能
根据OpenAI官方公布的参数,GPT-5o Mini参数量仅为原版GPT-5o的1/8,但在多模态理解、代码生成、逻辑推理等核心能力上达到了原版92%的水平。尤其在实时语音交互场景下,响应延迟从原来的800ms降低至200ms,完全满足移动端、智能硬件等低功耗设备的部署需求。
OpenAI技术负责人在发布会上表示,本次优化主要得益于全新的稀疏注意力架构和量化压缩技术,在不损失核心能力的前提下实现了体积和算力需求的大幅下降,“这是大模型走向消费级硬件的关键一步,未来你家里的智能音箱、手表、甚至家电都能运行本地版的GPT-5o Mini”。
定价策略调整:开发者成本大幅降低
定价方面,GPT-5o Mini的API调用价格为每百万输入token 0.15美元,每百万输出token 0.6美元,相比原版GPT-5o的0.5美元/2美元的定价直接降低了70%。同时OpenAI还针对月调用量超过10亿token的企业客户提供最高30%的额外折扣,进一步降低了大模型应用的落地门槛。
国内多家AI应用开发商已经第一时间宣布接入GPT-5o Mini,包括字节跳动、百度等企业均表示将在旗下的智能助手、内容生成工具中优先使用该模型,预计相关产品的用户体验将在未来1-2个月内完成迭代升级。
行业影响:AI普惠时代加速到来
行业分析师普遍认为,GPT-5o Mini的发布标志着大模型产业正式从“比拼能力”进入“比拼成本”的新阶段。随着推理成本的持续下降,未来AI能力将像水电一样成为公共基础设施,大量中小开发者和传统行业都能以极低的成本用上先进的AI能力,进一步推动全行业的数字化转型。
值得关注的是,OpenAI同时宣布将在今年Q3开放GPT-5o Mini的本地部署授权,允许企业和开发者在自有服务器甚至边缘设备上部署模型,这一举措也将大幅缓解用户的数据安全顾虑,进一步拓展大模型的应用场景。



