重磅！OpenAI 发布开源模型：GPT-OSS，效果媲美 o4-mini

最新推荐文章于 2025-08-23 13:27:51 发布

程序猿DD_

最新推荐文章于 2025-08-23 13:27:51 发布

阅读量429

点赞数 3

CC 4.0 BY-SA版权

文章标签： gpt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/j3T9Z7H/article/details/149998870

开源大模型已经很多没有重磅消息了，没想到睡前看到一直被戏称为CloseAI的OpenAI居然发布了开源大模型：GPT-OSS

模型概述

根据 OpenAI 的官方公告，GPT-OSS 系列包括两个变体：

• GPT-OSS-120B：约 120 亿参数，设计用于高推理需求的生产环境，性能接近 OpenAI 的 o4-mini 模型，可在单块 80GB GPU 上高效运行。
• GPT-OSS-20B：约 20 亿参数，优化为低延迟，适合在 16GB 内存的消费级硬件上运行，性能与 o3-mini 相当，适合本地推理或快速迭代。（这就非常棒了，一张16G显存的消费级显卡还是很容易获得的）

null

这些模型采用混合专家（Mixture-of-Experts）架构，并使用 4 位量化方案（MXFP4），在保持资源使用低的同时实现快速推理。

根据评测数据，GPT-OSS 模型在推理任务上表现出色，特别是在链式推理（Chain-of-Thought）和工具使用方面。例如，GPT-OSS-120B 在核心推理基准测试中接近 o4-mini 的表现，而 GPT-OSS-20B 则适合边缘设备，适用于本地部署或快速原型开发。模型支持可配置的推理努力级别（低、中、高），允许用户根据具体需求和延迟要求进行调整。

此外，该开源模型的另一大亮点是采用了宽松的Apache 2.0许可证，允许广泛的修改和商业用途，无需担心专利风险。

不过这次OpenAI开源的大模型，在评测方面只给出了与自己模型的比较，并没有给出与其他厂商模型的评分对比。但用户可根据其自家模型水平来评估起能力，比如：

• GPT-OSS-120B 接近 o4-mini
• GPT-OSS-20B 接近 o3-mini

用户可根据o4-mini、o3-mini与其他厂商模型的能力对比来评估GPT-OSS-120B与GPT-OSS-20B。

参考资料

• https://openai.com/index/introducing-gpt-oss/
• https://huggingface.co/openai/gpt-oss-120b

推荐阅读

告别微服务，迎接SCS（Self-Contained Systems）

Java 开发玩转机器学习的利器：Tribuo

Spring AI 1.0.0 中文文档

Hibernate中@Formula注解的最佳实践

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。