公众号

关注微信公众号

移动端

创头条企服版APP

商标注册云服务办公孵化推广通双创地图

超DeepSeek和阿里，OpenAI重启开源，奥特曼称要让AI有美国价值观

2025-09-04 17:16 抢发第一评

当地时间周二， OpenAI 宣布，推出了两款全新的开源AI推理模型，能力与此前推出的o系列模型相近。

OpenAI 称，这两款模型在多个公开基准测试中表现出了“顶尖水平”。

“回到我们 2015 年创办公司的初衷，OpenAI 的使命始终是确保通用人工智能（AGI）惠及全人类。因此，我们十分期待全球开发者基于美国创造的、基于我们价值观的开源 AI 堆栈构建技术，让所有人免费使用，造福大众。”OpenAI CEO 山姆·奥特曼说。

这两款模型分别为：

- gpt-oss-120b：规模较大，性能更强，甚至能在单张 Nvidia 显卡上运行。

- gpt-oss-20b：较轻量，甚至可在拥有16GB内存的普通笔记本电脑上运行。

这次发布是 OpenAI 自五年前发布GPT-2以来，首次推出新的“开源”大语言模型。

OpenAI 透露，基于这些开源模型，当其无法单独完成复杂任务，比如处理图片，开发者可以将其与 OpenAI 的闭源模型连接，以获取帮助。

虽然 OpenAI 早期曾开源过模型，但近年来逐渐转向闭源策略，通过API向企业和开发者出售访问权，建立了庞大的商业模式。

最新数据显示，ChatGPT周活跃用户达7亿，较去年增长了4倍。

今年 1 月，OpenAI CEO 山姆·奥特曼表示，在开源问题上，OpenAI 可能“站错了历史的一边”。

4 月，奥特曼在 X 平台预告称，“几个月内发布一款带推理能力的开放权重模型”。

7 月，他再次发文，将该开源模型无限期推迟。

不到一个月，奥特曼“食言”。

但开源模型市场早已时移世易。

截至7月31日，GitHub Trending 前10的模型中，全部都是中国的开源模型。

其中， Qwen一家独占5席位，开源世界半壁江山。智谱GLM-4.5登顶，Air排名第6；混元3D世界模型作为唯二的多模态，排行第3。

作为对比，几乎所有美国 AI 公司都选择了闭源路线，给大模型“上锁”。

Meta 曾是开源 AI 模型领域的领军企业，但其 Llama 系列模型在过去一年已逐渐落后。

7 月30日，马克·扎克伯格在其公开信中写道，“我们将谨慎选择哪些模型继续开源，哪些则不再公开。”

这家曾经的“开源旗手”正式转向，为闭源留出了后门。

就在公开信发布前一周，据《纽约时报》报道，Meta新成立的超级智能实验室已暂停其最大开源模型“Behemoth”的内部测试，原因是“性能未达预期”。

相关阅读：开源旗手扎克伯格“叛变”，Github 前10都是中国AI模型

7 月，特朗普政府呼吁美国 AI 公司，更多地开源技术，推动全球采用符合美国价值观的 AI 技术。

看起来，OpenAI 率先响应了该一号召。

通过推出 gpt-oss，OpenAI 希望赢得开发者和特朗普政府的认可，同时应对来自中国 AI的竞争压力。

OpenAI 称，此次推出的开源模型在性能上已成为同类领先者。

在编程竞赛平台 Codeforces（工具辅助）上：gpt-oss-120b 得分 2622 分；gpt-oss-20b 得分 2516 分。

两款模型表现优于 DeepSeek 的 R1 模型，但低于 o3 和 o4-mini。

（OpenAI 开源模型在 Codeforces 上的表现）

在另一项跨学科测试——Humanity’s Last Exam（工具辅助）中： gpt-oss-120b 得分 19%；gpt-oss-20b 得分 17.3%。

成绩同样不及 o3 模型，但超过了 DeepSeek 和通义千问等现有顶尖开源模型。

（OpenAI 开源模型在 Humanity’s Last Exam 测试中的表现）

值得注意的是，这两款开源模型的“幻觉”（生成虚假信息）问题明显高于最新的闭源模型 o3 和 o4-mini。

OpenAI 表示，这与小型模型知识储备不足、容易产生更多幻觉的预期结果一致。

在 OpenAI 内部用于测试人物相关知识准确性的 PersonQA 基准中：gpt-oss-120b 幻觉率高达 49%；gpt-oss-20b 幻觉率为 53%。

相比之下，早期的 o1 模型仅为 16%，最新的小型闭源模型 o4-mini 为 36%。

训练方法上，OpenAI 表示，开源模型的训练方式与闭源模型类似，都采用了专家混合（MoE）机制，使模型运行效率大幅提升。

例如，拥有 1170 亿参数的 gpt-oss-120b，每次推理实际调用的参数只有 51 亿个。

OpenAI 强调，这些开源模型特别适合用于 AI 智能体，可调用网络搜索、Python 代码执行等工具辅助推理。

但目前它们仅支持文本，无法处理图像或音频。

OpenAI 将新模型以 Apache 2.0 开源许可协议发布，这意味着企业可免费使用甚至商业化，无需取得 OpenAI 授权。

这两款模型此前曾因安全考量多次延迟发布。经测试，新模型在生化攻击等方面的潜在风险略有提升，但并未达到“危险”的能力门槛。

声明：该文章版权归原作者所有，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本网联系。

您阅读这篇文章花了0秒

转发这篇文章只需要1秒钟哦

喜欢这篇 10

评论一下 0

凯派尔知识产权全新业务全面上线

蓝月亮离“中国宝洁”还有多远？

蓝月亮离“中国宝洁”还有多远？

2020-12-18 16:14 抢发第一评

25倍股欧普康视遭实控人减持持股已质押近两成

25倍股欧普康视遭实控人减持持股已质押近两成

2020-12-18 16:35 抢发第一评

极狐阿尔法 T：续航和驾驶体验均衡的北汽新能源之子

极狐阿尔法 T：续航和驾驶体验均衡的北汽新能源之子

2020-12-18 16:38 抢发第一评

沾上疫苗就涨停！常铝股份收关注函：疑似蹭热点配合股东减持

沾上疫苗就涨停！常铝股份收关注函：疑似蹭热点配合股东减持

2020-12-18 16:48 抢发第一评

隆基股份遭股东李春安减持4033万股超计划减持数量

隆基股份遭股东李春安减持4033万股超计划减持数量

2020-12-18 16:53 抢发第一评

评论

试试以这些内容开始评论吧

数据可视化数据可视化数据可视化

登录后发表评论

游客

热文

1

电子电路打样之王——金百泽科技的管理模型解析

最新视频

分众83亿收购新潮，行业忧虑此举或将竖起“高墙”

1.3万次播放

分众83亿收购新潮，行业忧虑此举或将竖起“高墙”

1

yuanbo

重磅嘉宾寄语｜加拿大工程院院士杜如虚为2023中国创交会打Call！

1.7万次播放

重磅嘉宾寄语｜加拿大工程院院士杜如虚为2023中国创交会打Call！

抢发第一评

18600040560

【视频精彩回顾】科技创新与成果转化大会暨聊城概念验证中心合作签约仪式

2.6万次播放

【视频精彩回顾】科技创新与成果转化大会暨聊城概念验证中心合作签约仪式

2

18600040560

最新专题

TOP “科创中国”创新创业联合体

12 68.4万 2

2 2023中国创新创业成果交易会

18 91.9万 4

3 2023阿里云创峰会暨长三角（镇江）数字经济发展高峰论坛

9 82.3万 0

4 科技创新与成果转化大会暨聊城概念验证中心合作签约仪式

8 81.1万 0

5 颂扬中国制造精神，寻访隐形冠军

7 68.3万 0

凯派尔知识产权全新业务全面上线

宁波城市站

金华城市站

热文

1

电子电路打样之王——金百泽科技的管理模型解析

资讯

政策

活动

100特色空间

×

#热门搜索#

精选双创服务

历史搜索清空

创头条是创兴动力旗下的创新创业资讯和企服产品，国家高新技术企业。平台汇聚百万级企业用户，基于企业号、双创地图、政策通、融资报、活动工具、企服市场等产品，提供资讯、数据、线上对接等企业服务，并以路演、产业大赛、峰会、培训、产业对接等方式提供线下赋能服务。

创兴动力

北京| 上海| 杭州| 郑州| 大连| 金华| 石家庄| 邢台| 济南| 深圳| 佛山

关于我们

APP下载

Android & IOS

微信公众号

扫码关注

©2015-2026 创头条版权所有京ICP备15013664号-2

京公网安备 11010802029378号站长统计 RSS

Tel：18514777506

关注微信公众号

创头条企服版APP