当前位置: 首页 > news >正文

OpenAI隆重推出开源大模型:GPT-OSS

2025年8月5日,OpenAI 在 GitHub 同步发布了其最新开源项目 —— GPT‑OSS。这是自 2019 年 GPT‑2 以来,OpenAI 首次公布具备完整参数的语言模型。

项目地址为: https://github.com/openai/gpt-oss

本次发布包含两个版本:

  • gpt‑oss‑120b:1200 亿参数,支持单张 80GB GPU 运算;

  • gpt‑oss‑20b:200 亿参数,可在消费级设备(16GB 内存以上)本地运行。

模型名称

层数

总参数量

每个令牌的活跃参数

总专家数

每个令牌的活跃专家数

上下文长度

GPT-OSS-120B

36

1170亿

51亿

128

4

12.8万

GPT-OSS-20B

24

210亿

36亿

32

4

12.8万


🧠 模型定位

OpenAI 将 GPT‑OSS 定义为 “开放权重推理模型”(open-weight reasoning models),强调以下特性:

  • 支持链式推理(Chain-of-Thought)

  • 可在本地离线运行

  • 可进行微调(fine-tuning),但不包含原始训练数据

  • 不提供训练代码,因此不属于完全开源

模型使用 Apache 2.0 许可证发布,允许商用。


📊 性能表现

根据 OpenAI 提供的内部评估数据:

  • gpt‑oss‑120b 在推理、编程、数学任务中表现与 o4‑mini 接近;

  • gpt‑oss‑20b 表现与 o3‑mini 接近,适用于中小规模部署。

Gpt-oss-120b 在竞赛编程 (Codeforces)、通用问题解决 (MMLU 和 HLE) 以及工具调用 (TauBench) 方面表现优于 OpenAI o3‑mini,并与 OpenAI o4-mini 持平或超越其性能。此外,它在健康相关查询 (HealthBench⁠) 和竞赛数学 (AIME 2024 和 2025) 方面表现得比 o4-mini 更好。尽管 gpt-oss-20b 的规模较小,但在这些相同的评估中,它与 OpenAI o3‑mini 持平或超越后者,甚至在竞赛数学和医疗方面表现得更好


📌 行业背景

当前,Meta(LLaMA)、Mistral、DeepSeek 等公司持续推进开源语言模型,OpenAI 长期坚持闭源政策。此次发布被业内视为其策略上的重要转向,有望在开源生态与产业实践之间寻求更平衡的发展路径。

http://www.dtcms.com/a/317579.html

相关文章:

  • 面试题:基础的sql命令
  • Java NIO
  • 从 LinkedIn 到 Apache:Kafka 的架构设计与应用场景
  • 【25-cv-08899/08985】Lisa Audit 23张版权画作暴雷,Keith律所双案并发冻结跨境店铺!
  • Numpy科学计算与数据分析:Numpy入门之多平台安装与基础环境配置
  • Python 自动化与 Web 应用开发详细教案
  • 前端全栈修炼手册:从 Vue3 到工程化的进阶之路
  • Ethereum: 深入Hardhat Console, 我们的智能合约瑞士军刀
  • 微型导轨:智能家居抽屉的智能化应用
  • Text2SQL 智能问答系统开发-spider验证集(三)
  • 线程互斥与同步
  • C语言控制语句练习题1
  • 汽车以太网通信协议——SOME/IP
  • JTAG-SVF文件完整教程
  • 身份证实名认证接口增强联网平台的便利性与安全性
  • Centos上安装Mysql5.7教程
  • 智能提示词引擎的革新与应用:PromptPilot使用全解析
  • Bug 记录:SecureRandom.getInstanceStrong()导致验证码获取阻塞
  • 算法238. 除自身以外数组的乘积
  • 完整的登陆学生管理系统(配置数据库)
  • VSCode git提交记录中文commit显示乱码
  • 碰撞问题的分析
  • OpenAI开源大模型gpt-oss系列深度解析:从120B生产级到20B桌面级应用指南
  • C++实现线程池(3)缓存线程池
  • get请求中文字符参数乱码问题
  • 互联网一线大厂Java面试八股文整理(1000题附答案)
  • MATLAB深度学习之数据集-数据库构建方法详解
  • Leetcode——209. 长度最小的子数组
  • Redis中间件(二):Redis协议与异步方式
  • 用docker的方式快速搭建一个Hive的调测环境