当前位置: 首页 > news >正文

【新模型速递】PAI-Model Gallery云上一键部署gpt-oss系列模型

模型介绍

近期,OpenAI 开源了 gpt-oss 系列模型,包含2个尺寸,gpt-oss-120b 和 gpt-oss-20b。

  • gpt-oss-120b 适用于生产环境、通用目的、高推理需求(117B 参数,5.1B 激活参数)
  • gpt-oss-20b 适用于低延迟、本地或特定用途(21B 参数,3.6B 激活参数)

本次开源使用了宽松的 Apache 2.0 License,非常适合实验、定制和商业部署。

阿里云 PAI-Model Gallery 已同步接入 gpt-oss 系列模型,提供企业级部署方案。

PAI-Model Gallery 简介

PAI-Model Gallery 是阿里云人工智能平台 PAI 的产品组件,它集成了国内外 AI 开源社区中优质的预训练模型,涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配,用户可以以零代码方式实现从训练到部署再到推理的全过程,简化了模型的开发流程,为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

PAI-Model Gallery 访问地址:阿里云登录 - 欢迎登录阿里云,安全稳定的云计算服务平台

✅ 零代码一键部署

✅ 自动适配云资源

✅ 部署后开箱即用API

✅ 全流程运维托管

✅ 企业级安全 数据不出域

一键部署 gpt-oss 模型

1. 在 PAI-Model Gallery 模型广场找到 gpt-oss-120b 模型,或通过链接直达该模型:阿里云登录 - 欢迎登录阿里云,安全稳定的云计算服务平台

2. 在模型详情页右上角点击「部署」,在选择计算资源后,即可一键完成模型的云上部署。

3. 部署成功后,在服务页面可以点击“查看调用信息”获取调用的 Endpoint 和 Token,想了解服务调用方式可以点击预训练模型链接,返回模型介绍页查看调用方式说明。

4. 使用推理服务:您可以使用 API 调用模型服务,也可以使用 PAI 平台提供的在线调试功能,此外您还可以使用 PAI 平台提供的 WebUI 界面与模型进行交互。

更多模型支持

PAI-Model Gallery 持续提供开源社区热门模型快速部署、训练、评测实践。

  • 云上一键部署 Qwen3-Coder 模型:【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型
  • 云上一键部署 Kimi K2 模型:【新模型速递】PAI-Model Gallery云上一键部署Kimi K2模型
  • 云上一键部署 Qwen3 全尺寸模型:账号已迁移
  • DeepSeek-R1 推理性能优化版:账号已迁移。推理性能提升,相同时延约束下,吞吐能提升492%;相同吞吐情况下, 首token时延直降86%,token间时延直降69%。
http://www.dtcms.com/a/327614.html

相关文章:

  • 一起来聊聊GPT-5
  • c++的四种类型转换(static_cast,reinterpret_cast,const_cast,dynamic_cast)详解和代码示例
  • 使用pyqt5实现可勾选的测试用例界面
  • B站 韩顺平 笔记 (Day 16)
  • 如何以开发者的身份开发出比python更好的应用软件?
  • 攻击者将Linux摄像头武器化为攻击工具,可注入击键并发动攻击
  • 使用reqwest+select实现简单网页爬虫
  • 《Fast Automatic White Balancing Method by Color Histogram Stretching》论文笔记
  • 小米宠物空气净化器好用吗?希喂/小米/范罗士核心性能深度对比
  • 5G专网项目外场常见业务测试指南(六)-PingInfoView
  • 力扣面试150(54/150)
  • 如何构建PHP表单页面及验证相关原理(PHP基础)
  • 六十、【Linux系统lvs应用】LVS简介 、 LVS-NAT集群 、 LVS-DR集群
  • 微服务ETCD服务注册和发现
  • 3 Abp 核心框架(Core Framework)
  • 过程设计工具深度解析-软件工程之详细设计(补充篇)
  • 数字孪生如何推动智慧园区精细化管理
  • CV 医学影像分类、分割、目标检测,之【皮肤病分类】项目拆解
  • OHEM (在线难例挖掘) 详细讲解
  • 【Vue.js】生产设备规划工具(报价单Word文档生成)【开发全流程】
  • 无人机航拍数据集|第14期 无人机水体污染目标检测YOLO数据集3000张yolov11/yolov8/yolov5可训练
  • etcd 备份与恢复
  • Etcd客户端工具Etcd Workbench更新了1.2.0版本!多语言支持了中文,新增了许多快捷功能使用体验再次提升
  • Spark 运行流程核心组件(一)作业提交
  • 干货分享|如何从0到1掌握R语言数据分析
  • 小红书笔记信息获取_实在智能RPA源码解读
  • 邦纳BANNER相机视觉加镜头PresencePLUSP4 RICOH FL-CC2514-2M工业相机
  • C++实现LINGO模型处理程序
  • Java结课案例-景点人数统计的几种场景
  • 日期格式化成英文月,必須指定語言環境