当前位置: 首页 > news >正文

天津网站快速备案外贸网站模板有什么用

天津网站快速备案,外贸网站模板有什么用,校园网站建设宣传,陕西网站建设排名想在自己的硬件上运行OpenAI的GPT-OSS模型?本指南将手把手教你如何用Ollama本地部署GPT-OSS-20B或GPT-OSS-120B,实现离线对话、API调用,甚至连接Agents SDK。 注意:本指南针对消费级硬件(如PC/Mac)运行模型…

想在自己的硬件上运行OpenAI的GPT-OSS模型?本指南将手把手教你如何用Ollama本地部署GPT-OSS-20B或GPT-OSS-120B,实现离线对话、API调用,甚至连接Agents SDK。

注意:本指南针对消费级硬件(如PC/Mac)运行模型的情况。

选择模型

Ollama支持两种规格的GPT-OSS模型:

  • gpt-oss-20b
    • 较小模型
    • 建议≥16GB显存或统一内存
    • 适合高端消费级GPU或苹果M系列芯片
  • gpt-oss-120b
    • 完整大模型
    • 建议≥60GB显存或统一内存
    • 适合多GPU或工作站配置
注意事项:
  • 当前仅提供MXFP4量化版本
  • 显存不足时可卸载到CPU运行(但速度会降低)

快速安装

  1. 安装Ollama → 下载地址
  2. 拉取所需模型:
# 20B版本
ollama pull gpt-oss:20b# 120B版本
ollama pull gpt-oss:120b

开始对话

通过应用或终端启动聊天:

ollama run gpt-oss:20b

Ollama默认采用OpenAI和谐模式的对话模板,直接输入内容即可交流。

API调用

Ollama提供兼容OpenAI的Chat Completions API,无需修改即可使用OpenAI SDK。Python示例:

from openai import OpenAIclient = OpenAI(base_url="http://localhost:11434/v1",  # Ollama本地APIapi_key="ollama"                       # 虚拟密钥
)response = client.chat.completions.create(model="gpt-oss:20b",messages=[{"role": "system", "content": "你是一个助人为乐的AI助手。"},{"role": "user", "content": "解释什么是MXFP4量化?"}]
)print(response.choices[0].message.content)

熟悉OpenAI SDK的用户可无缝切换。也可直接使用Ollama的Python/JavaScript SDK。

工具调用

Ollama支持:

  • 函数调用
  • 内置浏览器工具(应用中)

函数调用示例:

tools = [{"type": "function","function": {"name": "get_weather","description": "获取指定城市当前天气","parameters": {"type": "object","properties": {"city": {"type": "string"}},"required": ["city"]},},}
]response = client.chat.completions.create(model="gpt-oss:20b",messages=[{"role": "user", "content": "柏林现在天气如何?"}],tools=tools
)print(response.choices[0].message)

由于模型通过思维链(CoT)实现工具调用,需将API返回的推理结果反馈给工具调用接口,循环直至获得最终答案。

Responses API 替代方案

目前 Ollama 尚未原生支持 Responses API。

若您希望使用 Responses API,可以通过 Hugging Face 的 Responses.js 代理工具将 Chat Completions 转换为 Responses API 格式。

对于基础使用场景,您也可以运行我们提供的 Python 示例服务器(以 Ollama 为后端)。该服务器仅为基础示例,暂未实现…

pip install gpt-oss
python -m gpt_oss.responses_api.serve \--inference_backend=ollama \--checkpoint gpt-oss:20b

代理SDK集成

想在OpenAI代理SDK中使用gpt-oss?

两种代理SDK都允许您覆盖OpenAI基础客户端,通过聊天补全功能指向Ollama,或使用Responses.js代理本地模型。您也可以使用内置功能将代理SDK指向第三方模型。

  • Python:使用LiteLLM通过LiteLLM代理到Ollama
  • TypeScript:使用AI SDK搭配ollama适配器

以下是使用LiteLLM的Python代理SDK示例:

import asyncio
from agents import Agent, Runner, function_tool, set_tracing_disabled
from agents.extensions.models.litellm_model import LitellmModelset_tracing_disabled(True)@function_tool
def get_weather(city: str):print(f"[debug] getting weather for {city}")return f"The weather in {city} is sunny."async def main(model: str, api_key: str):agent = Agent(name="Assistant",instructions="You only respond in haikus.",model=LitellmModel(model="ollama/gpt-oss:120b", api_key=api_key),tools=[get_weather],)result = await Runner.run(agent, "What's the weather in Tokyo?")print(result.final_output)if __name__ == "__main__":asyncio.run(main())
http://www.dtcms.com/a/458494.html

相关文章:

  • 百度网站关键词wordpress菜单栏改成小写
  • 昆明网站seo诊断互联网公司排名待遇阶梯
  • Rust 中的数组和数组切片引用
  • 洛阳网站建设建站系统懒人建站
  • 模型网站大全免费wordpress drupal
  • .removeClass() 方法详解
  • 免费网站建设制作视频云南旅游网站设计
  • 加盟网官方网站微信小商城怎么开通
  • 微信小程序网站建设定制铜仁市住房和城乡建设部网站
  • 做网站如何赚钱知乎如何免费开个人网站
  • iis虚拟网站古典网站案例
  • 高水平的番禺网站建设网站的内链建设
  • 易语言建设网站点击网络网站
  • 给传销产品做网站黑龙江网站备案管理局
  • 镜像网站能否做google排名网站手机版排名seo
  • 初学者的网站建设在线电子商务网站开发
  • 连云港建设工程安全网站百度自媒体注册入口
  • 公司注册网站有什么好处手机网站最小宽度
  • CSP-S选手学习斜率优化详解
  • 湖州做网站的网站怎么申请百度小程序
  • 站内seo优化wordpress图片集插件
  • 拜师做网站请问做网站需要什么
  • 开源!Vue3 + Nest.js+DeepSeek 开发 AGIC(能豆AI批改助手)
  • 温州cms模板建站用dreammwea怎么做视频网站
  • SK Hynix数据中心存储质量管理案例剖析
  • 网站首页布局风格广告设计公司是做什么的
  • 一键处理AIMD获得MSD并绘图脚本
  • 文化类网站建设深圳网站建设zvge
  • 网站 案例网站开发流程ppt
  • Python 面试常考:浅拷贝与深拷贝的区别详解