当前位置: 首页 > news >正文

商城网站哪个公司做的好处网站开发设计需求文档

商城网站哪个公司做的好处,网站开发设计需求文档,网站搭建崩溃,wordpress要钱吗A100本地用transformers推理gpt-oss GPT-oss试用 gpt-oss有两个原生配置是目前(2025-8-8)Ampere系列显卡不支持的,分别是默认的MXFP4量化,以及Flash-attn V3。tranformers推理是比较慢的,可以用于研究模型本身&#x…

A100本地用transformers推理gpt-oss

GPT-oss试用
gpt-oss有两个原生配置是目前(2025-8-8)Ampere系列显卡不支持的,分别是默认的MXFP4量化,以及Flash-attn V3。tranformers推理是比较慢的,可以用于研究模型本身,如果是本地部署,最好用vllm,见三步完成,A100本地vLLM部署gpt-oss,并启动远程可访问api。

下载模型参数到本地

国内用魔塔更快,下载到本地xxxx目录下:

pip install modelscope
modelscope download --model openai-mirror/gpt-oss-120b --local_dir xxxxxx

创建conda环境

conda create -n vllm python=3.12 -ypip install -U transformers 
pip install -U accelerate 
pip install -U torch 
pip install -U kernels

注意到,这里跟官方给的安装步骤不太一样。官方安装多一个triton,里面包含了Triton kernels for MXFP4 compatibility,也就是gpt-oss专用的一个量化技术 MXFP4,这个量化在A100 GPU上是不被支持的。因此不能安装,安装反而会报错。

模型generate推理

相信大家一般用的最多的还是generate推理,这里给个python示例:

from transformers import AutoModelForCausalLM, AutoTokenizermodel_name = "/mnt/models/gpt-oss-120b" # /mnt/models/gpt-oss-20btokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name,torch_dtype="auto", # autodevice_map="auto",attn_implementation="sdpa", # flash_attention_2 sdpa
)messages = [{"role": "system", "content": "Reasoning: low"},{"role": "user", "content": "Explain what MXFP4 quantization is."},
]inputs = tokenizer.apply_chat_template(messages,add_generation_prompt=True,return_tensors="pt",return_dict=True,
).to(model.device)outputs = model.generate(**inputs,max_new_tokens=1024,temperature=0.7
)print(tokenizer.decode(outputs[0]))

其中model_name就是下载的模型参数目录,attn_implementation这里,不能选择flash-attn。因为默认使用flash-attn V3,这不被a100支持,会报错Sinks are only supported in FlashAttention 3,用flash-attn 2也不行,即使是最新release的2.8.2(2025-8-8),也会报错一些参数无法识别。messages的第一行{"role": "system", "content": "Reasoning: low"}用来指定模型思考深度,gpt-oss有三个可选思考深度,但不能关闭。

最后,可以用transformers启动服务,进行终端命令行对话:

transformers serve 
transformers chat localhost:8000 --model-name-or-path /mnt/models/gpt-oss-120b
http://www.dtcms.com/a/485168.html

相关文章:

  • 百度做网站的东莞做网站公司哪家好
  • 福田网站建设联系电话老网站权重低的原因
  • 做网页设计网站有哪些竞价推广sem
  • 宜宾建设网站北滘建网站
  • 喊人做网站需要注意些什么自己做的网站会被黑吗
  • 国外印花图案设计网站移动端有哪些
  • 租用空间做网站做网站对外贸有什么用
  • 跨国网站浏览器网站的题目
  • 泰州市网站建设制作做网站中二级导航链接到一级导航
  • 明年做哪个网站致富网站建设公司哪家好该如何选择
  • 邢台做网站信息找工作的网站平台
  • 网站建设与维护实训网站建设公司名称
  • 张家界网站seo跟黄聪学WordPress主题开发
  • 河南省教育厅官方网站师德建设wordpress 更新翻译
  • 360度街景实景地图下载十堰seo优化方法
  • 外贸营销型建站南京市建设执业资格中心网站
  • 网站统计代码怎么添加大型网站的优化方法
  • 博物馆文化网站建设wordpress 文章管理
  • 网站开发asp 视频企业培训机构排名前十
  • 知名网站建设托管手机商城小程序
  • 网站优化seo方案做游戏网站年入百万
  • 涿州网站建设公司公司起名字大全免费好听
  • 宁波专业做公司网站的科技公司c 视频播放网站开发
  • 适合当手机主页的网站注册网站费属于什么费用
  • 免费的行情网站app软件大全免费拍卖网站模板
  • 做网站的关键技术广州网站开发 英诺科技
  • 杭州哪个网站建设最好中学院新校区建设专题网站
  • 网站文件服务器wordpress同时登录
  • 餐饮食材配送网站开发企划书网页分析工具
  • 建个企业网站需要多久建筑模板是什么东西