当前位置: 首页 > news >正文

【代码模板】从huggingface加载tokenizer和模型,进行推理

【代码模板】从huggingface加载tokenizer和模型,进行推理

from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline# 1. 加载 tokenizer 和模型
tokenizer = AutoTokenizer.from_pretrained("PowerInfer/SmallThinker-3B-Preview", use_fast=True, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("PowerInfer/SmallThinker-3B-Preview", torch_dtype="auto", trust_remote_code=True)# 2. 创建文本生成/问答管道
qa_pipeline = pipeline("text-generation",         # 对于简单问答也可以用 text-generationmodel=model,tokenizer=tokenizer,device=0                   # 如果有 GPU,改成对应的 GPU id;没有的话删掉这一行
)# 3. 生成回答
question = "什么是激活稀疏性(activation sparsity)"
prompt = f"问:{question}\n答:"
result = qa_pipeline(prompt,max_new_tokens=256,do_sample=True,           # 设为 greedy 解码;你可以改为 True 并加 top_k/top_p 来更丰富eos_token_id=tokenizer.eos_token_id
)
print(result[0]["generated_text"])

相关文章:

  • WebRTC 中 ICE 流程优化:SRS 轻量级部署与 NAT 类型检测实战
  • 工控类UI设计经常接触到10.1寸迪文屏
  • 【CSS position 属性】static、relative、fixed、absolute 、sticky详细介绍,多层嵌套定位示例
  • 群晖NAS是否有专业的安全防护措施?是否支持无密码登录?
  • 【JavaEE】-- HTTP
  • 各数据库字段类型统计
  • CentOS7下的集群化部署
  • C语言数据结构笔记5:Keil 编译器优化行为_malloc指针内存分配问题
  • F5 BIG IP show running config
  • MSSQL 订阅和发布主从库
  • Vim 删除命令完整学习笔记
  • Vim 光标移动命令总览
  • 【部署】使用华为云容器化部署Java项目指南
  • 统计学核心概念与现实应用精解(偏机器学习)
  • 第1章信息化知识归纳总结补充内容
  • Android 应用开发概述与环境搭建指南
  • 微信小程序抓包(burp + proxifier)
  • DBSyncer:一款开源的数据同步工具
  • 重会python爬虫学习----1
  • 【OSG学习笔记】Day 18: 碰撞检测与物理交互
  • 免费空间测试网站/黑帽seo365t技术
  • 推广公司网站有哪些方式/河南关键词排名顾问
  • 北京网站关键词/搜索营销
  • 微信企业网站 源码下载/优化法治化营商环境
  • 不用花生壳做网站服务器/关键词搜索量全网查询
  • 苏州实力做网站公司/排名首页服务热线