当前位置: 首页 > news >正文

【代码模板】从huggingface加载tokenizer和模型,进行推理

【代码模板】从huggingface加载tokenizer和模型,进行推理

from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline# 1. 加载 tokenizer 和模型
tokenizer = AutoTokenizer.from_pretrained("PowerInfer/SmallThinker-3B-Preview", use_fast=True, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("PowerInfer/SmallThinker-3B-Preview", torch_dtype="auto", trust_remote_code=True)# 2. 创建文本生成/问答管道
qa_pipeline = pipeline("text-generation",         # 对于简单问答也可以用 text-generationmodel=model,tokenizer=tokenizer,device=0                   # 如果有 GPU,改成对应的 GPU id;没有的话删掉这一行
)# 3. 生成回答
question = "什么是激活稀疏性(activation sparsity)"
prompt = f"问:{question}\n答:"
result = qa_pipeline(prompt,max_new_tokens=256,do_sample=True,           # 设为 greedy 解码;你可以改为 True 并加 top_k/top_p 来更丰富eos_token_id=tokenizer.eos_token_id
)
print(result[0]["generated_text"])
http://www.dtcms.com/a/242429.html

相关文章:

  • WebRTC 中 ICE 流程优化:SRS 轻量级部署与 NAT 类型检测实战
  • 工控类UI设计经常接触到10.1寸迪文屏
  • 【CSS position 属性】static、relative、fixed、absolute 、sticky详细介绍,多层嵌套定位示例
  • 群晖NAS是否有专业的安全防护措施?是否支持无密码登录?
  • 【JavaEE】-- HTTP
  • 各数据库字段类型统计
  • CentOS7下的集群化部署
  • C语言数据结构笔记5:Keil 编译器优化行为_malloc指针内存分配问题
  • F5 BIG IP show running config
  • MSSQL 订阅和发布主从库
  • Vim 删除命令完整学习笔记
  • Vim 光标移动命令总览
  • 【部署】使用华为云容器化部署Java项目指南
  • 统计学核心概念与现实应用精解(偏机器学习)
  • 第1章信息化知识归纳总结补充内容
  • Android 应用开发概述与环境搭建指南
  • 微信小程序抓包(burp + proxifier)
  • DBSyncer:一款开源的数据同步工具
  • 重会python爬虫学习----1
  • 【OSG学习笔记】Day 18: 碰撞检测与物理交互
  • 腾讯开源 AniPortrait:音频驱动的逼真肖像动画生成革命
  • LeetCode:912归并排序,洛谷:ACM风格
  • leetcode:42. 接雨水(秒变简单题)
  • 聊一聊 - 如何像开源项目一样,去设计一个组件
  • Linux系统编程-DAY12
  • Ubuntu下挂载NTFS格式磁盘
  • 延伸大疆AI能力:Coovally一键训练模型,直通无人机部署
  • SALOME源码分析: libBatch
  • [FX5U-PLC] 双重联锁正反转的继电接触控制线路
  • Matlab点云合并函数pcmerge全解析