当前位置：首页 > news >正文

【代码模板】从huggingface加载tokenizer和模型，进行推理

news 2025/9/24 3:28:18

【代码模板】从huggingface加载tokenizer和模型，进行推理

from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline# 1. 加载 tokenizer 和模型
tokenizer = AutoTokenizer.from_pretrained("PowerInfer/SmallThinker-3B-Preview", use_fast=True, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("PowerInfer/SmallThinker-3B-Preview", torch_dtype="auto", trust_remote_code=True)# 2. 创建文本生成／问答管道
qa_pipeline = pipeline("text-generation",         # 对于简单问答也可以用 text-generationmodel=model,tokenizer=tokenizer,device=0                   # 如果有 GPU，改成对应的 GPU id；没有的话删掉这一行
)# 3. 生成回答
question = "什么是激活稀疏性（activation sparsity）"
prompt = f"问：{question}\n答："
result = qa_pipeline(prompt,max_new_tokens=256,do_sample=True,           # 设为 greedy 解码；你可以改为 True 并加 top_k/top_p 来更丰富eos_token_id=tokenizer.eos_token_id
)
print(result[0]["generated_text"])

http://www.dtcms.com/a/242429.html

相关文章：

WebRTC 中 ICE 流程优化：SRS 轻量级部署与 NAT 类型检测实战

工控类UI设计经常接触到10.1寸迪文屏

【CSS position 属性】static、relative、fixed、absolute 、sticky详细介绍，多层嵌套定位示例

群晖NAS是否有专业的安全防护措施？是否支持无密码登录？

【JavaEE】-- HTTP

各数据库字段类型统计

CentOS7下的集群化部署

C语言数据结构笔记5：Keil 编译器优化行为_malloc指针内存分配问题

F5 BIG IP show running config

MSSQL 订阅和发布主从库

Vim 删除命令完整学习笔记

Vim 光标移动命令总览

【部署】使用华为云容器化部署Java项目指南

统计学核心概念与现实应用精解（偏机器学习）

第1章信息化知识归纳总结补充内容

Android 应用开发概述与环境搭建指南

微信小程序抓包（burp + proxifier）

DBSyncer：一款开源的数据同步工具

重会python爬虫学习----1

【OSG学习笔记】Day 18: 碰撞检测与物理交互

腾讯开源 AniPortrait：音频驱动的逼真肖像动画生成革命

LeetCode:912归并排序，洛谷：ACM风格

leetcode：42. 接雨水(秒变简单题）

聊一聊 - 如何像开源项目一样，去设计一个组件

Linux系统编程-DAY12

Ubuntu下挂载NTFS格式磁盘

延伸大疆AI能力：Coovally一键训练模型，直通无人机部署

SALOME源码分析: libBatch

[FX5U-PLC] 双重联锁正反转的继电接触控制线路

Matlab点云合并函数pcmerge全解析