当前位置: 首页 > news >正文

HuggingFace常用加载模型方法

模型加载类适用任务描述适用类型
AutoModelEmbedding、Transformer架构模型用于加载基础的 transformer 模型(如 BERT、RoBERTa、DistilBERT 等),适合提取文本的 embedding 向量。适用于 Embedding 任务,文本表示。
AutoModelForSequenceClassification文本分类加载预训练的 transformer 模型,适用于文本分类任务。LLM(用于分类任务)。
AutoModelForTokenClassification实体识别(NER)用于命名实体识别等任务,加载适合 token 分类的模型。LLM(用于 token 级别的任务)。
AutoModelForQuestionAnswering问答任务用于加载问答模型,基于 transformers 架构,适合回答给定文本中的问题。LLM(用于问答任务)。
AutoModelForCausalLM文本生成(Causal LM)用于加载自回归的语言模型(如 GPT-2),适合用于文本生成任务。LLM(用于生成任务)。
AutoModelForMaskedLM掩码语言模型(MLM)用于加载掩码语言模型(如 BERT、RoBERTa),适合用于填充缺失的文本部分。LLM(用于填充缺失词)。
AutoModelForSeq2SeqLM序列到序列任务(如翻译)用于加载序列到序列的模型(如 T5、BART),适合用于翻译、摘要等任务。LLM(用于序列到序列任务)。

相关文章:

  • RabbitMQ 中的六大工作模式介绍与使用
  • Spring IoC 注解式开发全解析
  • linux netlink实现用户态和内核态数据交互
  • 什么是多租户系统
  • 实战探讨:为什么 Redis Zset 选择跳表?
  • UDP / TCP 协议
  • 机器学习入门-线性回归模型/损失函数/梯度下降
  • Java SE(7)——类和对象(二)
  • 深入解析 SqlSugar 与泛型封装:实现通用数据访问层
  • 4.29-4.30 Maven+单元测试
  • Spring MVC @RequestBody 注解怎么用?接收什么格式的数据?
  • 数据赋能(208)——质量管理——及时性原则
  • 单细胞测序数据分析流程的最佳实践
  • 旋转矩阵公式理解
  • Learning vtkjs之PolyDataNormals
  • Android Compose 中 Side Effects 和 State 相关的 API 使用
  • Python datetime库的用法 Python从入门到入土系列第3篇-洞察标准库DateTime
  • 第九章:反击的序曲(续)
  • 优化01-统计信息
  • Space Engineers 太空工程师 [DLC 解锁] [Steam] [Windows]
  • 86岁书画家、美术教育家、吴昌硕嫡裔曾孙吴民先离世
  • 中演协:五一假期全国营业性演出票房收入同比增长3.6%
  • 郑州一街道被指摊贩混乱经营,12345热线:已整治并加强巡查
  • 躺着玩手机真有意思,我“瞎”之前最喜欢了
  • 新华社:赵心童世锦赛夺冠,中国书写斯诺克运动新历史
  • 南京明孝陵石兽遭涂鸦“到此一游”,景区:已恢复原貌,警方在排查