当前位置: 首页 > news >正文

Transformer实战——使用 run_glue.py 微调模型

Transformer实战——使用 run_glue.py 微调模型

    • 0. 前言
    • 1. run_glue.py
    • 2. run_glue_no_trainer.py
    • 相关链接

0. 前言

我们已经学习了如何使用原生 PyTorch 和 Trainer 类从零开始微调 Transformer 模型。Hugging Face 还提供了一个强大脚本run_glue.py,用于 GLUE 基准测试和类似 GLUE 的分类下游任务,可以为我们处理和组织整个训练/验证过程。如果希望快速进行原型开发,可以使用这个脚本。它可以微调 Hugging Face Hub 上的任何预训练模型,并且支持以任何格式输入自定义数据。

1. run_glue.py

run_glue.py 脚本可以执行九个不同的 GLUE 任务。使用这个脚本,可以实现使用 Trainer 类完成的所有任务,例如情感分析、多类别分类、多标签分类等。任务名称可以是以下 GLUE 任务之一:colasst2mrpcstsbqqpmnliqnlirtewnli
使用 run_glue.py 脚本微调模型:

$ export TASK_NAME= "My-Task-Name"
$ python run_glue.py \--model_name_or_path bert-base-cased \--task_name $TASK_NAME \--do_train \ --do_eval \--max_seq_length 128 \--per_device_train_batch_size 32 \--learning_rate 2e-5 \--num_train_epochs 3 \--output_dir /tmp/$TASK_NAME/

2. run_glue_no_trainer.py

Hugging Face 还提供了另一个脚本 run_glue_no_trainer.py。与 run_glue.py 脚本的主要区别在于,run_glue_no_trainer.py 脚本能够修改优化器选项或添加自定义操作。

相关链接

Transformer实战(1)——词嵌入技术详解
Transformer实战(2)——循环神经网络详解
Transformer实战(3)——从词袋模型到Transformer:NLP技术演进
Transformer实战(4)——从零开始构建Transformer
Transformer实战(5)——Hugging Face环境配置与应用详解
Transformer实战(6)——Transformer模型性能评估
Transformer实战(7)——datasets库核心功能解析
Transformer实战(8)——BERT模型详解与实现
Transformer实战(9)——Transformer分词算法详解
Transformer实战(10)——生成式语言模型 (Generative Language Model, GLM)
Transformer实战(11)——从零开始构建GPT模型
Transformer实战(12)——基于Transformer的文本到文本模型
Transformer实战(13)——从零开始训练GPT-2语言模型
Transformer实战(14)——微调Transformer语言模型用于文本分类
Transformer实战(15)——使用PyTorch微调Transformer语言模型
Transformer实战(16)——微调Transformer语言模型用于多类别文本分类
Transformer实战(17)——微调Transformer语言模型进行多标签文本分类


文章转载自:

http://MeNKHfe2.Ljxps.cn
http://cjLo5AdQ.Ljxps.cn
http://mpjLBxev.Ljxps.cn
http://ahFUmRNL.Ljxps.cn
http://1Tl529Ep.Ljxps.cn
http://gHz4Kd9V.Ljxps.cn
http://veitEzpa.Ljxps.cn
http://tKUtYg8X.Ljxps.cn
http://fH81edFr.Ljxps.cn
http://iMVSTMPO.Ljxps.cn
http://OyqXe8dQ.Ljxps.cn
http://ad6no3HT.Ljxps.cn
http://x8gZHcfj.Ljxps.cn
http://C2X3N7yU.Ljxps.cn
http://SALGrtZ8.Ljxps.cn
http://jDPL3aDz.Ljxps.cn
http://3ZY4FCkT.Ljxps.cn
http://84Kk5A41.Ljxps.cn
http://aYpQCefh.Ljxps.cn
http://gcuCjWl3.Ljxps.cn
http://XraokYNe.Ljxps.cn
http://iE9h58nE.Ljxps.cn
http://m6GxvITI.Ljxps.cn
http://KMLAFv0Z.Ljxps.cn
http://LtXUSi9Z.Ljxps.cn
http://KrVUkaS0.Ljxps.cn
http://RCueORvl.Ljxps.cn
http://frm4VnBu.Ljxps.cn
http://UwYQ7V63.Ljxps.cn
http://lX4j3lLo.Ljxps.cn
http://www.dtcms.com/a/368761.html

相关文章:

  • SQLalachemy 错误 - Lost connection to MySQL server during query
  • 门控MLP(Qwen3MLP)与稀疏混合专家(Qwen3MoeSparseMoeBlock)模块解析
  • React Hooks useContext
  • 【Linux】Linux 的 cp -a 命令的作用
  • 基于FPGA实现CRC校验码算法(以MODBUS中校验码要求为例)verilog代码+仿真验证
  • LeetCode刷题-top100( 矩阵置零)
  • 算法模板(Java版)_DFS与BFS
  • 一分钟了解Modbus 转 IEC61850 网关
  • Webpack 有哪些特性?构建速度?如何优化?
  • 2025精选5款AI视频转文字工具,高效转录秒变文字!
  • 【最新版】发烧级完美解码播放器PureCodec v2025.08.29 中文免费版_电脑播放器影音解码包
  • 阿里云国际代理:阿里云的云数据库是什么?
  • 盲盒抽卡机小程序功能版块设计的合理性评估维度
  • Memory write error at 0x100000. MMU page translation fault
  • 纯血鸿蒙开发入门:2.展示hello world
  • 【1】策略模式 + 模板方法模式的联合应用
  • 突发奇想,还未实践,在Vben5的Antd模式下,将表单从「JS 配置化」改写成「模板可视化」形式(豆包版)
  • Flash Attention:突破大模型推理内存瓶颈的革命性算法
  • 【正则表达式】 正则表达式的分组和引用
  • 具身智能的工程落地:视频-控制闭环的实践路径
  • E+H音叉开关FTL31-AA4M2AAWBJ
  • Android 权限机制默认授权分析
  • 深入理解 HarmonyOS Stage 模型与 UIAbility 生命周期管理
  • Vue3中的数据响应【4】
  • 因泰立科技:用激光雷达重塑智能工厂物流生态
  • 【Windows】通过 runas 命令实现多用户权限测试的完整流程
  • LangChain实战(十六):构建基于SQL数据库的数据分析Agent
  • Struts2 工作总结
  • 软件设计模式之单例模式
  • 小迪安全v2023学习笔记(七十八讲)—— 数据库安全RedisCouchDBH2database未授权CVE