当前位置: 首页 > news >正文

Prompt Tuning:轻量级微调与反向传播揭秘

Prompt Tuning 损失函数与反向传播原理解析

在Transformers中,Prompt Tuning是一种轻量级参数高效微调方法,其核心思想是只训练额外添加的提示词向量(prompt embeddings),而冻结预训练模型的主体参数。

损失函数设计

Prompt Tuning的损失函数与标准的语言模型训练类似,主要基于交叉熵损失:

  1. 对于生成任务(如文本生成、摘要):

    L = -1/N ∑ log P(y_i | [P;x])
    

    其中[P;x]表示原始输入x前拼接上可训练的提示P,y_i是目标词,N是序列长度。

  2. 对于分类任务(如情感分析、文本分类):

    L = - ∑ y_true * log(softmax(cls([P;x])))
    

    其中cls()表示取[CLS]标记的输出,y_true是真实标签分布。

反向传播机制

Prompt Tuning的反向传播有两个关键特点:

http://www.dtcms.com/a/209240.html

相关文章:

  • el-dialog 组件 多层嵌套 被遮罩问题
  • 每日Prompt:虚拟世界游
  • 【笔记】JetBrains 数据迁移与符号链接操作
  • Halcon计算点到平面的距离没有那么简单
  • 【Oracle】创建公共数据连接
  • 分布式事务之Seata
  • 【MATLAB代码】扩展卡尔曼滤波估计pmsm的位置误差
  • 如何评估物联网框架的交互体验?
  • 五分钟图解Diffusion扩散模型
  • Qt 的多线程
  • JVM—Java对象
  • Vue3中reactive响应式使用注意事项
  • 港口危货储存单位主要安全管理人员考试题
  • Android正则表达式
  • 技术文档:SINAMICS S120 变频器搭配 GRJ9000S 系列 EMC 电源滤波器
  • 教育行业课件共享难题:大文件分发效率优化方案
  • 【Java高阶面经:消息队列篇】22、消息队列核心应用:高并发场景下的解耦、异步与削峰
  • 龙虎榜——20250523
  • 继续对《道德经》第57章至第81章进行数学形式化建模
  • 今日打卡,Leetcode第四题:寻找两个正序数组的中位数,博主表示就会sorted
  • 若依 Plus 自定义字典的使用
  • 如何设置名称服务器
  • 2025年5月软考系分论文预测
  • 【解决】GIT空文件夹不被追踪导致的分支污染
  • 大疆制图跑飞马D2000的正射与三维模型
  • PETR- Position Embedding Transformation for Multi-View 3D Object Detection
  • 从渗透测试角度分析 HTTP 数据包
  • 【前端】Bun:快速上手
  • WebStorm 高效快捷方式全解析
  • ⽂件上传⿊名单限制绕过方法