当前位置：首页 > news >正文

Prompt Tuning：轻量级微调与反向传播揭秘

news 2025/10/31 5:31:48

Prompt Tuning 损失函数与反向传播原理解析

在Transformers中，Prompt Tuning是一种轻量级参数高效微调方法，其核心思想是只训练额外添加的提示词向量(prompt embeddings)，而冻结预训练模型的主体参数。

损失函数设计

Prompt Tuning的损失函数与标准的语言模型训练类似，主要基于交叉熵损失：

对于生成任务（如文本生成、摘要）：
```
L = -1/N ∑ log P(y_i | [P;x])
```
其中[P;x]表示原始输入x前拼接上可训练的提示P，y_i是目标词，N是序列长度。
对于分类任务（如情感分析、文本分类）：
```
L = - ∑ y_true * log(softmax(cls([P;x])))
```
其中cls()表示取[CLS]标记的输出，y_true是真实标签分布。

反向传播机制

Prompt Tuning的反向传播有两个关键特点：

参

http://www.dtcms.com/a/209240.html

相关文章：

el-dialog 组件多层嵌套被遮罩问题

每日Prompt：虚拟世界游

【笔记】JetBrains 数据迁移与符号链接操作

Halcon计算点到平面的距离没有那么简单

【Oracle】创建公共数据连接

分布式事务之Seata

【MATLAB代码】扩展卡尔曼滤波估计pmsm的位置误差

如何评估物联网框架的交互体验？

五分钟图解Diffusion扩散模型

Qt 的多线程

JVM—Java对象

Vue3中reactive响应式使用注意事项

港口危货储存单位主要安全管理人员考试题

Android正则表达式

技术文档：SINAMICS S120 变频器搭配 GRJ9000S 系列 EMC 电源滤波器

教育行业课件共享难题：大文件分发效率优化方案

【Java高阶面经：消息队列篇】22、消息队列核心应用：高并发场景下的解耦、异步与削峰

龙虎榜——20250523

继续对《道德经》第57章至第81章进行数学形式化建模

今日打卡，Leetcode第四题：寻找两个正序数组的中位数，博主表示就会sorted

若依 Plus 自定义字典的使用

如何设置名称服务器

2025年5月软考系分论文预测

【解决】GIT空文件夹不被追踪导致的分支污染

大疆制图跑飞马D2000的正射与三维模型

PETR- Position Embedding Transformation for Multi-View 3D Object Detection

从渗透测试角度分析 HTTP 数据包

【前端】Bun：快速上手

WebStorm 高效快捷方式全解析

⽂件上传⿊名单限制绕过方法