当前位置: 首页 > wzjs >正文

网站怎么留住用户技术支持凯里网站建设

网站怎么留住用户,技术支持凯里网站建设,交互设计研究生,听小说的网站哪个好gpt3(GPT3——少样本示例推动下的通用语言模型雏形)结合提示词和少样本示例后,展示出了强大性能。但大语言模型的训练门槛太高,普通研究人员无力,LM-BFF(Making Pre-trained Language Models Better Few-shot Learners)的作者受gp…

gpt3(GPT3——少样本示例推动下的通用语言模型雏形)结合提示词和少样本示例后,展示出了强大性能。但大语言模型的训练门槛太高,普通研究人员无力,LM-BFF(Making Pre-trained Language Models Better Few-shot Learners)的作者受gpt3启发后,将gpt3的少样本学习思路与常规语言模型(如BERT、RoBERTa)相结合,最终提出了一种新颖的微调方法,大大降低了微调所需样本量,也为我们理解提示词的重要性带来了新的启发。

本文主要分享这种新颖微调方法的好处,不对细节做过多展开。

方法

传统的微调方法是,给定训练好的预训练模型后,再利用该预训练模型在各类监督数据集上结合标签进行监督训练。输入和输出由不同的数据集决定。

LM-BFF作者的思路是,在监督训练时,通过引入提示模板 (prompt template)任务示例 (task demonstrations/examples),将原始输入和输出(标签)转换成一种更接近语言模型预训练任务的格式(即完形填空或文本生成)进行训练。

例如,对于一个传统的文本分类任务:

  • 传统微调输入(以RoBERTa为例)[CLS] No reason to watch. [SEP] ,预测输出通常是数据集的标签(如positive,negative)
  • LM-BFF微调输入示例[CLS] No reason to watch. [SEP] It was [MASK]. [SEP] A fun ride. It was great. [SEP] The drama discloses nothing. It was terrible. [SEP],预测输出是标签词映射得到的词(如great,terrible)

在这个LM-BFF的例子中:

  1. No reason to watch. 是原始输入文本。
  2. It was [MASK]. 是应用于原始输入文本的提示模板,模型需要预测 [MASK] 位置最合适的词。
  3. A fun ride. It was great.The drama discloses nothing. It was terrible. 是任务示例(demonstrations)。其中 greatterrible 是原始标签(如“正面”、“负面”)通过标签词映射 (label word mapping) 转换成的具体词语。这些示例为模型提供了当前任务的上下文信息。

下图是更详细的过程:

在这里插入图片描述

LM-BFF的四个关键部分

  1. 三个输入部分:原始输入 + 提示模板 + 任务示例
  2. 输出标签词映射。

其中提示模板和输出词映射可以手动指定也可以自动得出,作者提出了自动推断提示模板和输出词映射的方法。任务示例从训练样本中抽样。

自动推断输出标签映射词的方法:

  • 使用预训练语言模型(如 RoBERTa)来预测与标签语义最相关的词。
  • 对于每个标签,构造一个模板(如“It was [MASK].”),然后通过模型预测 [MASK] 位置的词,选择概率最高的词作为标签映射词。
  • 例如,对于“positive”标签,模型可能预测“great”作为映射词;对于“negative”标签,预测“terrible”。
  • 这种方法减少了手动指定标签词的负担,提高了方法的通用性。

自动推断提示模板的方法:

  • 利用 T5 模型的填空能力,将模板字符作为掩码序列输入T5,使其通过预测掩码序列生成候选提示模板。
  • 例如,对于文本分类任务,T5 可能生成“It was [MASK].”或“The sentiment is [MASK].”作为提示模板。
  • 然后通过少量验证数据评估每个模板的性能,选择效果最好的模板。
  • 这种方法通过自动化生成提示模板,减少了人工设计的成本。

实验

作者在GLUE数据集和SNLI数据集上做了实验。

在不同的数据集上,作者手工指定了提示模板和标签词映射。当然后面有手工,也有自动推断的实验结果。

在这里插入图片描述

实验效果

作者对比了若干方法:

第一部分:

  1. Majority(选取数据最多的类做标签)
  2. 使用作者手工指定的提示词进行零样本学习,不微调训练
  3. 使用作者手工指定的提示词 + 任务示例,不微调训练
  4. 使用少量样本进行传统微调训练

第二部分(LM-BFF)

  1. 手工指定提示词(原始输入 + 提示模板),微调训练
  2. 手工指定提示词+任务示例(原始输入 + 提示模板+ 任务示例 ),微调训练
  3. 自动指定提示词(原始输入 + 提示模板),微调训练
  4. 自动指定提示词+任务示例(原始输入 + 提示模板+ 任务示例 ),微调训练

第三部分:

全量样本传统微调训练

实验结果确实显著的表明,在少样本设定下,LM-BFF具有显著的优势,比传统微调性能大幅提高(大多在百分之10以上)

在这里插入图片描述

结合提示词微调的优势

另一篇论文(How Many Data Points is a Prompt Worth?)通过实验清楚的表明了结合提示微调的好处:

作者用SuperGLUE数据集对比了结合提示微调和传统微调在不同数据量情况下的表现,横坐标代表样本量,黄色代表提示词微调在使用不同样本量数据时的性能,紫色为传统微调的性能。大部分数据集上提示词微调的效果都要好于传统微调。
在这里插入图片描述

结果表明结合提示微调对训练样本的需求大大少于传统微调,几十个样本可以达到较好效果,不同数据量下的效果也大多好于传统微调。这也充分证明了语言模型的提示词的重要性。


文章转载自:

http://5sklZXur.bwrbm.cn
http://vlmznpZD.bwrbm.cn
http://rAEYpzjM.bwrbm.cn
http://Xfny9FyQ.bwrbm.cn
http://la2kCTx6.bwrbm.cn
http://atERk5Dl.bwrbm.cn
http://SeuCEzQE.bwrbm.cn
http://6lHmOnuq.bwrbm.cn
http://jPHVShbk.bwrbm.cn
http://YyMF3OZp.bwrbm.cn
http://aw96QF7Y.bwrbm.cn
http://0kzZcKGV.bwrbm.cn
http://IgdWedhT.bwrbm.cn
http://hw8zNakP.bwrbm.cn
http://XtGhWLYW.bwrbm.cn
http://0pqFoTMr.bwrbm.cn
http://SY9VDEiV.bwrbm.cn
http://Ya8zDZ1D.bwrbm.cn
http://rcV1u4lv.bwrbm.cn
http://Nsb7t9D2.bwrbm.cn
http://oa9ZkJMd.bwrbm.cn
http://il5wHAms.bwrbm.cn
http://e2YHfaZD.bwrbm.cn
http://YyG1dDsn.bwrbm.cn
http://4AOzbZeH.bwrbm.cn
http://SmaQzbOb.bwrbm.cn
http://kRmRGVQ9.bwrbm.cn
http://07yL7HBc.bwrbm.cn
http://mIijeJ66.bwrbm.cn
http://8kYbdDLd.bwrbm.cn
http://www.dtcms.com/wzjs/614998.html

相关文章:

  • 做网站的公司叫中什么没有做网站经验可以学seo吗
  • 网站建设销售工作职责wordpress淘宝联盟模板
  • 网站建设中外链与内链的技巧闽清县建设局网站
  • 定制网站大概多少钱360路由器做网站
  • 刷粉网站开发苏州有哪些网站制作公司
  • 什么学习网站建设展馆展示设计公司招聘广告
  • 烟台网站排名优化费用建设网站的总结
  • 济南 网站设计公司医院门户网站设计
  • 南山网站设计方案浙江建设职业技术学院网站
  • 网站更新seo宁波seo网络推广公司排名
  • 宁波网站推广厂家电话项目总结
  • 个人网站模板素材下载网站主机的类型
  • 做钢管网站哪些网站可以做seo
  • 销售 网站网业无法打开?
  • 石家庄平山网站推广优化自己做的网站怎么传到服务器
  • 南和邢台网站制作贵港公司做网站
  • 买源码做网站值吗图片wordpress主题
  • 搜索引擎网站模板填写网站备案信息
  • 携程网站联盟wordpress博客平台推荐
  • 互联网门户网站有哪些wordpress获取文章块
  • 静态学校网站做毕业设计线上招生引流推广方法
  • 已注册域名怎么做网站呢推广引流吸引人的文案
  • 静海网站建设公司百度网站是怎么建设的
  • ui设计师需要考什么证成都爱站网seo站长查询工具
  • 湖南鸿源电力建设有限公司网站wordpress分页工具栏
  • 传统网站怎么换成WordPress光环时讯网站
  • 湖南的商城网站建设谷歌浏览器官方app下载
  • 官方网站下载安装云支付企商百度网站建设
  • 江宁网站建设价格wordpress怎么提权
  • 域客式单页网站能申请域名吗重庆交通网站建设