当前位置: 首页 > wzjs >正文

cms203片自动优化app

cms203片,自动优化app,买服务器做网站,浙江网站建设售后保障目录 3.2 上下文学习3.2.1 上下文学习的定义3.2.2 演示示例选择1)直接检索2)聚类检索3)迭代检索 3.2.3 性能影响因素 3.2 上下文学习 随模型训练数据规模和参数量的扩大,大语言模型涌现出了上下文学习(In-Context Lea…

目录

    • 3.2 上下文学习
      • 3.2.1 上下文学习的定义
      • 3.2.2 演示示例选择
        • 1)直接检索
        • 2)聚类检索
        • 3)迭代检索
      • 3.2.3 性能影响因素


3.2 上下文学习

随模型训练数据规模和参数量的扩大,大语言模型涌现出了上下文学习In-Context Learning,ICL)能力。

其使得语言模型能够通过给定的任务说明或示例等信息来掌握处理新任务的能力。可以快速适应下游任务。为“语言模型即服务”(LLM as a Service)模式奠定了坚实的能力基础。

下面从上下文学习的定义,演示示例选择,影响其性能的因素,对上下文学习展开介绍。

.

3.2.1 上下文学习的定义

上下文学习(In-Context Learning, ICL):

  • 是一种通过构造特定的Prompt,来使得语言模型理解并学习下游任务的范式;

  • 这些特定的Prompt中可以包含演示示例,任务说明等元素。

实现的关键:在于如何设计有效的Prompt,以引导模型理解任务的上下文和目标。

在上下文学习中,Prompt通常包含几个与待解决任务相关的演示示例,以展示任务输入与预期输出。这些示例按照特定顺序组成上下文,并与问题拼接共同组成Prompt输入给大语言模型。大语言模型从上下文中学习任务范式,同时利用模型自身的能力对任务进行作答。

图3.5: 上下文学习示例
在这里插入图片描述

上下文学习依示例数量分为三种形式:

  • 零样本:仅需任务说明,无示例,泛化能力强,但性能依赖模型且可能欠佳。

  • 单样本:提供一个示例,符合人类学习模式,但效果依赖示例代表性。

  • 少样本:提供少量示例(几至十几个),能提升特定任务表现,但增加计算成本。示例的代表性和多样性也将影响其生成效果。

上下文学习有效的原因:

据斯坦福大学研究,可解释为“隐式贝叶斯推理”:大语言模型预训练时学习了文本中的潜在概念;推理时借助示例锚定这些概念,从而预测答案。

.

3.2.2 演示示例选择

在上下文学习中,演示示例对引导大语言模型理解任务至关重要,其内容和质量直接影响学习效果。合理选择示例需依据相似性和多样性:

  • 相似性:挑选与待解决问题最接近的示例,从语言和结构等层面衡量,为模型提供相近参照,助其理解问题。

  • 多样性:确保示例涵盖广泛内容,扩大覆盖范围,使模型从多角度理解任务,增强应对不同问题的能力。

本节主要探讨基于这两个因素,从大量候选示例中选择合适示例的方法。

1)直接检索

直接检索通过计算候选示例与待解决问题的相似性排序,选取前K个示例。

代表性方法KATE利用RoBERTa编码问题和示例,通过向量余弦相似度评分选择最高K个示例。

此方法简单易用,但未考虑示例多样性,可能导致同质化

2)聚类检索

聚类检索通过先聚类后检索来保证示例的多样性,避免直接检索导致的样例趋同。Self-Prompting 是代表性方法,其操作步骤如下:

  1. 将候选示例和待解决问题编码成向量。

  2. 运用 K-Means 算法把示例集合聚为 K 个簇。

  3. 依照问题与示例之间的余弦相似度,从每个簇中选取与问题最相似的示例,得到 K 个示例。

该方法虽提高了示例的多样性,但因部分簇与问题不相似,致所选示例的相似性可能不够高

3)迭代检索

迭代检索通过动态选择示例,在相似性和多样性之间取得平衡。

其流程如下:

  • 初始化检索器内部状态:根据当前问题,基于LSTM检索器初始化内部状态。

  • 选择第一个示例:从候选示例中选择一个与问题高度相似的示例。

  • 更新检索器内部状态:结合问题和已选示例,更新检索器内部状态。

  • 选择下一个示例:根据更新后的状态,从剩余候选示例中选择下一个示例。

  • 重复迭代:重复更新和选择,直到选出k个示例。

RetICL是代表性方法,其根据问题初始化基于LSTM的检索器内部状态,选择示例并不断更新状态,直到得到k个示例。

图3.9: 迭代检索
在这里插入图片描述

.

3.2.3 性能影响因素

除示例选择以外,上下文学习的性能受多种因素影响,包括预训练数据、预训练模型、演示示例等。

1)预训练数据的影响

预训练数据是上下文学习能力的来源,深刻影响其性能,领域丰富度、任务多样性、训练数据的分布特性是影响性能的关键因素。

2)预训练模型的影响

预训练模型对上下文学习性能的影响主要体现在模型参数规模上,参数数量需达到亿级别及以上,模型规模越大,性能越强。此外,模型的架构和训练策略也是影响性能的重要因素。

3)演示示例的影响

已经讨论了演示示例选择对上下文学习的重要性。除此之外,演示示例的格式、输入-标签映射、示例数量及顺序对上下文学习的性能也存在不小的影响。

除上述因素外,Prompt中的任务说明的质量也直接影响上下文学习的效果。

.


其他参考:【大模型基础_毛玉仁】系列文章


声明:资源可能存在第三方来源,若有侵权请联系删除!

http://www.dtcms.com/wzjs/55576.html

相关文章:

  • 电商网站开发岗位职责网络营销工具有哪些?
  • 做彩票网站会被判死刑神马移动排名优化
  • 如何建议一个网站百度seo通科
  • 孝感网站开发找优搏苏州网站制作公司
  • 把网站做进微信公众号网络营销的宏观环境
  • 专业手表网站网络舆情监测专业
  • 公司做英文网站网站制作建设
  • 新品发布会流程策划方案四川seo整站优化吧
  • 眉山网站设计关键词排名推广方法
  • web网站代做营销网站建设教学
  • 做一个好的网站需要什么天津网站排名提升多少钱
  • 网站建设基础问题搜索引擎seo
  • 网站建设 客户免费网站服务器安全软件下载
  • 做交友类网站适合什么cms网站设计专业的公司
  • 河南住房和城乡建设厅职称网站seo三人行网站
  • 想学做网站seo 在哪学 电话多少网络营销ppt模板
  • 如皋网站建设招标广告公司的业务范围
  • 深圳市做网站的企业黄冈网站推广
  • 网站建设的页面要求网络营销做得比较好的企业
  • 2018网站做外链企业网站建设
  • 做网站需要执照嘛如何做网站推广私人
  • 做网站需要模板吗相城seo网站优化软件
  • dw自己做的网站手机进不去济南做seo排名
  • 小程序代理哪家好济宁sem优化软件哪家好
  • 苏州做网站建设公司湖南做网站的公司
  • 网站维护 内容郑州官网关键词优化公司
  • asp 通过ftp 网站搬家t和p在一起怎么做网站
  • 北辰网站建设公司太原网站制作云搜索下载
  • 园林景观设计公司名字谷歌seo关键词优化
  • 自学网站平面设计湖州网站建设制作