当前位置: 首页 > wzjs >正文

做网站用什么源码最好如何优化网站首页

做网站用什么源码最好,如何优化网站首页,自学做网站需要学会哪些,美食网站页面设计模板上下文学习 定义分类零样本上下文学习单样本上下文学习少样本上下文学习 原因选择相似性多样化 方案直接检索聚类检索迭代检索 随着模型参数规模与训练数据量的持续增长,大语言模型涌现出上下文学习(In-Context Learning,ICL)能力…

上下文学习

  • 定义
  • 分类
    • 零样本上下文学习
    • 单样本上下文学习
    • 少样本上下文学习
  • 原因
  • 选择
    • 相似性
    • 多样化
  • 方案
    • 直接检索
    • 聚类检索
    • 迭代检索

随着模型参数规模与训练数据量的持续增长,大语言模型涌现出上下文学习(In-Context Learning,ICL)能力。该能力,使语言模型无需再针对某个任务特定训练一个模型或者在预训练模型上微调,而是通过上下文,快速适应下游任务。
这种通过页面或者 API 能够及其快速适应下游任务的模式,也被称为“语言模型即服务(LLM as Service)”。

定义

上下文学习(ICL),是一种通过构造特定的 Prompt,使得语言模型理解并学习下游任务的范式。

这个特定的 Prompt,一般包含三部分内容:任务目标、相关演示实例与输出格式,而上下文学习的关键点,也就自然落在了:“如何设计有效的 Prompt,以快速准确的引导模型理解下游任务并生成符合要求的输出”。

可以说,基于以上优点,上下文学习成为提示词工程(Prompt Engineering)中最重要的一环之一,且广泛应用于大模型的各垂类任务中。


分类

在上下文学习中,一个重要的部分就是相关演示实例。如下示例所示 (图3.5 上下文学习示例),通过将示例、目标和格式的结合,形成提示词(Prompt)输入给大模型。
请添加图片描述

  • (a)示例中,使用模型通过情感分析进行分类任务
  • (b)示例中,通过数学运算能力,提供示例使用模型进行生成任务

演示实例这个维度中,按照实例的数量,可以将上下文学习分为多种形式:零样本(Zero-Shot)、**单样本(One-Shot) 以及少样本(Few-Shot)**上下文学习。

零样本上下文学习

又称 Zero-Shot,在该形式中,仅需在提示词中提供 “任务目标”“输出格式”,无需提供任何 “相关示例”。零样本学习完全依赖于大语言模型能力,但经验来看,在处理复杂任务时一般效果不理想。

请添加图片描述

单样本上下文学习

又称 One-Shot,在该形式中,示例中仅需提供一个 “相关示例”,贴合举一反三的人类学习模式,结合 “任务目标”“输出格式”,构成提示词,引导模型生成内容。但单样本学习强依赖于示例相对于任务的代表性,带有主观偏见。

请添加图片描述

少样本上下文学习

又称 Few-Shot,在该形式中,提供少量的 “相关示例”(通常几个到几十个),结合 “任务目标”“输出格式”,显著提升模型在特定任务上的表现。但是,随着示例内容的增加,tokens 的增大,会显著增大大语言模型推理成本,示例的代表性与多样性也会影响最终的生成效果。

请添加图片描述

可以说,上下文学习技术(ICL)的分类,主要依据提供的 “相关示例” 数量。


原因

上下文学习(ICL)技术为何奏效?

斯坦福大学团队于ICLR 2022发表的研究《An Explanation of In-context Learning as Implicit Bayesian Inference》提出了一种上下文学习(ICL)核心机制的想法:该技术本质是通过隐式贝叶斯推理实现的概率建模过程。其有效性源于大语言模型在预训练阶段已从海量文本中内化了丰富的潜在概念,当提供包含示例的上下文提示时,模型能够通过示例间的统计关联快速锚定与当前任务最相关的知识结构,从而将预训练阶段习得的抽象概念转化为具体推理能力,最终实现对目标问题的概率预测与内容生成。

e . g . e.g. e.g. 举例来说,图 3.5 (a) 之所以可以根据内容进行情感分析并完成分类任务,是因为模型在预训练时已接触到充足的情感内容、抽象出了情感概念。而当模型推理时,借助提供的提示词,锚定了情感的相关概念,并基于这些概念,生成问题答案。


选择

那么,如果我们要使用上下文学习方法,提供 “演示示例” 作为提示词内容部分之一,怎样有效提升引导模型的质量,规避示例的主观性带来的偏向以及多样性缺乏带来的影响?

总结来说,“演示示例” 的选择,主要依靠相似性和多样化。

相似性

相似性指挑选出与待解决问题最相关的示例。相似可以从多个维度与层面度量,比如语言层面(关键词匹配、语义相似度),结构的相似性等等。通过选取相似的示例,提供最佳参照,引导模型更精准生成内容。

多样化

多样化要求模型所选示例尽量涵盖广泛的内容以及结果的所有可能。多样化的示例能够帮助模型从不同的角度理解任务,增强模型对某领域的广泛认知,增强解决多种类别结果的能力。

相似性和多样性就类似准确率和查全率,一个要求垂类关联性强,另一个要求覆盖领域内容广。


方案

示例选择的具体方案,有如下三个方案供参考:

  1. 直接检索
  2. 聚类检索
  3. 迭代检索

直接检索

直接检索依据候选示例与待解决问题间的相似性对候选示例进行排序,然后选取排名靠前的 K 个示例。直接检索的代表性方法如 KATE,其主要步骤如下:

  1. 利用 RoBERTa 对待解决问题和候选示例进行编码
  2. 然后通过计算待解决问题编码和候选示例编码间的余弦相似度计算二者相似度
  3. 基于评分选择最高的 K 个示例作为上下文学习的演示实例

请添加图片描述

直接检索方法优点在于简单易操作,但是其未对示例的多样性进行考虑,选择出的示例趋向同质化缺乏多样性。

聚类检索

聚类检索方法通过先聚类后检索的整体方案,来缓解直接检索存在的 “缺乏多样性” 的问题。具体步骤首先会把所有候选示例划分为 K 个簇,然后从每个簇中选取最相似的一个示例。Self-Prompting 是其中的代表性方法,其具体步骤如下:

  1. 首先将候选示例和待解决问题编码成向量形式
  2. 运用 K-Means 算法把示例集合聚为 K 个簇
  3. 依照问题与示例之间的余弦相似度,从每个簇中选取与问题最相似的示例,由此得到 K 个示例

请添加图片描述

聚类检索方法大大改善了直接检索方法存在的缺乏多样性的问题,但势必有一些簇与问题并不相似,由此会侧面影响模型生成内容的准确性。

迭代检索

直接检索和聚类检索在相似性和多样性之间往往顾此失彼。所以为了兼容直接检索的专一和聚类检索的多样,迭代检索应运而生。迭代检索首先挑选与问题高度相似的示例,随后在迭代过程中,结合当前问题和已选示例,动态选择下一个示例,从而确保所选示例的相似性和多样性。RetICL 是迭代检索的代表性方法,具体步骤如下:

  1. RetICL首先根据当前问题初始化基于 LSTM 检索器的内部状态
http://www.dtcms.com/wzjs/363460.html

相关文章:

  • 怎么样网站开源seo为什么要进行外部优化
  • 北京做网站公司有哪些百度搜索排名怎么靠前
  • shopify做国内网站咸阳网站建设公司
  • 论坛网站开发教程网络营销模式有哪些
  • 中国平安网站建设深圳货拉拉
  • 做网站用的背景图微信营销号
  • 吉林松原疫情最新消息seo查询网站是什么
  • 青锐成长计划网站开发人员菏泽资深seo报价
  • 微信公众号微网站建设sem竞价推广代运营
  • 网站建设佛网店运营推广中级实训
  • 工信部网站备案修改公众号推广合作平台
  • web界面模板深圳优化公司义高粱seo
  • 单页网站怎么制作山东seo多少钱
  • 公司网站搜索优化链接购买平台
  • 请人做网站要多少钱最新的销售平台
  • 微信模板图片东莞优化seo
  • 推广公司的新产品英文深圳网站seo哪家快
  • 做电路设计的兼职网站推广普通话手抄报模板
  • 小程序开发天津seo诊断
  • 百度验证网站软文有哪些发布平台
  • 网络科技公司劳动合同天津seo数据监控
  • 天水网站建设博客百度推广代理怎么加盟
  • 做网站 租服务器吗代做seo关键词排名
  • 如何把qq音乐导入到wordpressseo诊断报告
  • 正规制作网站公司哪家好天津网络推广seo
  • 免费解析网站制作亚马逊alexa
  • 网站建设的关键杭州seo公司排名
  • 网站域名如何起深圳产品网络推广
  • 把自己做的网页变成网站排行榜
  • 综合型b2b网站有哪些网页代码大全