当前位置: 首页 > wzjs >正文

南京成旭通网站建设公司怎么样做蛋糕视频教学网站

南京成旭通网站建设公司怎么样,做蛋糕视频教学网站,河南做网站找谁,wordpress 输入表单一、上下文学习 上下文学习强调在学习过程中考虑问题所处的上下文环境。 1.1 上下文学习的分类 零样本(Zero-Shot)上下文学习单样本(One-Shot)上下文学习少样本(Few-Shot)上下文学习 1.2 示例选择方法 …

一、上下文学习

上下文学习强调在学习过程中考虑问题所处的上下文环境。

1.1 上下文学习的分类

  • 零样本(Zero-Shot)上下文学习
  • 单样本(One-Shot)上下文学习
  • 少样本(Few-Shot)上下文学习

1.2 示例选择方法

两个主要依据是相似性和多样性

  • 直接检索:然后选取排名靠前的K个示例。
  • 聚类检索:把所有示例划分为K个簇,从每个簇中选取最为相似的示例,获取K个示例。
  • 迭代检索:下一个示例的选择依赖于当前的问题和已选择的示例。

1.3 性能影响因素

  • 预训练数据:领域丰富度、任务多样性、训练数据的分布
  • 预训练规模:模型参数规模
  • 演示示例:示例的数量和顺序

二、思维链

2.1 两种任务类型

(1)System-1任务

  • 依靠直觉和经验进行瞬间判断。
  • 随着规模(参数量、训练数据、算力)变大,模型性能显著提升。

(2)System-2任务

  • 运用逻辑分析、计算和有意识的思考来解决。
  • 模型会出现“Flat Scaling Curves”现象——即模型规模增长未带来预期性能提升。

2.2 思维链的定义

在提示中嵌入一系列中间推理步骤,引导大模型模拟人类解决问题时的思考过程,以提升模型处理System-2任务的能力

2.3 思维链的分类

在标准COT方法上,出现了许多扩展方法,这些方法按照其推理方式的不同,可以归纳为三种模式:按部就班、三思而行、集思广益

按部就班模式

强调逻辑的连贯性和步骤的顺序性

代表方法:

  • COT:手工构造(费时费力例子,作为示例放入Prompt,引导模型一步一步推理。
  • Zero-Shot COT:无需手工标注,只需提供简单的提示,如“Let's think step by step”,引导模型自行生成一条推理链。

魔法咒语:Let's think step by step.

  • Auto COT:聚类算法自动筛选相关样本,Zero-Shot生成思维链内容作为示例,引导大语言模型生成针对用户问题的推理链和答案。

不足:

  • 局部:在思维过程中不会探索不同的后续内容,即树的分支。
  • 全局:顺序链式输出,不存在回溯的过程。

三思后行模式

强调审慎和灵活

代表方法:

  • Tree of Thoughts(TOT):将推理过程构造为一棵思维树,允许模型在不确定时进行回溯重新选择。TOT从拆解、衍生、评估、搜索四个角度构造思维树。

  • Graph of Thoughts(GOT)

集思广益模式

强调观点和方法的多样性。

代表方法:

  • Self-Consistency:引入多样性的推理路径,从中提取并选择最一致的答案。

  • Universal Self-Consistency:利用LLMs自身选择最一致答案,支持更多种任务,无需答案提取过程。


三、Prompt工程

3.1 Prompt规范

编写规范的Prompt是与大语言模型进行有效沟通的基础。一个标准规范的Prompt通常由任务说明、上下文、问题、输出格式这几个部分中的一个或几个来组成。

3.2 Prompt技巧

  • 复杂问题拆解
  • 追问
  • 适时使用COT
  • 善用心理暗示:角色扮演or情景代入

3.3 Prompt工程应用

可以通过精心设计的Prompt激活大语言模型的内在潜力,而不需要对模型进行微调。Prompt已经在垂域任务、数据增强、智能代理等多个领域发挥出卓越性能。

(1)自然语言接口

  • Text to SQL
  • 代码生成

(2)大模型支撑的数据合成

  • Self-Instruct

(3)大模型增强的搜索引擎

(4)大模型赋能智能体

经典的智能体通常由大语言模型和四大模块组成,分别是:配置模块(Profile)、记忆模块(Memory)、计划模块(Planning)、行动模块(Action)。

单智能体仅包含一个智能体,交互相对简单,适用于简单任务。Prompt设计主要用于引导模型执行特定任务,且围绕单个上下文。

多智能体包含多个智能体,每个智能体都设定有角色和任务,交互复杂度高。他们协调、合作、竞争,以实现共同或各自目标。

(5)大模型驱动的具身智能

大语言模型是AGI的智慧引擎,机器人是大语言模型走向真实世界的物理载体。


四、参考

bilibili:浙江大学-大模型原理与技术

http://www.dtcms.com/wzjs/817756.html

相关文章:

  • 广东官网网站建设价格wordpress 搜索框鼠标点击无效_需要按键盘回车
  • 个人网站的设计论文建设部网站中淼工程有限公司
  • 长安镇网站建设公司单页网站欣赏
  • 企业网站需要哪些模块平台网站很难做
  • 安徽平台网站建设制作给宝宝做衣服网站好
  • 网站附件做外链全案品牌策划公司
  • 商业网站建设方案百度seo优化分析
  • 温州网站改版哪家好深圳外贸公司电话
  • 这样建立自己的网站自学网站建设视频
  • 彩票网站开发的风险wordpress夏天的风
  • 有帮人做网站的人吗有没有什么网站做兼职
  • 孝感网站seo怎么做网站步骤
  • 网站主机一个g网站多久备案一次吗
  • 郑州高端网站定制建设佛山网站建设专业品牌
  • 南京网站优樱化网络部署方案
  • 阿里巴巴网站建设的目的宁波网站设计推广培训班
  • 无锡网站建设高端旅游公司网站难做吗
  • 室内设计奖项有哪些湖南seo服务电话
  • 陕西网站建设报价注册公司需要多久
  • 网站开发公司员工叫什么名字gzip 网站
  • 自己建网站买玩具品牌vi设计包括什么
  • 文化传播集团网站建设asp网站做文件共享上传
  • swing做网站产品设计品牌有哪些
  • 互联网做网站地推启信聚客通网络营销策划
  • 录音转文字网站开发简单的网页设计
  • c 网站开发技术网站空间150m
  • 江门网站推广优化什么网站利于优化
  • 淄博桓台网站建设定制手机app开发制作多少钱
  • 网站建设的拓扑结构宁波seo快速优化平台
  • 在哪里找人做公司网站域名备案做电影网站