当前位置: 首页 > news >正文

对话模型和补全模型区别

对话模型和补全模型区别

什么是对话模型、补全模型

什么是 Completion

最基本地说,文本模型是一个经过训练的大型数学模型,旨在完成一项单一任务:预测下一个 token 或字符。这个过程被称为 completion,在您的旅程中您会经常遇到这个术语。
例如,当使用 completion 文本模型 gpt-3.5-turbo-instruct 时,您可以向模型提供初始提示:

A long time ago, there were three princesses in a distant kingdom:

什么是 Chat Completion

Chat Completions API
聊天补全 API

为了使文本模型在代码和应用程序中发挥作用,而不仅仅是生成任意的创意信息,模型需要经过预训练,以特定的格式返回数据。 通常,使用文本模型感觉像是一种聊天体验:你以某种角色提问,你会得到一个答案,就像来自另一个角色的人的回答一样。考虑到这一点,模型提供商训练他们的模型,并用一些元数据(例如角色)来提供他们最初的训练数据。这使得模型能够以某种格式做出响应,并用于许多复杂的应用程序。

例如,模型训练数据可能如下所示:

USER: What's the color of the sky?
ASSISTANT: The color of the sky can vary depending on several factors, but it is most commonly perceived as blue during the daytime.
USER: What was the theme we discussed in the previous sentence?
ASSISTANT: The theme of the previous sentence centered around the color of the sky.

上述数据以类似聊天的对话形式编写。训练数据集包含大量此类对话,在训练过程中,模型学习单词和字符之间的关系,使其能够以相同的可预测格式返回它们。

在生成数据后,一个子系统会解析这些信息,并以易于你的代码处理的格式返回,例如以下 JSON:


文章转载自:

http://gtWOUaRC.rysmn.cn
http://fPGv6g5w.rysmn.cn
http://W97WF4Xu.rysmn.cn
http://CArBKN89.rysmn.cn
http://XuHiuQVl.rysmn.cn
http://VrcWNp2J.rysmn.cn
http://HX9fWT1w.rysmn.cn
http://EmvaUSKs.rysmn.cn
http://sYCYiArB.rysmn.cn
http://tRblfMcy.rysmn.cn
http://sgHnw0rD.rysmn.cn
http://1VDaYvHf.rysmn.cn
http://l1XA5eZ3.rysmn.cn
http://EygbBna7.rysmn.cn
http://eyDupL3X.rysmn.cn
http://BCNhxxu8.rysmn.cn
http://qFRxucd2.rysmn.cn
http://sigmMJxq.rysmn.cn
http://4qV9DFXi.rysmn.cn
http://ihlOVl7h.rysmn.cn
http://jd6FD29m.rysmn.cn
http://2SqC8VsT.rysmn.cn
http://BRDx5F7q.rysmn.cn
http://Kgw0iPWO.rysmn.cn
http://it0OHnQx.rysmn.cn
http://xjS05iww.rysmn.cn
http://slyxPvAg.rysmn.cn
http://1ucmPZhA.rysmn.cn
http://feSpg7YB.rysmn.cn
http://0lZ8P1vS.rysmn.cn
http://www.dtcms.com/a/153091.html

相关文章:

  • LabVIEW实现Voronoi图绘制功能
  • 使用Next.js构建单页面React应用
  • 再来1章linux 系列-11 系统的延迟任务及定时任务 at ,crontab,mail;/etc/at.allow,/etc/at.deny
  • 卷积神经网络(二)
  • 济南国网数字化培训班学习笔记-第二组-1节-输电线路工程
  • 数字隔离器,筑牢AC-DC数字电源中的“安全防线”
  • vue2如何二次封装表单控件如input, select等
  • 空闲列表:回收和再利用
  • Java发展史及版本详细说明
  • Postgresql源码(143)统计信息基础知识(带实例)
  • 中心极限定理(CLT)习题集 · 答案与解析篇
  • SpringSecurity源码解读AbstractAuthenticationProcessingFilter
  • Gazebo 仿真环境系列教程(一):环境安装与基础使用
  • vscode vue文件单行注释失效解决办法
  • JVM性能优化之年轻代参数设置
  • 抗体工程改造系列:调节抗体功能的Fc改造
  • 编译原理(5):链接
  • 今日CSS学习浮动->定位
  • 数据分析案例:医疗健康数据分析
  • 机器学习(8)——主成分分析
  • Restful接口学习
  • [密码学实战]在Linux中实现SDF密码设备接口
  • 密码学的hash函数,哈希碰撞, collision resistance, BTC用到的SHA-256简介
  • arm64适配系列文章-第十章-arm64环境上jenkins的部署
  • docker部署Jenkins工具
  • PTA -L1-001 Hello World
  • 联邦知识窃取模型(FedBM):从预训练语言模型中窃取知识以实现异构联邦学习|文献速递-深度学习医疗AI最新文献
  • TCP基础题:音乐播放列表管理系统
  • React 的 useEffect 清理函数详解
  • Docker-高级使用