当前位置: 首页 > news >正文

词编码模型和回答问题的LLM是否为同一个; 词编码模型和回答问题模型分开时:需要保证词嵌入维度一致吗

词编码模型和回答问题的LLM是否为同一个

目录

    • 词编码模型和回答问题的LLM是否为同一个
        • 二者为同一模型的情况
        • 二者为不同模型的情况
    • 词编码模型和回答问题模型分开时:需要保证词嵌入维度一致吗
      • 需要保证词嵌入维度一致的原因
      • 特殊情况
    • 豆包采用什么模式
      • 一体化的设计架构
      • 模型的优势

在实际应用里,词编码模型和回答问题的大语言模型(LLM)既可能是同一个,也可能不同

二者为同一模型的情况

以使用单个完整的预训练大语言模型(如 GPT - 3.5、文心一言等)处理问答任务为例。

在这种情形下,该模型自身就集成了词编码功能与问答能力。当输入一个问题时,模型内部首先会进行词编码操作,把输入文本转化为模型能够处理的数值表示,接着利用自身的神经网络架构对这些编码进行处理,最终生成问题的答案。

例如,你向 OpenAI 的 GPT - 3.5 询问“地球的卫星是什么”,
GPT - 3.5 会自动将这个问题文本进行分词、编码等操作,把文字转化为内部的向量表示
然后基于其大规模的预训练知识和神经网络计算,输出“地球的卫星是月球”这样的回答。这里的词编码和回答问题的过程都由 GPT - 3.5 这一个模型完成。

二者为不同模型的情况

在一些复杂的问答系统架构中,会将词编码和问答任务分别交给不同的模型处理。

相关文章:

  • STM32--TIM--函数
  • 【iOS】源码阅读(三)——内存对齐原理
  • 4G与5G网络频率:技术演进与应用场景解析
  • 自动化创业机器人:现状、挑战与Y Combinator的启示
  • XMP-Toolkit-SDK 编译与示例程序
  • WordPress:Locoy.php火车头采集
  • 手持小风扇方案解说---【其利天下技术】
  • 基于SpringBoot和PostGIS的应急运输事件影响分析-以1.31侧翻事故为例
  • nginx性能优化与深度监控
  • C++模板
  • [特殊字符] 深入解析:Go 与 Rust 中的数组与动态集合结构
  • redis bitmap数据类型调研
  • Java的HashMap面试题
  • JavaWeb:MySQL进阶
  • leetcode 141. Linked List Cycle
  • 软考 系统架构设计师系列知识点 —— 黑盒测试与白盒测试(2)
  • 如何做界面自动化工具选择?
  • Leetcode 刷题记录 09 —— 链表第三弹
  • 数据结构--树
  • 精益数据分析(45/126):媒体网站商业模式的深度剖析与挑战应对
  • 高龄老人骨折后,生死可能就在家属一念之间
  • 图集︱“中国排面”威武亮相
  • A股三大股指低收:银行股再度走强,两市成交11920亿元
  • 美英达成贸易协议,美股集体收涨
  • 水利部:山西、陕西等地旱情将持续
  • 阿森纳被打得毫无脾气,回天无力的阿尔特塔只剩嘴硬