当前位置: 首页 > news >正文

rag相关的技术

Text embedding就是将文本转成一组固定维度的向量表示。我们所熟知的word embedding是以token为基本单位,而text embedding则是以文本为基本单位的。

理想的text embedding应该尽可能保留文本的语义信息,相同语义但不同表述方式的文本可以被映射到同一个位置,而不同语义的文本在向量空间应该保持对应的距离。

Text embedding能用来做些什么?它可以用在Classification, Clustering, Pair Classification, Reranking, Retrieval, STS, Summarization, Bitext Mining等任务中。如何评价它的好坏,也可以通过在这些任务的表现来评估。

如何从语言模型中获得Text embedding呢?以目前主流的Transformer-Encoder为例,有以下几种不同方式。

a) 将模型最后一层[CLS]位置的向量表征直接作为句向量。
b) 将模型最后一层[CLS]位置的向量表征,再经过MLP层得到的向量。
c) 将模型最后一层所有位置的向量表征,再经过一个Pooling层得到的向量。(大部分情况下采用的是mean pooling,在有些情况下也会使用max pooling等其他方式)
d) 将模型最后一层所有位置的向量表征,再经过一个Pooling层跟MLP层得到的向量。

rag技术主要原因还是:

1)哪怕是GPT3.5,幻觉依然严重,商业场景(如客服,研究)没法支持,用户满意度可怜。何况客户还要求私有化部署,还没有服务器.

2)客户的问题很多是无法用RAG解决的:

  • 预测类:xxxx2024年会如何?
  • 多跳逻辑类:Elon musk的兄弟是谁?(知识库里只有Elon musk的妈妈,以及妈妈的儿子有谁,导致召回严重失败)
  • 统计类:昨天有多少销售反馈了折扣力度不足的问题?
  • 逻辑推理
  • “太有”良知问题:很多模型都很有良知,无法匹配商业中的无良场景(别笑)。比如GPT会非常忠诚地指出,化妆品里的xx因子是没有经过科学验证的,要谨慎对待。

相关文章:

  • CSS 列表样式学习笔记
  • Spring Security 权限配置详解
  • 【5G-A学习】ISAC通信感知一体化学习小记
  • Elasticsearch搜索引擎 3(DSL)
  • 2025.4.7-2025.4.13文献阅读
  • 「Flutter」Flutter集成Google Ads广告
  • WXJ196微机小电流接地选线装置使用简单方便无需维护
  • 路由策略/策略路由之route-policy
  • 水下塑料垃圾识别分割数据集labelme格式2703张6类别
  • Redis实现签到功能
  • SSM智能排课系统
  • SpringBoot 自定义输出控制台图标
  • ANP协议深度解析:智能体网络协议的演进与革新
  • 完整源码停车场管理系统,含新能源充电系统,实现了停车+充电一体化
  • Java学习手册:Java反射与注解
  • 企业级JDK升级思路分享(一)JDK11升级到JDK17
  • UE5蓝图设置界面尺寸大小
  • 【小工具】定时任务执行器
  • CUDA编程高阶优化:如何突破GPU内存带宽瓶颈的6种实战策略
  • 深入详解MYSQL的MVCC机制
  • 以色列媒体:哈马斯愿意释放部分人员换取两个月停火
  • 美国失去最后一个AAA评级,资产价格怎么走?美股或将触及天花板
  • 美国新泽西客运公司遭遇罢工:40年来首次,35万人受影响
  • 新修订的《餐饮业促进和经营管理办法》公布,商务部解读
  • 最高法、证监会:常态化开展证券纠纷代表人诉讼,降低投资者维权成本
  • 在古老的意大利科莫歌剧院,廖昌永唱响16首中国艺术歌曲