当前位置: 首页 > news >正文

【GPT入门】第38课 RAG评估指标概述

这里写自定义目录标题

  • 一、RAG评估指标
  • 二、ragas 评估
  • 三、trulens

一、RAG评估指标

在这里插入图片描述

二、ragas 评估

2.1 ragas介绍

开源地址:https://github.com/explodinggradients/ragas
官方文档:https://docs.ragas.io/en/stable/

从文本生成和文本召回两个维度,进行分析:
在这里插入图片描述
准确性
生成内容的准确性:评估生成的文本是否准确回答了问题,是否与相关知识源的信息一致。例如,在回答历史事件问题时,生成的内容应准确反映事件的时间、地点、人物等关键信息。
检索结果的准确性:考查检索模块能否准确地从知识源中找到与问题相关的信息。比如,当用户询问某一科学理论时,检索系统应能精准定位到包含该理论详细解释的相关文献。
相关性
生成内容与问题的相关性:判断生成的文本与用户提问的主题和意图是否紧密相关。生成的回答不应偏离问题的核心,要围绕问题的关键要点展开。
检索结果与问题的相关性:衡量检索出的知识与问题的匹配程度。检索结果应直接或间接地与问题所涉及的领域、概念等相关,有助于生成准确且相关的回答。

三、trulens

在这里插入图片描述

相关文章:

  • 【办公类-39-07】20250511批量生成通义万相图片(七)彩色背景蝴蝶-筛选无黑无白的图片
  • 【Bluedroid】蓝牙HID DEVICE断开连接流程源码分析
  • 基于Java和高德开放平台的WebAPI集成实践-以搜索POI2.0为例
  • 什么是深度神经网络
  • VirtualBox中安装并运行ubuntu-24.04.2-desktop虚拟机
  • 控制LED灯设备
  • 专题一:汉诺塔问题:递归算法的精妙解析
  • Spring框架(一)
  • OpenResty反向代理
  • 在Java项目中实现本地语音识别与热点检测,并集成阿里云智能语音服务(优化版)
  • 【Part 2安卓原生360°VR播放器开发实战】第四节|安卓VR播放器性能优化与设备适配
  • Redis设计与实现——单机Redis实现
  • iVX 平台技术解析:图形化与组件化的融合创新
  • 信息系统项目管理师-软考高级(软考高项)​​​​​​​​​​​2025最新(十五)
  • 深入剖析缓存与数据库一致性:Java技术视角下的解决方案与实践
  • java的Stream流处理
  • MySql(进阶)
  • macOS 15 (Sequoia) 解除Gatekeeper限制
  • wget、curl 命令使用场景与命令实践
  • 第八讲 | stack和queue的使用及其模拟实现
  • 北洋“修约外交”的台前幕后——民国条约研究会档案探研
  • 新华时评:中美经贸会谈为全球经济纾压增信
  • 科普|“小”耳洞也会引发“大”疙瘩,如何治疗和预防?
  • 金科股份重整方案通过,正式进入重整计划执行环节
  • 母亲节|写给妈妈
  • 《尤物公园》连演8场:观众上台,每一场演出都独一无二