当前位置: 首页 > news >正文

nDCG(归一化折损累计增益) 是衡量排序质量的指标,常用于搜索引擎或推荐系统

nDCG(归一化折损累计增益) 是衡量排序质量的指标,常用于搜索引擎或推荐系统。核心思想是:排名越靠前的高质量结果,对整体评分的贡献越大,但后续结果的贡献会逐渐“打折”。最终通过对比实际排序与理想排序的得分,得到一个0到1之间的值(越接近1,排序越好)。


通俗解释:

假设你搜索“苹果”,搜索引擎返回5个结果。nDCG的作用是:

  1. 给高质量结果加分(比如相关度高的排在前面)。
  2. 给靠后的结果打折(比如第5名的结果即使相关,贡献也变小)。
  3. 对比“实际排序”和“完美排序”的得分,最终给出一个0~1的评分(1表示完美)。

数值举例(假设相关度分3档:0不相关,1一般,2非常相关)

场景:
  • 实际排序:结果的相关度依次为 [2, 1, 2, 0, 1]
  • 理想排序(按相关度从高到低排列):[2, 2, 1, 1, 0]

计算步骤:
  1. 计算DCG(实际排序的得分)

    • 公式:每个结果的增益除以它的位置的对数值(位置从1开始)。
    • 计算:
      DCG = 2/log₂(2) + 1/log₂(3) + 2/log₂(4) + 0/log₂(5) + 1/log₂(6)= 2/1 + 1/1.585 + 2/2 + 0 + 1/2.585≈ 2 + 0.63 + 1 + 0 + 0.39≈ 4.02
      
  2. 计算IDCG(理想排序的得分)

    • 理想排序的DCG即为IDCG:
      IDCG = 2/log₂(2) + 2/log₂(3) + 1/log₂(4) + 1/log₂(5) + 0/log₂(6)= 2/1 + 2/1.585 + 1/2 + 1/2.322 + 0≈ 2 + 1.26 + 0.5 + 0.43≈ 4.19
      
  3. 归一化得到nDCG

    nDCG = DCG / IDCG = 4.02 / 4.19 ≈ 0.96
    

结论:

  • nDCG≈0.96,接近1,说明实际排序接近理想情况。
  • 如果实际排序完全乱序(比如把不相关的结果排第一),nDCG会接近0。

相关文章:

  • FUSE 3.0.0 | 聚合7大直播平台的免费电视直播软件,支持原画清晰度及弹幕、收藏功能
  • 玩转Nginx
  • 电脑重复图片太多?推荐一款开源的图片去重工具ImageContrastTools
  • 鸿蒙 应用开发 项目资源结构及资源访问
  • 数据库12(游标)
  • 2025年-redis(p1-p10)
  • D365 开发环境证书到期替换处理
  • ant-design 表格多选无法显示,选一个选项全部被选中
  • 牛客:AB4 逆波兰表达式求值
  • 启动Hadoop集群及集群效果
  • ai改写智能助手在线润色,高效产出优质文章!
  • Java 数据类型之间的转换入门
  • OpenCV的grabCut算法分割图像
  • Windows结合WSL之ext4.vhdx不断增大问题
  • Unity URP RenderTexture优化(二):深度图优化
  • PCI总线数据采集卡 32路多功能异步模拟量信号采集卡
  • 【C/C++】线程池_学习笔记
  • 6轴、智能、低功耗惯性测量单元BMI270及其OIS接口
  • CrowdStrike推出新型工具防御恶意AI模型与数据窃取
  • 全局事件总线EventBus的用法
  • 奥斯卡新规:评委必须看完影片再投票;网友:以前不是啊?
  • 奈雪的茶叫停“能喝奶茶就不要喝水”宣传,当地市监称不要误导消费者
  • 4月译著联合书单|心爱之物:热爱如何联结并塑造我们
  • 首映|“凤凰传奇”曾毅:拍电影,我是认真的
  • 京津冀“飘絮之困”如何破解?专家坦言仍面临关键技术瓶颈
  • 西湖大学独家回应本科招生走出浙江:经过三年试点,条件成熟