当前位置: 首页 > news >正文

推荐系统学习笔记(十)多目标排序模型

用户-笔记的交互

对于每篇笔记,系统会记录:曝光次数/点击次数/点赞次数/收藏次数/转发次数

计算公式:

点击率 = 点击次数/曝光次数

点赞率 = 点赞次数/点击次数

收藏率 = 收藏次数/点击次数

转发率 = 转发次数/点击次数

排序模型融合这些预估分数做排序。

多目标模型

模型结构

场景特征包括用户所在的时间、地点等,比如候选物品在不同的城市、季节以及节假日影响,用户对其有完全不同的兴趣程度

这里的神经网络模型可以根据任务自行选择。

损失函数:

训练

困难:类别不平衡

例如,点击vs未点击,收藏vs未收藏。显然,负样本的数量要远远多于正样本。常见的解决方案是进行负样本降采样(down-sampling):

1. 保留一小部分负样本,让正负样本数量平衡;
2. 减少了负样本数量,节约计算。

预估值校准

在模型输出各个指标预估值之后,需要先进行预估值校准,才能做后续的排序。主要原因在于:

举个例子:

设正样本、负样本数量为  和

真实点击率:(期望)

对负样本做降采样,抛弃一部分负样本。使用  个负样本, 是采样率。

预估点击率:(期望)

由于负样本变少,预测点击率大于真实点击率。

预估值校准就是希望通过函数调整预估值,使得其能与真实值一致,根据上述两个点击率的等式可得对点击率预估值的校准公式为

推导过程如下:

 

 

 

 

 

 

 

 

 

http://www.dtcms.com/a/322882.html

相关文章:

  • “戴着镣铐”的AI推理:中国如何打破算力枷锁,赢得“最后一公里”?
  • Nvidia 开源 KO 驱动学习配置入门
  • 基于51单片机温湿度检测系统无线蓝牙APP上传设计
  • 化工安防误报率↓82%!陌讯多模态融合算法实战解析
  • 【前端八股文面试题】DOM常⻅的操作有哪些?
  • 深入理解对话状态管理:多轮交互中的上下文保持与API最佳实践
  • Linux 中CentOS Stream 8 - yum -y update 异常报错问题
  • 【LLM】Openai之gpt-oss模型和GPT5模型
  • PNPM总结
  • 【SQL进阶】用EXPLAIN看透SQL执行计划:从“盲写“到“精准优化“
  • 如何解决 Vue 项目启动时出现的 “No such module: http_parser” 错误问题
  • AI 边缘计算网关:开启智能新时代的钥匙
  • 爬虫攻防战:反爬与反反爬全解析
  • Node.js特训专栏-实战进阶:22. Docker容器化部署
  • 基于 InfluxDB 的服务器性能监控系统实战(一)
  • 大语言模型提示工程与应用:提示工程-提升模型准确性与减少偏见的方法
  • 【线性代数】线性方程组与矩阵——行列式
  • 强化学习-MATLAB
  • STM32的中断系统
  • 数据分析框架从 “工具堆砌” 转向 “智能协同”
  • java -jar xxx.jar 提示xxx.jar中没有主清单属性报错解决方案
  • PAT 1052 Linked List Sorting
  • 第16届蓝桥杯Scratch选拔赛初级及中级(STEMA)2024年10月20日真题
  • 求和算法的向后稳定性 backward stable
  • 【Python 高频 API 速学 ③】
  • 优化器:SGD、Adam、RMSprop等优化算法对比与机器翻译应用
  • 99-基于Python的京东手机数据分析及预测系统
  • I2CHAL库接口
  • c++ opencv调用yolo onnx文件
  • 用天气预测理解分类算法-从出门看天气到逻辑回归