当前位置: 首页 > news >正文

如何说课网站建设当地公交建设公司的官网

如何说课网站建设,当地公交建设公司的官网,国家653建筑工程网,网站短链接怎么做涨指标的方法有哪些? 改进召回模型,添加新的召回模型改进粗排和精排模型提升召回,粗排,精排的多样性特殊对待新用户吗,低活用户等特殊人群利用关注,转发,评论这三种交互行为 排序的多样性 精排多…

涨指标的方法有哪些?

  • 改进召回模型,添加新的召回模型
  • 改进粗排和精排模型
  • 提升召回,粗排,精排的多样性
  • 特殊对待新用户吗,低活用户等特殊人群
  • 利用关注,转发,评论这三种交互行为

排序的多样性

精排多样性

  • 精排阶段,结合兴趣分数和多样性分数对物品 iii 排序
    • sis_isi:兴趣分数,即融合点击率等多个预估指标
    • did_idi:多样性分数,即物品 iii 与已经选中的物品的差异
    • si+dis_i+d_isi+di 对物品做排序,这个排序几乎决定了最终用户看到的结果
  • 常用 MRR,DPP 等方法计算多样性分数,精排使用滑动窗口,粗排不使用滑动窗口
    • 精排决定最终的曝光,曝光页面上邻近的物品相似度应该小,所以计算精排多样性要使用滑动窗口,保证同一个滑动窗口内的物品要有足够的差异
    • 粗排要考虑整体的多样性,而非一个滑动窗口中的多样性
  • 除了多样性分数,精排还使用打散策略增加多样性
    • 类目:当前选中物品 iii,之后 555 个位置不允许跟 iii 的二级类目相同
    • 多模态:事先计算物品多模态内容向量表征,讲全库物品聚为 100010001000 类;在精排阶段,如果当前选中物品 iii,之后 10 个位置不允许跟 iii 同属一个聚类。道理是同一类物品的图片和文字应该相似,需要打散

粗排多样性

  • 粗排给 500050005000 个物品打分,选出 500500500 个物品送入精排
  • 提升粗排和精排多样性都可以提升推荐系统的核心指标
  • 根据 sis_isi 对 5000 个物品排序,分数最高的 200 个物品送入精排。之类暂且不考虑多样性分数,将用户最感兴趣的物品送入精排
  • 对于剩余的 4800 个物品,对每个物品 iii 计算兴趣分数 sis_isi 和多样性分数 did_idi
  • 根据 si+dis_i+d_isi+di 对剩余 4800 个物品排序,分数最高的 300 个物品送入精排。这 300 个既是用户感兴趣的,也保证了差异

召回的多样性

双塔模型:添加噪声

  • 双塔模型是最重要的召回模型
  • 用户塔将用户特征作为输入,输出用户的向量表征;然后做 ANN 检索,召回向量相似度高的物品
  • 线上做召回时(在计算出用户向量后,做 ANN 检索之前),往用户向量中添加随机噪声
  • 用户的兴趣越窄(比如用户最近交互的 nnn 个物品只覆盖少数几个类目),则添加的噪声越强
  • 添加噪声使得召回的物品更多样,可以提升推荐系统核心指标。按道理来说添加噪声会使得召回不准,但是很神奇的是可以涨指标

双塔模型:抽样用户行为序列

  • 用户最近交互的 nnn 个物品(用户行为序列)是用户塔的输入
  • 保留最近的 rrr 个物品 (r<<n)(r<<n)(r<<n)
  • 从剩余的 n−rn-rnr 个物品中随机抽样 ttt 个物品 (t<<n)(t<<n)(t<<n),可以是均匀抽样,也可以用非均匀抽样让类目平衡
  • 将得到的 r+tr+tr+t 个物品作为用户行为序列,而不是用全部 nnn 个物品
    • 推荐系统的用户每天可能会刷好几十次,每次都会做召回和排序。每次做召回的时候都会对用户随机行为序列做抽样,这样会让双塔召回的结果有随机性,哪怕同时做两次召回,召回的结果也会有较大差异,即多样性提升
  • 抽样用户行为为什么能涨指标?
    • 一方面:注入随机性,召回结果更多样化
    • 另一方面,nnn 可以非常大,可以利用到用户很久之前的兴趣

U2I2I:抽样用户行为序列

  • U2I2I(user → item → item) 中的第一个 item 是指用户最近交互的 nnn 个物品之一,在 U2I2I 中叫做种子物品
  • nnn 个物品覆盖的类目数教少,且类目不平衡
    • 系统总共有 200 个类目,某用户的 nnn 个物品只能覆盖 15 个类目
    • 足球类目的物品有 0.4n0.4n0.4n 个,电视剧类目的物品有 0.2n0.2n0.2n 个,其余类目的物品数均少于 0.05n0.05n0.05n 个。如果只用 nnn 个种子物品,那么大部分肯定都会召回到足球和电视剧,多样性很差
  • 做非均匀随机抽样,从 nnn 个物品中选出 ttt 个,让类目平衡(想法和效果与用户行为序列抽样类似)
  • 用抽样得到的 ttt 个物品(代替原本的 nnn 个物品)作为 U2I2I 的种子物品
  • 一方面,使类目更平衡,多样性更好。另一个方面,nnn 可以更大,覆盖的类目更多

探索流量

  • 每个用户曝光的物品中有 2%2\%2% 是非个性化的,用作兴趣探索
  • 维护一个精选内容池,其中物品均为交互率指标高的优质物品(内容池可以分人群,比如 30 到 40 岁男性内容池)
    • 既然没有了个性化,就要提高物品质量来吸引用户。用高质量弥补多样性
  • 从精选内容池中随机抽样几个物品,跳过排序,直接插入最终排序结果。
    • 这些物品没有经过用户的交互,大概率会被淘汰掉,所以直接插入
  • 兴趣探索在短期内负向影响核心指标,但长期会产生正向指标
    • 做非个性化的推荐用户大概率不感兴趣,点击偏低,用户不看,2%2\%2% 的流量大部分会被浪费掉。
    • 兴趣探索长期是有利的,可以发掘更多兴趣点更好提升用户留存

总结

在这里插入图片描述

http://www.dtcms.com/a/481796.html

相关文章:

  • 哪里有网站开发服务器西安关键词排名提升
  • npx 与 npm 区别
  • diffusion model(0.5) score-SDE 关于score function与noise的关系
  • leetcode724 寻找数组的中心下标
  • AI用户洞察新纪元:atypica.AI如何重塑商业决策逻辑
  • 彻底解决 Zip4j 解压中文文件名乱码问题(含混合编码与 Mac 特殊情况)
  • 河北农业网站建设公司凡科互动官网登录
  • 企业网站建设的成本构成吉林市网站建设招标
  • git push 报错 push rejected (一文读懂并解决)
  • 从缓存到分库分表:MySQL 高并发海量数据解决方案全解析
  • 苍穹外卖-缓存套餐 Spring Cache day07
  • 垂直电商网站建设方案wordpress主题开发时间
  • 报告工具更新!Word附注一键期末转期初
  • 优化A7M4相机直播图像传输:避免质量损失,实现端到端高保真
  • 平替MongoDB金仓多模数据库在电子证照国产化中的实践与优势
  • AWS WAF 深度体验:全新控制台,开启云原生WAF与CloudFront无缝联防新纪元
  • 【统计字母出现最多次数不分大小写按字典顺序输出】2022-11-9
  • 怎么查自己的网站备案编号本人已履行网站备案信息
  • 电子商务网站建设结论谷歌查询关键词的工具叫什么
  • Ubuntu 安装 SSH,并开启 root 远程登录
  • python学习之路(一)
  • 电源唐大师
  • QT-常用控件(四)-输入类
  • newstar2025 web week1week2题解(少一道)
  • 【C++】vector常用接口的使用
  • ES6 面试题及详细答案 80题 (62-80)-- 类与继承
  • 宁波高质量品牌网站设计厂家网络完全公司排名
  • 网站源码在线提取东莞市网站公司
  • C++中substr()函数详解
  • 乐迪信息:煤矿堆煤隐患难排查?AI摄像机实时监控与预警