当前位置: 首页 > news >正文

召回11:地理位置召回、作者召回、缓存召回

GeoHash 召回

属于地理位置召回,用户可能对附近发生的事情感兴趣。GeoHash 是一种对经纬度的编码,地图上每个单位矩形的 GeoHash 的前几位是相同的,GeoHash 编码截取前几位后,将相同编码发布的内容按时间顺序(先是时间更晚的)呈现,还需要经过排序模型的选择。这种方式并没有个性化,从另一个角度来说,用户本就对附近的事有一定的兴趣。

假设你在北京中关村,GeoHash 编码是 wx4g0ec1,那周边几百米范围内的位置可能都是以 wx4g0ec 开头。
所以,如果你想查“附近的人”或“附近的商店”,只要查 GeoHash 以 wx4g0ec 开头的就行。

同城召回

与 GeoHash 召回类似,范围更大,按照当前的城市和以前居住过的城市的内容推荐。

作者召回

用户对关注的作者发布的笔记感兴趣。系统会维护两个索引,一个是关注的作者,另一个是作者发布的笔记,同样是按时间顺序倒排。召回时对用户的 id 查询关注的作者,然后再查找这些作者最新的笔记。

有交互的作者召回

如果用户对某笔记感兴趣(点赞、收藏、转发),那么用户可能对该作者的其他笔记也感兴趣。维护用户交互过的作者的索引,长时间未交互的就删除,维护最近交互过的作者,类似 lru。召回时对用户的 id 查询有交互的作者,然后再查找这些作者最新的笔记。

相似作者召回

和 itemcf 原理类似,如果用户喜欢某作者,那么用户也很有可能喜欢类似的作者。对作者维护相似作者的索引。召回时对用户查询其感兴趣的作者,然后再查询相似的作者,最后返回最新的笔记。例如用户有 n n n 个关注的作者,每个作者有 k k k 个相似的作者,这就会有 n k nk nk 个作者,每个作者都返回其最新的笔记也能有 n k nk nk 篇笔记了。

缓存召回

精排没有被曝光的笔记中排名靠前的,比如前 50,直接丢弃很浪费,缓存起来作为一条召回通道。
会遇到的问题:缓存大小固定,需要退场机制。
退场机制也和 lru 的思想类似。比如一旦笔记成功曝光,就从缓存退场;超过缓存大小移除最早进入的笔记;笔记召回上限为 10 次,一旦超过就退场;笔记最多保存 3 天,超过三天就退场。这些是相对暴力的方法,还有更精细的方法,比如想要多扶持低曝光的笔记可以设置动态的阈值,曝光次数较低的退场时间更长。

相关文章:

  • 【人工智能-agent】--Dify+Mysql+Echarts搭建了一个能“听懂”人话的数据可视化助手!
  • 【Linux系统】从 C 语言文件操作到系统调用的核心原理
  • 校园网规划与设计方案
  • 医院网络安全托管服务(MSS)深度解读与实践路径
  • 学习黑客LAN与WAN详解-网络通信的局域与广域之旅
  • 华为2024年报:鸿蒙生态正在取得历史性突破
  • PCIe数据采集系统
  • 【系统架构师】2025论文《WEB系统性能优化技术》
  • Axure中继器高保真交互原型的核心元件
  • tomcat 400 The valid characters are defined in RFC 7230 and RFC 3986
  • 解锁数据密码:企业数据体系如何开启业务增长新引擎
  • 漏洞修复:tomcat 升级版本 spring-boot-starter-tomcat 的依赖项
  • 使用 TypeScript + dhtmlx-gantt 在 Next.js 中实现
  • 鸿蒙OSUniApp 制作自定义弹窗与模态框组件#三方框架 #Uniapp
  • 使用itextsharp5.0版本来合并多个pdf文件并保留书签目录结构
  • 从AlphaGo到ChatGPT:AI技术如何一步步改变世界?
  • 使用 Apache POI 生成 Word 文档
  • 第 83 场周赛:较大分组的位置、隐藏个人信息、连续整数求和、统计子串中的唯一字符
  • WordPress_Relevanssi Sql注入漏洞复现(CVE-2025-4396)
  • 2025最新ChatGPT Plus令牌(Token)限制完全指南:每日/每月用量详解与突破方法
  • 蒋圣龙突遭伤病出战世预赛存疑,国足生死战后防线严重减员
  • 美国4月CPI同比上涨2.3%低于预期,为2021年2月来最小涨幅
  • “11+2”复式票,宝山购彩者领走大乐透1170万头奖
  • 在对国宝的探索中,让美育浸润小学校园与家庭
  • 年轻小将绽放光芒!中国短跑男女接力队直通东京世锦赛
  • 韩国大选连发“五月惊奇”:在野党刚“摆脱”官司,执政党又生“内讧”