当前位置: 首页 > wzjs >正文

帮人建网站价格公司网站策划

帮人建网站价格,公司网站策划,如何发布视频赚钱,在哪个网站可做网络夫妻RecSys 2023 代码:iesl/narrative-driven-rec-mint: Mint: A data augmentation method for narrative driven recommendation. 1 intro 尽管基于历史交互的数据能够有效地提供推荐,但用户在请求推荐时,往往只是对目标物品有一个模糊的概念…

RecSys 2023

代码:iesl/narrative-driven-rec-mint: Mint: A data augmentation method for narrative driven recommendation.

1 intro

  • 尽管基于历史交互的数据能够有效地提供推荐,但用户在请求推荐时,往往只是对目标物品有一个模糊的概念,或者希望推荐结果能够根据其使用情境而变化,而这些上下文信息通常在历史交互数据中缺失
    • 用户常常会通过长篇叙述式查询(long-form narrative queries)来描述他们的广泛兴趣和情境,从而请求推荐。这类信息访问任务被称为叙述驱动推荐(Narrative-Driven Recommendation, 简称 NDR)
    • 这类叙述性请求在讨论论坛和某些 Reddit 子版块中非常常见,但现有推荐系统对这种复杂自然语言查询的支持仍然严重不足
  • 相较于传统的搜索接口,用户使用自然语言表达复杂主观需求的情况正在显著增加
  • 具有强大语言理解能力的大语言模型(LLMs)的出现,也为满足此类复杂请求带来了可能
  • 论文探索如何将传统用于协同过滤推荐器训练的历史用户-物品交互数据集,重新利用于支持 NDR 任务

2 问题定义

3 方法

  • 核心思想是重新利用丰富的用户-物品交互数据集 I,借助大语言模型(LLM)生成叙述式查询 qu​,从而构造训练数据
  • 3.1 使用 LLM 生成叙述式查询

  • 为了为用户-物品交互数据集 I中的每位用户生成叙述式查询 qu,使用InstructGPT 模型作为查询生成器 Qgen

  • 将用户与项目交互所得的文本\{d_i\}_{i=1}^{N_u}作为 QGen 的 prompt,并指示模型生成一个叙述式查询

LLM根据用户的偏好和评论,模拟这位用户可能在 Reddit 上发出的请求性帖文

3.2 为合成查询筛选项目

  • 核心意思是:生成出来的叙述式查询(narrative query)可能无法代表用户所有兴趣,所以需要对用户的项目集合进行筛选,只保留那些与生成的查询最相关的项目,来训练检索模型
    • 如果你用用户的全部项目\{d_i\}_{i=1}^{N_u}来训练模型,会加入很多与当前查询无关的项目,这会增加噪声、降低训练效果。
  • ——>

3.3 检索模型训练

  • 基于上述合成数据训练了 bi-encodercross-encoder 两种模型
    • Bi-encoder 通常作为第一阶段排序器,能够从大规模项目集合中高效检索
    • Cross-encoder 则允许更丰富的查询-项目交互,常用于 reranking 阶段。
    • 在这两种模型中均使用了一个参数规模为 110M 的预训练 Transformer 模型 MPNet,其结构类似于 BERT。
  • 在 bi-encoder 中,查询和项目分别编码为高维向量:
    • 通过L2 距离对项目进行排序
  • 在 cross-encoder 中,模型同时接收查询和项目作为输入,输出一个打分:
  • 损失函数
  • 测试阶段
    • 先用训练好的 bi-encoder 检索前 200 个项目,再用 cross-encoder 对其重新排序。
    • 实验中对这两个阶段分别评估,分别命名为 BiEnc-MintCrEnc-Mint

4 实验

4.1 数据

  • 使用Pointrec进行评估
    • 包含 112 个真实的叙述式查询
    • 这些项目由众包工人和/或论坛成员进行了分级相关性标注,并经数据集作者进一步验证
    • 目前这是唯一公开的、带人工标注和候选池的 NDR 测试集
  • 项目集合 CCC 包含约 70 万个 POI,每个 POI 提供元信息(如类别、城市)和从 Bing 搜索引擎抓取的简略描述
    • 仅对与查询相关城市与类别(如“餐厅”)中的候选项目进行排序,遵循先前工作中避免无关项目干扰的做法
  • 使用 Yelp 的用户-物品交互数据生成合成查询用于训练
    • 排除所有评论数少于 10 的用户和 POI,确保所选用户为高活跃度用户
      • 这一筛选步骤参考了用户-物品推荐系统中常见的预处理流程
    • 保留评分平均值大于 3/5 且有 10-30 条高于平均值评论的用户,以偏向那些更擅长表达喜好(而非厌恶)的用户
      • 这些用户的兴趣也更适合通过生成器建模。最终筛选后,Yelp 数据集中保留了 45,193 个用户
    • 从中随机选出 10,000 位用户生成合成查询。对每位用户,我们从其 10 条评论中随机选一句话,组成 prompt
    • 最终生成约 60,000 条训练样本
      • 生成所有查询的成本约为 230 美元

4.2  结果


文章转载自:

http://1AIyRHYu.swkzk.cn
http://YvvL55Cj.swkzk.cn
http://70hpxtpd.swkzk.cn
http://LGpGdEm5.swkzk.cn
http://zNclBtnp.swkzk.cn
http://YfAR93Y3.swkzk.cn
http://2Xnyl9Kc.swkzk.cn
http://Ch44KE55.swkzk.cn
http://NByP5rfZ.swkzk.cn
http://SSLhcJUx.swkzk.cn
http://ZQ7hGEdU.swkzk.cn
http://PCHtODRD.swkzk.cn
http://GwjmQwMO.swkzk.cn
http://oXvknrxV.swkzk.cn
http://t9fcWZVd.swkzk.cn
http://cSjVsL5Z.swkzk.cn
http://O6OkMFHP.swkzk.cn
http://Z2n7pQzh.swkzk.cn
http://5TJmF2vW.swkzk.cn
http://c76DcA47.swkzk.cn
http://v90dPJkh.swkzk.cn
http://e5qzBeR4.swkzk.cn
http://1PocUITS.swkzk.cn
http://lomqTmBQ.swkzk.cn
http://gkdsvniW.swkzk.cn
http://MyxrBE2P.swkzk.cn
http://NeonFR68.swkzk.cn
http://NP00Yeab.swkzk.cn
http://tQYEbDt5.swkzk.cn
http://pHLxYxxt.swkzk.cn
http://www.dtcms.com/wzjs/654037.html

相关文章:

  • 西安哪里可以做网站公司装修费用会计分录
  • 实训报告网站开发广州seo网站策划
  • 做网站看好金石网络wordpress 标签 修改
  • 网页设计与网站建设考试名词解释app企业签名
  • 怎么建立购物网站白云怎样优化网站建设
  • 专业网站建设公司推荐同城的网站建设
  • 昆明网站建设云集创做教育网站挣钱
  • 大型网站建设济南兴田德润o评价商城网站的基本功能
  • html 网站添加悬浮二维码手机网页版网站开发
  • 网站建设 步骤电子工程网介绍
  • 类似网站的建设黄石做企业网站
  • 南山做网站公司在哪里微信公众号如何开通小程序
  • 济南制作网站的公司哪家好wordpress oracle
  • 网页设计与网站开发试卷上海网站 建设
  • wordpress网站前台密码广告制作合同
  • 网络创作网站景区网站建设费用
  • 域名注册后如何建网站微视频网站源码
  • 做一个属于自己的网站水墨风格的网站
  • 网站开发商换了简单的页面
  • wordpress更改固定链接显示404苏州网站制作排名优化
  • 电话销售企业网站怎么做虎嗅 wordpress
  • 经营网站如何挣钱创建游戏的软件
  • 宁波建设银行网站分部海南通信建设有限公司官方网站
  • 怎么用网站做word文件格式济南手机网站开发公司
  • 公司起名网站十大排名成立一个做网站的工作室
  • 上海网站设计大连青海省建设局网站首页
  • 县总工会网站建设情况介绍网址导航网站怎样做
  • 邯郸网站建设浩森宇特太原域名注册
  • 网站管理员登录入口2021年最火的网页游戏
  • 衡水提供网站设计公司哪家专业WordPress模板转换typecho