当前位置: 首页 > news >正文

基于图的可解释性推荐综述

提出了一个三维度的分类法,用于归纳现有的可解释图推荐系统 。

1. 学习方法,是如何学习图中的信息来进行推荐的 。

基于嵌入 : 核心是学习“节点嵌入”。它捕捉节点的局部或全局结构,但不显式地处理“路径” ;基于路径 : 显式地从图中提取路径,并将这些路径本身作为信息输入模型 。混合: 同时使用节点嵌入和显式路径 。

2.解释方法,产生解释的组件是如何工作的 。

模型特定: 解释组件是内置于模型架构中的,专为该模型定制。模型无关: 解释组件是一种事后技术,它可以独立于推荐模型,并能应用于多种不同的模型(这正是您上一篇CPER论文的定位) 。

3.解释类型,最终呈现给用户的解释是什么样子的 。

节点级 : 告诉用户哪些“节点”(例如朋友、购买过的物品、物品属性)对推荐结果贡献最大 ;路径级 (Path-level): 向用户展示具体的“路径”,例如:“推荐您T-shirt D,因为您买过T-shirt C,它们都属于T-shirt类别” 。元路径级: 向用户展示一个更高阶的语义模式,例如:“我们基于User-Item-Category-Item这个模式向您推荐” 。隐式 (Implicit): 不生成任何显式解释。相反,模型在训练时就被设计为自动偏好(增加)那些更容易被解释的物品的推荐分数 。

1. 按学习方法分类

可解释的图推荐系统是如何从图中学习信息来进行推荐的

1基于嵌入的方法

利用图嵌入技术(如GNN、TransE等)来学习节点嵌入。模型通过这些嵌入来捕捉图的结构关系(局部或全局),并在此基础上进行推理和解释 ,但可解释性较差(黑盒)。

强化学习:“寻找一条好的解释路径”建模为一个马尔可夫决策过程(MDP)。PGPR 和 UCPR 就使用RL智能体在图上“导航”,从用户节点走到推荐物品节点,走过的路径即为解释 。ADAC 进一步使用“生成对抗模仿学习”(GAIL)来监督RL智能体,迫使它生成的路径与人类定义的“演示路径”(如最短路径)相似,以增强解释的可读性 。RL方法的主要缺点是可扩展性问题,因为图中的“动作空间”(即每一步可以选择的邻居)可能非常大,导致计算成本高昂 。

GNN:目前最主流的嵌入方法。GNN(如GCN、GAT)通过“消息传递”机制,递归地聚合邻居信息来更新节点嵌入,从而自然地捕捉到多跳信息 。

2基于路径的方法

​不依赖于复杂的节点嵌入学习,显式地从图中提取大量的用户-物品路径,并将这些“路径”本身作为特征输入到推荐模型中 ,但但依赖于预定义的路径,可能错过全局信息。

随机游走:KPRN :首先随机游走出大量路径,然后使用LSTM来编码这些路径(节点和关系的序列),最后用注意力机制来聚合所有路径的表示,以计算推荐得分 。注意力权重最高的路径即为解释 。PRINCE :它使用一种带偏向的随机游走来生成推荐 ,然后通过反事实的方式(迭代移除用户的边)来找到起关键作用的边作为解释.

元路径:遵循预先定义的元路径,TMER :利用元路径提取连接用户历史中“连续物品”的路径,然后用Word2Vec计算路径嵌入,并用注意力机制组合它们 。RuleRec 和 MP4Rec :它们会基于多条不同的元路径计算特征,然后用注意力机制来聚合这些元路径,最终,注意力权重最高的元路径(例如 User-Item-Category-Item)将作为一种高阶语义解释 。

3 混合方法

结合上述两种方法的优点:既利用嵌入捕捉图的全局结构信息,又利用路径提供显式的、可解释的上下文 ,但设计复杂度更高。

2.按解释方法分类

模型的可解释性组件本身是如何工作的,将所有方法分为两大类:模型特定模型无关

1模型特定

解释机制是内置的,与推荐模型的内部组件紧密集成 。解释是模型在进行推荐时“顺便”产生的,因此是为该模型量身定做的 。解释更精确、与模型的决策过程更一致 。缺点是缺乏通用性,并且可能增加了系统设计的复杂性 。

注意力:这是最主流的模型特定方法。它在模型学习(例如GNN聚合或路径聚合)的过程中,联合学习得到一组权重,这些权重被用来表示不同节点、关系或路径的重要性 。在GNN中: 注意力权重被用来识别哪些邻居节点或关系在信息传播中贡献最大;在路径聚合中(如KPRN, EIUM): 模型首先提取多条路径,然后使用注意力机制来计算哪条路径对最终推荐得分的贡献最大;在元路径中(如MP4Rec, MSRE): 模型基于多条元路径学习,并用注意力权重来识别哪种语义模式(例如 User-Item-Brand-Item)最重要 。

强化学习:将寻找解释路径建模为一个RL任务。智能体从一个用户节点出发,在图中导航,每走一步(选择一个关系/节点)都会得到一个奖励。智能体最终“走过”的抵达推荐物品的路径,就是这条推荐的解释 。PGPR , UCPR , ADAC , TPRec 。这些模型的主要区别在于奖励函数的设计或动作空间的剪枝策略 。

自回归路径生成:不是从图中“提取”已存在的路径,而是像语言模型一样,生成一条路径。

2模型无关

解释机制是独立于推荐模型本身的 。它们是事后执行的 ,可以被灵活地应用到任何(通常是“黑盒”)推荐模型上 。灵活、可迁移,能解释任何黑盒模型 。缺点是解释可能是事后合理化,可能不如模型特定的方法那样精确或“忠实” 。

基于启发式排名的路径选择:首先从图中提取所有可能的候选路径,然后使用一组“启发式规则”来对这些路径进行排序,选出最好的作为解释 。SEP 使用三个指标来对路径排序:路径可信度、路径可读性和路径多样性 。

基于反事实的解释 :如果拿走什么,推荐就会改变?RINCE 会迭代地移除用户的一个关系(例如一条购买边),然后检查这个移除是否改变了推荐结果的排序 。如果排序变了,那么被移除的那个关系就被视为一个关键的“反事实解释” 。

基于特征工程的方法:会预先提取图中的特征(例如路径特征),这些特征本身是可解释的,并且可以被用于多种不同的推荐模型中,从而使解释方法与模型解耦。

3.按解释类型分类

模型最终呈现给用户的解释是什么形式的,将所有解释形式分为四大类:节点级路径级元路径级隐式

1 节点级

通过识别出那些对推荐决策贡献最大的单个节点(或关系)来提供解释 ,但缺乏上下文 。

基于权重的识别: SemAuto 和 LDSDMF 分别通过自动编码器中的神经元权重或自定义的“喜好度”来识别最重要的属性节点。

基于GNN注意力的识别: GEAPR 和 HAGERec 使用GNN的注意力权重来识别最重要的邻居节点。

基于意图/关系的识别: KGIN 和 CaDSI 识别出最重要的“关系”或“意图”(在图中也可以被视为一种节点或边)作为解释。

基于反事实的识别: PRINCE通过识别“如果移除哪个节点(或关系)会导致推荐结果改变”来提供反事实解释 。

2 路径级

这是可解释图推荐中最普遍的一种形式 。它利用图提供的独特的高阶连接信息,将连接用户和物品的具体路径(例如 User -> ItemA -> Category -> ItemB)作为解释 ,但计算量大,更复杂 。

基于排序的路径选择: SEP 和 FairKG4Rec 首先提取大量的候选路径,然后使用一组启发式指标(如可信度、可读性、多样性或公平性)对这些路径进行排序,选择排名最高的路径作为解释 。

基于注意力的路径选择: KPRN 、EIUm 和 TMER 等模型会同时处理多条路径,并使用注意力机制来计算哪条路径的权重最高,将其选为解释 。KGAT 和 RippleNet 则通过节点间的注意力权重来反向构建出一条最重要的路径。

基于RL的路径导航: PGPR 、ADAC 和 ReMR 等模型将解释过程视为一个RL任务。智能体在图上从用户“导航”到物品,这条导航路径本身就是解释 。优点是,它找到的路径保证在图中真实存在 。

基于生成的路径构建: LOGER (使用LSTM) 和 PLM-Rec (使用Transformer) 像语言模型一样,自回归地生成一条解释路径,而不是从图中“寻找”路径 。论文也指出了这种方法的风险:生成的路径可能在真实图中并不存在 。

3 元路径级

这种解释提供了一个更高层次的抽象视角(meta-level view)。它不告诉用户具体的路径(例如 User1 -> T-shirtC -> Category:T-shirt -> T-shirtD),而是告诉用户这条推荐所依赖的语义模式(即元路径),例如:User-Item-Category-Item ,但丢失了细粒度的细节。

MSRE 和 MP4Rec 都会基于多条不同的元路径来学习推荐。它们使用注意力机制来聚合这些元路径的贡献,最终,注意力权重最高的元路径(例如 User-Item-Brand-Item)就被当作推荐的理由 。RuleRec 通过特定方法选择出重要的“Item-Item元路径”,这些被选中的元路径(规则)本身就是解释 。

4 隐式

不会向用户生成任何显式的解释,在训练的损失函数中加入一个额外的约束项(例如,基于关联规则挖掘 或元路径得分 )。这个约束项会惩罚那些不可解释的推荐,同时奖励那些“可解释”的推荐 ,但牺牲了透明度。

MP4Rec 和 SEV-RS 都在它们的BPR损失函数中加入了这样的约束项,迫使模型更倾向于推荐那些(根据它们内部标准)可解释的物品 。

4 可解释性评估

1 定性评估

可视化:热图展示注意力权重; 散点图 将物品嵌入可视化,通过观察聚类来理解模型是如何学习和区分不同概念的; 解释路径图: 将得分最高的解释路径绘制出来,形成推理子图.

案例研究:检查模型生成的解释(例如具体的路径或节点),并结合该用户的个人资料和常识,来判断这个解释是否合理、有意义 。例如,分析推荐路径是否与用户的历史偏好一致 ,或者分析解释是否公平、多样 。

用户调研:A/B测试: 比较用户在“有解释”和“无解释”两种情况下对推荐的满意度或评分变化 。问卷调查 : 使用李克特量表等形式,让用户评价解释的有用性、相关性、多样性等 。

2 定量评估

平均可解释性精确率/召回率/F值:评估模型推荐可解释物品的能力(主要用于评估“隐式”解释)。需要一个预先定义好的“可解释物品集”。然后像计算标准Precision/Recall一样,计算推荐列表和这个可解释集间的重合度。

性能偏移:采用了反事实的思想。首先,从训练数据中移除解释所涉及的关键元素(例如路径中的节点或关系);然后,重新训练模型;最后,观察模型的性能下降了多少。性能下降得越剧烈,说明被移除的元素对模型决策越重要,解释的忠实性越高 。

辛普森多样性指数:评估解释的多样性和公平性,用于路径级解释,计算两条随机选择的解释路径属于同一元路径模式的概率 。SID值越高,说明解释路径的模式越多样,表明模型没有偏向于某几种特定的解释模式 。

评论匹配:从用户的文本评论中提取关键词,然后将其与解释路径中的节点进行比较,计算Precision和Recall 。

JS散度:评估解释的忠实性,即解释是否准确反映了用户的整体历史行为 。比较两个概率分布的差异:1)用户所有历史路径的规则分布;2)模型生成的解释路径的规则分布.JS散度值越小,说明二者分布越接近,即模型的解释越能忠实地反映用户的历史行为 。

编辑距离:评估生成的解释(路径或子图)在拓扑结构上的相似性 。计算将一个序列(路径)转换为另一个序列所需的最小编辑(插入、删除、替换)次数 。可以用来比较模型生成的解释与“真实解释”(如果存在)的差距,或者比较不同模型解释之间的相似性 。

5 未来工作

1 对注意力机制解释性的质疑

注意力机制可能具有误导性。有研究(尤其在NLP领域)表明,注意力权重并不总能反映模型真正的决策逻辑(即与基于梯度的特征重要性不一致)。需要更仔细地研究注意力权重在推荐任务中到底是如何以及在何种程度上真正有助于解释的 。

2 图解释本身的局限性

给用户看“注意力分数”或“路径”可能对开发者调试模型很有用,但并不一定能说服最终用户. 此外,解释路径通常会包含其他用户的行为,这引发了隐私问题。探索对用户更友好的新解释形式(例如更像自然语言的解释 ),并能同时保护用户隐私 。

3 多模态图

大多数现有工作忽视了多模态数据,将多模态数据(能提供更丰富的上下文)有效地融合到可解释的图推荐系统中,这是一个开放的研究问题 。

4 因果图

因果推理是增强透明度的另一大热门方法 。虽然已有模型开始将因果关系集成到图中,但这种集成仍有待完善 。一个有前景的方向是构建专注“因果多跳关系的图,以同时利用图的高阶连接性和因果推理能力 。

 5 可扩展性

真实世界的图非常庞大,而为了增强可解释性(例如加入多模态或因果信息)会使图变得更加复杂,导致严重的可扩展性问题 。现有的解决方案(如剪枝或使用子图)虽然能缓解问题,但可能会损害模型的准确性和可解释性 。因此需要开发出能够在保持高性能和高可解释性的同时,处理大规模图的可扩展方法 。

6 基准数据集和评估

这是该领域的一个核心痛点。目前缺乏专门为“可解释性”设计的基准数据集 ,也没有公认的、统一的评估指标 。

7 实际部署中的限制

动态图: 用户的偏好是不断变化的,但基于动态图的可解释推荐系统仍未得到充分探索 。

隐私: 图中的连接信息可能会暴露用户的敏感交互 。

线下/线上不一致: 离线指标常常无法模拟真实的用户反馈,导致在线上部署时,推荐质量和可解释性可能与测试结果严重不符 。

http://www.dtcms.com/a/606248.html

相关文章:

  • Nginx搭建RTMP点播流媒体服务器步骤详解,Nginx+RTMP+OBS推流搭建流媒体服务器
  • 东莞建设网站官网住房和城乡网站平台系统设计公司
  • 具身智能-一文详解视觉-语言-动作(VLA)大模型(2)
  • 如何使用 Docker 打包一个简单的应用程序:简易指南
  • Hyper-V Windows 11 Pro x64 开局问题
  • 长沙外贸建站土地 水利 勘测设计 公司宣传册设计样本
  • Cursor区域限制解决方法, Cursor 提示:“Model not available“的原因
  • 自签名证书需要手动确认风险导致nginx转发无效问题
  • 重庆市建设工程安全网站广告营销公司
  • 编译型语言有哪些 | 深入了解编译型语言的工作原理和特点
  • 实践教程|如何创建一个WhatsApp AI Chatbot
  • 网站流量分成专题制作 wordpress
  • 深度学习中适合长期租用的高性价比便宜的GPU云服务器有哪些?
  • 【DaisyUI】如何覆盖 dropdown 下拉效果?
  • 个人网站可以挂广告吗网站开发项目合同书
  • 网站建设前提企业信息管理
  • 每日两题day42
  • 最优惠的手机网站建设wordpress页面访问量
  • AI提效前端开发
  • 建立主题网站的知识点东莞市做网站公司
  • 怎么重启电脑的网卡(Windows系统)?
  • 【STM32】串口
  • 杭州建网站装修材料
  • 从U盘损坏中恢复视频文件并修复修改日期的完整解决方案
  • 网站建设人员wordpress个人
  • 免费项目网站wordpress如何导入模板数据库
  • 三坐标测量软件路径仿真和碰撞检测功能
  • K8s Ingress 与 Ingress API 全解析:外部访问集群的统一入口
  • kubernetes部署
  • 【2025最新】05 Spring Security 构建 RESTful Web 注册服务 - 2