当前位置：首页 > news >正文

基于图的可解释性推荐综述

news 2025/11/14 9:23:21

提出了一个三维度的分类法，用于归纳现有的可解释图推荐系统。

1. 学习方法，是如何学习图中的信息来进行推荐的。

基于嵌入： 核心是学习“节点嵌入”。它捕捉节点的局部或全局结构，但不显式地处理“路径” ；基于路径： 显式地从图中提取路径，并将这些路径本身作为信息输入模型。混合： 同时使用节点嵌入和显式路径。

2.解释方法，产生解释的组件是如何工作的。

模型特定： 解释组件是内置于模型架构中的，专为该模型定制。模型无关： 解释组件是一种事后技术，它可以独立于推荐模型，并能应用于多种不同的模型（这正是您上一篇CPER论文的定位）。

3.解释类型，最终呈现给用户的解释是什么样子的。

节点级： 告诉用户哪些“节点”（例如朋友、购买过的物品、物品属性）对推荐结果贡献最大；路径级 (Path-level)： 向用户展示具体的“路径”，例如：“推荐您T-shirt D，因为您买过T-shirt C，它们都属于T-shirt类别” 。元路径级： 向用户展示一个更高阶的语义模式，例如：“我们基于User-Item-Category-Item这个模式向您推荐” 。隐式 (Implicit)： 不生成任何显式解释。相反，模型在训练时就被设计为自动偏好（增加）那些更容易被解释的物品的推荐分数。

1. 按学习方法分类

可解释的图推荐系统是如何从图中学习信息来进行推荐的

1基于嵌入的方法

利用图嵌入技术（如GNN、TransE等）来学习节点嵌入。模型通过这些嵌入来捕捉图的结构关系（局部或全局），并在此基础上进行推理和解释，但可解释性较差（黑盒）。

强化学习：“寻找一条好的解释路径”建模为一个马尔可夫决策过程（MDP）。PGPR 和 UCPR 就使用RL智能体在图上“导航”，从用户节点走到推荐物品节点，走过的路径即为解释。ADAC 进一步使用“生成对抗模仿学习”（GAIL）来监督RL智能体，迫使它生成的路径与人类定义的“演示路径”（如最短路径）相似，以增强解释的可读性。RL方法的主要缺点是可扩展性问题，因为图中的“动作空间”（即每一步可以选择的邻居）可能非常大，导致计算成本高昂。

GNN:目前最主流的嵌入方法。GNN（如GCN、GAT）通过“消息传递”机制，递归地聚合邻居信息来更新节点嵌入，从而自然地捕捉到多跳信息。

2基于路径的方法

不依赖于复杂的节点嵌入学习，显式地从图中提取大量的用户-物品路径，并将这些“路径”本身作为特征输入到推荐模型中，但但依赖于预定义的路径，可能错过全局信息。

随机游走：KPRN ：首先随机游走出大量路径，然后使用LSTM来编码这些路径（节点和关系的序列），最后用注意力机制来聚合所有路径的表示，以计算推荐得分。注意力权重最高的路径即为解释。PRINCE ：它使用一种带偏向的随机游走来生成推荐，然后通过反事实的方式（迭代移除用户的边）来找到起关键作用的边作为解释.

元路径:遵循预先定义的元路径，TMER ：利用元路径提取连接用户历史中“连续物品”的路径，然后用Word2Vec计算路径嵌入，并用注意力机制组合它们。RuleRec 和 MP4Rec ：它们会基于多条不同的元路径计算特征，然后用注意力机制来聚合这些元路径，最终，注意力权重最高的元路径（例如 User-Item-Category-Item）将作为一种高阶语义解释。

3 混合方法

结合上述两种方法的优点：既利用嵌入捕捉图的全局结构信息，又利用路径提供显式的、可解释的上下文，但设计复杂度更高。

2.按解释方法分类

模型的可解释性组件本身是如何工作的，将所有方法分为两大类：模型特定和模型无关。

1模型特定

解释机制是内置的，与推荐模型的内部组件紧密集成。解释是模型在进行推荐时“顺便”产生的，因此是为该模型量身定做的。解释更精确、与模型的决策过程更一致。缺点是缺乏通用性，并且可能增加了系统设计的复杂性。

注意力：这是最主流的模型特定方法。它在模型学习（例如GNN聚合或路径聚合）的过程中，联合学习得到一组权重，这些权重被用来表示不同节点、关系或路径的重要性。在GNN中：注意力权重被用来识别哪些邻居节点或关系在信息传播中贡献最大;在路径聚合中（如KPRN, EIUM）：模型首先提取多条路径，然后使用注意力机制来计算哪条路径对最终推荐得分的贡献最大;在元路径中（如MP4Rec, MSRE）：模型基于多条元路径学习，并用注意力权重来识别哪种语义模式（例如 User-Item-Brand-Item）最重要。

强化学习：将寻找解释路径建模为一个RL任务。智能体从一个用户节点出发，在图中导航，每走一步（选择一个关系/节点）都会得到一个奖励。智能体最终“走过”的抵达推荐物品的路径，就是这条推荐的解释。PGPR , UCPR , ADAC , TPRec 。这些模型的主要区别在于奖励函数的设计或动作空间的剪枝策略。

自回归路径生成：不是从图中“提取”已存在的路径，而是像语言模型一样，生成一条路径。

2模型无关

解释机制是独立于推荐模型本身的。它们是事后执行的，可以被灵活地应用到任何（通常是“黑盒”）推荐模型上。灵活、可迁移，能解释任何黑盒模型。缺点是解释可能是事后合理化，可能不如模型特定的方法那样精确或“忠实” 。

基于启发式排名的路径选择：首先从图中提取所有可能的候选路径，然后使用一组“启发式规则”来对这些路径进行排序，选出最好的作为解释。SEP 使用三个指标来对路径排序：路径可信度、路径可读性和路径多样性。

基于反事实的解释 :如果拿走什么，推荐就会改变？RINCE 会迭代地移除用户的一个关系（例如一条购买边），然后检查这个移除是否改变了推荐结果的排序。如果排序变了，那么被移除的那个关系就被视为一个关键的“反事实解释” 。

基于特征工程的方法：会预先提取图中的特征（例如路径特征），这些特征本身是可解释的，并且可以被用于多种不同的推荐模型中，从而使解释方法与模型解耦。

3.按解释类型分类

模型最终呈现给用户的解释是什么形式的，将所有解释形式分为四大类：节点级、路径级、元路径级和隐式。

1 节点级

通过识别出那些对推荐决策贡献最大的单个节点（或关系）来提供解释，但缺乏上下文。

基于权重的识别： SemAuto 和 LDSDMF 分别通过自动编码器中的神经元权重或自定义的“喜好度”来识别最重要的属性节点。

基于GNN注意力的识别： GEAPR 和 HAGERec 使用GNN的注意力权重来识别最重要的邻居节点。

基于意图/关系的识别： KGIN 和 CaDSI 识别出最重要的“关系”或“意图”（在图中也可以被视为一种节点或边）作为解释。

基于反事实的识别： PRINCE通过识别“如果移除哪个节点（或关系）会导致推荐结果改变”来提供反事实解释。

2 路径级

这是可解释图推荐中最普遍的一种形式。它利用图提供的独特的高阶连接信息，将连接用户和物品的具体路径（例如 User -> ItemA -> Category -> ItemB）作为解释，但计算量大，更复杂。

基于排序的路径选择： SEP 和 FairKG4Rec 首先提取大量的候选路径，然后使用一组启发式指标（如可信度、可读性、多样性或公平性）对这些路径进行排序，选择排名最高的路径作为解释。

基于注意力的路径选择： KPRN 、EIUm 和 TMER 等模型会同时处理多条路径，并使用注意力机制来计算哪条路径的权重最高，将其选为解释。KGAT 和 RippleNet 则通过节点间的注意力权重来反向构建出一条最重要的路径。

基于RL的路径导航： PGPR 、ADAC 和 ReMR 等模型将解释过程视为一个RL任务。智能体在图上从用户“导航”到物品，这条导航路径本身就是解释。优点是，它找到的路径保证在图中真实存在。

基于生成的路径构建： LOGER (使用LSTM) 和 PLM-Rec (使用Transformer) 像语言模型一样，自回归地生成一条解释路径，而不是从图中“寻找”路径。论文也指出了这种方法的风险：生成的路径可能在真实图中并不存在。

3 元路径级

这种解释提供了一个更高层次的抽象视角（meta-level view）。它不告诉用户具体的路径（例如 User1 -> T-shirtC -> Category:T-shirt -> T-shirtD），而是告诉用户这条推荐所依赖的语义模式（即元路径），例如：User-Item-Category-Item ，但丢失了细粒度的细节。

MSRE 和 MP4Rec 都会基于多条不同的元路径来学习推荐。它们使用注意力机制来聚合这些元路径的贡献，最终，注意力权重最高的元路径（例如 User-Item-Brand-Item）就被当作推荐的理由。RuleRec 通过特定方法选择出重要的“Item-Item元路径”，这些被选中的元路径（规则）本身就是解释。