当前位置: 首页 > news >正文

【第六章:项目实战之推荐/广告系统】3.精排算法-(3)精排模块多目标融合:从线性融合到Bayes方程融合原理

第六章:项目实战之推荐/广告系统

第三部分:精排算法

第三节:精排模块多目标融合:从线性融合到Bayes方程融合原理


一、引言:精排不止有一个目标

推荐系统的“精排阶段”是整个推荐链路中最精细、最关键的环节。
在召回与粗排之后,系统面对的是有限数量的候选项,目标是利用高复杂度的模型(如 DNN、DeepFM、ESMM、MMoE、PLE 等)精确预测每个候选内容的用户响应概率,并排序展示。

然而,真实业务场景中目标往往不止一个

  • 电商:点击率(CTR)、加购率、转化率(CVR)、GMV(交易额);

  • 视频:播放完成率、停留时长、点赞、关注;

  • 信息流广告:CTR、CVR、广告收益(eCPM);

  • 内容社区:互动率、用户留存、创作者曝光。

不同目标往往相互牵制(例如 CTR 高的内容未必有高 CVR)。
因此,**多目标融合(Multi-Objective Fusion)**成为精排阶段不可或缺的核心技术点之一。


二、多目标融合的本质

多目标融合的本质是:
在多个预测目标(如 CTR、CVR、留存率等)之间寻找最优的加权或联合决策方式,使得最终的排序指标最大化整体业务收益。

融合方式可以分为两大类:

  1. 结果层融合(Post-Fusion):模型分别输出 CTR、CVR、GMV 等预测,再通过公式进行融合;

  2. 模型层融合(Joint-Fusion):在模型结构中共享部分参数或隐空间(如 ESMM、MMoE、PLE)。

本节聚焦于结果层的融合策略,从最简单的线性融合到基于概率论的 Bayes 融合,系统地讲清楚背后的理论与工程逻辑。


三、线性融合:最简单也最常用的方式

线性融合(Linear Fusion)是业界最常见、实现最简便的融合方式,其核心思想是:

Score = \alpha \cdot CTR + \beta \cdot CVR + \gamma \cdot GMV + \dots

其中 (\alpha, \beta, \gamma) 为各目标的权重,表示目标在排序中的重要程度。

3.1 优点

  • 简单直观,易实现;

  • 可快速迭代与调参;

  • 对模型无侵入,可直接在在线服务中实现。

3.2 缺点

  • 权重选择主观;

  • 各目标分布尺度不同(CTR≈0.1,CVR≈0.01),不归一化会导致失衡;

  • 无法反映目标之间的条件依赖。

3.3 工程常用变体

  1. 归一化线性融合
    对各目标取 z-scoremin-max 归一化后再加权;
    Score = \alpha \cdot Norm(CTR) + \beta \cdot Norm(CVR)

  2. 自适应融合(Learn-to-Fuse):
    通过轻量神经网络或线性层学习最优权重,例如:

    score = torch.sigmoid(w1 * ctr + w2 * cvr + b)
    

    训练目标可以是 GMV、eCPM 或点击收益。

  3. 分场景加权
    不同用户群体、频道、时间段使用不同的 α/β 值,称为“动态融合权重”。

实践中,线性融合往往是系统上线的第一版本,随后再逐步过渡到概率融合或模型级融合。


四、非线性融合:从启发式到学习式

在一些复杂业务场景中(如电商广告),单纯的线性权重无法捕捉 CTR 与 CVR 的非线性关系。
例如:CTR 很高但 CVR 很低的广告会浪费曝光,而 CVR 很高但 CTR 极低的广告又难以被看到。
此时,需要非线性融合策略。

4.1 乘积式融合(Multiplicative Fusion)

经典的点击后转化率模型(CTCVR)
P(CTCVR) = P(CTR) \times P(CVR|click)

在广告排序中,eCPM 常用表达为:
eCPM = Bid \times CTR \times CVR
该公式天然是乘法结构,体现了概率链式关系。

4.2 学习式融合(Learning Fusion)

使用一个轻量神经网络 (f_\theta) 来融合多个目标:
Score = f_\theta(CTR, CVR, GMV, ...)
模型可以是:

  • DNN;

  • GBDT;

  • Logistic regression;

  • 甚至基于强化学习的融合器。

这种方式能自动学习非线性权重,但需要额外训练数据与计算资源。


五、Bayes 融合:从概率论出发的理论最优解

Bayes 融合是融合理论中最系统、最有逻辑基础的方式。

5.1 理论基础

设:

  • (E):事件(用户点击、购买、转化等);

  • (X):特征向量;

  • (M_1, M_2, ...):不同目标模型输出。

我们的目标是计算最终排序得分:
P(E|X) = P(E|M_1(X), M_2(X), ...)

根据 Bayes 定理
P(E|M_1, M_2) \propto P(M_1, M_2|E) \cdot P(E)

若假设各模型独立(Naive Bayes 假设):
P(E|M_1, M_2) \propto P(E) \cdot P(M_1|E) \cdot P(M_2|E)

通过取对数变换:
\log P(E|M_1, M_2) = \log P(E) + \log P(M_1|E) + \log P(M_2|E) + C

这表明,融合的最优形式其实是多模型 log 概率的加权求和,与线性融合在形式上类似,但权重由数据概率决定。

5.2 在推荐系统中的具体应用

假设我们有 CTR 与 CVR 两个模型:
P(CTR) = P(\text{click}=1|X)
P(CVR) = P(\text{buy}=1|\text{click}=1, X)

根据条件概率公式:
P(\text{buy}=1|X) = P(CTR) \times P(CVR)
这正是业界广泛采用的 Bayes 乘积融合(CTCVR 模型)

在广告系统中,这一融合策略用于计算最终的 eCPM = Bid × P(CTR) × P(CVR),即转化后收益的期望值。


六、从理论到实战:多目标融合的实现路径

在工程实现上,多目标融合通常出现在精排的最后一层或线上 Serving 阶段
下面给出几种常见实践方案:

融合策略核心公式优点典型应用场景
线性融合α·CTR + β·CVR简单快速、可解释内容推荐
乘积融合CTR × CVR体现概率依赖广告、eCPM
Log-Bayes 融合log P(E) + Σ log P(M_iE)理论最优
学习式融合NN(CTR, CVR, GMV, …)自动学习非线性关系大规模多目标排序
动态权重融合f(user, scene) → w场景自适应个性化推荐

七、实战案例:电商广告中的多目标融合

假设广告系统有以下三个目标模型:

  • CTR 模型:点击概率;

  • CVR 模型:点击后购买概率;

  • ARPU 模型:用户平均收益。

系统可设计如下融合逻辑:

score = bid * ctr * cvr * arpu

或更一般地:

score = α * log(ctr) + β * log(cvr) + γ * log(arpu)

并通过 A/B 测试确定最优 α、β、γ 权重。
线上部署时可进一步将权重调整为实时动态函数,例如:

\alpha = f(user_type, time, category)
\beta = g(item_price, device)

这样可以根据用户类型与时间段动态调整推荐重点(曝光、转化、复购)。


八、未来趋势:从静态融合到决策级优化

传统融合多为静态函数,但随着强化学习和多任务优化的发展,业界正向更智能化方向演进:

  1. 基于强化学习(RL)的融合:将排序得分视为策略输出,通过 reward 信号动态学习最优融合方式;

  2. Meta-Learning 融合:融合模型根据场景快速自适应;

  3. Uncertainty-Aware 融合:融合时考虑模型不确定性,置信区间高的目标赋予更高权重;

  4. End-to-End 多任务联合优化:通过多目标损失函数同时优化 CTR、CVR、留存等,内在实现动态融合。


九、总结

阶段主要思想优点适用场景
线性融合人工加权求和实现简单快速上线、A/B 调参
非线性融合学习式或乘积式捕捉复杂关系大规模推荐、广告
Bayes 融合概率论推导理论最优CTR+CVR 联合建模
动态融合权重自适应个性化排序实时推荐场景

多目标融合的演进,体现了推荐系统从经验加权数据驱动决策的转变。
它让精排模块不再是单一目标优化器,而成为真正的综合收益最大化引擎


一句话总结:

多目标融合的核心,不是简单地“相加”,而是让各个目标的概率在数学与业务逻辑上合理共存,让推荐系统在点击、转化与收益之间找到最优平衡点。

http://www.dtcms.com/a/546285.html

相关文章:

  • Linux小课堂: 磁盘容量配额配置与管理
  • SMT 卡扣贴片治具怎么设计,主要解决哪些问题
  • 珠三角做网站免费网站建站申请
  • 网站建设运营知识关于排版的网站
  • 【CSS】CSS 面试知多少
  • 手机app 网站iis上做的网站外网怎么访问
  • 长春电商网站建设哪家专业在哪里建设网站
  • 好用的电磁阀供应商
  • 第10章:中断处理: Quick Reference
  • 建网站得钱吗网站策划文案
  • 九江做网站公司国外网站备案查询
  • 代码随想录第四十八天|1143.最长公共子序列 1035.不相交的线 53. 最大子序和 392.判断子序列
  • Spring AI Alibaba 【四】
  • 保定网站建设工作要搭建网站
  • 项目构建优化:git
  • 手机产品 网站建设公众号助手
  • 网站的v2信誉认证怎么做世界500强企业查询入口
  • Veyon,一款开源免费的教室电脑远程管理工具
  • 22. 课件整理 文件IO
  • 值得浏览的国外网站国外英语写作网站
  • 贸易公司网站建设价格企业网站设计html代码
  • 创造网站需要多少钱乐清城市网
  • 专业手机网站建设价格那网站做问答
  • 做一个网站做少多少钱微网站成功案例
  • dwcc2017做网站教程网站建设需要使用哪些设备
  • 仓颉编程实战:类与对象的精髓
  • Honeywell 通过 SAP 实现端到端流程转型,打造软件业务新引擎
  • 制作网站的方法有哪些网站建设与开发教学大纲
  • 枣庄网站建设多少钱wordpress 主题 速度快
  • XSLT 简介