当前位置: 首页 > news >正文

【第五章:计算机视觉-项目实战之推荐/广告系统】3.精排算法-(3)精排模块多目标融合:从线性融合到Bayes方程融合原理

第五章:计算机视觉-项目实战之推荐/广告系统

第三部分:精排算法

第三节:精排模块多目标融合:从线性融合到Bayes方程融合原理


一、引言:精排不止有一个目标

推荐系统的“精排阶段”是整个推荐链路中最精细、最关键的环节。
在召回与粗排之后,系统面对的是有限数量的候选项,目标是利用高复杂度的模型(如 DNN、DeepFM、ESMM、MMoE、PLE 等)精确预测每个候选内容的用户响应概率,并排序展示。

然而,真实业务场景中目标往往不止一个

  • 电商:点击率(CTR)、加购率、转化率(CVR)、GMV(交易额);

  • 视频:播放完成率、停留时长、点赞、关注;

  • 信息流广告:CTR、CVR、广告收益(eCPM);

  • 内容社区:互动率、用户留存、创作者曝光。

不同目标往往相互牵制(例如 CTR 高的内容未必有高 CVR)。
因此,**多目标融合(Multi-Objective Fusion)**成为精排阶段不可或缺的核心技术点之一。


二、多目标融合的本质

多目标融合的本质是:
在多个预测目标(如 CTR、CVR、留存率等)之间寻找最优的加权或联合决策方式,使得最终的排序指标最大化整体业务收益。

融合方式可以分为两大类:

  1. 结果层融合(Post-Fusion):模型分别输出 CTR、CVR、GMV 等预测,再通过公式进行融合;

  2. 模型层融合(Joint-Fusion):在模型结构中共享部分参数或隐空间(如 ESMM、MMoE、PLE)。

本节聚焦于结果层的融合策略,从最简单的线性融合到基于概率论的 Bayes 融合,系统地讲清楚背后的理论与工程逻辑。


三、线性融合:最简单也最常用的方式

线性融合(Linear Fusion)是业界最常见、实现最简便的融合方式,其核心思想是:

Score = \alpha \cdot CTR + \beta \cdot CVR + \gamma \cdot GMV + \dots

其中 (\alpha, \beta, \gamma) 为各目标的权重,表示目标在排序中的重要程度。

3.1 优点

  • 简单直观,易实现;

  • 可快速迭代与调参;

  • 对模型无侵入,可直接在在线服务中实现。

3.2 缺点

  • 权重选择主观;

  • 各目标分布尺度不同(CTR≈0.1,CVR≈0.01),不归一化会导致失衡;

  • 无法反映目标之间的条件依赖。

3.3 工程常用变体

  1. 归一化线性融合
    对各目标取 z-scoremin-max 归一化后再加权;
    Score = \alpha \cdot Norm(CTR) + \beta \cdot Norm(CVR)

  2. 自适应融合(Learn-to-Fuse):
    通过轻量神经网络或线性层学习最优权重,例如:

    score = torch.sigmoid(w1 * ctr + w2 * cvr + b)
    

    训练目标可以是 GMV、eCPM 或点击收益。

  3. 分场景加权
    不同用户群体、频道、时间段使用不同的 α/β 值,称为“动态融合权重”。

实践中,线性融合往往是系统上线的第一版本,随后再逐步过渡到概率融合或模型级融合。


四、非线性融合:从启发式到学习式

在一些复杂业务场景中(如电商广告),单纯的线性权重无法捕捉 CTR 与 CVR 的非线性关系。
例如:CTR 很高但 CVR 很低的广告会浪费曝光,而 CVR 很高但 CTR 极低的广告又难以被看到。
此时,需要非线性融合策略。

4.1 乘积式融合(Multiplicative Fusion)

经典的点击后转化率模型(CTCVR)
P(CTCVR) = P(CTR) \times P(CVR|click)

在广告排序中,eCPM 常用表达为:
eCPM = Bid \times CTR \times CVR
该公式天然是乘法结构,体现了概率链式关系。

4.2 学习式融合(Learning Fusion)

使用一个轻量神经网络 (f_\theta) 来融合多个目标:
Score = f_\theta(CTR, CVR, GMV, ...)
模型可以是:

  • DNN;

  • GBDT;

  • Logistic regression;

  • 甚至基于强化学习的融合器。

这种方式能自动学习非线性权重,但需要额外训练数据与计算资源。


五、Bayes 融合:从概率论出发的理论最优解

Bayes 融合是融合理论中最系统、最有逻辑基础的方式。

5.1 理论基础

设:

  • (E):事件(用户点击、购买、转化等);

  • (X):特征向量;

  • (M_1, M_2, ...):不同目标模型输出。

我们的目标是计算最终排序得分:
P(E|X) = P(E|M_1(X), M_2(X), ...)

根据 Bayes 定理
P(E|M_1, M_2) \propto P(M_1, M_2|E) \cdot P(E)

若假设各模型独立(Naive Bayes 假设):
P(E|M_1, M_2) \propto P(E) \cdot P(M_1|E) \cdot P(M_2|E)

通过取对数变换:
\log P(E|M_1, M_2) = \log P(E) + \log P(M_1|E) + \log P(M_2|E) + C

这表明,融合的最优形式其实是多模型 log 概率的加权求和,与线性融合在形式上类似,但权重由数据概率决定。

5.2 在推荐系统中的具体应用

假设我们有 CTR 与 CVR 两个模型:
P(CTR) = P(\text{click}=1|X)
P(CVR) = P(\text{buy}=1|\text{click}=1, X)

根据条件概率公式:
P(\text{buy}=1|X) = P(CTR) \times P(CVR)
这正是业界广泛采用的 Bayes 乘积融合(CTCVR 模型)

在广告系统中,这一融合策略用于计算最终的 eCPM = Bid × P(CTR) × P(CVR),即转化后收益的期望值。


六、从理论到实战:多目标融合的实现路径

在工程实现上,多目标融合通常出现在精排的最后一层或线上 Serving 阶段
下面给出几种常见实践方案:

融合策略核心公式优点典型应用场景
线性融合α·CTR + β·CVR简单快速、可解释内容推荐
乘积融合CTR × CVR体现概率依赖广告、eCPM
Log-Bayes 融合log P(E) + Σ log P(M_iE)理论最优
学习式融合NN(CTR, CVR, GMV, …)自动学习非线性关系大规模多目标排序
动态权重融合f(user, scene) → w场景自适应个性化推荐

七、实战案例:电商广告中的多目标融合

假设广告系统有以下三个目标模型:

  • CTR 模型:点击概率;

  • CVR 模型:点击后购买概率;

  • ARPU 模型:用户平均收益。

系统可设计如下融合逻辑:

score = bid * ctr * cvr * arpu

或更一般地:

score = α * log(ctr) + β * log(cvr) + γ * log(arpu)

并通过 A/B 测试确定最优 α、β、γ 权重。
线上部署时可进一步将权重调整为实时动态函数,例如:

\alpha = f(user_type, time, category)
\beta = g(item_price, device)

这样可以根据用户类型与时间段动态调整推荐重点(曝光、转化、复购)。


八、未来趋势:从静态融合到决策级优化

传统融合多为静态函数,但随着强化学习和多任务优化的发展,业界正向更智能化方向演进:

  1. 基于强化学习(RL)的融合:将排序得分视为策略输出,通过 reward 信号动态学习最优融合方式;

  2. Meta-Learning 融合:融合模型根据场景快速自适应;

  3. Uncertainty-Aware 融合:融合时考虑模型不确定性,置信区间高的目标赋予更高权重;

  4. End-to-End 多任务联合优化:通过多目标损失函数同时优化 CTR、CVR、留存等,内在实现动态融合。


九、总结

阶段主要思想优点适用场景
线性融合人工加权求和实现简单快速上线、A/B 调参
非线性融合学习式或乘积式捕捉复杂关系大规模推荐、广告
Bayes 融合概率论推导理论最优CTR+CVR 联合建模
动态融合权重自适应个性化排序实时推荐场景

多目标融合的演进,体现了推荐系统从经验加权数据驱动决策的转变。
它让精排模块不再是单一目标优化器,而成为真正的综合收益最大化引擎


一句话总结:

多目标融合的核心,不是简单地“相加”,而是让各个目标的概率在数学与业务逻辑上合理共存,让推荐系统在点击、转化与收益之间找到最优平衡点。

http://www.dtcms.com/a/545010.html

相关文章:

  • 【详细教程】对拍 0 基础学习小课堂 [内附例题演示]
  • 在 Windows 系统中安装 Oracle、SQL Server(MSSQL)和 MySQL
  • 企业网站导航代码国外代码开源网站
  • 深圳网站开发公司哪家好平面设计岗位职责
  • mooc网站开发案例ip138域名查询
  • 黑白图片智能上色API技术文档 - 让你的老照片重获新生
  • 【Android】Dalvik 对比 ART
  • 【游戏设计】如何建立个人的游戏创意库
  • 手表电商网站湖南人文科技学院官网教务系统
  • 【软件可维护性测试:构建可持续演进更新的软件系统】
  • 【小白笔记】 while 与 for + break 的比较分析
  • STM32中死机 Crash dump 打印出函数调用关系
  • STM32的GPIOx_IDR 与 GPIOx_ODR
  • Rust 借用检查器(Borrow Checker)的工作原理:编译期内存安全的守护者
  • 仓颉语言核心技术深度解析:面向全场景智能时代的现代编程语言
  • 漳州住房和城乡建设部网站简单的页面
  • 架构论文《论负载均衡的设计与应用》
  • Linux frameworks 音视频架构音频部分
  • 【AI论文】PICABench:我们在实现物理逼真图像编辑的道路上究竟走了多远?
  • 设计模式之抽象工厂模式:最复杂的工厂模式变种
  • 设计模式>原型模式大白话讲解:就像复印机,拿个原件一复印,就得到一模一样的新东西
  • 网站数据库大小石家庄发布最新消息
  • 本地运行Tomcat项目
  • 大模型如何变身金融风控专家
  • 台州网站建设维护网页设计与制作教程杨选辉
  • 动力网站移动端模板网站建设价格
  • Windows 10终止服务支持:企业IT安全迎来重大考验
  • Mac os安装Easyconnect卡在正在验证软件包
  • 手机网站免费模板下载门户网站 销售
  • 学习和掌握RabbitMQ及其与springboot的整合实践(篇二)