当前位置: 首页 > news >正文

EOM公式推导

在uplift建模中,除了AUUC、QINI指标,还有EOM。它是基于离线RCT模拟评估在线业务收益的指标,EOM越高,业务收益越高。

记录下EOM的公式推导EOM这个推导依赖于概率论中的两个核心概念

  1. 全期望定律 (Law of Total Expectation)
  2. 随机实验中的独立性 (Independence in Randomized Experiments)

目标: 证明 E[Z]=E[Y∣T=h(X)]\text{E}[Z] = \text{E}[Y | T = h(\mathbf{X})]E[Z]=E[YT=h(X)]

其中,随机变量 ZZZ 的定义为:
Z=∑t=0K1ptYI{h(X)=t}I{T=t}Z = \sum_{t=0}^{K} \frac{1}{p_t} Y \mathbb{I}\{h(\mathbf{X}) = t\} \mathbb{I}\{T = t\}Z=t=0Kpt1YI{h(X)=t}I{T=t}
这里 pt=P(T=t)p_t = P(T=t)pt=P(T=t) 是用户被分配到干预 ttt 的概率。

第一步:代入 ZZZ 的定义并利用期望的线性性

期望 E[⋅]\text{E}[\cdot]E[] 具有线性性,因此我们可以将期望 E[Z]\text{E}[Z]E[Z] 拆分成和式的期望:
E[Z]=E[∑t=0K1ptYI{h(X)=t}I{T=t}]\text{E}[Z] = \text{E}\left[\sum_{t=0}^{K} \frac{1}{p_t} Y \mathbb{I}\{h(\mathbf{X}) = t\} \mathbb{I}\{T = t\}\right]E[Z]=E[t=0Kpt1YI{h(X)=t}I{T=t}]

将求和 ∑\sum 和常量 1pt\frac{1}{p_t}pt1 移出期望:
E[Z]=∑t=0K1ptE[YI{h(X)=t}I{T=t}](∗)\text{E}[Z] = \sum_{t=0}^{K} \frac{1}{p_t} \text{E}\left[Y \mathbb{I}\{h(\mathbf{X}) = t\} \mathbb{I}\{T = t\}\right] \quad (*)E[Z]=t=0Kpt1E[YI{h(X)=t}I{T=t}]()

第二步:利用全期望定律和指示函数

根据概率论中对随机变量乘积期望的定义,两个指示函数 I{A}\mathbb{I}\{A\}I{A}I{B}\mathbb{I}\{B\}I{B} 相乘,等价于条件 AAABBB 同时成立

E[YI{h(X)=t}I{T=t}]=E[Y⋅I{h(X)=t,T=t}]\text{E}[Y \mathbb{I}\{h(\mathbf{X}) = t\} \mathbb{I}\{T = t\}] = \text{E}\left[Y \cdot \mathbb{I}\left\{h(\mathbf{X}) = t, T = t\right\}\right]E[YI{h(X)=t}I{T=t}]=E[YI{h(X)=t,T=t}]

利用全期望定律,将期望写成 联合概率的积分 形式:
E[Y⋅I{h(X)=t,T=t}]=E[Y∣h(X)=t,T=t]⋅P(h(X)=t,T=t)\text{E}\left[Y \cdot \mathbb{I}\left\{h(\mathbf{X}) = t, T = t\right\}\right] = \text{E}\left[Y \mid h(\mathbf{X}) = t, T = t\right] \cdot P\left(h(\mathbf{X}) = t, T = t\right)E[YI{h(X)=t,T=t}]=E[Yh(X)=t,T=t]P(h(X)=t,T=t)

将这个结果代回 (∗)(*)()
E[Z]=∑t=0K1pt⋅E[Y∣h(X)=t,T=t]⋅P(h(X)=t,T=t)\text{E}[Z] = \sum_{t=0}^{K} \frac{1}{p_t} \cdot \text{E}\left[Y \mid h(\mathbf{X}) = t, T = t\right] \cdot P\left(h(\mathbf{X}) = t, T = t\right)E[Z]=t=0Kpt1E[Yh(X)=t,T=t]P(h(X)=t,T=t)

第三步:利用随机实验的独立性

在RCT样本中,用户被分配到干预组 TTT 的过程是独立于用户的特征 X\mathbf{X}X(以及模型基于 X\mathbf{X}X 的预测 h(X)h(\mathbf{X})h(X))的。

因此,事件 {h(X)=t}\{h(\mathbf{X})=t\}{h(X)=t}{T=t}\{T=t\}{T=t} 是相互独立的。

根据独立性,联合概率可以分解:
P(h(X)=t,T=t)=P(h(X)=t)⋅P(T=t)=P(h(X)=t)⋅pt\begin{aligned} P\left(h(\mathbf{X}) = t, T = t\right) &= P\left(h(\mathbf{X}) = t\right) \cdot P\left(T = t\right) \\ &= P\left(h(\mathbf{X}) = t\right) \cdot p_t \end{aligned} P(h(X)=t,T=t)=P(h(X)=t)P(T=t)=P(h(X)=t)pt

E[Z]=∑t=0K1pt⋅E[Y∣h(X)=t,T=t]⋅(P(h(X)=t)⋅pt)=∑t=0KE[Y∣h(X)=t,T=t]⋅P(h(X)=t)\begin{aligned} \text{E}[Z] &= \sum_{t=0}^{K} \frac{1}{p_t} \cdot \text{E}\left[Y \mid h(\mathbf{X}) = t, T = t\right] \cdot \left(P\left(h(\mathbf{X}) = t\right) \cdot p_t\right) \\ &= \sum_{t=0}^{K} \text{E}\left[Y \mid h(\mathbf{X}) = t, T = t\right] \cdot P\left(h(\mathbf{X}) = t\right) \end{aligned} E[Z]=t=0Kpt1E[Yh(X)=t,T=t](P(h(X)=t)pt)=t=0KE[Yh(X)=t,T=t]P(h(X)=t)

回顾全期望定律:E[A]=∑iE[A∣B=bi]P(B=bi)\text{E}[A] = \sum_{i} \text{E}[A | B=b_i] P(B=b_i)E[A]=iE[AB=bi]P(B=bi)

E[Z]=∑t=0KE[Y∣h(X)=t,T=t]⋅P(h(X)=t)=∑t=0KE[Y∣T=t,h(X)=t]⋅P(h(X)=t)=E[Y∣T=h(X)]\begin{aligned} \text{E}[Z] &=\sum_{t=0}^{K} \text{E}\left[Y \mid h(\mathbf{X}) = t, T = t\right] \cdot P\left(h(\mathbf{X}) = t\right) \\ &=\sum_{t=0}^{K} \text{E}\left[Y \mid T = t, h(\mathbf{X}) = t\right] \cdot P\left(h(\mathbf{X}) = t\right) \\ &= \text{E}[Y | T = h(\mathbf{X})] \end{aligned} E[Z]=t=0KE[Yh(X)=t,T=t]P(h(X)=t)=t=0KE[YT=t,h(X)=t]P(h(X)=t)=E[YT=h(X)]


在营销场景的在线运筹中,h(X)=th(X) = th(X)=t 表示运筹出一张券面额,如果实发面额TTT也等于ttt,那么z=Yptz=\frac{Y}{p_t}z=ptY,这样即可模拟出在线业务收益。ptp_tpt是该treatment的样本分布占比,1pt\frac{1}{p_t}pt1表示IPW,从而避免样本不均的影响。


参考

  • Uplift Modeling with Multiple Treatments and General Response Types
http://www.dtcms.com/a/467310.html

相关文章:

  • 网站建设qinnet个股期权网站开发
  • 网站如何做好优化wordpress下载慢
  • 通信工程网站建设在线一键扒站源码php
  • 免费推广网站哪家好有哪些付费wordpress
  • 管理约束 · 开篇概述(一)
  • 电子商务网站建设培训小结北京模板开发建站
  • 源码之家网站国家企业信用公示信息系统入口
  • 华为OD机试C卷 - 对称美学 - 递归 - (Java C++ JavaScript Python)
  • 手怎么搭建网站泉州网站制作推广
  • 填空 前三章
  • 乐清网站制作优化邓亚萍20亿做网站
  • 进程的控制
  • 电脑网站微信支付怎么做的企业建设网站公司有哪些
  • 欧美做电影 迅雷下载网站网站工商备案查询
  • 深圳办公室装修哪家好正规的网站优化推广公司
  • 网站硬件方案全椒有做网站的吗
  • 提供做网站公司移动开发软件
  • 南阳卧龙区网站建设哪家好wordpress页面权限设置
  • 做网站win7好用么广州建网站比较有名的公司
  • 我的全栈学习之旅:FastAPI (持续更新!!!)
  • 做电影网站要怎么拿到版权资源下载网站建设
  • 佛山找企业的网站苏州实力做网站公司有哪些
  • 网站技术策划人员要求怎么搞到网站
  • 在 tinkinter 中 label 标签的 font 属性有哪几种形式设置?
  • wordpress友情链接激活seo关键词
  • 晋城网站制作公司怎么选wordpress 最新一片文章
  • 淄博市沂源县城乡建设局网站wordpress 删除 wordpress.org
  • 阿里云怎么放多个网站wordpress微信拦截
  • 餐饮营销型网站案例分析域名注册查询阿里云
  • 单位网站怎么做2021年uc秒懂网址