当前位置: 首页 > news >正文

文献分享: DESSERT基于LSH的多向量检索(Part3.2.外部聚合的联合界)

原论文

1.   \textbf{1. } 1. 定理 4.2 \textbf{4.2} 4.2的内容

1.1.   \textbf{1.1. } 1.1. 一些符号

1️⃣一些基础的符号

  1. 基本符号:
    符号含义
    Q Q Q查询集,此处只考虑一个 Q Q Q并且 Q = { q 1 , q 2 , . . . , q m q } Q{=}\{q_1,q_2,...,q_{m_q}\} Q={q1,q2,...,qmq}(此处假设 m q m_q mq为常数),记其子向量为 q r ∈ Q q_r{∈}Q qrQ
    S S S目标集,此处假定每个 ∣ S ∣ = m {\mid}S{\mid}{=}m S=m(常数), S ∗ S^* S Q Q Q评分最大(其元素为 x j ∗ ∈ S ∗ x^*_j{∈}S^* xjS),其余都记为 S i S_i Si(其元素为 x i j ∈ S i x_{ij}{∈}S_i xijSi)
    N N N目标集的集即 D = { S 1 , . . . , S N } D\text{=}\{S_1,...,S_N\} D={S1,...,SN},记其元素为 S i ∈ N S_i{∈}N SiN
  2. 相似度集合
    符号含义
    s r i {\mathbf{s}}_{ri} sri q r q_r qr ∀ x i j ∈ S i \forall{x_{ij}}{∈}S_i xijSi的精确相似度的集合,即 s r i = { Sim ( q r , x i 1 ) , . . . , Sim ( q r , x i m ) } {\mathbf{s}}_{ri}{=}\{\text{Sim}(q_r,x_{i1}),...,\text{Sim}(q_r,x_{im})\} sri={Sim(qr,xi1),...,Sim(qr,xim)}
    s ^ r i \hat{\mathbf{s}}_{ri} s^ri q r q_r qr ∀ x i j ∈ S i \forall{x_{ij}}{∈}S_i xijSi的近似相似度的集合,即 s ^ r i = { Sim ^ ( q r , x i 1 ) , . . . , Sim ^ ( q r , x i m ) } \hat{\mathbf{s}}_{ri}{=}\{\hat{\text{Sim}}(q_r,x_{i1}),...,\hat{\text{Sim}}(q_r,x_{im})\} s^ri={Sim^(qr,xi1),...,Sim^(qr,xim)}
    s r ∗ {\mathbf{s}}_r^* sr q r q_r qr ∀ x j ∗ ∈ S ∗ \forall{}x^*_j{∈}S^* xjS的精确相似度的集合,即 s r i = { Sim ( q r , x 1 ∗ ) , . . . , Sim ( q r , x m ∗ ) } {\mathbf{s}}_{ri}{=}\{\text{Sim}(q_r,x_1^*),...,\text{Sim}(q_r,x_m^*)\} sri={Sim(qr,x1),...,Sim(qr,xm)}
    s ^ r ∗ \hat{\mathbf{s}}_r^* s^r q r q_r qr ∀ x j ∗ ∈ S ∗ \forall{}x^*_j{∈}S^* xjS的近似相似度的集合,即 s ^ r i = { Sim ^ ( q r , x 1 ∗ ) , . . . , Sim ^ ( q r , x m ∗ ) } {\mathbf{\hat{s}}}_{ri}{=}\{\hat{\text{Sim}}(q_r,x_1^*),...,\hat{\text{Sim}}(q_r,x_m^*)\} s^ri={Sim^(qr,x1),...,Sim^(qr,xm)}
  3. 相似度及其最大值
    符号含义
    s r i j s_{rij} srij s r i max ⁡ s_{ri\max} srimax q r q_r qr ∀ x i j ∈ S i \forall{x_{ij}}{∈}S_i xijSi中的 s r i j = Sim ( q r , x i j ) s_{rij}{=}\text{Sim}(q_r,x_{ij}) srij=Sim(qr,xij),其最大值记作 s r i max ⁡ = max ⁡ ( s r i ) s_{ri\max}{=}\max({\mathbf{s}}_{ri}) srimax=max(sri)且此时向量记为 x i j ∗ x_{ij}^* xij
    s ^ r i j \hat{s}_{rij} s^rij s ^ r i max ⁡ \hat{s}_{ri\max} s^rimax q r q_r qr ∀ x i j ∈ S i \forall{x_{ij}}{∈}S_i xijSi中的 s ^ r i j = Sim ^ ( q r , x i j ) \hat{s}_{rij}{=}\hat{\text{Sim}}(q_r,x_{ij}) s^rij=Sim^(qr,xij),其最大值记作 s ^ r i max ⁡ = max ⁡ ( s ^ r i ) \hat{s}_{ri\max}{=}\max(\hat{{\mathbf{s}}}_{ri}) s^rimax=max(s^ri)且此时向量记为 x i j ∗ x_{ij}^* xij
    s r j ∗ {s}_{rj}^* srj s r max ⁡ ∗ s_{r\max}^* srmax q r q_r qr ∀ x j ∗ ∈ S ∗ \forall{}x^*_j{∈}S^* xjS中的 s r j ∗ = Sim ( q r , x j ∗ ) {s}_{rj}^*{=}\text{Sim}(q_r,x_j^*) srj=Sim(qr,xj),其最大值记作 s r max ⁡ ∗ = max ⁡ ( s r ∗ ) s_{r\max}^*{=}\max({\mathbf{s}}_r^*) srmax=max(sr)且此时向量记为 x j ∗ ∗ x_j^{**} xj∗∗
    s ^ r j ∗ \hat{s}_{rj}^* s^rj s ^ r max ⁡ ∗ \hat{s}_{r\max}^* s^rmax q r q_r qr ∀ x j ∗ ∈ S ∗ \forall{}x^*_j{∈}S^* xjS中的 s ^ r j ∗ = Sim ^ ( q r , x j ∗ ) \hat{s}_{rj}^*{=}\hat{\text{Sim}}(q_r,x_j^*) s^rj=Sim^(qr,xj),其最大值记作 s ^ r max ⁡ ∗ = max ⁡ ( s ^ r ∗ ) \hat{s}_{r\max}^*{=}\max({\mathbf{\hat{s}}}_r^*) s^rmax=max(s^r)且此时向量记为 x j ∗ ∗ x_j^{**} xj∗∗
  4. 几种聚合:( w r w_r wr为权值)
    • 内部聚合:即 σ σ σ max ⁡ \max max(最大值聚合),以 σ \sigma σ为例对不同集合的聚合记作 σ ( s r i ) / σ ( s ^ r i ) / σ ( s r ∗ ) / σ ( s ^ r ∗ ) σ({\mathbf{s}}_{ri})/σ(\hat{\mathbf{s}}_{ri})/σ({\mathbf{s}}_r^*)/σ(\hat{\mathbf{s}}_r^*) σ(sri)/σ(s^ri)/σ(sr)/σ(s^r)
    • 外部聚合:聚合 σ ( s r i ) / σ ( s ^ r i ) / σ ( s r ∗ ) / σ ( s ^ r ∗ ) σ({\mathbf{s}}_{ri})/σ(\hat{\mathbf{s}}_{ri})/σ({\mathbf{s}}_r^*)/σ(\hat{\mathbf{s}}_r^*) σ(sri)/σ(s^ri)/σ(sr)/σ(s^r)得到评分
      • S i S_i Si有: F ( Q , S i ) = 1 m q ∑ r = 1 m q w r σ ( s r i ) F\left({Q,S_i}\right)\text{=}\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ({\mathbf{s}}_{ri}) F(Q,Si)=mq1r=1mqwrσ(sri) F ^ ( Q , S i ) = 1 m q ∑ r = 1 m q w r σ ( s ^ r i ) \hat{F}\left({Q,S_i}\right)\text{=}\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ({\mathbf{\hat{s}}}_{ri}) F^(Q,Si)=mq1r=1mqwrσ(s^ri)
      • S ∗ S^* S有: F ( Q , S ∗ ) = 1 m q ∑ r = 1 m q w r σ ( s r ∗ ) {F}\left({Q,S^*}\right)\text{=}\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ({\mathbf{s}}_r^*) F(Q,S)=mq1r=1mqwrσ(sr) F ^ ( Q , S ∗ ) = 1 m q ∑ r = 1 m q w r σ ( s ^ r ∗ ) \hat{F}\left({Q,S^*}\right)\text{=}\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ(\hat{\mathbf{s}}_r^*) F^(Q,S)=mq1r=1mqwrσ(s^r)

2️⃣定理参数与结论

  1. 界限参数:对于 0 < β ≤ 1 ≤ α 0\text{<}β\text{≤}1\text{≤}α 0<β1α
    符号含义
    F ( Q , S ∗ ) F(Q, S^*) F(Q,S)的下界 B ∗ B^* B B ∗ = β m q ∑ r = 1 m q w r s r max ⁡ ∗ B^*\text{=}\displaystyle{}\frac{β}{m_q}\sum_{r=1}^{m_q}w_rs_{r\max}^* B=mqβr=1mqwrsrmax S ∗ S^* S的保守估计
    F ( Q , S i ) F(Q, S_i) F(Q,Si)的上界 B i B_i Bi B i = α m q ∑ r = 1 m q w r s ^ r i max ⁡ B_i\text{=}\displaystyle{}\fracα{m_q}\sum_{r=1}^{m_q}w_r\hat{s}_{ri\max} Bi=mqαr=1mqwrs^rimax S i S_i Si的乐观估计, S ∗ ∉ { S i } S^*{\notin}\{S_i\} S/{Si} B i B_i Bi最大值为 B i max ⁡ B_{i\max} Bimax,及 Δ = B ∗ – B i max ⁡ 3 \Delta{\text{=}}\cfrac{B^*–B_{i\max}}{3} Δ=3BBimax
  2. 其它参数:(有些是证明过程中的)
    符号含义
    失败概率 δ δ δ算法的失败概率,目标是以至少 1 − δ 1{-}δ 1δ的概率正确返回 S ∗ S^* S
    哈希数量 L L L DESSERT \text{DESSERT} DESSERT中对每个 q r ∈ Q q_r{∈}Q qrQ x i j ∈ S i x_{ij}{∈}S_i xijSi进行 L L L次分桶,此处设为 L = O ( log ⁡ ( N m q m δ ) ) L\text{=}\displaystyle{}O\left({\log\left(\frac{N{m}_{q}m}{δ}\right)}\right) L=O(log(δNmqm))
    上界 γ r i γ_{ri} γri关于 Δ i r / s r i max ⁡ / τ i r \Delta_{ir}/s_{ri\max}/\tau_{ir} Δir/srimax/τir的函数( τ r i = α s r i max ⁡ + Δ r i \tau_{ri}{=}αs_{ri\max}{+}\Delta_{ri} τri=αsrimax+Δri),当 Δ r i \Delta_{ri} Δri固定时最大值 ( γ r i ) max ⁡ ∈ ( 1 − Δ r i α , 1 ) (γ_{ri})_{\max}{∈}\left(1{-}\cfrac{\Delta_{ri}}{α},1\right) (γri)max(1αΔri,1)
    指示随机 1 \mathbb{1} 1例如事件 A A A发生了则有 1 A = 1 \mathbb{1}_A{=}1 1A=1,而本文中 1 = 1 \mathbb{1}{=}1 1=1表示所有上界和下界条件同时满足

1.2.   \textbf{1.2. } 1.2. 定理内容

1️⃣定理结论:设定 Δ > 0 \Delta\text{>}0 Δ0

  1. 第一种表述: Pr ⁡ [ ∀ i ( F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) ) ] ≥ 1 − δ \Pr\left[\forall{i}\left(\hat{F}(Q,S^*){>}\hat{F}(Q,S_i)\right)\right]{≥}1{-}δ Pr[i(F^(Q,S)>F^(Q,Si))]1δ
  2. 第一种表述: DESSERT \text{DESSERT} DESSERT算法结构能以 1 − δ 1{-}δ 1δ的概率,返回与 Q Q Q相似度最高的 S ∗ = argmax ⁡ i ∈ { 1 , … , N } F ( Q , S i ) S^*\text{=}\mathop{\operatorname{argmax}}\limits_{{i{∈}\{1,\ldots,N\}}}F\left( {Q,S_{i}}\right) S=i{1,,N}argmaxF(Q,Si)

2️⃣证明思路:要证 Pr ⁡ [ ∀ i ( F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) ) ] ≥ 1 − δ \Pr\left[\forall{i}\left(\hat{F}(Q,S^*){>}\hat{F}(Q,S_i)\right)\right]{≥}1{-}δ Pr[i(F^(Q,S)>F^(Q,Si))]1δ

  1. 总体思路:找到一个 L L L满足
    • 上界控制:对于所有 S i ≠ S ∗ S_i{≠}S^* Si=S,确保其估计得分 F ^ ( Q , S i ) \hat{F}(Q,S_i) F^(Q,Si)不超过某个阈值
    • 下界控制:对于 S ∗ S^* S,确保其估计得分 F ^ ( Q , S ∗ ) \hat{F}(Q,S^*) F^(Q,S)不低于某个阈值
    • 联合界限:上述条件同时以高概率成立,从而保证 F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) \hat{F}(Q,S^*){>}\hat{F}(Q,S_i) F^(Q,S)>F^(Q,Si)
  2. 上下界限:当 L = max ⁡ { ln ⁡ ( δ 2 ( N − 1 ) m q m ) ln ⁡ ( ( γ r i ) max ⁡ ) , β 2 ln ⁡ ( 4 m q δ ) 2 Δ r i 2 } L{=}\max\left\{\cfrac{\ln\left(\cfrac{δ}{2(N{-}1)m_qm}\right)}{\ln{\left((γ_{ri})_{\max}\right)}},\cfrac{β^2\ln\left(\cfrac{4m_q}{\delta}\right)}{2\Delta_{ri}^2}\right\} L=max ln((γri)max)ln(2(N1)mqmδ),2Δri2β2ln(δ4mq)
    • 上界: S i ≠ S ∗ S_i{≠}S^* Si=S中共 ( N − 1 ) m q (N{-}1)m_q (N1)mq q r q_r qr,有 Pr ⁡ [ ∀ q r ( σ ( s ^ r i ) ≥ α s r i max ⁡ + Δ r i ) ] ≤ δ 2 \Pr\left[\forall{q_r}\left({σ(\hat{\mathbf{s}}_{ri}){≥}α s_{ri\max}{+}\Delta_{ri}}\right)\right]{≤}\cfrac{δ}{2} Pr[qr(σ(s^ri)αsrimax+Δri)]2δ σ ( s ^ r i ) σ(\hat{\mathbf{s}}_{ri}) σ(s^ri)高概率在上界 α s r i max ⁡ + Δ r i αs_{ri\max}{+}\Delta_{ri} αsrimax+Δri
    • 下界: S ∗ S^* S中共 m q m_q mq q r q_r qr,有 Pr ⁡ [ ∀ q r ( σ ( s ^ r ∗ ) ≤ β s r max ⁡ ∗ − Δ r i ) ] ≤ δ 2 \Pr\left[\forall{q_r}\left({σ(\hat{\mathbf{s}}_r^*){≤}βs_{r\max}^*{-}\Delta_{ri}}\right)\right]{≤}\cfrac{δ}{2} Pr[qr(σ(s^r)βsrmaxΔri)]2δ σ ( s ^ r ∗ ) σ(\hat{\mathbf{s}}_r^*) σ(s^r)高概率在下界 β s r max ⁡ ∗ − Δ r i βs_{r\max}^*{-}\Delta_{ri} βsrmaxΔri
  3. 联合界限:保证 F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) \hat{F}(Q,S^*){>}\hat{F}(Q,S_i) F^(Q,S)>F^(Q,Si)高概率成立
    • 假定: 1 \mathbb{1} 1为一个二元指示,当 1 = 1 \mathbb{1}{=}1 1=1时表示上述 ( N − 1 ) m q (N{-}1)m_q (N1)mq个上界和 m q m_q mq个下界同时成立
      • 上界:对所有 S i ≠ S ∗ S_i{≠}S^* Si=S中共 ( N − 1 ) m q (N{-}1)m_q (N1)mq q r q_r qr,有 σ ( s ^ r i ) σ(\hat{\mathbf{s}}_{ri}) σ(s^ri)都在上界 α s r i max ⁡ + Δ r i αs_{ri\max}{+}\Delta_{ri} αsrimax+Δri
      • 下界:所有 S ∗ S^* S中共 m q m_q mq q r q_r qr,有 σ ( s ^ r ∗ ) σ(\hat{\mathbf{s}}_r^*) σ(s^r)都在下界 β s r max ⁡ ∗ − Δ r i βs_{r\max}^*{-}\Delta_{ri} βsrmaxΔri
    • 思路:先证明蕴含关系即 1 = 1 \mathbb{1}{=}1 1=1时事件 ∀ i ( F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) ) \forall{i}\left(\hat{F}(Q,S^*){>}\hat{F}(Q,S_i)\right) i(F^(Q,S)>F^(Q,Si))成立,再证明 Pr ⁡ ( 1 = 1 ) = 1 − δ \Pr(\mathbb{1}{=}1){=}1{-}\delta Pr(1=1)=1δ

3.   \textbf{3. } 3. 联合界限

0️⃣基本思路:保证 F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) \hat{F}(Q,S^*){>}\hat{F}(Q,S_i) F^(Q,S)>F^(Q,Si)高概率成立

  1. 假定: 1 \mathbb{1} 1为一个二元指示,当 1 = 1 \mathbb{1}{=}1 1=1时表示 ( N − 1 ) m q (N{-}1)m_q (N1)mq个上界和 m q m_q mq个下界同时成立
    • 上界:对所有 S i ≠ S ∗ S_i{≠}S^* Si=S中共 ( N − 1 ) m q (N{-}1)m_q (N1)mq q r q_r qr,有 σ ( s ^ r i ) σ(\hat{\mathbf{s}}_{ri}) σ(s^ri)都在上界 α s r i max ⁡ + Δ r i αs_{ri\max}{+}\Delta_{ri} αsrimax+Δri
    • 下界:所有 S ∗ S^* S中共 m q m_q mq q r q_r qr,有 σ ( s ^ r ∗ ) σ(\hat{\mathbf{s}}_r^*) σ(s^r)都在下界 β s r max ⁡ ∗ − Δ r i βs_{r\max}^*{-}\Delta_{ri} βsrmaxΔri
  2. 思路:先证明蕴含关系即 1 = 1 \mathbb{1}{=}1 1=1时事件 ∀ i ( F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) ) \forall{i}\left(\hat{F}(Q,S^*){>}\hat{F}(Q,S_i)\right) i(F^(Q,S)>F^(Q,Si))成立,再证明 Pr ⁡ ( 1 = 1 ) ≥ 1 − δ \Pr(\mathbb{1}{=}1){≥}1{-}\delta Pr(1=1)1δ

1️⃣蕴含关系的证明:对 Pr ⁡ [ ∀ i ( F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) ) ] \Pr\left[\forall{i}\left(\hat{F}(Q,S^*){>}\hat{F}(Q,S_i)\right)\right] Pr[i(F^(Q,S)>F^(Q,Si))]的不断进行变换

  1. 由定义 F ^ ( Q , S i ) = 1 m q ∑ r = 1 m q w r σ ( s ^ r i ) \hat{F}\left({Q,S_i}\right)\text{=}\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ({\mathbf{\hat{s}}}_{ri}) F^(Q,Si)=mq1r=1mqwrσ(s^ri) F ^ ( Q , S ∗ ) = 1 m q ∑ r = 1 m q w r σ ( s ^ r ∗ ) \hat{F}\left({Q,S^*}\right)\text{=}\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ(\hat{\mathbf{s}}_r^*) F^(Q,S)=mq1r=1mqwrσ(s^r)
    • 代入得,原式 = Pr ⁡ [ ∀ i ( F ^ ( Q , S ∗ ) − F ^ ( Q , S i ) > 0 ) ] = Pr ⁡ [ ∀ i ( ( 1 m q ∑ r = 1 m q w r σ ( s ^ r ∗ ) − 1 m q ∑ r = 1 m q w r σ ( s ^ r i ) ) > 0 ) ] {=}\Pr\left[\forall{i}\left(\hat{F}(Q,S^*){-}\hat{F}(Q,S_i){>}0\right)\right]{=}\Pr\left[\forall{i}\left(\left(\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ(\hat{\mathbf{s}}_r^*){-}\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ({\mathbf{\hat{s}}}_{ri})\right){>}0\right)\right] =Pr[i(F^(Q,S)F^(Q,Si)>0)]=Pr[i((mq1r=1mqwrσ(s^r)mq1r=1mqwrσ(s^ri))>0)]
    • 化简得,原式 = Pr ⁡ [ ∀ i ( ∑ r = 1 m q w r ( σ ( s ^ r ∗ ) − σ ( s ^ r i ) ) > 0 ) ] {=}\Pr\left[\forall{i}\left(\displaystyle{}\sum_{r=1}^{m_q}w_r\left(σ(\hat{\mathbf{s}}_r^*){-}σ({\mathbf{\hat{s}}}_{ri})\right){>}0\right)\right] =Pr[i(r=1mqwr(σ(s^r)σ(s^ri))>0)]
  2. 考虑有 Pr ⁡ ( A ) ≥ Pr ⁡ ( A ∩ B ) = Pr ⁡ ( A ∣ B ) Pr ⁡ ( B ) \Pr(A){≥}\Pr(A{∩}B){=}\Pr(A|B)\Pr(B) Pr(A)Pr(AB)=Pr(AB)Pr(B),所以原式 ≥ Pr ⁡ [ ∀ i ( ∑ r = 1 m q w r ( σ ( s ^ r ∗ ) − σ ( s ^ r i ) ) > 0 | 1 = 1 ) ] Pr ⁡ [ 1 = 1 ] {≥}\displaystyle\Pr\left[\forall{i}\left(\sum_{r=1}^{m_q}w_r \left(\sigma(\hat{\mathbf{s}}_r^*){-}\sigma(\hat{\mathbf{s}}_{ri}) \right){>}0\middle|\mathbb{1}{=}1\right)\right]\Pr\left[\mathbb{1}{=}1\right] Pr[i(r=1mqwr(σ(s^r)σ(s^ri))>0 1=1)]Pr[1=1]
    • 1 = 1 \mathbb{1}{=}1 1=1时有 σ ( s ^ r i ) ≤ α s r i max ⁡ + Δ r i σ(\hat{\mathbf{s}}_{ri}){≤}αs_{ri\max}{+}\Delta_{ri} σ(s^ri)αsrimax+Δri以及 σ ( s ^ r ∗ ) ≥ β s r max ⁡ ∗ − Δ r i σ(\hat{\mathbf{s}}_r^*){≥}βs_{r\max}^*{-}\Delta_{ri} σ(s^r)βsrmaxΔri,所以 σ ( s ^ r ∗ ) − σ ( s ^ r i ) ≥ β s r max ⁡ ∗ − α s r i max ⁡ − 2 Δ r i σ(\hat{\mathbf{s}}_r^*){-}σ(\hat{\mathbf{s}}_{ri}){≥}βs_{r\max}^*{-}αs_{ri\max}{-}2\Delta_{ri} σ(s^r)σ(s^ri)βsrmaxαsrimax2Δri
    • β s r max ⁡ ∗ − α s r i max ⁡ − 2 Δ r i > 0 βs_{r\max}^*{-}αs_{ri\max}{-}2\Delta_{ri}{>}0 βsrmaxαsrimax2Δri>0发生时, σ ( s ^ r ∗ ) − σ ( s ^ r i ) > 0 σ(\hat{\mathbf{s}}_r^*){-}σ(\hat{\mathbf{s}}_{ri}){>}0 σ(s^r)σ(s^ri)>0必发生,即 β s r max ⁡ ∗ − α s r i max ⁡ − 2 Δ r i > 0 βs_{r\max}^*{-}αs_{ri\max}{-}2\Delta_{ri}{>}0 βsrmaxαsrimax2Δri>0事件概率更小
    • Pr ⁡ [ ∀ i ( ∑ r = 1 m q w r ( σ ( s ^ r ∗ ) − σ ( s ^ r i ) ) > 0 | 1 = 1 ) ] ≥ Pr ⁡ [ ∀ i ( ∑ r = 1 m q w r ( β s r max ⁡ ∗ − α s r i max ⁡ − 2 Δ r i ) > 0 ) ] \displaystyle\Pr\left[\forall{i}\left(\sum_{r=1}^{m_q}w_r \left(\sigma(\hat{\mathbf{s}}_r^*){-}\sigma(\hat{\mathbf{s}}_{ri}) \right){>}0\middle|\mathbb{1}{=}1\right)\right]{≥}\displaystyle\Pr\left[\forall{i}\left(\sum_{r=1}^{m_q}w_r \left(βs_{r\max}^*{-}αs_{ri\max}{-}2\Delta_{ri}\right){>}0\right)\right] Pr[i(r=1mqwr(σ(s^r)σ(s^ri))>0 1=1)]Pr[i(r=1mqwr(βsrmaxαsrimax2Δri)>0)]
    • 稍作变换,原式 ≥ Pr ⁡ [ ∀ i ( ∑ r = 1 m q w r ( β s r max ⁡ ∗ − α s r i max ⁡ ) > 2 Δ r i ∑ r = 1 m q w r ) ] Pr ⁡ ( 1 = 1 ) {≥}\displaystyle\Pr\left[{{\forall }{i}\left({\sum_{{r=1}}^{{m}_{q}}{w}_{r}\left({βs_{r\max}^*{-}\alpha s_{ri\max}}\right){>}{2\Delta_{ri}}\sum_{{r = 1}}^{{m}_{q}}{w}_{r}}\right)}\right]\Pr(\mathbb{1}{=}1) Pr[i(r=1mqwr(βsrmaxαsrimax)>2Δrir=1mqwr)]Pr(1=1)
  3. 由定义 B ∗ = β m q ∑ r = 1 m q w r s r max ⁡ ∗ B^*\text{=}\displaystyle{}\frac{β}{m_q}\sum_{r=1}^{m_q}w_rs_{r\max}^* B=mqβr=1mqwrsrmax B i = α m q ∑ r = 1 m q w r s ^ r i max ⁡ B_i\text{=}\displaystyle{}\fracα{m_q}\sum_{r=1}^{m_q}w_r\hat{s}_{ri\max} Bi=mqαr=1mqwrs^rimax
    • 代入得,原式 ≥ Pr ⁡ [ ∀ i ( m q ( B ∗ − B i ) > 2 Δ r i ∑ r = 1 m q w r ) ] Pr ⁡ ( 1 = 1 ) {≥}\Pr\left[{\forall{i}\left({{m}_{q}\left({B^*{-}B_i}\right){>}{2\Delta_{ri} }\displaystyle\sum_{{r = 1}}^{{m}_{q}}{w}_r}\right) }\right]\Pr({\mathbb{1}{=}1}) Pr[i(mq(BBi)>2Δrir=1mqwr)]Pr(1=1)
    • 又由于 B i , max ⁡ > B i B_{i,\max}{>}B_i Bi,max>Bi,即 Pr ⁡ [ ∀ i ( m q ( B ∗ − B i ) > 2 Δ r i ∑ r = 1 m q w r ) ] ≥ Pr ⁡ [ ∀ i ( m q ( B ∗ − B i max ⁡ ) > 2 Δ r i ∑ r = 1 m q w r ) ] \Pr\left[{\forall{i}\left({{m}_{q}\left({B^*{-}B_i}\right){>}{2\Delta_{ri} }\displaystyle\sum_{{r=1}}^{{m}_{q}}{w}_r}\right) }\right]{≥}\Pr\left[{\forall{i}\left({{m}_{q}\left({B^*{-}B_{i\max}}\right){>}{2\Delta_{ri} }\displaystyle\sum_{{r=1}}^{{m}_{q}}{w}_r}\right) }\right] Pr[i(mq(BBi)>2Δrir=1mqwr)]Pr[i(mq(BBimax)>2Δrir=1mqwr)]
    • 所以,原式 ≥ Pr ⁡ [ ∀ i ( m q ( B ∗ − B i max ⁡ ) > 2 Δ r i ∑ r = 1 m q w r ) ] Pr ⁡ ( 1 = 1 ) {≥}\Pr\left[{\forall{i}\left({{m}_{q}\left({B^*{-}B_{i\max}}\right){>}{2\Delta_{ri} }\displaystyle\sum_{{r=1}}^{{m}_{q}}{w}_r}\right) }\right]\Pr({\mathbb{1}{=}1}) Pr[i(mq(BBimax)>2Δrir=1mqwr)]Pr(1=1)
  4. 定义阈值:让所有的 Δ r i \Delta_{ri} Δri都为固定值,且 Δ = B ∗ – B i max ⁡ 3 \Delta{=}\cfrac{B^*–B_{i\max}}{3} Δ=3BBimax
    • 所以,原式 ≥ Pr ⁡ [ ∀ i ( 3 m q Δ > 2 Δ ∑ r = 1 m q w r ) ] Pr ⁡ ( 1 = 1 ) {≥}\Pr\left[{\forall{i}\left({3{m}_{q}\Delta{>}{2\Delta}\displaystyle\sum_{{r=1}}^{{m}_{q}}{w}_r}\right)}\right]\Pr({\mathbb{1}{=}1}) Pr[i(3mqΔ>r=1mqwr)]Pr(1=1)
    • 又考虑到 1 ≥ w r 1{≥}{w}_r 1wr 2 m q Δ ≥ 2 Δ ∑ r = 1 m q w r 2m_q\Delta{≥}2\Delta\displaystyle\sum_{{r=1}}^{{m}_{q}}{w}_r 2mqΔr=1mqwr,所以 Pr ⁡ [ ∀ i ( 3 m q Δ > 2 Δ ∑ r = 1 m q w r ) ] ≥ Pr ⁡ [ ∀ i ( 3 m q Δ > 2 m q Δ ) ] \Pr\left[{\forall{i}\left({3{m}_{q}\Delta{>}{2\Delta}\displaystyle\sum_{{r=1}}^{{m}_{q}}{w}_r}\right)}\right]{≥}\Pr\left[{\forall{i}\left({3{m}_{q}\Delta{>}2m_q\Delta}\right)}\right] Pr[i(3mqΔ>r=1mqwr)]Pr[i(3mqΔ>2mqΔ)]
    • 所以原式 ≥ Pr ⁡ [ ∀ i ( 3 m q Δ > 2 Δ ) ] Pr ⁡ ( 1 = 1 ) = Pr ⁡ ( 1 = 1 ) = 1 − Pr ⁡ ( 1 = 0 ) {≥}\Pr\left[{\forall{i}\left({3{m}_{q}\Delta{>}{2\Delta}}\right)}\right]\Pr({\mathbb{1}{=}1}){=}\Pr({\mathbb{1}{=}1}){=}1{-}\Pr({\mathbb{1}{=}0}) Pr[i(3mqΔ>)]Pr(1=1)=Pr(1=1)=1Pr(1=0)

2️⃣概率的证明: Pr ⁡ ( 1 = 1 ) = 1 − δ \Pr(\mathbb{1}{=}1){=}1{-}\delta Pr(1=1)=1δ

  1. 试图证明 Pr ⁡ ( 1 = 0 ) \Pr(\mathbb{1}{=}0) Pr(1=0),并将该失败事件分为
    • 至少有一个上界失败,即 U fail = ( ∃ ( r , S i ≠ S ∗ ) ( σ ( s ^ r i ) ≥ α s r i max ⁡ + Δ r i ) ) U_{\text{fail}}{=}\left({∃}(r,S_i{≠}S^*)\left({σ(\hat{\mathbf{s}}_{ri}){≥}α s_{ri\max}{+}\Delta_{ri}}\right)\right) Ufail=((r,Si=S)(σ(s^ri)αsrimax+Δri)),已证设定 L L L Pr ⁡ ( U fail ) ≤ δ 2 \Pr\left(U_{\text{fail}}\right){≤}\cfrac{\delta}{2} Pr(Ufail)2δ
    • 至少有一个下界失败,即 L fail = ( ∃ ( r , S i = S ∗ ) ( σ ( s ^ r ∗ ) ≤ β s r max ⁡ ∗ − Δ r i ) ) L_{\text{fail}}{=}\left({∃}(r,S_i{=}S^*)\left({σ(\hat{\mathbf{s}}_r^*){≤}βs_{r\max}^*{-}\Delta_{ri}}\right)\right) Lfail=((r,Si=S)(σ(s^r)βsrmaxΔri)),已证设定 L L L Pr ⁡ ( L fail ) ≤ δ 2 \Pr\left(L_{\text{fail}}\right){≤}\cfrac{\delta}{2} Pr(Lfail)2δ
  2. 所以 Pr ⁡ ( 1 = 0 ) ≤ Pr ⁡ ( U fail ) + Pr ⁡ ( L fail ) = δ \Pr(\mathbb{1}{=}0){≤}\Pr\left(U_{\text{fail}}\right){+}\Pr\left(L_{\text{fail}}\right){=}\delta Pr(1=0)Pr(Ufail)+Pr(Lfail)=δ,即 Pr ⁡ ( 1 = 1 ) ≥ 1 − δ \Pr(\mathbb{1}{=}1){≥}1{-}\delta Pr(1=1)1δ
  3. 最后 L = max ⁡ { ln ⁡ ( 2 ( N − 1 ) m q m δ ) ln ⁡ ( 1 ( γ r i ) max ⁡ ) , β 2 ln ⁡ ( 4 m q δ ) 2 Δ r i 2 } = max ⁡ { O ( log ⁡ ( N m q m δ ) ) , O ( log ⁡ ( m q δ ) ) } = O ( log ⁡ ( N m q m δ ) ) \small{}L{=}\max\left\{\cfrac{\ln\left(\cfrac{2(N{-}1)m_qm}{δ}\right)}{\ln{\left(\cfrac{1}{(γ_{ri})_{\max}}\right)}},\cfrac{β^2\ln\left(\cfrac{4m_q}{\delta}\right)}{2\Delta_{ri}^2}\right\}{=}\max\left\{O\left( {\log \left( \cfrac{N{m}_{q}m}{\delta}\right) }\right),O\left( {\log \left( \cfrac{{m}_{q}}{\delta }\right) }\right)\right\}{=}O\left( {\log \left( \cfrac{N{m}_{q}m}{\delta}\right) }\right) L=max ln((γri)max1)ln(δ2(N1)mqm),2Δri2β2ln(δ4mq) =max{O(log(δNmqm)),O(log(δmq))}=O(log(δNmqm))证毕

Ps.   \textbf{Ps. } Ps. 运行时间分析

1️⃣一些假设

  1. 计算任何一个 LSH \text{LSH} LSH函数 ψ t ( x ) \psi{_t}(x) ψt(x)的时间都为 O ( d ) O(d) O(d),其中 d d d为向量 x x x的维度
  2. ∣ D [ i ] t , h ∣ < T |\mathcal{D}{\left\lbrack{}i\right\rbrack}_{t,h}|\text{<}T D[i]t,hT,即用哈希函数 ψ t \psi_t ψt对集合 S i S_i Si分桶,落入哈希值为 h h h的桶的向量数不超过常数 T T T
  3. 让哈希数量 L = O ( log ⁡ ( N m q m δ ) ) L{=}O\left( {\log \left( \cfrac{N{m}_{q}m}{\delta}\right) }\right) L=O(log(δNmqm)),于定理中的一致

2️⃣复杂度: O ( m q L d + ∑ q r = q 1 q r = q m q ∑ S i = S 1 S i = S N ∑ ψ t = ψ 1 ψ t = ψ L D [ i ] t , ψ t ( q r ) ) O\left(m_qLd{+}\displaystyle\sum_{q_r=q_1}^{q_r=q_{m_q}}\sum_{S_i=S_1}^{S_i=S_N}\sum_{\psi_t=\psi_1}^{\psi_t=\psi_L}\mathcal{D}{\left\lbrack{}i\right\rbrack}_{t,\psi_{t}(q_r)}\right) O mqLd+qr=q1qr=qmqSi=S1Si=SNψt=ψ1ψt=ψLD[i]t,ψt(qr)

  1. O ( m q L d ) O\left(m_qLd\right) O(mqLd)表示对查询 Q Q Q的处理,给 m q m_q mq个向量 q r q_r qr每个计算 L L L个哈希值,每个哈希值计算耗时 O ( d ) O(d) O(d),所以为 O ( m q L d ) O\left(m_qLd\right) O(mqLd)
  2. O ( ∑ q r = q 1 q r = q m q ∑ S i = S 1 S i = S N ∑ ψ t = ψ 1 ψ t = ψ L D [ i ] t , ψ t ( q r ) ) O\left(\displaystyle\sum_{q_r=q_1}^{q_r=q_{m_q}}\sum_{S_i=S_1}^{S_i=S_N}\sum_{\psi_t=\psi_1}^{\psi_t=\psi_L}\mathcal{D}{\left\lbrack{}i\right\rbrack}_{t,\psi_{t}(q_r)}\right) O qr=q1qr=qmqSi=S1Si=SNψt=ψ1ψt=ψLD[i]t,ψt(qr) 表示对 D = { S 1 , S 2 , . . . , S N } D\text{=}\{S_1,S_2,...,S_N\} D={S1,S2,...,SN}的处理
    • ∑ ψ t = ψ 1 ψ t = ψ L D [ i ] t , ψ t ( q r ) \displaystyle\sum_{\psi_t=\psi_1}^{\psi_t=\psi_L}\mathcal{D}{\left\lbrack{}i\right\rbrack}_{t,\psi_{t}(q_r)} ψt=ψ1ψt=ψLD[i]t,ψt(qr)表示,对于固定 q r q_r qr S i S_i Si,所姚检查的所有桶中的向量的总数,每检查一个向量(与 q r q_r qr碰撞与否)耗时 O ( 1 ) O(1) O(1)
    • 对于所有的 q r q_r qr和所有的 S i S_i Si,一共要检查 O ( ∑ q r = q 1 q r = q m q ∑ S i = S 1 S i = S N ∑ ψ t = ψ 1 ψ t = ψ L D [ i ] t , ψ t ( q r ) ) O\left(\displaystyle\sum_{q_r=q_1}^{q_r=q_{m_q}}\sum_{S_i=S_1}^{S_i=S_N}\sum_{\psi_t=\psi_1}^{\psi_t=\psi_L}\mathcal{D}{\left\lbrack{}i\right\rbrack}_{t,\psi_{t}(q_r)}\right) O qr=q1qr=qmqSi=S1Si=SNψt=ψ1ψt=ψLD[i]t,ψt(qr)
    • 考虑到 ∣ D [ i ] t , h ∣ < T |\mathcal{D}{\left\lbrack{}i\right\rbrack}_{t,h}|\text{<}T D[i]t,hT所以 O ( ∑ q r = q 1 q r = q m q ∑ S i = S 1 S i = S N ∑ ψ t = ψ 1 ψ t = ψ L D [ i ] t , ψ t ( q r ) ) < O ( ∑ q r = q 1 q r = q m q ∑ S i = S 1 S i = S N ∑ ψ t = ψ 1 ψ t = ψ L T ) = O ( m q N L T ) O\left(\displaystyle\sum_{q_r=q_1}^{q_r=q_{m_q}}\sum_{S_i=S_1}^{S_i=S_N}\sum_{\psi_t=\psi_1}^{\psi_t=\psi_L}\mathcal{D}{\left\lbrack{}i\right\rbrack}_{t,\psi_{t}(q_r)}\right)\text{<}O\left(\displaystyle\sum_{q_r=q_1}^{q_r=q_{m_q}}\sum_{S_i=S_1}^{S_i=S_N}\sum_{\psi_t=\psi_1}^{\psi_t=\psi_L}T\right)\text{=}O\left(m_qNLT\right) O qr=q1qr=qmqSi=S1Si=SNψt=ψ1ψt=ψLD[i]t,ψt(qr) O qr=q1qr=qmqSi=S1Si=SNψt=ψ1ψt=ψLT =O(mqNLT)
  3. L = O ( log ⁡ ( N m q m δ ) ) L{=}O\left( {\log \left( \cfrac{N{m}_{q}m}{\delta}\right) }\right) L=O(log(δNmqm))代回
    • 最终 O ( m q L d + m q N L T ) = O ( m q L d + m q N L T ) = O ( m q d log ⁡ ( N m q m δ ) + m q N T log ⁡ ( N m q m δ ) ) O\left(m_qLd{+}m_qNLT\right){=}O\left(m_qLd{+}m_qNLT\right){=}O\left(m_qd\log \left( \cfrac{N{m}_{q}m}{\delta}\right){+}m_qNT\log \left( \cfrac{N{m}_{q}m}{\delta}\right)\right) O(mqLd+mqNLT)=O(mqLd+mqNLT)=O(mqdlog(δNmqm)+mqNTlog(δNmqm))
    • 另外其实还可以忽略常数 T T T

相关文章:

  • lx2160 LSDK21.08 firmware 笔记 - 0.基于fip.bin 编译流程展开的 makefile 分析
  • DrissionPage详细教程
  • Django3 - 建站基础
  • AcWing 5969. 最大元素和
  • openapi + knife4j的使用
  • C++动态规划基础入门
  • Numpy和OpenCV库匹配查询,安装OpenCV ABI错误
  • 深度学习ResNet模型提取影响特征
  • 小米运维面试题及参考答案(80道面试题)
  • CST1016.基于Spring Boot+Vue高校竞赛管理系统
  • DOM解析XML:Java程序员的“乐高积木式“数据搭建
  • 国内AI大模型卷到什么程度了?
  • Linux虚拟内存详解
  • LLaMA 常见面试题
  • 探索加密期权波动率交易的系统化实践——动态对冲工具使用
  • 配置SecureCRT8.5的粘贴复制等快捷键
  • 代码生成工具explain的高级用法
  • 【随身wifi】青龙面板保姆级教程
  • ROS2---std_msgs基础消息包
  • AI+高德MCP:制作一份旅游攻略
  • 网站建设费属于无形资产吗/武汉seo搜索引擎优化
  • 梧州零距离网论坛/系统优化的例子
  • 四川住房和城乡建设厅官方网站/微信营销的成功案例
  • 北京大学两学一做网站/黑科技推广软件
  • 阿里云做私服网站/泰州seo
  • 导航网站链接怎么做/南宁seo外包平台