当前位置：首页 > news >正文

融合动态权重与抗刷机制的网文评分系统——基于优书网、IMDB与Reddit的混合算法实践

news 2025/10/22 6:20:27

✨ Yumuing 博客

🚀 探索技术的每一个角落，解码世界的每一种可能！

💌 如果你对 AI 充满好奇，欢迎关注博主，订阅专栏，让我们一起开启这段奇妙的旅程！

在这里插入图片描述

以权威用户为核心，时间衰减为尺度，社区互动为杠杆」的评分体系，实现：

📌 动态防刷：实时监控异常点赞，自动降权可疑评价

📌 智能冷启动：新书享3个月权重保护期，新用户默认60%权威值

📌 时空平衡：3年半衰期机制+Reddit热榜公式，兼顾经典与时效性

$\frac{\sum_{i=1}^{n} (w_i \cdot s_i)+C\cdot \mu}{\sum_{i=1}^{n} w_i+C}$

其中：

$w_i = (A_i \cdot T_i \cdot V_i)$

$A_i =\frac {\log(1 + \frac{h_a}{h_{avg}})}{1+\log(1 + \frac{h_a}{h_{avg}}) } \cdot sigmoid(\frac{h_a - h_{avg}}{h_{std}})$

其中：

设计原理：

$T_i = e^{-\lambda \cdot \Delta t}$

其中：

示例效果：推荐值为0.02，半衰期为3年

$V_i =\frac{1}{2}(\sqrt{\frac{v_i}{v_{max}}} + \frac{v_i}{v_i + v_{q}})$

其中：

设计原理：

动态适应性：
1. 每小时自动更新 $h_{avg}$ 和 $h_{std}$
2. 每天更新 $v_{max}$ 值
3. 每月重新计算所有 $\Delta t$
鲁棒性保障：

设置权重下限 $w_{min}=0.2$ 防止过度衰减

对刷赞行为设置 $v_i$ 上限（如当日突增超均值3σ，则动态降低到该书评计算得出社区权重的20%）
冷启动方案：

新用户默认 $A_i=0.6$

新书籍首月时间递减参数 $\lambda$ 降为0.01，三个月后改为0.02

起始平均分 $\mu$ 选取优书网所有书籍加权平均 $\mu=\frac{\sum_{i=1}^{n}\frac{该书籍评价人数}{所有评价人数} \cdot 该书籍评分}{\sum_{i=1}^{n}\frac{该书籍评价人数}{所有评价人数}}$

$N_{x}=\frac{N_{\max}-N_{\min}}{O_{\max}-O_{\min}}\times(O_{x}-O_{\min})+N_{\min}\quad$

其中：

即： $N_{x}=\frac{9}{4}\times(O_{x}-1)+1$

注：保留两位小数，少于二十人评分建议不显示

算法说明

$log_{10}(z) + (\frac {y \cdot t} {45000})$

其中：

t = 发帖时间 - 2005年12月8日7:46:43

Reddit用发帖时间与成立时间的差值来表示t，单位为秒。帖子越新，t值越大，得分就越高。因此，最新的帖子相对较旧的帖子有更高的排名优先权。
x = 赞成票 - 反对票

这个值反映了帖子总体的支持度。显然，赞成票多于反对票的帖子更容易排在前列。
y = +1 或 -1

如果赞成票多于反对票，y取+1，反之则取-1，代表帖子是否整体受欢迎。
z = |赞成票 - 反对票|

受欢迎程度反映了投票差的绝对值，即z越大，表示帖子越受欢迎或越被厌恶。