当前位置：首页 > news >正文

广告营销反欺诈

news 2025/10/19 10:34:05

在广告营销生态中，识别虚假流量（如广告欺诈、机器人流量等）通常是多个环节共同承担的责任，而不仅仅由 SSP 或 Ad Exchange 单独完成。

各角色在防止虚假流量中的作用：

SSP（供应方平台，Supply-Side Platform）
- SSP 主要服务于发布商（Publisher），帮助他们管理广告库存，并将广告位卖给 Ad Exchange 或 DSP（需求方平台）。
- 作为流量的“提供方”，SSP 需要对接入的流量质量负责，因此会部署流量过滤机制，比如：
  - 通过 IP 归属、用户行为分析识别机器人流量（Bot Traffic）
  - 检测无效点击（Invalid Clicks）、广告填充作弊（Ad Stacking）、自动刷新（Auto Refresh）等
  - 结合 MRC（Media Rating Council）或其他行业标准来识别可视性欺诈（Viewability Fraud）
Ad Exchange（广告交易平台）
- Ad Exchange 连接 SSP 和 DSP，充当广告交易的“中间市场”，让广告主的 DSP 竞价购买流量。
- 作为“交易撮合者”，Ad Exchange 也会承担一部分流量质量管理职责，比如：
  - 采用反欺诈算法或第三方防欺诈服务（如 IAS、MOAT、DoubleVerify）过滤可疑流量
  - 进行实时竞价（RTB）时，提供流量评级（Traffic Scoring）给 DSP 参考
  - 监控流量模式，检测异常流量来源（如短时间内大量广告请求、重复曝光等）

最终决策：谁负责更多？

SSP 是第一道防线，因为它直接对接流量来源（发布商的网站或 App），需要预先过滤可疑流量，以提高自身信誉，防止被 Ad Exchange 屏蔽或 DSP 拒绝投放。
Ad Exchange 是第二道防线，它需要确保流量质量，避免低质量流量影响竞价公平性，否则 DSP 可能会减少对其流量的采购。
DSP（需求方平台）也会进一步检测流量质量，因为广告主希望优化投放效果，防止浪费广告预算。

总结

SSP 负责第一层流量过滤，Ad Exchange 进行第二层监控，最终 DSP 也会做筛选。
如果某个环节未能有效检测虚假流量，整个广告生态都会受到影响，所以多个环节都会投入资源来识别无效流量。

在广告营销系统中，识别虚假流量（Ad Fraud Detection）的技术方案通常涉及多个层面的检测机制，包括 实时检测（Real-time Detection）、历史分析（Historical Analysis）、第三方反欺诈集成（Third-party Fraud Prevention），并结合大数据分析、机器学习和规则引擎来优化识别能力。以下是一个完整的技术方案设计。

1. 技术架构

整个方案可以分为 数据采集、实时检测、离线分析、策略引擎和黑名单管理 五大核心模块。

(1) 数据采集层

主要任务：从多个数据源收集流量数据，为后续检测提供原始数据。
涉及数据：

请求数据（Bid Request）：用户的设备信息、IP、User-Agent、Referer、广告位信息等。
点击数据（Click Logs）：广告被点击时的用户行为数据。
曝光数据（Impression Logs）：广告实际展示的信息，如曝光时间、页面 URL、地理位置等。
用户行为数据：访问时间、页面停留时长、鼠标轨迹、滚动行为等。
外部数据：IP 信誉库、设备指纹数据库（Device Fingerprint）、黑名单数据库等。

技术选型：

数据采集：Kafka / Flink / Logstash
数据存储：ClickHouse / Elasticsearch / HDFS（历史数据存储）

(2) 实时检测层（RTB 竞价前过滤）

主要任务：对进入 Ad Exchange 或 DSP 的流量进行实时检查，降低无效流量进入竞价系统的概率。

检测方式

IP & 设备指纹检查
- 通过 IP 信誉数据库（如 MaxMind、IP2Location）检测 VPN、代理 IP、数据中心 IP 等。
- 设备指纹（Device Fingerprint）比对，检测同一设备是否频繁更换 IP 或 User-Agent 伪造。
- User-Agent 解析，检测是否使用虚拟浏览器（如 Puppeteer、Selenium）。
异常行为检测
- 流量激增异常（短时间内大量请求）
- 鼠标轨迹/滚动轨迹检测（Bot 可能无鼠标轨迹）
- 点击作弊检测（短时间内同 IP、设备的点击率异常高）
浏览器环境检测
- 通过 JavaScript 收集 navigator 信息，检测是否为自动化环境（如 webdriver、headless 模式）
- WebRTC 检测真实 IP，防止代理欺诈。
规则引擎拦截
- 基于预定义规则（如点击频率、曝光频率）进行拦截。
- 规则可存储在 Redis（实时）或 Elasticsearch（批量分析）。

技术选型：

实时计算：Apache Flink / Spark Streaming
规则引擎：Drools / Redis（黑名单存储）

(3) 离线分析层（历史数据分析）

主要任务：结合大数据分析，发现更深层次的欺诈模式。

分析方法

时间序列分析
- 识别异常模式，例如：
  - 突然增加的点击/曝光
  - 某个 IP / 设备在多个广告位重复出现
- 采用 LSTM、Holt-Winters 指数平滑 进行趋势预测。
聚类分析
- 通过 K-Means、DBSCAN 聚类算法识别类似的欺诈行为：
  - 发现不同用户间的相似模式（如多个设备模拟真人浏览）
  - 识别 “广告农场”——多个设备共用相同网络环境
设备指纹比对
- 通过**相似度计算（Cosine Similarity、Jaccard 相似度）**比对新流量与已知欺诈流量的相似性。
- 检测同一设备是否被多个 IP 使用，或同一 IP 是否对应多个设备。

技术选型：

大数据存储：Hadoop / ClickHouse / Druid
计算引擎：Apache Spark / Presto
机器学习：TensorFlow / Scikit-Learn

(4) 策略引擎（实时拦截 + 竞价调整）

主要任务：

结合 实时检测（RTB 竞价前） 和 历史分析（机器学习） 结果，动态调整流量质量评分。
提供可解释的拦截规则，并支持运营人员自定义策略。

具体策略：

黑名单系统
- 对高风险 IP、设备、User-Agent、域名进行屏蔽。
- 黑名单存储在 Redis，支持实时查询。
信誉评分（Traffic Scoring）
- 结合历史数据计算每个请求的信誉分（0~100）。
- 信誉分过低的流量，可：
  - SSP 直接拒绝接收
  - Ad Exchange 降低竞价权重
  - DSP 直接过滤
智能竞价调整
- DSP 可基于信誉评分动态调整出价：
  - 信誉分 ≥80，正常竞价
  - 信誉分 50~79，降低 30% 出价
  - 信誉分 ≤50，不参与竞价

技术选型：

规则存储：Redis / MySQL
黑名单更新：Flink / Kafka
API 接口：Spring Boot / gRPC（用于高并发查询）

2. 反欺诈策略与优化

与第三方反欺诈系统集成
- IAS（Integral Ad Science）、MOAT、DoubleVerify：提供广告可视性和无效流量检测。
- Google Ads Traffic Quality API：检查广告流量是否符合 Google 标准。
动态风险调整
- 结合 AB 实验 调整拦截策略，避免误伤真实用户。
基于区块链的透明流量
- 采用 区块链（如 Hyperledger） 记录广告交易，防止流量造假。

3. 总结

SSP 主要负责流量来源的初步过滤，在广告请求进入 Ad Exchange 前清理无效流量。
Ad Exchange 进一步分析流量质量，为 DSP 提供信誉评分，避免低质量流量竞价。
DSP 最终决定是否竞价，并可利用 AI 预测流量的真实性。

核心技术选型总结：

组件	技术
数据采集	Kafka / Flink / ClickHouse
实时检测	Redis（黑名单）、Flink（实时流处理）
机器学习	TensorFlow / Scikit-Learn
规则引擎	Drools / Redis
黑名单存储	Redis / Elasticsearch
大数据分析	Spark / Presto / Hadoop