风控系统中常用的概念和架构学习
认识风控系统中一些常见的概念和系统。
目录
- 数据源/风险事件
- 规则引擎
- 样本/名单机制
- 模型/算法
- 风控阶段-送审/审核
- 风控阶段-处置
- 附常见的风控架构
- 参考文章
数据源/风险事件
- 事件本身的基础特征
- 通过某些服务获取到的如手机归属地,身份证有效地址等等
- 各种指标
- 视频中的字幕、图片信息等
规则引擎
风控系统的最核心,包括
- 规则如何描述
- 规则如何执行,如何采集规则执行结果
- 规则操作符的扩展
- 规则的上线,灰度发布
样本/名单机制
- 黑名单主要阻止已知的高风险实体(IP,设备,身份证号等),命中就阻止。这部分主要是根据历史数据清洗出来或者来自客户反馈之类的恶意用户,设备等。
- 白名单是允许部分无风险用户进入,属于受信任的客户,通过这种名单为用户创建良好的体验。也有可能是合规的高价值客户。
- 灰名单,介于黑名单和白名单之间,会出现状态转换,需要进一步观察和控制。你也可以理解成,这一部分名单需要额外的加验,如果加验成功,那么可能转成白名单,如果失败或者一直不解除,那可能就进入黑名单中。
模型/算法
如常见的
- 人脸模型
- 涉政Logo
- OCR模型
通过模型迭代给出算法接口,外部能快速判断比如图片是否黄图,语言是否有非法政治言论等
风控阶段-送审/审核
审核包含机审、人审两个环节。
从方法方面看,机审可以分为机器模型和人工策略两种。这两种方法本质上都是通过多维度数据,计算一条内容违规的概率。大致区别如下:
- 机器模型:由机器自主学习,数据维度多,计算复杂,迭代周期长,可解释性较差。
- 人工策略:依赖人工经验,数据维度少,计算简单,迭代周期短,可解释性强。
风控阶段-处置
风险审核后判断有风险,那么就需要做出一系列的动作,当然这也是一个复杂的系统设计。
处置一般跟违规行为的类型密切相关。如机器注册则封禁账号,发布违规内容则删除内容。处置手段经常会叠加使用,如既封禁账号又删除内容。
同一种处置手段内部,可以再区分不同的严重程度。比如删除内容是对内容最严重的处置,相比之下还可以有仅本人可见、禁止评论、禁止推荐、禁止分享、仅登录可见等多种轻度处置手段。
处置手段之间可以做升级处理。比如首次发布违规信息,仅处置内容;多次发布违规信息,则封禁账号。
附常见的风控架构
架构1:网易
架构2:携程
参考文章
- 风控系统资料合集-蚂蚁,京东,美团,开源系统
- 风控杂谈-名单应用
- 手把手教你做内容风控