敏感词过滤算法
COLDataset
中文冒犯语言检测数据集
- https://github.com/thu-coai/COLDataset
敏感词检测
sensitive-word
基于 DFA 算法实现的高性能 java 敏感词过滤工具框架。
https://github.com/houbb/sensitive-word
敏感词及违禁词检测
https://www.volcengine.com/theme/1563016-M-7-1
一、基于关键词匹配的敏感词检测算法
二、基于正则表达式的敏感词检测算法
DFA敏感词过滤算法详解
https://blog.csdn.net/java_eiji/article/details/127354207