当前位置: 首页 > news >正文

突破!再次新增【钓鱼邮件检测】能力

🔥 一个集成多源威胁情报的聚合平台,为安全研究人员和运维团队提供实时威胁情报查询和播报服务;集成阿里云WAF主动拦截威胁IP,钓鱼邮件实时监测,集成AI等多项常用安全类工具🔧

https://github.com/HaoY-l/threat-intel-hub

其他能力之前已经有过文章介绍,或者可以看公开文档:https://www.yuque.com/weare/mx0zcy/vrqwsxe3vgtesate?singleDoc#,以下内容仅做【钓鱼邮件检测】能力相关介绍。🈲

钓鱼邮件检测🎣介绍

该部分提供钓鱼邮件检测能力,同时提供了邮件链接🔗、附件安全扫描能力,检测并发现邮件中的钓鱼链接,木马文件等安全风险。

它基于机器学习,旨在通过深度学习技术识别潜在的钓鱼邮件,保护用户免受网络诈骗威胁。该系统集成了数据预处理、模型训练、实时预测和结果可视化功能,提供用户友好的Web界面,支持邮件内容手动/自动输入、预测结果展示以及模型性能分析。

注意:模型的阈值为0.5,大于0.5的是钓鱼邮件,小于0.5的是正常的。最终结果都乘以了100%。

实现思路

  1. 数据获取:使用spam_assassin.csv数据集,包含邮件内容和标签(0=正常,1=钓鱼)。
  2. 数据预处理:通过NLTK分词和Scikit-learn的TF-IDF向量化,将邮件文本转换为特征向量。
  3. 模型构建:基于Keras的Sequential神经网络,包含多层Dense和Dropout,用于二分类任务。
  4. 模型训练与保存:训练模型并保存为HDF5格式,支持重复加载和预测。
  5. 实时预测:通过Flask Web界面接收用户输入的邮件内容,调用模型进行预测。
  6. 结果展示:展示预测结果(钓鱼/正常)及概率,同时记录预测日志。

模型

  • Keras Sequential模型,结构为:
    • 输入层:接受TF-IDF特征(5000维)。
    • 隐藏层1:128个神经元,ReLU激活,Dropout(0.2)防止过拟合。
    • 隐藏层2:64个神经元,ReLU激活。
    • 输出层:1个神经元,Sigmoid激活,输出钓鱼概率。
  • 优化器:Adam;损失函数:二元交叉熵;评估指标:准确率。
  • 训练参数:5个epoch,批次大小32。
  • 模型保存为phishing_model.h5,便于重复使用。

手动检测

手动复制邮件内容,点击【开始检测】,即会出现模型分析后的结果。

在下方的历史记录中,可以查看以往的历史检测记录,如果不及时可以点击【刷新】按钮;如果太多了不想要记录了直接点击【清空记录】。

自动检测

环境配置文件:.env需要配置对应的邮箱账号/密码,以及机器人的webhook url

自动检测,可以设置检测周期,这里的周期会对应自动去邮箱拉取邮件的周期,如:设置3分钟调用一次检测,那么去邮箱拉取的邮件范围就是当前时间到之前的3分钟内的邮箱。故这里想要实时检测,最好设置3分钟以内,如1分钟、2分钟、3分钟。

检测状态可以看到你设置的周期、下次检测时间、检测的次数、发现钓鱼邮件的数量等。

检测日志会记录检测完成后检测的数量等等。

模型性能

模型性能,可以看到当前模型的准确率、精确率、召回率、F1分数等信息,也可以在模型管理中重新训练模型。

模型管理

模型管理可以看到模型的详细信息,也可以重新训练我们的模型(需要几分钟),也可以看到当前系统模型是否正常等情况。

http://www.dtcms.com/a/419791.html

相关文章:

  • 闵行营销型网站建设tk网站注册
  • 西安做门户网站最好的公司手机app制作用什么软件
  • 【网络安全】二、入门篇:HTTP 协议进阶 ——GET/POST 常用传参方法详解
  • Apache Shiro 技术详解
  • 公众号授权网站莒县住房和城乡规划建设局网站
  • Day73 基本情报技术者 单词表08 操作系统进阶
  • [xboard]15 uboot加载内核启动分析
  • 从微分方程到FIR
  • 免费建立自己的网站代码一元夺宝网站怎么做
  • 网站备案前置审批表格做网站都注意哪些东西
  • 打开无忧管理后台网站装饰设计有限公司
  • Nginx 访问控制、用户认证、HTTPS配置实操手册
  • github repository 一个文件忘记添加到 .gitignore
  • 【STM32项目开源】基于STM32的智能语音分类垃圾桶
  • wordpress建站详细教程网页打不开视频怎么办
  • 【开题答辩全过程】以 基于Java的物流管理系统为例,包含答辩的问题和答案
  • BCEWithLogitsLoss
  • 在线设计网站大全网站建设方案推销
  • CUDA框架
  • 辽阳专业建设网站公司wordpress rss 爬取
  • TypeScript 简介与项目中配置
  • 南宁seo建站seo网站优化排名
  • 【每日一问】老化测试有什么作用?
  • 广州信科做网站dede 门户网站
  • 【JDBC】系列文章第一章,怎么在idea中连接数据库,并操作插入数据?
  • 企业的网站建设朔州网站建设收费
  • 外贸上哪个网站开发客户网站建设费可分摊几年
  • 8. mutable 的用法
  • 做网站 php j2ee做网站投注员挣钱吗
  • 试玩平台网站开发录入客户信息的软件