当前位置: 首页 > news >正文

一个高效的阿里云漏洞库爬虫工具,用于自动化爬取和处理CVE数据

工具介绍

阿里云漏洞库爬虫 (AliyunCVE_Crawler),一个高效的阿里云漏洞库爬虫工具,用于自动化爬取和处理CVE(Common Vulnerabilities and Exposures)数据。

🚀 功能特性

  • 批量爬取: 支持批量爬取阿里云漏洞库的CVE数据
  • 增量更新: 支持增量爬取,只获取指定日期后的新漏洞
  • 详细信息: 提取完整的CVE详情,包括描述、解决方案、CVSS评分等
  • 数据标准化: 自动转换为标准CVEInfo格式,便于后续处理
  • 并发处理: 支持异步并发爬取,提高效率
  • 智能重试: 内置错误处理和重试机制
  • 数据持久化: 自动保存爬取结果到JSON文件
  • 性能监控: 提供详细的爬取统计和性能指标
  • 🎨 现代GUI: 基于ttkbootstrap的现代化图形界面
  • 📊 数据可视化: 实时统计和结果展示
  • ⚙️ 可视化配置: 直观的参数设置和管理
  • ⏹️ 安全停止: 支持爬取过程中的安全中断和停止

🛠️ 安装

1. 克隆项目

git clone https://github.com/vistaminc/AliyunCVE_Crawler.git
cd AliyunCVE_Crawler

2. 安装依赖

pip install -r requirements.txt

3. 安装浏览器驱动

playwright install chromium

📖 快速开始

🎨 图形界面(推荐)

# 启动现代化GUI界面
python run_gui.py

GUI界面提供:

  • 🖱️ 直观的点击操作
  • 📊 实时数据展示
  • ⚙️ 可视化配置管理
  • 📈 爬取进度监控
  • 💾 一键导出功能

💻 命令行使用

# 爬取前10页数据
python main.py --pages 10# 从第5页开始爬取10页
python main.py --pages 10 --start-page 5# 增量爬取最近7天的数据
python main.py --incremental --days 7# 显示浏览器界面(调试模式)
python main.py --pages 5 --no-headless

🐍 Python API

import asyncio
from main import crawl_aliyun_cvesasync def main():# 爬取前5页的CVE数据cve_infos = await crawl_aliyun_cves(max_pages=5)print(f"成功爬取 {len(cve_infos)} 个CVE")asyncio.run(main())

工具下载

https://github.com/Vistaminc/AliyunCVE_Crawler

http://www.dtcms.com/a/303031.html

相关文章:

  • ROS2入门之开发环境搭建
  • AI-调查研究-40-多模态大模型量化 格局重塑:五大开源模型横评与技术对比
  • Navicat 17 教程:Windows 和 Mac 系统适用
  • 【运维】Smartctl安装及使用指南
  • Python爬虫实战:快速采集教育政策数据(附官网工具库API)
  • 设计模式实战:自定义SpringIOC(亲手实践)
  • 常见依赖于TCP/IP的应用层协议
  • Taro 网络请求相关 API 全面解析
  • 初识opencv05——图像预处理4
  • 【Linux系统】Ext2文件系统 | 软硬链接
  • 接口测试核心概念与实践指南
  • 分享一个脚本,从mysql导出数据csv到hdfs临时目录
  • Vue中Computed与Watch的深度解析:缓存机制与适用场景
  • LeetCode 214:最短回文串
  • Leetcode148. 排序链表 中遇到的错误
  • 【LeetCode 热题 100】(一)哈希
  • 设计模式(十七)行为型:迭代器模式详解
  • c/c++ 函数返回指针和引用所引发的问题
  • Linux系统Centos7 安装mysql5.7教程 和mysql的简单指令
  • JVM 内存模型深度解析:原子性、可见性与有序性的实现
  • FFmpeg 安装与使用
  • 从JPEG到SER:小波+CNN如何横扫CVPR/ICASSP?
  • C#_索引器
  • 最新!Polkadot 更新 2025 路线图
  • 【C++】priority_queue的模拟实现
  • Tchebycheff变换简介
  • 应急响应案例处置(下)
  • Dify-14: 工作流API端点
  • gRPC 为 Sui 上更智能的数据访问奠定基础
  • 【Kubernetes】使用StatefulSet进行的资源调度,删除更新策略