当前位置: 首页 > news >正文

【爬虫】web自动化和接口自动化

 专栏文章索引:爬虫

目录

一、介绍

二、推荐

1.接口自动化

2.Web自动化


一、介绍

爬虫技术一般可以分为两种类型:接口自动化和web自动化。下面是它们的简要介绍:

1.接口自动化

接口自动化技术的主要目的是通过模拟HTTP请求来实现自动化,通常用于测试web API和抓取数据。接口自动化爬虫可以直接访问数据接口获取数据,它可以通过发送规范的HTTP请求来实现数据的抓取和操作。接口自动化技术适用于需要大量抓取数据的需求,以及在抓取时对页面交互没有要求的场景。

综上所述,根据不同的需求和场景,可以选择适合自己的爬虫类型,分别应用Web自动化或接口自动化技术来进行网页数据的抓取和处理。

2.Web自动化

Web自动化技术旨在模拟人类操作浏览器来实现自动化,通常用于对网页进行操作和抓取数据。Web自动化爬虫可以通过自动化浏览器驱动,模拟人类的行为来实现数据的抓取和操作。Web自动化技术可以模拟页面操作、登陆、填表、拖拽等操作,非常适合于需要登录并模拟用户操作的网站、复杂的网页交互以及需要抓取动态网页数据的需求。

二、推荐

1.接口自动化

  • requests库

python的第三方库,目前使用比较多

2.Web自动化

  • Selenium

初学者可以先学习这个工具

  • DrissionPage

语法跟Selenium类似,由于出现的比较晚,检测还不是很严格

  • SaossionPage

DrissionPage的plus版


相关文章:

  • [嵌入式系统-39]:龙芯1B 开发学习套件 -9-PMON的文件结构
  • 大模型主流微调训练方法总结 LoRA、Adapter、Prefix-tuning、P-tuning、Prompt-tuning 并训练自己的数据集
  • 代码+视频,R语言使用BOOT重抽样获取cox回归方程C-index(C指数)可信区间
  • 贝尔曼方程【Bellman Equation】
  • 使用 ZipArchiveInputStream 读取压缩包内文件总数
  • RuoYi-Vue开源项目2-前端登录验证码生成过程分析
  • 记录一次服务器内存使用率过高达到90%告警问题排查。
  • 基于SpringBoot的高校办公室行政事务管理系统
  • 本地虚拟机平台Proxmox VE结合Cpolar内网穿透实现公网远程访问
  • PHP8编译安装
  • C++ map字典
  • 文本处理基本方法
  • 家具工厂5G智能制造数字孪生可视化平台,推进家具行业数字化转型
  • MySQL索引、事务、储存引擎
  • Python 常用内置函数详解(二):print()函数----打印输出
  • 【xr806开发板使用】连接wifi例程实现
  • js封装SDK 在VUE、小程序、公众号直接调用js调用后端接口(本文以vue项目为例)
  • Python深度学习之路:TensorFlow与PyTorch对比【第140篇—Python实现】
  • Android 开机启动的核心系统服务:你了解了吗?
  • Dubbo如何支持集群容错?有哪些集群容错模式?Dubbo的路由策略是怎样的?如何根据路由规则选择服务提供者?
  • 国家主席习近平会见斯洛伐克总理菲佐
  • 前4个月我国货物贸易进出口同比增长2.4%,增速较一季度加快1.1个百分点
  • 治沙“异瞳”男生疑似摆拍,团队称合作12天多期视频为策划拍摄
  • 视频丨习近平同普京会谈:共同弘扬正确二战史观,维护联合国权威和地位
  • OpenAI任命了一位新CEO
  • 首届上海老年学习课程展将在今年10月举办