当前位置: 首页 > news >正文

使用影刀RPA实现快递信息抓取

最近公司项目有个需求,要求抓取快递单号快递信息,比如签收地点、签收日期等。该项目对应的快递查询网站是一个国外的网站,他们有专门的快递平台可以用于查询。该平台提供了快递接口进行查询,但需要付费。同时也提供了免费的查询窗口,一次最多可以查询25个快递单号。我们的快递单号比较多,有几千个,这时候RPA工具就派上用场啦。

我们的任务很简单,就是根据Excel清单里面提供的快递单号,在对应位置的单元格写入获取到的签收信息即可。涉及到的技术点如下:

读取Excel

这个点需要说明一下,影刀RPA提供了数据表格以及Excel表格。这两个功能的区别就在于使用Excel表格必须要安装Office,否则无法使用其功能。而数据表格更通用,更像是一个内存型的数据表格,不需要安装Office。

在这里插入图片描述

模拟批量提交查询快递单号信息

因为我是25个快递单号一组提交查询,抓取到信息保存,再提交25个新的快递单号查询,这样反复循环。网站格式上面要求每一个快递单号一行,最多25行。如图所示,最后一行的时候多一个换行,可以加个按键BackSpace,去除最后一行的换行,然后提交查询。
在这里插入图片描述

抓取带分页的快递信息

有两点需要注意:

  1. 首先要选择多页,此外要指定抓取的页数,因为我是25个一批,页面每页显示5个快递信息,那么就是5页。
  2. 我勾选了保存至数据表格,那么我也可以操作这个数据表格写入Excel。
    在这里插入图片描述

写入Excel

抓取数据到数据表格后,就可以操作数据表格,写入Excel。
在这里插入图片描述
当然上图中,我也是25个一组获取到快递信息后,就及时写入Excel。这样保证如果中途中断,之前抓取过的信息仍然会保留。

上面用到的pitch2是一个插入Python代码段。影刀RPA就是这个好处,可以直接使用Python的能力嵌入到影刀中,开发非常方便。

在这里插入图片描述

总结

  • 其实我之前是想通过爬虫程序去完成的,但是自从用了RPA工具就发现RPA做这类数据抓取的应用,效率更高。
  • RPA跟爬虫的区别就在于,RPA最大化的模拟了人的鼠标点击和键盘操作,让对方的网站感觉是一个人在操作,而不是什么程序,这样被封杀的概率会降低。
http://www.dtcms.com/a/335338.html

相关文章:

  • XSS攻击:从原理入门到实战精通详解
  • Python代码规范与静态检查(ruff/black/mypy + pyproject.toml + Makefile)自动化工具链介绍
  • 8.从零开始写LINUX内核——初始化中断控制芯片
  • 实时计算 记录
  • 小杨的H字矩阵-洛谷B3924 [GESP202312 二级]
  • Python环境下载安装、以及环境配置教程(Windows版)
  • Vue组件基础解析
  • B+树索引分析:单表最大存储记录数
  • AI搜索:大模型商业落地的“第一束光”,照见了什么?
  • 车灯的技术和未来方向
  • Python列表与元组:数据存储的艺术
  • 【科研绘图系列】R语言在DOM再矿化数据分析与可视化中的应用
  • 力扣(接雨水)——基于最高柱分割的双指针
  • LLaVA
  • 胶质母细胞瘤对化疗的敏感性由磷脂酰肌醇3-激酶β选择性调控
  • MySQL 的 DDL / DML / DQL / DCL 做一次系统梳理:概念区别→常用语法→特点与注意点→实战小例子→常见面试/坑点速记
  • 解构下一-代 AI 智能体:超越 LLM,深度解析三大核心支柱——上下文、认知与行动
  • 基础数据结构
  • Linux——进程管理和计划任务管理
  • Python中*args和**kwargs
  • 基于springboot的在线视频教育管理系统设计与实现(源码+文档+部署讲解)
  • Flow-GRPO:通过在线 RL 训练 Flow matching 模型
  • 概率论基础教程第3章条件概率与独立性(二)
  • 如何解决C盘存储空间被占的问题,请看本文
  • C语言零基础第18讲:自定义类型—结构体
  • 9.从零开始写LINUX内核——设置中断描述符表
  • duiLib 实现鼠标拖动标题栏时,窗口跟着拖动
  • 深入了解 swap:作用、局限与分区建立
  • Linux sar命令详细使用指南
  • Effective C++ 条款45:运用成员函数模板接受所有兼容类型