当前位置: 首页 > wzjs >正文

旧货交易网站开发的背景电脑培训班多少费用

旧货交易网站开发的背景,电脑培训班多少费用,呼和浩特做网站的公司,域名做违法网站TOC 本文仅为记录学习轨迹,如有侵权,联系删除 一、环境说明 使用前必须检查以下环境 (1)python编译环境 (2)python脚本执行所需要的库,具体看代码(main.py)import导入的部分库 &a…

@TOC

本文仅为记录学习轨迹,如有侵权,联系删除

一、环境说明

使用前必须检查以下环境
(1)python编译环境
(2)python脚本执行所需要的库,具体看代码(main.py)import导入的部分库
(3)确保电脑可以正常连接网络,可以正常访问淘宝链接
备注:博主测试的python环境是3.8.8,尽量用python3版本

二、代码说明

代码请查看main.py,先看需要引入的库的部分,使用前需要保证这些库的正确引入,重点需要注意的是DrissionPage库的引入,该库用于爬取数据
在这里插入图片描述
共分为两个主要方法,一个是get_data方法,用于爬取数据,另一个是save_to_csv方法,用于保存数据
在这里插入图片描述

_main_是主函数入口,这里默认爬取30页的数据,可以根据实际情况修改要爬取的页数,不过需要注意的是,淘宝有很严格的反爬机制,如果爬取太多页的数据,可能会触发淘宝的相关反爬机制,例如限流、返回异常数据、或者弹窗验证码等操作。

三、代码执行

(1)前期准备

先打开谷歌浏览器,访问淘宝页面,然后先进行登录,这是为了绕过淘宝的登录验证机制,以前好像不用登录就可以搜索商品数据,现在好像有限制,而且为了避免引起不必要的麻烦,所以干脆先登录淘宝
在这里插入图片描述

(2)执行代码

博主测试时用的pycharm执行的代码,不过用python自带的编译器也可以,执行的时候代码会自动打开谷歌浏览器,然后自动在输入框输入商品名称,爬取数据后,会自动在页面点击下一页按钮进行换页,然后再爬取数据,直到代码设置的页数都爬取完成,以下截图来自博主亲测截图如下
在这里插入图片描述

数据爬取完成后,会在main.py同级目录下生成一个data目录,里面存放爬取的数据,格式为csv
注意,如果出现以下截图,例如卡在爬取某一页的日志,请耐心等待,代码设置了最长两分钟的监听时长,如果超时系统会有日志打印
在这里插入图片描述

http://www.dtcms.com/wzjs/169078.html

相关文章:

  • 怎么做公司展示网站软文推广去哪个平台好
  • 桥东区网站建设东莞关键词排名seo
  • 怎么做简单的视频网站by72777最新域名查询
  • 数据线 东莞网站建设安装百度一下
  • 中铁三局招聘学历要求汕头seo推广优化
  • 如何建一个购物网站互联网营销师培训费用是多少
  • 网页制作实训个人总结百度seo排名优化软件
  • sem网站做推广百度学术搜索
  • 网站百度优化2021搜索引擎排名
  • 天津武清做网站厦门站长优化工具
  • 山西建设集团网站环球网最新消息疫情
  • 怎么在静态网站基础上加动态新闻发稿发布平台
  • 佛山外贸网站建设公司营销软文是什么
  • 宁波专业平台网站建设建网站一般需要多少钱
  • 设计网站推荐国外广州软文推广公司
  • 常州做网站的济南搜索引擎优化网站
  • 网站添加微信支付chatgpt网页
  • iis7.5配置网站广州新闻报道
  • wordpress 南非政府培训seo哪家学校好
  • 网站前置审批在哪里办域名关键词排名查询
  • 做网站必备百度推广客户端教程
  • 日语网站设计windows10优化大师
  • 网站北京谷歌优化
  • 专业网站建设培训机构手机百度网盘登录入口
  • 有没有让人做问卷的网站百度网盘电脑版官网
  • 有什么比较好的做海报网站网站建设需要多少钱?
  • 体检营销型网站seo知识分享
  • 个人网站备案要求拓客最有效方案
  • 长春网站建设优化排名灰色词快速排名接单
  • 江苏省交通建设监理协会网站查询友情链接