当前位置: 首页 > wzjs >正文

中企动力骗子公司真的还是假的站长工具seo综合查询官网

中企动力骗子公司真的还是假的,站长工具seo综合查询官网,国内做微商城比较知名的网站,随州住房和城乡建设委员会网站TOC 本文仅为记录学习轨迹,如有侵权,联系删除 一、环境说明 使用前必须检查以下环境 (1)python编译环境 (2)python脚本执行所需要的库,具体看代码(main.py)import导入的部分库 &a…

@TOC

本文仅为记录学习轨迹,如有侵权,联系删除

一、环境说明

使用前必须检查以下环境
(1)python编译环境
(2)python脚本执行所需要的库,具体看代码(main.py)import导入的部分库
(3)确保电脑可以正常连接网络,可以正常访问淘宝链接
备注:博主测试的python环境是3.8.8,尽量用python3版本

二、代码说明

代码请查看main.py,先看需要引入的库的部分,使用前需要保证这些库的正确引入,重点需要注意的是DrissionPage库的引入,该库用于爬取数据
在这里插入图片描述
共分为两个主要方法,一个是get_data方法,用于爬取数据,另一个是save_to_csv方法,用于保存数据
在这里插入图片描述

_main_是主函数入口,这里默认爬取30页的数据,可以根据实际情况修改要爬取的页数,不过需要注意的是,淘宝有很严格的反爬机制,如果爬取太多页的数据,可能会触发淘宝的相关反爬机制,例如限流、返回异常数据、或者弹窗验证码等操作。

三、代码执行

(1)前期准备

先打开谷歌浏览器,访问淘宝页面,然后先进行登录,这是为了绕过淘宝的登录验证机制,以前好像不用登录就可以搜索商品数据,现在好像有限制,而且为了避免引起不必要的麻烦,所以干脆先登录淘宝
在这里插入图片描述

(2)执行代码

博主测试时用的pycharm执行的代码,不过用python自带的编译器也可以,执行的时候代码会自动打开谷歌浏览器,然后自动在输入框输入商品名称,爬取数据后,会自动在页面点击下一页按钮进行换页,然后再爬取数据,直到代码设置的页数都爬取完成,以下截图来自博主亲测截图如下
在这里插入图片描述

数据爬取完成后,会在main.py同级目录下生成一个data目录,里面存放爬取的数据,格式为csv
注意,如果出现以下截图,例如卡在爬取某一页的日志,请耐心等待,代码设置了最长两分钟的监听时长,如果超时系统会有日志打印
在这里插入图片描述

http://www.dtcms.com/wzjs/82298.html

相关文章:

  • 霸县网站建设北京seo公司有哪些
  • 网站开发公司代理宁波seo快速优化教程
  • 云南做网站广东新闻今日最新闻
  • 国外psd免费下载网站广州网站建设方案维护
  • 国外网站拼邮需要怎么做seo就业
  • 潍坊做网站公司推广优化
  • 网站地图生成工具西安网站建设优化
  • 价格优化网站建设今日十大热点新闻事件
  • java网站开发框架搭建手册排名网
  • 网站建设电销女生做sem还是seo
  • 软件开发工程师薪资待遇网页优化方法
  • 手机网站建设 广州线上营销推广的公司
  • wordpress内容模型百度搜索引擎优化相关性评价
  • 做网站服务器权限设置网站seo优化外包顾问
  • 管庄网站建设搜索关键词的方法
  • 邢路桥建设总公司网站seo查询网站是什么
  • 渭南哪家公司可以做网站制作公司网站大概多少钱
  • sns网站建设哪家公司好百度收录入口
  • 网站面包屑导航推广赚钱的软件
  • dedecms网站地图 显示三级栏目seo是什么服务器
  • 广州电商网站开发公司个人永久免费自助建站
  • 网站建设中企动力推荐申请网址怎么申请的
  • 网站 qq在线客服修改谷歌google 官网下载
  • 给wordpress写一个留言表单seo承诺排名的公司
  • 发帖软件广州seo团队
  • wordpress 用户登录ip记录信阳网站seo
  • 衡水网站建设供应商广告优化师发展前景
  • 二维码解码器生成短网址seo关键词优化软件合作
  • 公司网站自己可以做吗东莞seo网站推广建设
  • 龙江建网站google谷歌搜索