当前位置: 首页 > wzjs >正文

上市装修公司seo优化视频教程

上市装修公司,seo优化视频教程,企业网设计方案,互联网保险监管中间件这部分算是一个高阶的Scrapy内容,即便不了解这部分也可以使用Scrapy,但是一些特殊情况使用中间件就比较方便处理了,比如修改请求和响应等。 通过之前的工作原理图中,我们了解到Scrapy中有两个中间件,分别是下载器中间件和爬虫中间件,本节将一一讲解如何激活、编写自…

中间件这部分算是一个高阶的Scrapy内容,即便不了解这部分也可以使用Scrapy,但是一些特殊情况使用中间件就比较方便处理了,比如修改请求和响应等。
通过之前的工作原理图中,我们了解到Scrapy中有两个中间件,分别是下载器中间件和爬虫中间件,本节将一一讲解如何激活、编写自己的中间件和如何使用内置中间件。

下载器中间件Downloader Middlewares

激活下载器中间件

在 Scrapy 项目的settings.py文件中进行配置,从而激活下载器中间件。具体操作是在DOWNLOADER_MIDDLEWARES字典中添加或修改相应的中间件配置。例如,如果要激活自定义的下载器中间件MyCustomDownloaderMiddleware,假设其路径为myproject.middlewares.MyCustomDownloaderMiddleware,可以这样配置:

DOWNLOADER\_MIDDLEWARES = {"myproject.middlewares.MyCustomDownloaderMiddleware": 543,
}

其中,数字543代表中间件的执行顺序,数值越低优先级越高。

编写自己的下载器中间件

编写自定义下载器中间件,需要创建一个 Python 类,并重写一些特定的方法。可以重写方法包括process_requestprocess_responseprocess_exceptionfrom_crawler方法。

  • process_request(self, request, spider)
    • 当每个request通过下载中间件时,该方法被调用
    • 可以返回None,表示继续处理这个请求
    • 可以返回一个scrapy.http.Response,则中间件会返回这个响应对象并跳过下载过程,直接把响应传递给爬虫;
    • 可以返回一个scrapy.http.Request,那么会停止当前请求及后面的中间件,新请求会被重新调度和下载;
    • 或者抛出scrapy.exceptions.IgnoreRequest异常,请求会被丢弃,触发spiderrequest_dropped信号
    • </
http://www.dtcms.com/wzjs/456797.html

相关文章:

  • 网站备案拍照要求精准客户数据采集软件
  • 免费网站建立seo推广百度百科
  • 商务网站建设实训结论培训机构排名
  • 诸城网站做的好的百度导航下载2020新版语音
  • 小米的网站设计网络推广方案七步法
  • php做网站安装网站seo链接购买
  • 加盟店推广营销seo优化平台
  • 龙华区民治街道百度推广优化技巧
  • 建设银行企业网站银行seo网站seo
  • 福州网站建设H5自己的网站怎么推广
  • 石家庄做物流的网站百度空间登录入口
  • 福建石狮有做网站的没数据统计网站有哪些
  • 影视视频网站怎么做怎么弄推广广告
  • 做网站静态和动态宁波seo怎么做推广渠道
  • 广西北海市住房和建设厅网站江北seo综合优化外包
  • 用子域名可以做网站吗衡阳seo快速排名
  • 广州做模板网站的公司seo新手快速入门
  • 重庆企业网站建设官网重庆seo排名软件
  • 最具口碑的企业网站建设石家庄百度seo代理
  • 北京商城网站建设网站建设及网络推广
  • 如何测试网站速度申请网站怎么申请
  • 海报制作网站免费网址导航大全
  • 碑林网站制作广州公关公司
  • pyhton做网站最新全国疫情消息
  • wordpress模块化全能优化大师
  • wordpress生成二维码网站seo优化总结
  • 百度网站打开网络工程师是干什么的
  • 网页设计作品分析重庆seo入门教程
  • 毕业设计网站做啥100个常用的关键词
  • 哪个网站做初中英语试题赚钱信息流广告优化师