当前位置: 首页 > news >正文

深圳自建网站网站区分

深圳自建网站,网站区分,wordpress官方论坛,精准客户截流软件中间件这部分算是一个高阶的Scrapy内容,即便不了解这部分也可以使用Scrapy,但是一些特殊情况使用中间件就比较方便处理了,比如修改请求和响应等。 通过之前的工作原理图中,我们了解到Scrapy中有两个中间件,分别是下载器中间件和爬虫中间件,本节将一一讲解如何激活、编写自…

中间件这部分算是一个高阶的Scrapy内容,即便不了解这部分也可以使用Scrapy,但是一些特殊情况使用中间件就比较方便处理了,比如修改请求和响应等。
通过之前的工作原理图中,我们了解到Scrapy中有两个中间件,分别是下载器中间件和爬虫中间件,本节将一一讲解如何激活、编写自己的中间件和如何使用内置中间件。

下载器中间件Downloader Middlewares

激活下载器中间件

在 Scrapy 项目的settings.py文件中进行配置,从而激活下载器中间件。具体操作是在DOWNLOADER_MIDDLEWARES字典中添加或修改相应的中间件配置。例如,如果要激活自定义的下载器中间件MyCustomDownloaderMiddleware,假设其路径为myproject.middlewares.MyCustomDownloaderMiddleware,可以这样配置:

DOWNLOADER\_MIDDLEWARES = {"myproject.middlewares.MyCustomDownloaderMiddleware": 543,
}

其中,数字543代表中间件的执行顺序,数值越低优先级越高。

编写自己的下载器中间件

编写自定义下载器中间件,需要创建一个 Python 类,并重写一些特定的方法。可以重写方法包括process_requestprocess_responseprocess_exceptionfrom_crawler方法。

  • process_request(self, request, spider)
    • 当每个request通过下载中间件时,该方法被调用
    • 可以返回None,表示继续处理这个请求
    • 可以返回一个scrapy.http.Response,则中间件会返回这个响应对象并跳过下载过程,直接把响应传递给爬虫;
    • 可以返回一个scrapy.http.Request,那么会停止当前请求及后面的中间件,新请求会被重新调度和下载;
    • 或者抛出scrapy.exceptions.IgnoreRequest异常,请求会被丢弃,触发spiderrequest_dropped信号
    • </
http://www.dtcms.com/a/575163.html

相关文章:

  • 如何免费建设公司网站碧辉腾乐 网站建设
  • 网页设计新手制作的网站代码网站建设流程是什么意思
  • 网站怎么做视频教程wordpress添加订阅教程
  • 佛山 做网站公司有哪些哪一个军事网站做的比较好
  • 怎么找一家公司的网站代刷网自助建站系统
  • raf节流
  • 【SOA仿真】SOA增益饱和特性仿真3
  • 百度不收录我的网站网站备案部门
  • 西宁知名网站制作公司多模室内设计网
  • 余弦相似度、矩阵分解、深度学习物品的复杂、非线性特征
  • 湖州市建设局网站各个国家的google网站
  • 岳阳网站建设联系方式服务称赞的项目管理平台
  • 回流焊过炉治具载具一般用在什么产品上
  • 佛山网站优化个人备案的网站可以卖东西么
  • 网站建设 2015年11月网上服装定制网站
  • C++标准项目---在线五子棋对战
  • 给个网站带颜色抵押网站建设方案
  • 新余网站开发公司首页排名seo
  • 南昌做网站优化哪家好北京哪里有教怎么做网站的
  • 集成学习算法XGBoost(eXtreme Gradient Boosting)基础入门
  • 指定网站建设前期规划方案重庆网站seo
  • 怎么查网站建设是哪家公司wordpress网站后台
  • 电子商务网站建设与管理基础重庆展示型网站制作
  • 鞍山自适应网站制作网站改版域名不变
  • rocketmq 的核心概念讲解
  • 注册了自己的网站中华始祖堂室内设计
  • 定制化网站建设假网站连接怎么做的
  • 中小企业网站建设免费注册电子邮箱
  • 建设银行企业版网站电脑上免费制作ppt的软件
  • 顺企网属于什么网站江西建设监理协会网站