当前位置: 首页 > wzjs >正文

企业网站做电脑营销一个网站推广

企业网站做电脑营销,一个网站推广,百科网站建设,品牌建设新时代中间件这部分算是一个高阶的Scrapy内容,即便不了解这部分也可以使用Scrapy,但是一些特殊情况使用中间件就比较方便处理了,比如修改请求和响应等。 通过之前的工作原理图中,我们了解到Scrapy中有两个中间件,分别是下载器中间件和爬虫中间件,本节将一一讲解如何激活、编写自…

中间件这部分算是一个高阶的Scrapy内容,即便不了解这部分也可以使用Scrapy,但是一些特殊情况使用中间件就比较方便处理了,比如修改请求和响应等。
通过之前的工作原理图中,我们了解到Scrapy中有两个中间件,分别是下载器中间件和爬虫中间件,本节将一一讲解如何激活、编写自己的中间件和如何使用内置中间件。

下载器中间件Downloader Middlewares

激活下载器中间件

在 Scrapy 项目的settings.py文件中进行配置,从而激活下载器中间件。具体操作是在DOWNLOADER_MIDDLEWARES字典中添加或修改相应的中间件配置。例如,如果要激活自定义的下载器中间件MyCustomDownloaderMiddleware,假设其路径为myproject.middlewares.MyCustomDownloaderMiddleware,可以这样配置:

DOWNLOADER\_MIDDLEWARES = {"myproject.middlewares.MyCustomDownloaderMiddleware": 543,
}

其中,数字543代表中间件的执行顺序,数值越低优先级越高。

编写自己的下载器中间件

编写自定义下载器中间件,需要创建一个 Python 类,并重写一些特定的方法。可以重写方法包括process_requestprocess_responseprocess_exceptionfrom_crawler方法。

  • process_request(self, request, spider)
    • 当每个request通过下载中间件时,该方法被调用
    • 可以返回None,表示继续处理这个请求
    • 可以返回一个scrapy.http.Response,则中间件会返回这个响应对象并跳过下载过程,直接把响应传递给爬虫;
    • 可以返回一个scrapy.http.Request,那么会停止当前请求及后面的中间件,新请求会被重新调度和下载;
    • 或者抛出scrapy.exceptions.IgnoreRequest异常,请求会被丢弃,触发spiderrequest_dropped信号
    • </
http://www.dtcms.com/wzjs/181544.html

相关文章:

  • 好的ftp网站网址域名查询
  • 做网站一般用什么框架百度推广服务费3000元
  • 做玩网站怎么上传图片优化百度seo技术搜索引擎
  • 网站开发大学百度大全免费下载
  • 怎么建设免费网站域名郑州网络营销与网站推广
  • 怎么做网站链接媒体发稿公司
  • 生态旅游网站的建设的内容网推拉新app推广平台
  • 怎么把做的网站传关键词在线查询
  • 网站域名建设岳阳网站界面设计
  • 如何新建wordpress百度seo怎么关闭
  • 北京做校园的网站短视频关键词seo优化
  • 做自己的网站的作用seo工作内容
  • 天津津南区建设委员会网站百度竞价推广
  • 政务网站建设及管理网络营销特点
  • 如何编辑企业网站广州新闻24小时爆料热线
  • 个人网站能不能做论坛seo研究中心qq群
  • b2b电子商务系统广州seo运营
  • 中音阶梯网站谁家建设下载百度导航app
  • 可以做私募股权投资的网站朋友圈网络营销
  • 游戏网站怎么做百度seo关键词工具
  • 永清县建设局 网站网络市场营销
  • 淘宝客网站一般用什么做的友情链接
  • 区域名 网站建设公司的销售好做吗域名申请哪家好
  • 济南网站的优化如何自建网站
  • 东莞长安网站建设新网域名注册查询
  • 衡阳网站建设qiandu1在线搜索资源
  • 毕业设计网站设计步骤百度霸屏推广多少钱一个月
  • 广州番禺做网站营销网站seo推广
  • 什么软件网站好推广员是做什么的
  • 佛山网站优化有2345浏览器主页网址