当前位置: 首页 > wzjs >正文

杭州网站建设第一品牌wordpress翻译升级失败

杭州网站建设第一品牌,wordpress翻译升级失败,医学ppt模板下载免费,企业网站建设费怎么账务处理上一节我们对爬虫程序的默认回调函数parse做了改写,提取的数据可以在Scrapy的日志中打印出来了,光打印肯定是不行的,还需要把数据存储,数据可以存到文件,也可以存到数据库,我们一一来看。 存储数据到文件 首先我们看看如何将数据存储到文件,在讲[[【Scrapy】Scrapy教程…

上一节我们对爬虫程序的默认回调函数parse做了改写,提取的数据可以在Scrapy的日志中打印出来了,光打印肯定是不行的,还需要把数据存储,数据可以存到文件,也可以存到数据库,我们一一来看。

存储数据到文件

首先我们看看如何将数据存储到文件,在讲[[【Scrapy】Scrapy教程5——第一个Scrapy项目]]时,我们改写了prase函数,将首页存储到了一个shouye.html文件中,这便是我们的简单的数据存储,但这个存储方式是我们纯手写的代码,存的是整个页面,并非我们想要的数据。
这节主要讲存储数据,我们看下通过Scrapy命令直接存储数据,在这之前我们将parse函数修改下。

def parse(self, response):# 从获取的所有文章中提取链接和标题for article in response.css(".card")[1:]:yield {"title": article.xpath("./a").css("span::text").get(),"link": self.start_urls[0] + article.xpath("./a/@href").get(),}

然后,我们在到命令行中,运行以下命令。

scrapy crawl shouye -o titles.json

上面这条命令会将我们提取的数据存储到titles.json文件中,存储后的效果如下图所示。
在这里插入图片描述

我们会发现,存储的数据没有错,但是被整体存到了一个大的字典中,这不是我想要的结果,我只要数据一行一行的存储下来就好了,我们可以用以下命令。

scrapy crawl shouye -o titles.jsonl

没错,我们换个存储格式,就可以了。
在这里插入图片描述

存储数据到数据库

上面这种方法存储简单的数据可以,对于复杂结构的数据存储,就要引入Items和pipelines了。

Items

我们爬取页面的目标就是将非结构化数据提取为结构化数据,而Item就是Scrapy提供的一个类,用于定义通用输出数据格式的。Scrapy可以将提取的数据,作为Item返回,类似python的键值对。

Item Types

Scrapy通过itemadapter支持字典、Item对象、数据类对象、attrs对象几种Item类型。

  • 字典:类似Python的键值对字典
  • Item对象:Item提供的一个类似dict的API,可以支持更高级的特性
  • dataclass对象:允许定义具有字段名称的项目类,可以指定字段的类型和元数据
  • attrs对象:允许定义具有字段名称的项目类,可以指定字段的类型和元数据
http://www.dtcms.com/wzjs/554503.html

相关文章:

  • 达州网站开发海南四定网站开发
  • 用dw做网站时怎么添加弹窗国内免费域名申请
  • 网站建设终身不用维护模板网站与定制网站的区别
  • 苏宁易购电子商务网站建设目标比较好的网页制作公司
  • 怎样宣传网站网站建设论文提纲
  • 淄博易宝网站建设网络推广服务内容
  • 北京网站制做的公司莱芜网络推广公司哪里有
  • 装修公司网站模板北京网站设计公司有哪些
  • wordpress做文字站wordpress 评论 姓名
  • 做美团网站代码重庆公司团建推荐
  • 高速公路建设管理局网站怎么做wap网站
  • dedecms网站地图前台路径不修改如何建设网站知乎
  • 旅游网站的制作著名网站设计公司
  • 做搜索引擎优化对网站有哪些好处可以做设计兼职的网站有哪些工作
  • 陕西省城乡住房建设部网站网站建设金手指排名稳定
  • 商城网站架构网站域名登记证明文件
  • 建网站做站长安溪人做的网站
  • 加强网站网络安全建设酒店 深圳 网站制作
  • 做二手车广告推广哪家网站好遵义水网站建设
  • 网站开发需求分析怎么写WordPress模板使用方法
  • 做网站架构需要什么工具网站设计主页
  • 淮安网站建设找谁好深圳logo设计公司排名
  • 网站可以做音频线吗做网站的不给ftp
  • 团购网站怎么推广妇幼网站建设ppt
  • 网站设计基本流程邹城住房城乡建设部网站
  • 玉溪网站开发公司做网站界面设计注意什么
  • 住房和建设部官方网站照片书制作软件
  • ps网站怎么做超链接wordpress怎样临时关闭网址
  • 专业做网站建设公司哪家好网站设计就业前景
  • 成都市做网站的公司公司网站模板最新