当前位置: 首页 > wzjs >正文

做猎头需要用到的网站小红书新媒体营销案例分析

做猎头需要用到的网站,小红书新媒体营销案例分析,苏州seo服务,广西云尚网络科技有限公司一、提取链接 任务需求:如果爬取的数据通常分布在多个页面中,每个页面包含一部分数据以及到其他页面的链接,提取链接可以使用Selector和使用LinkExtractor两个方法。 在页面中待提取的链接较少的时候,可以使用Selector来进行解决&…

一、提取链接

        任务需求:如果爬取的数据通常分布在多个页面中,每个页面包含一部分数据以及到其他页面的链接,提取链接可以使用Selector和使用LinkExtractor两个方法。

        在页面中待提取的链接较少的时候,可以使用Selector来进行解决,但是其毕竟主要的作用还是提取数据,不是专门用于提取链接的,故这里使用LinkExtractor用于专门对大量链接和较为复杂场景的链接提取。可以设定不想要/想要的链接开头,设定提取的css范围和XPath列表以及不想要的链接域等都可以通过LinkExtractor获取到。

二、导出数据

这个解决任务的需求在于对爬取到的数据以某种数据格式保存到文件中,即导出数据。

在Scrapy中负责导出数据的组件被成为Exporter,在Scrapy中有多种Exporter,每种Exporter支持一种数据格式的导出,其可支持的数据格式为:JSON/JSON lines/CSV/XML/Pickle/Marshal。除去这6种文本格式外的格式,均需要自定义Exporter来实现。

导出数据时,Scrapy需提供导出文件的路径、导出文件的数据格式;可以通过命令行参数和修改配置文件实现导出数据。

①使用命令行参数导出(-o/-t)数据:

eg1:scrapy crawl books -o books.csv

eg2:scrapy crawl books-t csv -o books.data

②配置文件(settings.py)导出数据:

在默认配置文件中,使用的是FEED_EXPORTERS_BASE,这个使用的是内部支持的导出格式。

在用户配置文件中,使用的是FEED_EXPORTERS,这个是用户自定义的导出格式。

以下是在配置文件中需要设置的参数值:

FEED_URI:”export_data/%(name)s/%(time)s.data”//文件输出路径

FEED_FORMAT:”json”//文件输出格式

FEED_EXPORT_ENCODING:”utf-8”//文件编码格式

FEED_EXPORT_FIELDS:[‘name’,’author’,’price’,”type”,’’country”]//导出数据包含的字段

FEED_EXPORTERS:{“xlsx”:”myproject.myexporters.XLSXItemExporter”}//这个在自定义了一个XLSXItemExporter时进行这样使用。

以下是对如何进行自定义导出格式的实现阐述:

由于Scrapy中有一个BaseItemExporter导出基类,故在进行自定义导出类XLSXItemExporter实现中,需要继承该基类。然后自定义该类中的方法,最终实现对xlsx格式的导出。

http://www.dtcms.com/wzjs/406552.html

相关文章:

  • 郑州网站设计网站seo数据
  • 网站怎样投放广告位网络优化seo
  • pc和移动版网站长尾关键词搜索
  • 营销一型网站建设公司总推荐榜总点击榜总排行榜
  • 原则网站设计版式seo网络优化平台
  • 北京营销型网站建设价格关键词优化seo优化
  • 网络软文营销的案例seo网站排名优化公司哪家好
  • 汽车美容网站模板关键词优化公司推荐
  • 网站建设_网站制作公司_捷创关键词排名监控
  • 英文网站建设 济南搜索热门关键词
  • ipo和seoseo是什么平台
  • 何炅做的网站广告短视频运营公司
  • 网站如何做收录排行最受欢迎的十大培训课程
  • 沂seo网站推广竞价推广网络推广运营
  • 域名备案成功如何做网站优化 seo
  • .net做网站开发吗最新中高风险地区名单
  • 电子商务网站建设考卷怎么恶意点击对手竞价
  • 长沙公积金网站怎么做异动厦门网站制作全程服务
  • 河南天元建设公司网站宁波seo高级方法
  • 用drupal做的网站百度联盟广告收益
  • 芜湖互联网公司山东seo首页关键词优化
  • 海南房地产网站建设铜陵seo
  • 开淘宝的店铺网站怎么做留电话的广告网站
  • 专门做奢侈品的网站个人怎么在百度上做推广
  • 如何做网站的统计如何做推广最有效果
  • 做网站靠什么赚钱网站创建
  • 建立网站目录结构的意义网络营销的认识
  • 济南微信网站开发清远市发布
  • 织梦模板 行业网站seo软件推荐
  • 宁波建设银行搜索引擎优化seo优惠