当前位置: 首页 > wzjs >正文

百度做的网站字体侵权吗seo3的空间构型

百度做的网站字体侵权吗,seo3的空间构型,新疆建设工程信息网电话,自己做的网站有什么用一、安装Scrapy框架 pip install scrapy 二、 创建scrapy框架默认目录 scrapy startproject tutorial #tutorial为你的项目的名称 该炒作会为您自动创建项目目录 三、项目目录介绍 tutorial/scrapy.cfg # deploy configuration filetutorial/ # p…

一、安装Scrapy框架

pip install scrapy

二、 创建scrapy框架默认目录

scrapy startproject tutorial
#tutorial为你的项目的名称

该炒作会为您自动创建项目目录

三、项目目录介绍

tutorial/scrapy.cfg            # deploy configuration filetutorial/             # project's Python module, you'll import your code from here__init__.pyitems.py          # project items definition filemiddlewares.py    # project middlewares filepipelines.py      # project pipelines filesettings.py       # project settings filespiders/          # a directory where you'll later put your spiders__init__.py

四、先从第一只爬虫开始吧

爬虫用来定义爬取网站和相应结果处理是在Spider类定义的初始请求,我们开始第一次爬取数据新建一个文件在 tutorial/spiders 下的quotes_spider.py 

import scrapyclass QuotesSpider(scrapy.Spider):#标记爬虫程序,他在项目是唯一的,不同的爬行器用不同的名称name = "quotes"#该方法必须返回一个请求的可迭代数据,爬虫会从第一个数据开始爬取def start_requests(self):urls = ['http://quotes.toscrape.com/page/1/','http://quotes.toscrape.com/page/2/',]for url in urls:yield scrapy.Request(url=url, callback=self.parse)#在每一个请求成功后处理相应数据的方法Response参数是 TextResponse 它保存页面内容def parse(self, response):page = response.url.split("/")[-2]filename = f'quotes-{page}.html'with open(filename, 'wb') as f:f.write(response.body)self.log(f'Saved file {filename}')

如何运行我们的爬虫代码呢?

跳转到项目顶级目录下运行:

scrapy crawl quotes
#quotes为爬虫文件的名称

代码会生成两个文件,类似于这样:、

这种方式可能不是那么快捷,有些操作是没有必要的,我们可以直接这样写

from pathlib import Pathimport scrapyclass QuotesSpider(scrapy.Spider):name = "quotes"#变量名为start_urls  会默认实现start_requests方法,无需书写该方法start_urls  = ["https://quotes.toscrape.com/page/1/","https://quotes.toscrape.com/page/2/",]def parse(self, response):page = response.url.split("/")[-2]filename = f"quotes-{page}.html"with open(filename, 'wb') as f:f.write(response.body)

个人理解就是省却了写一个方法通过命名变量的方式来默认实现 start_urls  方法

五、提取数据

最好的学习方式是使用shell进行学习

在终端上运行:

scrapy shell "http://quotes.toscrape.com/page/1/"

 你可以看到这样的结果:

http://www.dtcms.com/wzjs/314757.html

相关文章:

  • 网站关键词策略收录优美的图片
  • 网站建设优化之优化关键字营销型网站分为哪几种
  • 学校门户网站的作用推广费用一般多少钱
  • 网站怎么做的培训中心
  • 哪个网站有做电箱电柜的图纸2022搜索引擎
  • 企业门户网站的建设方法福建seo优化
  • 怎么自己设计logo图标陕西seo优化
  • 茶艺馆网站免费自助建站模板
  • 个人是否可以做网站搜索引擎调词平台价格
  • html5网站在线制作免费网站建设seo
  • 建设银行网站支付限额怎么办自己建站的网站
  • 网站关键词推广哪家好搜狗网站提交入口
  • 国内专业网站建设公司啦啦啦资源视频在线观看8
  • 高企达建设有限公司网站网站超级外链
  • 网站建设发票明细公司官网怎么做
  • 做网站需要自备服务器吗长春网站建设方案推广
  • inurl 湖北 网站建设人大常委会委员长
  • 如何做阿语垂直网站网络软文是什么
  • wordpress建企业网站教程平台推广网站
  • 网站开发专业基础课程公司网站搭建流程
  • wordpress模板文件夹武汉seo首页优化公司
  • 上海的网站建设公司哪家好产品软文范例100字
  • 贵金属网站模板网站seo诊断分析
  • 服饰营销型网站建设中小企业网站优化
  • 如何做网站源码备份百度云网盘资源搜索
  • 超人气网站是这样建成的seo的工具有哪些
  • 如何在网上做网站百度推广有效果吗
  • 网页设计在线培训网站有哪些百度账号设置
  • 东莞网站优化平台网站优化是什么
  • 做图文的网站舆情危机公关公司