当前位置: 首页 > wzjs >正文

网页广告图seo搜索优化公司报价

网页广告图,seo搜索优化公司报价,建设网站是什么样的,广州新闻头条最新消息Scrapy框架 官网概念 Scrapy 是一个强大的 Python 网络爬虫框架。 最新版本学习 安装 pip install scrapy 使用 # 创建名称为myscrapy的爬虫项目 scrapy starpoject myscrapy # 创建爬那个 就是比如 需要爬http://quotes.toscrape.com 运行的名称:toscrape运行…

Scrapy框架

官网概念

        Scrapy 是一个强大的 Python 网络爬虫框架。

        最新版本学习

安装

pip install scrapy

使用

# 创建名称为myscrapy的爬虫项目
scrapy starpoject myscrapy
# 创建爬那个 就是比如 需要爬http://quotes.toscrape.com 运行的名称:toscrape运行的网址:http://quotes.toscrape.com
cd myscrapy/myscrapy/spider
scrapy genspider toscrape http://quotes.toscrape.com
# 运行cd到spiders目录下执行
scrapy crawl toscrape

常见命令

命令使用 -h(或者--help) 查看帮助示例描述
scrapyscrapy -h查看所有可用的Scrapy命令
scrapy startprojectscrapy startproject -h创建一个新的Scrapy项目
scrapy genspiderscrapy genspider -h在当前项目中生成一个新的爬虫
scrapy crawlscrapy crawl -h运行一个爬虫
scrapy checkscrapy check -h检查爬虫代码是否有错误
scrapy listscrapy list -h列出当前项目中所有可用的爬虫
scrapy editscrapy edit -h在编辑器中编辑爬虫(需配置EDITOR环境变量)
scrapy fetchscrapy fetch -h使用Scrapy下载器下载URL,并输出内容
scrapy viewscrapy view -h在浏览器中打开URL,查看Scrapy如何识别它
scrapy shellscrapy shell -h启动Scrapy shell,用于调试和测试选择器
scrapy parsescrapy parse -h解析给定的URL并使用处理它的爬虫
scrapy settingsscrapy settings -h获取Scrapy设置的值
scrapy runspiderscrapy runspider -h运行一个独立的爬虫Python文件,而无需创建项目
scrapy versionscrapy version -h显示Scrapy版本,结合-v显示可用的Python、Twisted和平台信息
scrapy benchscrapy bench -h运行基准测试(需安装scrapy-bench

示例

import scrapyclass ToscrapeSpider(scrapy.Spider):name = "toscrape"allowed_domains = ["quotes.toscrape.com"]start_urls = ['http://quotes.toscrape.com/page/1/','http://quotes.toscrape.com/page/2/',]def parse(self, response):print("hello world")page = response.url.split("/")[-2]filename = f'quotes-{page}.html'with open(filename, 'wb') as f:f.write(response.body)

项目结构

myscrapy/scrapy.cfg            # 部署配置文件myscrapy/             # 项目的Python模块,您将从这里导入代码__init__.pyitems.py          # 项目定义文件middlewares.py    # 项目中间件文件pipelines.py      # 项目管道文件settings.py       # 项目设置文件spiders/          # 放置蜘蛛的目录__init__.pytoscrape.py   # 爬虫实际执行文件 从这里执行 scrapy crawl toscrape

scrapy shell

     官网概念:scrappyshell是一个交互式shell,您可以在其中快速调试 scrape 代码,而不必运行spider。它本来是用来测试数据提取代码的,但实际上您可以使用它来测试任何类型的代码,因为它也是一个常规的Python外壳。

配置

在scrapy.cfg下配置

[settings]
shell = bpython

常用方法

命令/方法说明示例
scrapy shell <url>启动Scrapy Shell并自动下载URL,生成response对象scrapy shell "https://example.com"
fetch(url)在Shell中重新下载指定URL,更新response对象(需先启动Shell)fetch("https://example.com/page2")
response.css() / .xpath()用CSS/XPath选择器提取数据(最常用)response.css("h1::text").get()
.get() / .getall()提取单个结果(字符串)或所有结果(列表)response.xpath("//a/@href").getall()
view(response)在浏览器中打开当前response,检查页面渲染效果view(response)
response.url / .status查看当前响应的URL和HTTP状态码print(response.status)
request.headers查看请求头信息(用于调试反爬)print(request.headers)
shelp()查看Shell内置帮助(列出所有可用对象和函数)shelp()
vars()查看当前Shell的全局变量(如responserequestcrawlervars()
from scrapy import Selector手动创建Selector对象解析文本(非实时请求时使用)

sel = Selector(text="<html>...</html>")

exit()退出exit()
http://www.dtcms.com/wzjs/18612.html

相关文章:

  • 在自己的网站做百度搜索框百度推广营销
  • 做卡通的素材网站优化设计答案六年级上册语文
  • 哈尔滨嘟嘟网络靠谱吗网页优化建议
  • 北京网站制作报价链接点击量软件
  • 成都广告公司排行seo免费资源大全
  • 网站开发讲座百度有免费推广广告
  • 最早做美食团购的网站百度推广系统营销平台
  • 深圳 商城 网站建设新闻媒体发布平台
  • 几台服务器做集群网站全国疫情最新消息今天实时
  • php酒店网站源码武汉全网营销推广公司
  • 微信网页版登陆入口长沙优化科技
  • 项目网站建设方案百度seo关键词优化公司
  • 手机有软件做ppt下载网站有哪些内容吗百度推广合作
  • 西二旗网站建设免费推广网站大全下载
  • 南昌集团网站建设百度财报q3
  • 北京海淀中关村找工作网站优化师的工作内容
  • 麻城做网站第一设计
  • 中英 网站模板 带手机版关键词seo优化
  • 南京专业网站设计公司湖南网络推广服务
  • 深圳做网站de公司网站关键词优化排名公司
  • 佛山专业做网站公司seo实训报告
  • 做网站怎么防止被网警查到杭州百度
  • 甘肃省建设局网站做百度推广
  • 做公众号首图网站手机端百度收录入口
  • 罗湖网站建设哪家好自动app优化
  • 温州网站建设模板下载免费营销公司取名字大全
  • 厦门商场网站建设如何做品牌宣传与推广
  • 怎么用自己电脑做网站服务器天津网站建设技术外包
  • 基础微网站开发动态集合竞价口诀背熟6句
  • 专业刷单网站建设手机维修培训班学校