当前位置: 首页 > news >正文

高级深入--day30

Scrapy Shell

Scrapy终端是一个交互终端,我们可以在未启动spider的情况下尝试及调试代码,也可以用来测试XPath或CSS表达式,查看他们的工作方式,方便我们爬取的网页中提取的数据。

如果安装了 IPython ,Scrapy终端将使用 IPython (替代标准Python终端)。 IPython 终端与其他相比更为强大,提供智能的自动补全,高亮输出,及其他特性。(推荐安装IPython)

启动Scrapy Shell

进入项目的根目录,执行下列命令来启动shell:

scrapy shell "http://www.itcast.cn/channel/teacher.shtml"

Scrapy Shell根据下载的页面会自动创建一些方便使用的对象,例如 Response 对象,以及 Selector 对象 (对HTML及XML内容)

  • 当shell载入后,将得到一个包含response数据的本地 response 变量,输入 response.body将输出response的包体,输出 response.headers 可以看到response的包头。

  • 输入 response.selector 时, 将获取到一个response 初始化的类 Selector 的对象&#

相关文章:

  • web 基础和http 协议
  • CentOS 7 服务器上创建新用户及设置用户密码有效期
  • 四.镜头知识之放大倍率
  • 2023年全球及中国光伏硅片行业产量、市场竞争格局及趋势分析[图]
  • mac(M1)卸载miniconda3
  • Maven Eclipse
  • el-table合计行合并
  • 多线程并发篇---第五篇
  • 3.3 数据定义
  • 深度学习简述
  • 进阶JAVA篇-StringBuilder类与StringBuffer类的常用API(二)
  • 正则表达式——^的两种用法
  • MacOS Pro笔记本硬盘升级纪实
  • Flink-SQL join 优化 -- MiniBatch + local-global
  • 如何在 Spring Boot 中实现容错机制
  • 【原创】ubuntu18修改IP地址
  • 代码随想录算法训练营第四十四天| 01背包问题 二维、01背包问题 一维、416. 分割等和子集
  • 使用Tensorrt的一般步骤
  • FastAPI学习-27 使用@app.api_route() 设置多种请求方式
  • 华为云云耀云服务器L实例评测|华为云上的CentOS性能监测与调优指南
  • 印度最新发声:对所有敌对行动均予以反击和回应,不会升级冲突
  • 李在明正式登记参选下届韩国总统
  • 2025世界数字教育大会将于5月14日至16日在武汉举办
  • 国家主席习近平在莫斯科出席红场阅兵式
  • 东莞“超级”音乐节五一出圈背后:文旅热力何以澎湃经济脉动
  • 多人称华为手机忽现拍照模糊疑存缺陷,售后回应:主摄像头故障