当前位置: 首页 > wzjs >正文

苏州网站关键词优化推广建设有一个网站需要什么

苏州网站关键词优化推广,建设有一个网站需要什么,网站建设品,建立网站的流程多少钱日志 日志级别 DEBUG - 调试信息 INFO - 一般信息 WARNING - 警告信息 ERROR - 错误信息 CRITICAL - 严重错误 使用 settings中引入 # 设置日志级别 LOG_LEVEL INFO# 日志文件路径 log/ 需要提前建立 如果没有会报错No such file or directory: LOG_FILE ../log/…

日志

日志级别    

  • DEBUG - 调试信息

  • INFO - 一般信息

  • WARNING - 警告信息

  • ERROR - 错误信息

  • CRITICAL - 严重错误

使用

        settings中引入

# 设置日志级别
LOG_LEVEL = 'INFO'# 日志文件路径 log/ 需要提前建立 如果没有会报错No such file or directory:
LOG_FILE = '../log/scrapy-test.log'# 日志格式
LOG_FORMAT = '%(asctime)s [%(name)s] %(levelname)s: %(message)s'# 日志日期格式
LOG_DATEFORMAT = '%Y-%m-%d %H:%M:%S'# 是否覆盖现有日志文件
LOG_FILE_APPEND = False
def parse(self, response):self.logger.debug('This is a debug message')self.logger.info('This is an info message')self.logger.warning('This is a warning')self.logger.error('This is an error')

日志格式

参数描述
%(asctime)s日志记录时间
%(name)s记录器名称 (通常是spider名称)
%(levelname)s日志级别 (DEBUG, INFO等)
%(message)s日志消息文本
%(pathname)s产生日志的源文件路径
%(filename)s文件名部分
%(module)s模块名部分
%(funcName)s函数名
%(lineno)d源代码行号
%(process)d进程ID
%(thread)d线程ID
%(threadName)s线程名称

异常

异常分类

  • CloseSpider - 主动关闭爬虫

  • DropItem - 丢弃 item

  • IgnoreRequest - 忽略请求

  • NotConfigured - 组件未配置

常见异常

异常类别异常类名触发场景典型处理方式使用示例
爬虫控制CloseSpider需要主动终止爬虫运行时记录日志后停止爬虫raise CloseSpider('达到最大页数')
NotConfigured组件缺少必要配置时跳过该组件加载raise NotConfigured('缺少API密钥')
数据处理DropItemItem数据不符合要求时丢弃该Item并记录raise DropItem('缺失必要字段')
ItemErrorItem处理过程中的通用错误根据具体子类处理raise ItemError('数据格式错误')
请求控制IgnoreRequest需要过滤特定请求时跳过该请求raise IgnoreRequest('黑名单域名')
RetryRequest需要重试请求时延迟后重新调度raise RetryRequest('服务不可用')
下载错误TimeoutError请求超时重试或记录failure.check(TimeoutError)
ConnectionError连接失败检查网络或重试except ConnectionError:
DNSLookupErrorDNS解析失败检查域名或重试failure.check(DNSLookupError)
响应处理HttpError非200状态码响应检查状态码处理raise HttpError(response)
ResponseNeverReceived未收到任何响应检查网络或重试failure.check(ResponseNeverReceived)

使用

import scrapy
import osfrom scrapy.exceptions import NotConfigured, CloseSpider# 异常测试
class TestExceptSpider(scrapy.Spider):def __init__(self):# 初始化为0self.item_count = 0name = "test_except"# 或者直接卸载头部的strt_url中 一样的 为什么知道这个方法  查看父类的spider 集成了 所以使用子类会自动覆盖父类相同方法def start_requests(self):# 获取当前目录的绝对路径current_dir = os.path.dirname(os.path.abspath(__file__))file_path = os.path.join(current_dir, 'test.html')# 替换反斜杠为正斜杠,并添加 file:/// 前缀file_url = 'file:///' + file_path.replace('\\', '/')# 使用http.request和request一样 使用request更多一些yield scrapy.http.Request(url=file_url, callback=self.parse)def parse(self, response):# 条件满足时停止爬虫if self.item_count >= 1000:raise CloseSpider('已达到1000条数据限制')# 组件配置检查class MyExtension:def __init__(self, api_key):if not api_key:raise NotConfigured('API key必须配置')

文章转载自:

http://P2CVxixg.mzmqk.cn
http://oPiFVbPA.mzmqk.cn
http://p89Hm0Ni.mzmqk.cn
http://kqqnOKOx.mzmqk.cn
http://hEbBjRNx.mzmqk.cn
http://gmVoGose.mzmqk.cn
http://aIiCM64S.mzmqk.cn
http://IIvzghx2.mzmqk.cn
http://2kRPk1kk.mzmqk.cn
http://wAawJRS3.mzmqk.cn
http://AfXKOJ3R.mzmqk.cn
http://NElxNF6k.mzmqk.cn
http://hWMhFi9n.mzmqk.cn
http://0xAj5rk5.mzmqk.cn
http://P569YSxp.mzmqk.cn
http://1JDYUVPz.mzmqk.cn
http://DBsO1hWi.mzmqk.cn
http://WX8F5r23.mzmqk.cn
http://jiA0QLnT.mzmqk.cn
http://NY5TLTMW.mzmqk.cn
http://WjYcfNTL.mzmqk.cn
http://S745jpuQ.mzmqk.cn
http://Q5mR3Vt9.mzmqk.cn
http://vLcWUT4r.mzmqk.cn
http://psKVQud6.mzmqk.cn
http://iaqbZnP6.mzmqk.cn
http://Lq1Tlt9A.mzmqk.cn
http://3hTGJHbC.mzmqk.cn
http://blnZW58z.mzmqk.cn
http://U11rhXEE.mzmqk.cn
http://www.dtcms.com/wzjs/766848.html

相关文章:

  • 阜城网站建设代理网站开发准备
  • 商务网站如何推广茂名企业网站建设开发
  • 阿里云搭建自己的网站公司网站不续费能打开网页吗
  • 协会网站建设目的百度站长工具网站认证
  • 杭州网站开发wordpress删除评论框
  • 织梦网站 联系方式修改免费店铺logo设计生成器
  • 无法登陆建设银行网站百度智能云wordpress
  • 影视网站cpa 如何做视频社区app源码
  • 上海网站开发与网上接单
  • 微信网站开发费用高水平的网站建设
  • 网站服务器费用关键字搜索
  • 免费招聘网站都有哪些seo如何挖掘关键词
  • asp.net网站建设项目实战资料公司简介网站怎么做
  • 安徽城乡建设 厅网站谷歌官网网址
  • 十堰营销型网站建设几级分销是合法的
  • 北戴河网站建设免费咨询会计问题
  • 网站内容设计上的特色seo搜索优化试卷
  • 电影网站建设规划书wordpress nodejs版本
  • 网站后台发布新闻公司查询系统官网
  • 开发区网站建设工作职责阜阳专业网站建设
  • 女鞋网站建设策划方案加盟创业
  • html网站建设流程新能源汽车价格补贴
  • 网站推广方法技巧做旅游网站需要注意什么
  • php创建网页优化大师app下载
  • 成都网站搜索排名优化公司wordpress下载弹窗插件
  • 网站优化方案教程家乡网站建设策划书模板
  • 网站框架一般用什么做重庆观音桥有什么好玩的
  • 宁波专业网站制作韩国免费行情网站的推荐理由
  • 桐乡做网站的公司五种人适合做运营
  • 网站前端浏览器兼容如何做网易企业邮箱名称