当前位置: 首页 > wzjs >正文

无备案网站加速宁波网站推广找哪家公司

无备案网站加速,宁波网站推广找哪家公司,株洲网红打卡地,银川seo公司前言 XPath是Python爬虫最重要的过滤原始数据的手段之一,是爬虫最核心的技术 是专业抓取HTML页面而生的,基本上只用于抓取HTML页面使用 目录 安装支持XPath三方库lxml XPath代码入门示例 XPath表达式语法 在源代码上面直接获取XPath 安装支持XPath三方库lxml pip instal…

前言

XPath是Python爬虫最重要的过滤原始数据的手段之一,是爬虫最核心的技术

是专业抓取HTML页面而生的,基本上只用于抓取HTML页面使用

目录

安装支持XPath三方库lxml

XPath代码入门示例

XPath表达式语法

在源代码上面直接获取XPath


安装支持XPath三方库lxml

pip install lxml -i https://pypi.tuna.tsinghua.edu.cn/simple

XPath代码入门示例

from lxml import etreedata = "请求网页返回的源代码HTML数据"#使用 lxml 库中的 etree 模块使用XPath解析data数据
datas = etree.HTML(data)#返回的数据一般都是数据,即使是一个数据也是一个数组形式
res = datas.xpath('xpath表达式')#res这个数组里面的数据就是我们过滤好的目标数据
print(res)

XPath表达式语法

编写好的XPath表达式一般我们填入xpath()这个方法的适合习惯单引号,因为我们里面准备填写HTML里面的属性的时候我们习惯给双引号

XPath语法是按HTML页面的层级标签关系进行匹配的

 /                从根节点开始的绝对路径

//                匹配任意层级的节点

./                表示从当前节点开始的相对路径

HTML标签后面是可以跟坐标的,坐标是从1开始

        如 /html/body/p[1]/text()     

                就是使用绝对路径,从html标签根路径开始,html标签下的body标签下的第一个p标签的内容text()

        如//p[1]

                就是使用模糊匹配,匹配到HTML文件中的所有第一个P标签的内容text()

标签[@属性名="属性值"]             可以精确匹配具体的标签,确定好属性名和属性值的唯一性

/@属性名            取这个标签该属性值

/text()                  取这个标签的内容

在源代码上面直接获取XPath

不推荐,不美观而且使用起来不够灵活

Python请求的HTML有可能是懒加载的,导致请求的HTML字符串与页面源代码不符,导致使用不了

所以还是尽量自己可以按照XPath表达式语法自己编写,实际问题实际分析

 

http://www.dtcms.com/wzjs/439706.html

相关文章:

  • 怎样弄一个网站seo网络运营
  • 广州做网站建设哪家专业开平网站设计
  • 怎么让人搜索到自己做的网站恶意点击推广神器
  • 想接外包做网站网页制作步骤
  • 杭州网站制作建设百度直接打开
  • 网站设计与网站建设搜索引擎营销的实现方法有哪些
  • 政府网站建设指导广告营销方式有哪几种
  • 域名没备案如何建设网站如何推广app让别人注册
  • 法国化妆品进口报关做网站cpa游戏推广联盟
  • dw网站怎么做背景图seo排名点击软件推荐
  • 电子政务网站建设ppt襄阳网站seo
  • 做网站需要注意些什么口碑营销的主要手段有哪些
  • 西安建设工程网站游戏广告投放平台
  • 做公益网站赚钱吗网络公司是做什么的
  • 网站前台显示数据库指定分类怎么做php普通话手抄报简单又漂亮
  • 合肥网站建设工作室电话营销话术
  • 商城网站的建设如何让百度收录
  • 上海专业网站制作设计网站如何做优化排名
  • 上海行业门户网站建设应用站内推广有哪些方式
  • 外贸网站建设 全球搜阿里巴巴推广
  • 徐州做网站需要多少钱德州seo优化
  • 软件开发外包公司排怀化网站seo
  • 重庆网站建设外包哪家好企业网络营销推广方案策划
  • 省 两学一做 专题网站互联网营销师怎么报名
  • 50万县城做地方网站太原seo排名公司
  • 什么网站做海报新网站百度seo如何做
  • 沧州营销型网站建设如何制作自己的网站?
  • 网站独立ip空间网站排名优化方案
  • 营销型网站建设案例每日鲜搜索量排名
  • ui设计师工作流程轻松seo优化排名