当前位置: 首页 > wzjs >正文

无备案网站加速百度推广收费多少

无备案网站加速,百度推广收费多少,icp备案官网查询,宝安做网站前言 XPath是Python爬虫最重要的过滤原始数据的手段之一,是爬虫最核心的技术 是专业抓取HTML页面而生的,基本上只用于抓取HTML页面使用 目录 安装支持XPath三方库lxml XPath代码入门示例 XPath表达式语法 在源代码上面直接获取XPath 安装支持XPath三方库lxml pip instal…

前言

XPath是Python爬虫最重要的过滤原始数据的手段之一,是爬虫最核心的技术

是专业抓取HTML页面而生的,基本上只用于抓取HTML页面使用

目录

安装支持XPath三方库lxml

XPath代码入门示例

XPath表达式语法

在源代码上面直接获取XPath


安装支持XPath三方库lxml

pip install lxml -i https://pypi.tuna.tsinghua.edu.cn/simple

XPath代码入门示例

from lxml import etreedata = "请求网页返回的源代码HTML数据"#使用 lxml 库中的 etree 模块使用XPath解析data数据
datas = etree.HTML(data)#返回的数据一般都是数据,即使是一个数据也是一个数组形式
res = datas.xpath('xpath表达式')#res这个数组里面的数据就是我们过滤好的目标数据
print(res)

XPath表达式语法

编写好的XPath表达式一般我们填入xpath()这个方法的适合习惯单引号,因为我们里面准备填写HTML里面的属性的时候我们习惯给双引号

XPath语法是按HTML页面的层级标签关系进行匹配的

 /                从根节点开始的绝对路径

//                匹配任意层级的节点

./                表示从当前节点开始的相对路径

HTML标签后面是可以跟坐标的,坐标是从1开始

        如 /html/body/p[1]/text()     

                就是使用绝对路径,从html标签根路径开始,html标签下的body标签下的第一个p标签的内容text()

        如//p[1]

                就是使用模糊匹配,匹配到HTML文件中的所有第一个P标签的内容text()

标签[@属性名="属性值"]             可以精确匹配具体的标签,确定好属性名和属性值的唯一性

/@属性名            取这个标签该属性值

/text()                  取这个标签的内容

在源代码上面直接获取XPath

不推荐,不美观而且使用起来不够灵活

Python请求的HTML有可能是懒加载的,导致请求的HTML字符串与页面源代码不符,导致使用不了

所以还是尽量自己可以按照XPath表达式语法自己编写,实际问题实际分析

 

http://www.dtcms.com/wzjs/456040.html

相关文章:

  • 网站开发需要有登陆界面的网站网页制作教程
  • 商城网站开发合同广州网站定制多少钱
  • 如何选择网站建设供应商开发一款app软件需要多少钱
  • 简单网站开发工具免费自己建网站
  • 做网站的接私活犯法吗市场营销策略
  • 电子商务网站建设的步骤过程商城系统开发
  • 网站建设培训学院优化网站的方法有哪些
  • 现在还有网站做校内网吗什么是sem
  • 重庆门户网站建设制作网页模板
  • 如何用 python 做网站网站代发外链
  • 国外著名室内设计网址最好的优化公司
  • 网站链接改名怎做301天津网站优化公司
  • 自己做网站 搜索功能开发百度小说排行榜风云榜单
  • 长春网站制作wang怎么做网站?
  • html5手机网站开发视频关键词代发包收录
  • 网站动态图片如何做24小时网站建设
  • 淄博市网站建设上海aso
  • 用户体验的互动展示网站北京疫情又严重了
  • 如何用二级域名做网站布奏搜索引擎网址
  • 17网站一起做网店浙江网推平台有哪些比较好
  • 美国做调查网站已备案域名购买平台
  • 如果自己想建设网站该怎么做百度热搜榜单
  • 个人博客网站模板百度账号登录
  • wordpress建站企业宁波seo推荐
  • 怎样建设相亲网站北京网站建设公司优势
  • 想学室内设计在哪里学网站关键词怎么优化排名
  • 大连企业网站开发网站域名服务器查询
  • 心理网站的建设与维护b站2023推广网站
  • 如何做收费会员定制网站深圳整站seo
  • 用自己照片做衣服_杯子的是哪个网站长沙网站建设