当前位置: 首页 > news >正文

爬虫中一些有用的用法

文本和标签在一个级别下

如果文本和a标签在一个级别下
比如:

# 获取a标签后的第一个文本节点
    text_node = a.xpath('following-sibling::text()[1]')[0].strip()

将xpath的html代码转换成字符串

etree.tostring(root, pretty_print=True, encoding="utf-8")

获取所有同级标签的最后一个

data_list = html.xpath('//ul[@class=" list-paddingleft-2"]/li[last()]')

XPath中没有直接的[-1]语法来选择最后一个元素,而是使用last()函数

相关文章:

  • 【ISP】对于ISP的关键算法补充
  • Python第十七课:卷积神经网络 | 计算机视觉之眼
  • Vue3接入谷歌邮箱登录功能
  • 打造智能钉钉机器人:借助智谱GLM-4-Flash实现高效智能回复(文末附源码)
  • 决策树,Laplace 剪枝与感知机
  • K8S学习之基础二十三:k8s的持久化存储之nfs
  • 【CXX】6 内置绑定
  • MongoDB 触发器实现教程
  • js和java中方法重载(js本身是不支持方法重载,方便对比学习)
  • 从零开始的python学习(五)P75+P76+P77+P78+P79+P80
  • 2001-2023年上市公司数字化转型年报词频统计(年报词频统计和MDA词频统计两种方式)(吴非、赵宸宇、甄红线300+关键词三种方法)
  • 施磊老师c++笔记(四)
  • sonarqube+SonarScanner+postpresql+jenkins
  • 全网最详解答OSPF基础
  • 光谱相机检测肉类新鲜度的原理
  • 一位年薪35W的测试被开除,回怼的一番话,令人沉思
  • Spring IoC:解耦与控制反转的艺术
  • qt 多进程使用共享内存 ,加速数据读写,进程间通信 共享内存
  • pyCharm快速安装tensorflow、keras环境
  • 【1688】崖山集群YAC安装备忘
  • 青岛网站排名方案/百度度小店申请入口
  • 国外色情 网站 推荐/社会新闻最新消息
  • 成都网站建设创意/建网站一般需要多少钱
  • 余姚做网站设计的公司/国内专业seo公司
  • 联谊会总结网站建设对外宣传/搜索引擎名词解释
  • 公积金门户网站建设方案/百度云网盘资源搜索引擎入口