当前位置: 首页 > news >正文

BeautifulSoup 的页面中需要获取某个元素的 xpath 路径

BeautifulSoup 的页面中需要获取某个元素的 xpath 路径

    def generate_xpath(tag, is_class=True):"""根据页面信息获取指定内容的xpath路径:param tag: BeautifulSoup 的页面中需要获取xpath路径的对象:param is_class: 是否使用class进行创建xpath:return: xpath路径"""def path_generator(t):components = []for parent in t.parents:if parent.name == '[document]':breaksiblings = [sib for sib in parent.find_previous_siblings(t.name)if sib.name == t.name]position = len(siblings) + 1components.append(f"{t.name}[{position}]")t = parentcomponents.reverse()return '/' + '/'.join(components)# 优先检查唯一属性if tag.get('id'):return f"//{tag.name}[@id='{tag['id']}']"if is_class and tag.get('class'):return f"//{tag.name}[contains(@class,'{tag['class'][0]}')]"return path_generator(tag)
http://www.dtcms.com/a/541900.html

相关文章:

  • 网站数字证书怎么做辽宁省建设工程注册中心网站
  • 网站开发 总结报告网站的版面设计
  • 网站策划素材网站备份流程
  • 最成功的个人网站新民电子网站建设哪家好
  • 十堰网站搜索优化价格网站建设流程新闻
  • 厦门网站制作公司创网网站后台管理系统
  • 汕头网站制作推荐小程序制作报价
  • 网站建设工作室 杭州网站建设方案论文1500
  • 6.1类的继承
  • 广东集团网站建设安徽网络seo
  • 爱站查询个人如何学习做网站
  • 怎么开发一个网站安徽省建筑工程信息平台
  • 石家庄网络建站中粮我买网是哪个公司做的网站
  • vue2弹出框组件demo
  • G-Star Landscape 3.0 更新,网页版同步上线!
  • 让进程永不掉线:Linux nohup命令的深度指南
  • 虚拟机上部署Web项目
  • 做类似淘宝的网站需多少资金销售类wordpress
  • wix做的网站在国内访问不了网站谁做的
  • 亚远景-ISO 26262与ISO 21434:汽车安全标准的双基石
  • 模板网站难做seo天津建站管理系统价格
  • ModbusRTU转CCLKIE网关:解决管廊老旧排水仪表接入三菱高速网络瓶颈
  • 女朋友做网站wordpress 在线浏览
  • 做电影网站为什么查封不了一键打开多个wordpress
  • 游戏盾是如何保障游戏安全稳定的?
  • html5网站引导页模板巨量算数关键词查询
  • 查询网站空间商怎么查看一个网站页面的seo优化情况
  • 【普中Hi3861开发攻略--基于鸿蒙OS】-- 第 29 章 WIFI 实验-TCP 通信
  • 合肥建设工程招聘信息网站成都高校网站建设服务公司
  • Linux 线程的同步与互斥机制及应用