当前位置: 首页 > news >正文

网站手机版怎么弄台州网站排名优化

网站手机版怎么弄,台州网站排名优化,网站排名优化怎么样,ip网域名查询文章目录初始化解析器路径查找查找所有标签查找指定 id 的标签查找指定 class 的标签查找包含指定 class 的标签复杂路径查找示例1示例2常见操作获取所有标签的链接获取 div 标签的文本内容, 其他标签类似其他元素操作初始化解析器 from lxml import html from lxml.html impor…

文章目录

    • 初始化解析器
    • 路径查找
      • 查找所有标签
      • 查找指定 id 的标签
      • 查找指定 class 的标签
      • 查找包含指定 class 的标签
      • 复杂路径查找
        • 示例1
        • 示例2
    • 常见操作
      • 获取所有标签的链接
      • 获取 div 标签的文本内容, 其他标签类似
      • 其他元素操作

初始化解析器


from lxml import html
from lxml.html import HtmlElementpage = '''
<html><head></head>
<body><div id="overlay" class="hidden"><div id="loader"></div></div><header id="rootHeader" class="login"><div class="wrapper content login"><table width="186" border="0"></table><div class="login">example content</div><a href="https://www.example.com">Torrent Kitty - Free Torrent To Magnet Link Conversion Service</a></div></header><div class="becbdbcf otherClassName">Your Internet and Goverment can track your torrent Activity! Hide yourIP with a VPN!</div><a href="https://example.com">Torrent Kitty - Free Torrent To Magnet Link Conversion Service</a>
</body></html>
'''rootElement: HtmlElement = html.fromstring(page)# 简单查找,获取指定类别的所有标签elements: list[HtmlElement] = rootElement.find_class('login')
print(elements)

路径查找

  • HtmlElement.xpath(‘xxxxxxxxxxxxxxxx’)

如果匹配不到元素返回空数组

查找所有标签


elements = rootElement.xpath('//*')
print(elements)

查找指定 id 的标签


elements = rootElement.xpath('//*[@id="overlay"]')
print(elements)

查找指定 class 的标签


elements = rootElement.xpath('//*[@class="login"]')
print(elements)

查找包含指定 class 的标签


elements = rootElement.xpath('//*[contains(@class, "login")]')
print(elements)

复杂路径查找

示例1

1、查找 class 为login 的 header
2、在 header 下查找 class 包含content的 div
3、在 div 下查找所有 table 标签


elements = rootElement.xpath('//header[@class="login"]/div[contains(@class, "content")]/table')
print(elements)
示例2

1、查找 id 为overlay 的 div
2、在 div 下查找第二个 div
3、在第二个 div 下查找所有 table 标签


elements = rootElement.xpath('//div[@id="overlay"]/div[2]/table')
print(elements)

常见操作

获取所有标签的链接


# 如果想获取其他属性值,把@后面改成对应的属性名称即可
urls = rootElement.xpath('//a/@href') 
print(urls)

获取 div 标签的文本内容, 其他标签类似


pText = rootElement.xpath('//div[@class="login"]/text()')
print(pText)

其他元素操作


elements = rootElement.xpath('//*')
for element in elements:print(element.text) # 文本不拼接(不包含子元素内的文本)print(element.text_content()) # 拼接元素内所有文本 # 获取 class 的值,如果想获取其他属性值改成对应属性名称即可# 使用get获取,如果没有值可以提供默认值print(element.get('class', '没有值')) # print(element.get('class'))  # 获取所有属性,类型 dict, key为属性名,value为属性值print(element.attrib) if 'src' in element.attrib:print('src 属性存在')# 遍历属性attrib = element.attribfor key in attrib: print(key, attrib[key])items = element.find('div')print(items) # 获取element下的所有 div 标签# 在 element 下查找所有 table 标签items = element.xpath('table') print(items)# 在 element 下查找 id 为 overlay 的标签, 如果找不到返回 Noneitems = element.get_element_by_id('overlay', None) print(items)
http://www.dtcms.com/a/401736.html

相关文章:

  • 制作一个景点介绍的网站html澧县住房和城乡建设局网站
  • 东莞寮步网站建设网络公司杭州萧山网站建设
  • 外贸访问国外网站php网站的开发环境
  • 微网站免费模板公众号微信
  • 资源软件下载网站免费wordpress 加轮播图
  • 信主网站博客营销案例
  • 湖北省建设厅招骋网站莱州市网站
  • 绍兴网站建设冯炳良wordpress 软件公司主题
  • 钓鱼网站的危害wordpress 申请表单
  • 深圳网站开发外包公司网站全面推广方案
  • 建站公司 网站必应搜索引擎地址
  • 酒店门户网站建设背景可以做分销的网站
  • 蝙蝠做等级的网站淘宝网站建设策划案
  • 宝宝投票网站怎么做政网站首页怎么做试
  • 网站开发目录有哪些网站建设的方法
  • 微网站入口删除wordpress评论
  • dedecms的网站如何添加个引导页小程序制作预览
  • 校园网站建设的目的wordpress需要的环境
  • 做竹鼠网站东莞建网站的公
  • 局域网做网站wordpress被扫描
  • 苏州专业做网站较好的公司网站建设广东
  • 淘宝网站做推广收费吗桂林尚品网络科技有限公司
  • 做网站以后的趋势a3电子报在什么网站做
  • 网站结构优点海阳市住房和城乡建设局官方网站
  • wordpress建企业网站教程中国目前哪里在大建设
  • 七里河微信网站建设重庆个人建站模板
  • 苏州网站建设用哪种好做摄影网站公司
  • 一级a做爰片免费网站中国片妇联加强网站平台建设
  • 网站开发工程师薪资待遇互联网官方网站
  • 濮阳seo网站建设高端顺口公司名字