当前位置: 首页 > news >正文

requests 和 lxml 库的xpath实现

requests+lxml 实现

import requests
from lxml import html# 发送 GET 请求
url = 'https://knight.blog.csdn.net'
response = requests.get(url)# 检查请求是否成功
if response.status_code == 200:# 解析 HTML 内容tree = html.fromstring(response.content)# 查找对应的父元素parent_element = tree.xpath('//*[@id="navList-box"]/div[2]/div/div')if parent_element:# 找到所有子 div 元素child_elements = parent_element[0].xpath('./div')# 提取并输出每个子 div 的文本for child in child_elements:child_h4 = child.xpath('.//article/a/div/div[1]/div[1]/h4/text()')if child_h4:text = child_h4[0].strip()  # 去掉前后空格print(text)
else:print(f"请求失败,状态码: {response.status_code}")

http://www.dtcms.com/a/393772.html

相关文章:

  • 前端梳理体系从常问问题去完善-工程篇(webpack,vite)
  • Go语言在K8s中的核心优势
  • 旅游门票预订系统支持微信小程序+H5
  • Requests 网络请求:Python API 交互与数据获取
  • 基于Dify实现简历自动筛选过滤
  • PHP中常见数组操作函数
  • 避坑指南:鸿蒙(harmony next)APP获取公钥和证书指纹的方法
  • Java 大视界 -- Java 大数据在智能教育学习效果评估与教学质量改进中的深度应用(414)
  • 【场景题】如何解决大文件上传问题
  • 云原生复杂多变的环境中的安全防护方案
  • Python10-逻辑回归-决策树
  • 如何生成一个不会重复随机数?
  • 【精品资料鉴赏】155页WORD大型制造企业MES制造执行系统建设方案
  • 定时计划任务
  • 【脑电分析系列】第23篇:癫痫检测案例:从频谱特征到深度学习模型的CHB-MIT数据集实战
  • `CookieStore` API
  • 数据可视化的中间表方案
  • 编译运行duckdb rust插件模板extension-template-rs
  • 接口测试流程+jmeter并发+面试题(总结)
  • JMeter下载安装及入门教程
  • Oracle体系结构-Java Pool详解
  • ​​Service Worker 缓存 与 HTTP 缓存 是什么关系?
  • c++ 之三/五法则
  • 传输层协议 UDP
  • 关于类和对象(一)
  • 多人协作下的游戏程序架构 —— 分层方案
  • 机器学习中三个是基础的指标:​准确率 (Accuracy)​、精确率 (Precision)​​ 和 ​召回率 (Recall)​
  • 《Web端图像剪辑方案:Canvas API与JavaScript实现》
  • DeepSeek 登《自然》封面,OpenAI 推出 GPT-5-Codex,Notion Agent 首亮相!| AI Weekly 9.15-9.21
  • 多线程-初阶