当前位置: 首页 > news >正文

selenium一些进阶方法如何使用

浏览器高级配置

设置浏览器无头模式(Headless Chrome/Firefox):

from selenium import webdriver
options = webdriver.ChromeOptions()
options.add_argument('--headless=new')
driver = webdriver.Chrome(options=options)

自定义用户代理和窗口大小:

options.add_argument('--user-agent=CustomAgent')
options.add_argument('--window-size=1920,1080')

元素高级定位

XPath高级定位示例(包含动态属性处理):

# 包含特定文本
element = driver.find_element(By.XPATH, "//*[contains(text(),'动态文本')]")# 多条件组合定位
element = driver.find_element(By.XPATH, "//div[@class='list' and @data-id>100]")# 轴定位(查找兄弟节点)
sibling = driver.find_element(By.XPATH, "//div[@id='target']/following-sibling::div[1]")

CSS选择器高级用法:

# 属性值部分匹配
element = driver.find_element(By.CSS_SELECTOR, "[class*='partial']")# 子元素选择
element = driver.find_element(By.CSS_SELECTOR, "ul.items > li:first-child")

复杂交互操作

处理动态加载内容(显式等待结合EC条件):

from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
element = WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.ID, "dynamicElement"))
)

鼠标动作链(复杂拖拽操作):

from selenium.webdriver.common.action_chains import ActionChains
source = driver.find_element(By.ID, "source")
target = driver.find_element(By.ID, "target")
ActionChains(driver).drag_and_drop(source, target).perform()

文件处理

文件上传(无需GUI交互):

file_input = driver.find_element(By.CSS_SELECTOR, "input[type='file']")
file_input.send_keys("/absolute/path/to/file.txt")

文件下载配置(Chrome示例):

options = webdriver.ChromeOptions()
prefs = {"download.default_directory": "/path/to/downloads","download.prompt_for_download": False
}
options.add_experimental_option("prefs", prefs)

性能优化

禁用图片加载提升速度:

chrome_options = webdriver.ChromeOptions()
prefs = {"profile.managed_default_content_settings.images": 2}
chrome_options.add_experimental_option("prefs", prefs)

网络请求拦截(Chrome DevTools协议):

driver.execute_cdp_cmd('Network.enable', {})
driver.execute_cdp_cmd('Network.setBlockedURLs', {'urls': ['*.png', '*.gif']})

多窗口/框架处理

窗口切换控制:

main_window = driver.current_window_handle
driver.switch_to.window(new_window_handle)
# 操作结束后切回主窗口
driver.switch_to.window(main_window)

嵌套iframe处理:

driver.switch_to.frame("frameName")
driver.switch_to.frame(0)  # 通过索引切换
driver.switch_to.default_content()  # 返回主文档

高级验证机制

页面完全加载检测:

WebDriverWait(driver, 30).until(lambda d: d.execute_script("return document.readyState") == "complete"
)

AJAX请求完成检测:

WebDriverWait(driver, 10).until(lambda d: d.execute_script("return jQuery.active == 0")
)

异常处理

智能重试机制:

from selenium.common.exceptions import StaleElementReferenceException
retries = 3
for attempt in range(retries):try:element.click()breakexcept StaleElementReferenceException:if attempt == retries - 1: raise

分布式测试

Selenium Grid配置:

from selenium.webdriver.remote.webdriver import WebDriver
hub_url = "http://hub_host:4444/wd/hub"
capabilities = {"browserName": "chrome","platform": "LINUX"
}
driver = WebDriver(command_executor=hub_url, desired_capabilities=capabilities)

http://www.dtcms.com/a/342573.html

相关文章:

  • 大模型0基础开发入门与实践:第11章 进阶:LangChain与外部工具调用
  • 打破传统课程模式,IP变现的创新玩法 | 创客匠人
  • 从零开始学 Selenium:浏览器驱动、元素定位与实战技巧
  • 微服务:现代软件架构的主流范式
  • Linux mmap内存映射
  • 集中式负载均衡 vs. 分布式负载均衡
  • 【赵渝强老师】Redis Cluster分布式集群
  • #千问海报大赛
  • 订单簿动力学与深度学习模型的融合大单识别与短期市场价格波动预测
  • Java多线程编程基础篇
  • 多级缓存一致性矩阵:ABP vNext 下的旁路 / 写穿 / 写回组合实战
  • Qt的moveToThread使用
  • SQL-leetcode—3451. 查找无效的 IP 地址
  • centos常用命令
  • Visual Studio Code (VS Code) 工作区配置文件的作用
  • CentOS7安装部署NexusRepository
  • 【Spring Cloud 微服务】2.守护神网关Gateway
  • 告别人工建模:AI 自动化 ETL 工具对比,数据 pipeline 搭建时间缩短 60% 的实践
  • 洛谷 P2656 采蘑菇-普及+/提高
  • k 均值聚类算法总结
  • 从入门到精通:Java设计模式——单例模式
  • 8.21IPSEC安全基础后篇,IKE工作过程
  • 【TWT】
  • 常德二院信创转型实战:全栈国产化提升医疗效率与安全
  • 嵌入式linux设备升级和sm32升级对比
  • 计算机视觉(opencv)实战六——图像形态学(腐蚀、膨胀、开运算、闭运算、梯度、顶帽、黑帽)
  • el-table-draggable拖拽实现表格内容排序
  • VUE从入门到精通二:ref、reactive、computed计算属性、watch监听、组件之间的通信
  • 网络与信息安全有哪些岗位:(5)安全开发工程师
  • Android14内核调试 - boot vendor_boot