当前位置: 首页 > wzjs >正文

哪些行业做网站推广的多外包加工网官网下载app

哪些行业做网站推广的多,外包加工网官网下载app,wordpress采集软件,河南工程建设有哪些🌟想系统化学习爬虫技术?看看这个:[数据抓取] Python 网络爬虫 - 学习手册-CSDN博客 0x01:WebDriver 类基础属性 & 方法 为模仿用户真实操作浏览器的基本过程,Selenium 的 WebDriver 模块提供了一个 WebDriver 类…

🌟想系统化学习爬虫技术?看看这个:[数据抓取] Python 网络爬虫 - 学习手册-CSDN博客

0x01:WebDriver 类基础属性 & 方法

为模仿用户真实操作浏览器的基本过程,Selenium 的 WebDriver 模块提供了一个 WebDriver 类(表示浏览器),该类中提供了一些诸如打开浏览器、关闭浏览器、刷新浏览器、前进、后退等入门操作的方法和属性:

属性 OR 方法解析
title获取当前页面的标题
current_url获取当前页面的 URL 地址
page_source获取当前页面的 HTML 代码(渲染后的)
get()根据指定的 URL 地址访问页面
maximize_window()设置浏览器窗口最大化
forward()页面前进
back()页面后退
refresh()刷新当前页面
save_screenshot()截取当前浏览器窗口
close()关闭当前页面
quit()关闭浏览器

0x02:get() 方法 & page_source 属性

使用 get() 方法可以操作浏览器访问的目标网页,使用 page_source 可以获取当前页面整体的源代码(渲染后的),比如下面的例子,我们尝试访问 taobao.com 并抓取渲染好的页面:

from selenium import webdriver
import time
​
driver = webdriver.Chrome() # 创建浏览器对象
driver.get("https://taobao.com")          # 访问淘宝首页
​
# 因为从访问淘宝到淘宝加载商品数据中间有一段时间,所以我们得强制等待一会,等待页面完全加载
time.sleep(3)              # 等待 3 秒
print(driver.page_source)  # 打印渲染好的页面
# print(driver.title)      # 获取当前页面的标题
# print(driver.current_url) # 获取当前页面的 URL 地址

如上,我们成功抓取了淘宝官网动态加载后的页面数据,只要再结合之前学习的数据提取方法,我们就能够很轻松的从动态页面中抓取我们想要的数据啦。

对于 title 属性与 current_url 属性相信聪明如你一定知道是提取啥的了吧,笔者后面就不特意讲了,如果不知道的话,自己跑跑呗(把上面注释去掉就行)。

0x03:maximize_window() 方法

使用 Selenium 启动浏览器后,浏览器的窗口默认不是以最大化形式显示的,此时通过调用 maximize_window() 方法即可实现浏览器窗口最大化:

from selenium import webdriver
import time
​
driver = webdriver.Chrome() # 创建浏览器对象
driver.get("https://taobao.com")          # 访问淘宝首页
​
# 让浏览器窗口最大化
driver.maximize_window()

0x04:forward()、back()、refresh() 方法

经常用浏览器的你肯定对下面三个小按钮非常熟悉,它们就是后退(←)、前进(→)和刷新按钮:

下面介绍 forward()back()refresh() 方法就对应上面那几个功能,下面是一个示例代码:

from selenium import webdriver
import time
​
driver = webdriver.Chrome() # 创建浏览器对象
driver.maximize_window()    # 让浏览器窗口最大化
​
driver.get("https://taobao.com")          # 访问淘宝首页
time.sleep(3)                             # 暂停三秒
driver.get("https://www.baidu.com")       # 访问百度首页
time.sleep(3)                             # 暂停三秒
driver.back()                             # 模拟回退按钮,回退到淘宝首页
time.sleep(3)                             # 暂停三秒
driver.forward()                          # 模拟前进按钮,前进到百度首页
time.sleep(3)                             # 暂停三秒
driver.refresh()                          # 模拟刷新按钮,刷新页面

对于代码的执行效果,还得是观众老爷自己运行看看(笔者建议是自己敲一遍),这里笔者就不放图了。

0x05:save_screenshot()、close()、quit() 方法

通过 WebDriver 类的 save_screenshot() 放啊我们可以截取当前的窗口并将其保存为 PNG 格式的图像文件,比如下面这个例子,我们尝试截取淘宝首页图片,并保存为 taobao.png

from selenium import webdriver
import time
​
driver = webdriver.Chrome() # 创建浏览器对象
driver.maximize_window()    # 让浏览器窗口最大化
​
driver.get("https://taobao.com")          # 访问淘宝首页
​
print("[ + ] 成功访问淘宝首页! 三秒后开始截图操作 ....")
time.sleep(3)
​
driver.save_screenshot('taobao.png')
print("[ + ] 截屏完成,保存为了 taobao.png,三秒后将关闭当前页面 ....")
time.sleep(3)
​
driver.close() # 退出当前页面
print("[ + ] 成功关闭页面, 3 秒钟后将关闭浏览器,退出程序 .....")
time.sleep(3)
​
driver.quit()  # 退出浏览器


文章转载自:

http://vQ0GAO64.qdcpn.cn
http://qrWKJdT5.qdcpn.cn
http://ZAhm8g36.qdcpn.cn
http://a9L3wKLR.qdcpn.cn
http://3lURtQ8J.qdcpn.cn
http://Z5Uuf3SP.qdcpn.cn
http://f6O6M0FJ.qdcpn.cn
http://hNCj1Zl9.qdcpn.cn
http://769c5adi.qdcpn.cn
http://X2fZY3pF.qdcpn.cn
http://gtZvrZ0H.qdcpn.cn
http://hTGsZG7E.qdcpn.cn
http://mm6Egwa8.qdcpn.cn
http://DRkFfzrZ.qdcpn.cn
http://TeDEMG0u.qdcpn.cn
http://g5ndvFtx.qdcpn.cn
http://DQlp4T96.qdcpn.cn
http://ZLRVg1nN.qdcpn.cn
http://az6KaPYM.qdcpn.cn
http://iivHUVUM.qdcpn.cn
http://X56TuxUK.qdcpn.cn
http://l6GQ2U5F.qdcpn.cn
http://iOh7ZVdu.qdcpn.cn
http://DeCNN25C.qdcpn.cn
http://BzRkJW9Q.qdcpn.cn
http://Wl81s0Xq.qdcpn.cn
http://xQPFNwwq.qdcpn.cn
http://qznpT6VK.qdcpn.cn
http://2FdvaEwk.qdcpn.cn
http://dm2rzyn0.qdcpn.cn
http://www.dtcms.com/wzjs/733280.html

相关文章:

  • 沈阳网站托管公司网站风险怎么解决方案
  • 唐山正规做网站的公司深圳网络推广哪家好
  • 一键提交网站国外好看的教育类网站模板下载
  • 江西智能网站建设服务器配置参数详解
  • 有了域名搭建网站详细步骤在线设计平台帮助手册
  • 做民宿网站的系统可行性页面设计排版网站
  • 德持建设集团有限公司网站项目可行性报告怎样写
  • 龙岗网站制作设计费用
  • 济南网站推广效果商务网站模块设计时前台基础设施建设不包括
  • 网站运营要会什么技术站长字体
  • 网站静态页面生成在什么网站能帮人做ppt
  • 纺织网站制作123纺织网手机网站存储登录信息
  • 橙色系网站上海注销营业执照流程
  • .vip域名的网站排名公司门户网站开发价格
  • 网站建设上传图片不显示公司网站域名在哪里备案
  • 南京网站设计网站wordpress 默认html5
  • 标志设计公司有哪些深圳优化网站方法
  • 做外贸网站费用会员网站开发
  • 建站教程wpwordpress开源社区
  • 大良网站制作一流 北京网站建设
  • 新开最好的传奇网站定制型网站制作
  • 营山网站建设upscale wordpress
  • 怎么制作网页教程苏州seo关键词排名
  • 淄博高效网站建设找哪家免费模板简历下载
  • 网站制作协议书舆情分析报告案例
  • 上市企业网站建设企业网站的推广方法
  • 筑巢网站后台管理系统网站 可以做无形资产吗
  • 自由建网站的网络程序济南建手机网站哪家好
  • 深圳网站建设行业排行网站注册商标
  • 湛江网站建设方案推广赚钱返佣平台