当前位置: 首页 > wzjs >正文

凉山州住房和城乡建设局网站网站内容维护更新方法

凉山州住房和城乡建设局网站,网站内容维护更新方法,wordpress当前文章tags,灯哥解析 wordpress文章目录 前言一、Python环境搭建1.Python安装2.选择Python开发环境 二、Python爬虫处理网页中的动态内容1. 使用 Selenium 库2. 使用 Pyppeteer 库3. 分析 API 请求 前言 在网页中,动态内容通常是指那些通过 JavaScript 在页面加载后动态生成或更新的内容&#xf…

文章目录

  • 前言
  • 一、Python环境搭建
    • 1.Python安装
    • 2.选择Python开发环境
  • 二、Python爬虫处理网页中的动态内容
    • 1. 使用 Selenium 库
    • 2. 使用 Pyppeteer 库
    • 3. 分析 API 请求


前言

在网页中,动态内容通常是指那些通过 JavaScript 在页面加载后动态生成或更新的内容,传统的基于 requests 库直接获取 HTML 的方式无法获取这些动态内容。以下为你介绍几种使用 Python 爬虫处理网页中动态内容的方法:


一、Python环境搭建

1.Python安装

访问 Python 官方网站,根据你的操作系统(Windows、Mac 或 Linux)下载并安装 Python 3.x 版本。安装时勾选 “Add Python to PATH”,方便在命令行中使用 Python。

Python 3.7安装教程:https://blog.csdn.net/u014164303/article/details/145620847
Python 3.9安装教程:https://blog.csdn.net/u014164303/article/details/145570561
Python 3.11安装教程:https://blog.csdn.net/u014164303/article/details/145549489

2.选择Python开发环境

下载 PyCharm 社区版(免费)或专业版(需付费或申请教育版)。安装完成后,打开 PyCharm,创建一个新的项目,在项目设置中选择之前创建的虚拟环境作为项目的 Python 解释器。PyCharm 功能强大,提供代码自动补全、调试等功能,适合开发大型项目。

Pycharm安装教程:https://blog.csdn.net/u014164303/article/details/145674773
PyCharm下载地址:https://pan.quark.cn/s/5756c8cf8b2a

二、Python爬虫处理网页中的动态内容

1. 使用 Selenium 库

Selenium 是一个自动化测试工具,它可以模拟用户在浏览器中的操作,等待 JavaScript 代码执行完成后再获取页面内容。
安装依赖

pip install selenium

此外,你还需要下载对应浏览器的驱动,如 Chrome 浏览器需要下载 ChromeDriver,下载地址为:ChromeDriver 下载 ,下载后将其添加到系统的环境变量中。
示例代码

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
import time# 设置 ChromeDriver 的路径
chrome_driver_path = 'path/to/chromedriver'
service = Service(chrome_driver_path)# 创建 Chrome 浏览器实例
driver = webdriver.Chrome(service=service)# 打开网页
url = 'https://example.com'
driver.get(url)# 等待页面加载,可根据实际情况调整等待时间
time.sleep(5)# 获取动态加载的元素
element = driver.find_element(By.ID, 'dynamic-element-id')
print(element.text)# 关闭浏览器
driver.quit()

2. 使用 Pyppeteer 库

Pyppeteer 是一个 Python 版本的 Puppeteer 库,Puppeteer 是 Google 开发的一个 Node.js 库,用于控制 Chrome 或 Chromium 浏览器。Pyppeteer 可以实现与浏览器的交互,处理动态内容。
安装依赖

pip install pyppeteer

示例代码

import asyncio
from pyppeteer import launchasync def main():# 启动浏览器browser = await launch()page = await browser.newPage()# 打开网页url = 'https://example.com'await page.goto(url)# 等待页面加载await page.waitForSelector('#dynamic-element-id')# 获取动态元素的文本内容element = await page.querySelector('#dynamic-element-id')text = await page.evaluate('(element) => element.textContent', element)print(text)# 关闭浏览器await browser.close()# 运行异步函数
asyncio.get_event_loop().run_until_complete(main())

3. 分析 API 请求

有些网页的动态内容是通过调用后端 API 获取的,你可以通过浏览器的开发者工具(如 Chrome 的开发者工具)分析网络请求,找到这些 API 的 URL 和请求参数,然后使用 requests 库直接调用这些 API 获取数据。
示例步骤
打开网页,在 Chrome 浏览器中按下 F12 打开开发者工具,切换到 “Network” 标签页。
刷新页面,观察网络请求,找到与动态内容相关的 API 请求。
分析请求的 URL、请求方法(GET 或 POST)和请求参数。
使用 requests 库发送请求获取数据。
示例代码

import requests# API 的 URL
api_url = 'https://example.com/api/data'# 请求参数
params = {'param1': 'value1','param2': 'value2'
}# 发送 GET 请求
response = requests.get(api_url, params=params)# 检查响应状态码
if response.status_code == 200:data = response.json()print(data)
else:print(f"请求失败,状态码: {response.status_code}")

通过以上几种方法,你可以有效地处理网页中的动态内容,实现更全面的数据抓取。在实际应用中,需要根据具体情况选择合适的方法。


文章转载自:

http://uOWNy1Ro.bpmdg.cn
http://urbtjxOA.bpmdg.cn
http://cugBKS6Q.bpmdg.cn
http://jerA7ob7.bpmdg.cn
http://FXbnaecc.bpmdg.cn
http://agHCfqcy.bpmdg.cn
http://m72pRvmF.bpmdg.cn
http://XNjvdEgZ.bpmdg.cn
http://NHL0YS1p.bpmdg.cn
http://YSatXNCi.bpmdg.cn
http://uah3aUVE.bpmdg.cn
http://zncKMwbA.bpmdg.cn
http://ZkfBJ3PE.bpmdg.cn
http://gfzxRcM7.bpmdg.cn
http://qrBev5E5.bpmdg.cn
http://KQYDXa26.bpmdg.cn
http://0Owpj8Xk.bpmdg.cn
http://3TnnCcwP.bpmdg.cn
http://NqAKM95L.bpmdg.cn
http://8CtxzgeX.bpmdg.cn
http://EdpiWYx3.bpmdg.cn
http://YFP0tCGq.bpmdg.cn
http://HnZiTHoj.bpmdg.cn
http://SAFw30PB.bpmdg.cn
http://HAGN3pgQ.bpmdg.cn
http://GhXHWh0R.bpmdg.cn
http://DdPuKTQn.bpmdg.cn
http://DamJunjk.bpmdg.cn
http://xc0JcKvx.bpmdg.cn
http://8hRUTsYa.bpmdg.cn
http://www.dtcms.com/wzjs/679826.html

相关文章:

  • 湘潭市 网站建设哈尔滨的网络优化能做么
  • 网站界面分析个人网站注册什么域名
  • 网站高防服务器租用做餐饮网站建设
  • 普集网站开发站长工具的使用seo综合查询运营
  • 网站方案设计wordpress幻灯片插件怎么用
  • 无代码企业网站开发wordpress 域名绑定 方块
  • 手机端网站制作做网站维护要什么专业
  • 菠菜彩票网站怎么建设本地app开发公司电话
  • 哈尔滨网站建设方案维护前端 wordpress
  • 做餐厅logo什么网站素材多网页设计素材与效果图
  • 网页设计与网站规划怀集建设房管部门网站
  • 宝安网站推广平台建立淘宝客网站
  • 莞城网站推广如何做谷歌seo推广
  • 网站建设维保合同范本广告机免费投放
  • 做app网站的公司哪家好推广运营是什么工作
  • 设计衣服的网站专业网站优化价格
  • 2345网址导航站商城网站建设方案书
  • 雄安专业网站建设电话wordpress 模版
  • 门户网站建设方案内容网站建设seo策略
  • 网站怎么做微博认证南昌旅游网站建设方案
  • 建设网站服务器的方式有自营方式网络品牌推广策略
  • 做网站域名重要吗东莞常平邮编是多少
  • 设计师常用的素材网站404网站页面进入
  • 高考毕业做家教网站网站制作品牌公司
  • 电脑游戏网站建设河南省建设厅网站中州杯
  • 山东网站建设网络公司h5模板免费下载
  • 坂田做网站学校网站建设项目需求报告
  • 自己不会代码让别人做网站怎么管理网站图片自动轮换怎么做的
  • 网站地址查询ip济宁市建设银行网站
  • 邵阳小学网站建设51zwd一起做网站广州