当前位置: 首页 > news >正文

Python BeautifulSoup解析HTML获取图片URL并下载到本地

一、Python BeautifulSoup解析HTML获取图片URL并下载到本地

#! python3
# downloadXkcd.py - Downloads every single JDLY comic.
import osimport bs4
import requestsurl = 'https://www.jdlingyu.com/145853.html'
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/137.0.0.0 Safari/537.36"
}
os.makedirs('JDLY', exist_ok=True)
try:mainRequest = requests.get(url, headers)mainRequest.raise_for_status()# print(mainRequest.text)soup = bs4.BeautifulSoup(mainRequest.text, 'html.parser')  # html解析imgUrls = []imgUrls = soup.select('.entry-content img')  # 获取div class name为entry-content下的img图片# print(imgUrls)for imgUrl in imgUrls:url = imgUrl.get('data-src') # 获取data-src属性img = requests.get(url, headers=headers).content # 获取图片内容# 保存本地with open(os.path.join('JDLY//',os.path.basename(url)), mode='wb') as f:f.write(img)
except Exception as e:print(f"获取图片异常:" + str(e))

相关文章:

  • 【电路】阻抗匹配
  • 云原生架构赋能企业数字化转型:从理念到落地的系统性探索
  • springboot3.5整合Spring Security6.5默认密码没有打印输出控制台排查过程
  • BeanFactory 和 FactoryBean 有何区别与联系?
  • 在vs2022中的program.cs中已经没有app.useEndpoints
  • 分词算法总结:不同分词算法的优点和缺点
  • K8S认证|CKS题库+答案| 8. 沙箱运行容器 gVisor
  • 从入门到实战:AI学习路线全解析——避坑指南
  • AUTOSAR实战教程--开放式通用DoIP刷写工具OpenOTA开发计划
  • shell脚本 --案例实操
  • 【优选算法】模拟 问题算法
  • 【CSS-7】深入解析CSS伪类:从基础到高级应用
  • 73常用控件_QFormLayout的使用
  • SQL 注入开放与修复
  • 针对异构数据的联邦学习
  • Linux 基础IO(下)
  • D25异常处理
  • 【学习笔记】深入理解Java虚拟机学习笔记——第5章 调优案例分析与实战
  • NLP学习路线图(三十二): 模型压缩与优化
  • 从认识AI开始-----变分自编码器:从AE到VAE
  • 微信机器人网站开发/网络营销的整体概念
  • 静安集团网站建设/苏州百度
  • 内网 做 网站/百度关键词怎么排名
  • 邢台集团网站建设/八百客crm登录入口
  • 网站建设嘉兴公司电话/青岛seo建站
  • html 网站根目录/网上怎么做推广