当前位置: 首页 > news >正文

Python BeautifulSoup解析HTML获取图片URL并下载到本地

一、Python BeautifulSoup解析HTML获取图片URL并下载到本地

#! python3
# downloadXkcd.py - Downloads every single JDLY comic.
import osimport bs4
import requestsurl = 'https://www.jdlingyu.com/145853.html'
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/137.0.0.0 Safari/537.36"
}
os.makedirs('JDLY', exist_ok=True)
try:mainRequest = requests.get(url, headers)mainRequest.raise_for_status()# print(mainRequest.text)soup = bs4.BeautifulSoup(mainRequest.text, 'html.parser')  # html解析imgUrls = []imgUrls = soup.select('.entry-content img')  # 获取div class name为entry-content下的img图片# print(imgUrls)for imgUrl in imgUrls:url = imgUrl.get('data-src') # 获取data-src属性img = requests.get(url, headers=headers).content # 获取图片内容# 保存本地with open(os.path.join('JDLY//',os.path.basename(url)), mode='wb') as f:f.write(img)
except Exception as e:print(f"获取图片异常:" + str(e))
http://www.dtcms.com/a/238702.html

相关文章:

  • 【电路】阻抗匹配
  • 云原生架构赋能企业数字化转型:从理念到落地的系统性探索
  • springboot3.5整合Spring Security6.5默认密码没有打印输出控制台排查过程
  • BeanFactory 和 FactoryBean 有何区别与联系?
  • 在vs2022中的program.cs中已经没有app.useEndpoints
  • 分词算法总结:不同分词算法的优点和缺点
  • K8S认证|CKS题库+答案| 8. 沙箱运行容器 gVisor
  • 从入门到实战:AI学习路线全解析——避坑指南
  • AUTOSAR实战教程--开放式通用DoIP刷写工具OpenOTA开发计划
  • shell脚本 --案例实操
  • 【优选算法】模拟 问题算法
  • 【CSS-7】深入解析CSS伪类:从基础到高级应用
  • 73常用控件_QFormLayout的使用
  • SQL 注入开放与修复
  • 针对异构数据的联邦学习
  • Linux 基础IO(下)
  • D25异常处理
  • 【学习笔记】深入理解Java虚拟机学习笔记——第5章 调优案例分析与实战
  • NLP学习路线图(三十二): 模型压缩与优化
  • 从认识AI开始-----变分自编码器:从AE到VAE
  • LangChain工具集成实战:构建智能问答系统完整指南
  • springboot3.x对接AI智谱清言
  • 前端获取接口数据流程
  • 利用coze工作流制作一个自动生成PPT的智能体
  • ORACLE 修改端口号之后无法启动?
  • 安装Openstack
  • pgsql batch insert optimization (reWriteBatchedInserts )
  • 线性规划饮食问题求解:FastAPI作为服务端+libhv作为客户端实现
  • Web应用安全漏洞全解析:从原理到实战防御
  • 词法分析和词性标注 自然语言处理