当前位置：首页 > news >正文

Python BeautifulSoup解析HTML获取图片URL并下载到本地

news 2025/8/22 16:04:48

一、Python BeautifulSoup解析HTML获取图片URL并下载到本地

#! python3
# downloadXkcd.py - Downloads every single JDLY comic.
import osimport bs4
import requestsurl = 'https://www.jdlingyu.com/145853.html'
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/137.0.0.0 Safari/537.36"
}
os.makedirs('JDLY', exist_ok=True)
try:mainRequest = requests.get(url, headers)mainRequest.raise_for_status()# print(mainRequest.text)soup = bs4.BeautifulSoup(mainRequest.text, 'html.parser')  # html解析imgUrls = []imgUrls = soup.select('.entry-content img')  # 获取div class name为entry-content下的img图片# print(imgUrls)for imgUrl in imgUrls:url = imgUrl.get('data-src') # 获取data-src属性img = requests.get(url, headers=headers).content # 获取图片内容# 保存本地with open(os.path.join('JDLY//',os.path.basename(url)), mode='wb') as f:f.write(img)
except Exception as e:print(f"获取图片异常：" + str(e))

http://www.dtcms.com/a/238702.html

相关文章：

【电路】阻抗匹配

云原生架构赋能企业数字化转型：从理念到落地的系统性探索

springboot3.5整合Spring Security6.5默认密码没有打印输出控制台排查过程

BeanFactory 和 FactoryBean 有何区别与联系？

在vs2022中的program.cs中已经没有app.useEndpoints

分词算法总结：不同分词算法的优点和缺点

K8S认证|CKS题库+答案| 8. 沙箱运行容器 gVisor

从入门到实战：AI学习路线全解析——避坑指南

AUTOSAR实战教程--开放式通用DoIP刷写工具OpenOTA开发计划

shell脚本 --案例实操

【优选算法】模拟问题算法

【CSS-7】深入解析CSS伪类：从基础到高级应用

73常用控件_QFormLayout的使用

SQL 注入开放与修复

针对异构数据的联邦学习

Linux 基础IO（下）

D25异常处理

【学习笔记】深入理解Java虚拟机学习笔记——第5章调优案例分析与实战

NLP学习路线图（三十二）：模型压缩与优化

从认识AI开始-----变分自编码器：从AE到VAE

LangChain工具集成实战：构建智能问答系统完整指南

springboot3.x对接AI智谱清言

前端获取接口数据流程

利用coze工作流制作一个自动生成PPT的智能体

ORACLE 修改端口号之后无法启动?

安装Openstack

pgsql batch insert optimization （reWriteBatchedInserts ）

线性规划饮食问题求解：FastAPI作为服务端+libhv作为客户端实现

Web应用安全漏洞全解析：从原理到实战防御

词法分析和词性标注自然语言处理