当前位置：首页 > news >正文

Python爬虫第一战（爬取优美图库网页图片）

news 2025/10/24 2:53:36

本文是我在学习过程中记录学习的点点滴滴，目的是为了学完之后巩固一下顺便也和大家分享一下，日后忘记了也可以方便快速的复习。

爬取网页图片

前言

前言

今天学习的主要是关于如何利用Python爬取网页图片知识的理解和应用

# 1.获取网页信息，交给beautifulsoup
# 2.获取页面里面子页面的网址
# 3.将子页面信息给beautifulsoup获取图片下载链接
# 4.将图片下载到文件夹

import requests
import time
import random
from bs4 import BeautifulSoup

url = "http://umei.cc/weimeitupian/keaitupian/"
headers = {
   
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
}
# 获取网页首页源代码
resp = requests.get(url,headers=headers)
# 根据网页信息查看解码方式
resp.encoding="utf-8"
# print(resp.text)
# 将首页数据交给Beautifulsoup,这样获取元素更方便，直接按照元素标签名来获取信息
main_page = BeautifulSoup(resp.text

http://www.dtcms.com/a/107870.html

相关文章：

*快排延伸-自省排序

conda activate激活环境失败问题

《雷神之锤 III 竞技场》快速求平方根倒数的计算探究

conda 激活环境vscode的Bash窗口

数据清洗的具体内容

【Linux】手动部署并测试内网穿透

Python基础语法 - 判断语句

ffmpeg命令整理

从零开始学习Slam|ICP原理与应用

Sentinel实战(三)、流控规则之流控效果及流控小结

OpenIPC开源FPV之Adaptive-Link新版本算法v0.60.0

强大而易用的JSON在线处理工具

python网络爬虫开发实战之Ajax数据提取

链表的操作-反转链表

spring 设计模式、核心模块

创建Linux虚拟环境并远程连接，finalshell自定义壁纸

最短路径：Bellman-Ford算法

抽象类与接口：特征与比较

【实用技巧】电脑重装后的Office下载和设置

自动化测试(web测试）

vue-系统登录后进入页面【el-input】输入框无法正常显示？需要手动刷新才可以恢复设置样式?让我来瞅瞅~

关于 UPDATE 语句和 SELECT ... FOR UPDATE 的对比分析，包括语法、功能、锁机制、使用场景及示例代码

java知识梳理（二）

【电子通识】为什么电子元件的规格书常常要看英文版本

从 Credit Metrics 到 CPV：现代信用风险模型的进化与挑战

Windows家庭版如何开启Hyper-V与关闭Hyper-V

面试常考简单操作

ADS7822中文技术手册

Burp靶场 - HTTP走私请求【Part2】

Elasticsearch collapse 的使用场景及作用机制