当前位置：首页 > news >正文

Python 常用库速查手册

news 2025/8/16 16:48:53

一句话宗旨：Python 之所以被称为“胶水语言”，就是因为它能把各领域的库粘在一起干活。本手册分类介绍常用库、功能简述、核心 API 以及最小可用代码，让你在写代码时一查就能用。
适用人群：爬虫工程师、数据分析师、AI 工程师、自动化运维、科研人员、Python 开发者。

1. 网络请求与爬虫类

1.1 `requests` — 人类友好的 HTTP 客户端

import requests# GET 请求
r = requests.get("https://httpbin.org/get", params={"q": "python"})
print(r.status_code, r.json())# POST 请求
r = requests.post("https://httpbin.org/post", data={"name": "Tom"})
print(r.text)# 带会话（保持 Cookie）
s = requests.Session()
s.get("https://example.com/login")

简单直观、支持 SSL、代理、Cookie、文件上传、会话保持。

1.2 `aiohttp` — 异步 HTTP 请求

import aiohttp, asyncioasync def fetch(url):async with aiohttp.ClientSession() as s:async with s.get(url) as resp:return await resp.text()asyncio.run(fetch("https://httpbin.org/get"))

高并发请求，爬虫性能提升 10 倍。

1.3 `httpx` — 现代化异步 HTTP 客户端

import httpx
with httpx.Client() as client:r = client.get("https://httpbin.org/get")print(r.json())

支持 HTTP/1.1、HTTP/2，兼容同步 + 异步，requests 升级替代品。

1.4 `beautifulsoup4` — HTML 解析神器

from bs4 import BeautifulSoup
html = "<div><p>Hello <b>Python</b></p></div>"
soup = BeautifulSoup(html, "html.parser")
print(soup.find("b").text)

API 直观，支持 HTML、XML，多解析器。

1.5 `lxml` — XPath 提取

from lxml import etree
html = "<div><p>Hello <b>Python</b></p></div>"
tree = etree.HTML(html)
print(tree.xpath("//b/text()"))

解析速度快，XPath 灵活，适合复杂页面。

1.6 `selenium` — 浏览器自动化

from selenium import webdriver
driver = webdriver.Chrome()
driver.get("https://www.python.org")
print(driver.title)
driver.quit()

支持 Chrome/Firefox 等真实浏览器，处理 JS 渲染页面。

1.7 `playwright` — 新一代浏览器自动化

from playwright.sync

查看全文

http://www.dtcms.com/a/333814.html

小红书帖子评论的nodejs爬虫脚本

C++编程学习（第24天）

数据结构与算法p4

Eclipse：关闭项目

【121页PPT】锂膜产业MESERP方案规划建议（附下载方式）

Git、JSON、MQTT

ramdisk内存虚拟盘(一)——前世今生

嵌入式第二十九课！！！回收子进程资源空间函数与exec函数

SurperSet柱状图排序失效问题解决

移动板房的网络化建设

python中的reduce函数

FTP定时推拉数据思考

深入理解 Python 闭包：从原理到实践

AI - MCP 协议（一）

NY232NY236美光固态闪存NY240NY241

Dummy步进电机驱动使用和相关问题

疏老师-python训练营-Day46通道注意力(SE注意力)

高通vendor app访问文件

【使用三化总结大模型基础概念】

淘宝/天猫店铺商品搜索利器：taobao.item_search_shop API返回值详解

【秋招笔试】2025.08.15饿了么秋招机考-第一题

嵌入式linux学习 -- 进程和线程

CIAIE 2025上海汽车内外饰展观察：从美学到功能的产业跃迁

Redis 启动时出现 “Bad file format reading the append only file“ 错误

【万字精讲】左枝清减·右枝丰盈：C++构筑的二叉搜索森林

office2016常见故障解决方法

第七十一章：AI的“个性定制服务”：微调 LLM vs 微调 Diffusion 模型——谁是“魔改之王”？

展览讯息易天邀您共赴第26届中国国际光电博览会

AI创业公司分析：Paloma

网络通讯核心知识

1. 网络请求与爬虫类

1.1 requests — 人类友好的 HTTP 客户端

1.2 aiohttp — 异步 HTTP 请求

1.3 httpx — 现代化异步 HTTP 客户端

1.4 beautifulsoup4 — HTML 解析神器

1.5 lxml — XPath 提取

1.6 selenium — 浏览器自动化

1.7 playwright — 新一代浏览器自动化

相关文章：