当前位置: 首页 > news >正文

Python 常用库速查手册

一句话宗旨:Python 之所以被称为“胶水语言”,就是因为它能把各领域的库粘在一起干活。本手册分类介绍常用库、功能简述、核心 API 以及最小可用代码,让你在写代码时一查就能用。
适用人群:爬虫工程师、数据分析师、AI 工程师、自动化运维、科研人员、Python 开发者。

1. 网络请求与爬虫类

1.1 requests — 人类友好的 HTTP 客户端

import requests# GET 请求
r = requests.get("https://httpbin.org/get", params={"q": "python"})
print(r.status_code, r.json())# POST 请求
r = requests.post("https://httpbin.org/post", data={"name": "Tom"})
print(r.text)# 带会话(保持 Cookie)
s = requests.Session()
s.get("https://example.com/login")

简单直观、支持 SSL、代理、Cookie、文件上传、会话保持。

1.2 aiohttp — 异步 HTTP 请求

import aiohttp, asyncioasync def fetch(url):async with aiohttp.ClientSession() as s:async with s.get(url) as resp:return await resp.text()asyncio.run(fetch("https://httpbin.org/get"))

高并发请求,爬虫性能提升 10 倍。

1.3 httpx — 现代化异步 HTTP 客户端

import httpx
with httpx.Client() as client:r = client.get("https://httpbin.org/get")print(r.json())

支持 HTTP/1.1、HTTP/2,兼容同步 + 异步,requests 升级替代品。

1.4 beautifulsoup4 — HTML 解析神器

from bs4 import BeautifulSoup
html = "<div><p>Hello <b>Python</b></p></div>"
soup = BeautifulSoup(html, "html.parser")
print(soup.find("b").text)

API 直观,支持 HTML、XML,多解析器。

1.5 lxml — XPath 提取

from lxml import etree
html = "<div><p>Hello <b>Python</b></p></div>"
tree = etree.HTML(html)
print(tree.xpath("//b/text()"))

解析速度快,XPath 灵活,适合复杂页面。

1.6 selenium — 浏览器自动化

from selenium import webdriver
driver = webdriver.Chrome()
driver.get("https://www.python.org")
print(driver.title)
driver.quit()

支持 Chrome/Firefox 等真实浏览器,处理 JS 渲染页面。

1.7 playwright — 新一代浏览器自动化

from playwright.sync
http://www.dtcms.com/a/333814.html

相关文章:

  • 小红书帖子评论的nodejs爬虫脚本
  • C++编程学习(第24天)
  • 数据结构与算法p4
  • Eclipse:关闭项目
  • 【121页PPT】锂膜产业MESERP方案规划建议(附下载方式)
  • Git、JSON、MQTT
  • ramdisk内存虚拟盘(一)——前世今生
  • 嵌入式第二十九课!!!回收子进程资源空间函数与exec函数
  • SurperSet柱状图排序失效问题解决
  • 移动板房的网络化建设
  • python中的reduce函数
  • FTP定时推拉数据思考
  • 深入理解 Python 闭包:从原理到实践
  • AI - MCP 协议(一)
  • NY232NY236美光固态闪存NY240NY241
  • Dummy步进电机驱动使用和相关问题
  • 疏老师-python训练营-Day46通道注意力(SE注意力)
  • 高通vendor app访问文件
  • 【使用三化总结大模型基础概念】
  • 淘宝/天猫店铺商品搜索利器:taobao.item_search_shop API返回值详解
  • 【秋招笔试】2025.08.15饿了么秋招机考-第一题
  • 嵌入式linux学习 -- 进程和线程
  • CIAIE 2025上海汽车内外饰展观察:从美学到功能的产业跃迁
  • Redis 启动时出现 “Bad file format reading the append only file“ 错误
  • 【万字精讲】 左枝清减·右枝丰盈:C++构筑的二叉搜索森林
  • office2016常见故障解决方法
  • 第七十一章:AI的“个性定制服务”:微调 LLM vs 微调 Diffusion 模型——谁是“魔改之王”?
  • 展览讯息易天邀您共赴第26届中国国际光电博览会
  • AI创业公司分析:Paloma
  • 网络通讯核心知识