当前位置: 首页 > news >正文

42 python http之urllib库

作为办公室牛马,日常工作中总少不了和网络数据打交道。比如从公司内部系统抓取数据做报表。Python urllib 库用于操作网页 URL,并对网页的内容进行抓取处理

一、Urllib 基础入门

urllib 是 Python 内置的一个强大的处理 URL 和网络请求的库,它包含了多个模块,每个模块都有自己独特的功能,就像一套工具套装,不同的工具应对不同的任务。

  1. urllib.request:主要用于发送 HTTP 请求,就像是快递员,负责把我们的请求送到服务器,并带回服务器的响应。
  2. urllib.parse:用于解析和处理 URL,比如拆分 URL、编码和解码 URL 参数等,就像一个 URL 整理大师,把 URL 整理得井井有条。
  3. urllib.error:处理在使用 urllib 过程中可能出现的各种错误,比如网络连接错误、服务器响应错误等,为我们的网络请求保驾护航。

二、发送 GET 请求

想象一下,我们要从公司的官网获取首页的内容,这时候就可以使用 urllib.request 来发送 GET 请求。

相关文章:

  • Vue 自定义指令输入校验过滤
  • 【前缀和】矩阵区域和
  • Hadoop架构再探讨
  • 【MongoDB篇】MongoDB的聚合框架!
  • python刷题笔记:三目运算符的写法
  • 高等数学第五章---定积分(§5.1定积分的概念、性质和应用)
  • 【HFP】蓝牙语音通信高级功能解析:快速拨号与呼叫等待协议实现
  • 【日撸 Java 三百行】Day 4(条件语句实战——闰年问题)
  • ORACLE EBS 12.1 启用https 简单策略
  • STM32H743单片机实现ADC+DMA多通道检测+事件组
  • nut-list和nut-swipe搭配:nut-cell侧滑定义无法冒泡打开及bug(含代码、案例、截图)
  • 继电器负载知识
  • 内存的位运算
  • Dify - Stable Diffusion
  • 未来设计新篇章!2025 年 UX/UI 设计趋势,技术与体验的全新结合!
  • 基于Jetson Nano与PyTorch的无人机实时目标跟踪系统搭建指南
  • 通过CIDR推出子网掩码和广播地址等
  • 【quantity】1 SI Prefixes 实现解析(prefix.rs)
  • 网络的搭建
  • BBS (cute): 1.0.2靶场渗透
  • 上海:5月8日起5年以上首套个人住房公积金贷款利率下调至2.6%
  • 中俄领导人将讨论从俄罗斯经蒙古至中国天然气管道项目?外交部回应
  • 创新创业50人论坛开幕在即,双创青年为何选择来上海筑梦?
  • 上海市政府常务会议部署提升入境旅游公共服务水平,让国际友人“无障碍”畅游上海
  • 赵乐际:深入学习贯彻习近平生态文明思想,推动森林法全面有效贯彻实施
  • 虚构医药服务项目、协助冒名就医等,北京4家医疗机构被处罚