42 python http之urllib库
作为办公室牛马,日常工作中总少不了和网络数据打交道。比如从公司内部系统抓取数据做报表。Python urllib 库用于操作网页 URL,并对网页的内容进行抓取处理
一、Urllib 基础入门
urllib
是 Python 内置的一个强大的处理 URL 和网络请求的库,它包含了多个模块,每个模块都有自己独特的功能,就像一套工具套装,不同的工具应对不同的任务。
urllib.request
:主要用于发送 HTTP 请求,就像是快递员,负责把我们的请求送到服务器,并带回服务器的响应。urllib.parse
:用于解析和处理 URL,比如拆分 URL、编码和解码 URL 参数等,就像一个 URL 整理大师,把 URL 整理得井井有条。urllib.error
:处理在使用urllib
过程中可能出现的各种错误,比如网络连接错误、服务器响应错误等,为我们的网络请求保驾护航。
二、发送 GET 请求
想象一下,我们要从公司的官网获取首页的内容,这时候就可以使用 urllib.request
来发送 GET 请求。