当前位置: 首页 > news >正文

Python Url地址截取方法

        在Python中,如果想从HTTP地址(通常是一个URL)中提取信息,比如协议(http或https)、主机名(域名或IP地址)、路径等,你可以使用urllib.parse模块中的urlparse函数。下面是如何使用urlparse来截取HTTP地址中不同部分的示例:

导入模块

首先,需要导入urllib.parse模块:

from urllib.parse import urlparse

使用urlparse函数

然后,可以使用urlparse函数来解析URL:

url = "http://www.example.com/path/to/resource?key=value#fragment"
parsed_url = urlparse(url)

访问解析后的URL的各个部分

urlparse返回一个六元素的命名元组(或者在新版本的Python中是11元素的命名元组,包括查询参数和片段),可以通过属性名访问这些部分:

print("Scheme:", parsed_url.scheme)       # 协议(例如 http 或 https)
print("Netloc:", parsed_url.netloc)       # 网络位置(例如 www.example.com)
print("Path:", parsed_url.path)           # 路径(例如 /path/to/resource)
print("Params:", parsed_url.params)      # 参数(不常见,通常为空)
print("Query:", parsed_url.query)        # 查询参数(例如 key=value)
print("Fragment:", parsed_url.fragment)  # 片段标识符(例如 fragment)

完整代码如下:

from urllib.parse import urlparse
 
url = "http://www.example.com/path/to/resource?key=value#fragment"
parsed_url = urlparse(url)
 
print("Scheme:", parsed_url.scheme)       # 输出: http
print("Netloc:", parsed_url.netloc)       # 输出: www.example.com
print("Path:", parsed_url.path)           # 输出: /path/to/resource
print("Query:", parsed_url.query)        # 输出: key=value
print("Fragment:", parsed_url.fragment)  # 输出: fragment

相关文章:

  • 1.4 单元测试与热部署
  • Python——计算机网络
  • vs编译各种报错:未知重写说明符
  • MyBatis 与 JDBC 的关系?
  • 【记录一下】Hierarchical Navigable Small Worlds(HNSW)是什么玩意?
  • VS2022远程调试树莓派上的.net core程序
  • C语言经典案例-菜鸟经典案例
  • C++编写Redis客户端
  • BOOK推荐-学海无涯
  • 大模型工程师学习日记(十五):Hugging Face 模型微调训练(基于 BERT 的中文评价情感分析)
  • Linux基础网络设置
  • 尚硅谷爬虫note15n
  • day18-后端Web开发——Maven高级
  • NewStar CTF week3 web wp
  • 玩转python:掌握Python数据结构之栈Stack
  • SPI学习笔记
  • 数电笔记——第二章 逻辑代数基础(二)
  • seacmsv9报错注入管理员密码+orderby+limit
  • Django下防御Race Condition
  • 【时间序列】因果推断:从时序数据中探寻“因”与“果”
  • 惠州网站建设(推荐乐云践新)/腾讯广告
  • 二手书交易网站开发现状/网络培训心得体会5篇
  • 怎么做淘宝客网站赚钱/青岛seo服务
  • 网新科技做网站怎么样/培训计划模板
  • 网站建设方案ppt 枫子科技/成都专业网站推广公司
  • 中国建盏logo/seo咨询