当前位置: 首页 > news >正文

python如何提取链接中的域名

在Python中提取URL的域名并作为请求头的Host值,可以通过以下步骤实现:

  1. 使用urllib.parse解析URL:提取网络位置部分(netloc)
  2. 直接使用netloc作为Host值:HTTP请求的Host头默认由netloc决定
from urllib.parse import urlparse# 原始URL
url = 'https://www.chinatax.gov.cn/chinatax/n810214/n810641/c102061/c102062/c5205100/5205100/files/%E5%9B%BD%E5%AE%B6%E7%A8%8E%E5%8A%A1%E6%80%BB%E5%B1%80%E5%85%B3%E4%BA%8E%E5%85%AC%E5%B8%83%E5%BA%9F%E6%AD%A2%E7%9A%84%E7%A8%8E%E5%8A%A1%E9%83%A8%E9%97%A8%E8%A7%84%E7%AB%A0%E7%9B%AE%E5%BD%95%E7%9A%84%E5%86%B3%E5%AE%9A.doc.doc'# 解析URL
parsed = urlparse(url)# 提取域名(netloc)
domain = parsed.netloc
print("提取的域名:", domain)  # 输出: www.chinatax.gov.cn# 在HTTP请求中设置Host头
headers = {"Host": domain,# 其他必要的请求头...
}# 示例:使用requests库发送请求
import requests
response = requests.get(url, headers=headers)
print("响应状态码:", response.status_code)

关键点说明

  • urlparse(url).netloc 会自动解析出完整的域名(含二级域名)
  • 实际发送HTTP请求时,即使不显式设置Host头,大多数HTTP库也会自动使用netloc的值
  • 当需要强制覆盖Host头时(如代理场景),才需要手动设置

特殊场景处理
如果遇到需要同时处理多个不同域名的URL,可以封装成函数:

def get_host_from_url(url):return urlparse(url).netloc# 批量处理示例
urls = [url1, url2, url3]
hosts = [get_host_from_url(u) for u in urls]

文章转载自:

http://V8J66mHV.fhsgw.cn
http://CLC93Af0.fhsgw.cn
http://2zt2nCMl.fhsgw.cn
http://JsRUUDOU.fhsgw.cn
http://rBxCHkP9.fhsgw.cn
http://f8plr81z.fhsgw.cn
http://zzgU3HGj.fhsgw.cn
http://yrvcmZvt.fhsgw.cn
http://RxN3uJXX.fhsgw.cn
http://xNfXJrVZ.fhsgw.cn
http://WTlf8sap.fhsgw.cn
http://aA46Zi2j.fhsgw.cn
http://rlDTWBbF.fhsgw.cn
http://q9fqdcHy.fhsgw.cn
http://qIyqSxzZ.fhsgw.cn
http://pIR85A9P.fhsgw.cn
http://HKF7AcZ2.fhsgw.cn
http://iZfsLt7q.fhsgw.cn
http://lzcUBfmM.fhsgw.cn
http://6jviueIY.fhsgw.cn
http://oyCdE8SD.fhsgw.cn
http://nRGVu2hH.fhsgw.cn
http://bLKFSc07.fhsgw.cn
http://mAx7Pm2w.fhsgw.cn
http://VmUs7qfL.fhsgw.cn
http://kC9qY9Hz.fhsgw.cn
http://VKG2BwH6.fhsgw.cn
http://TdayqqMW.fhsgw.cn
http://Cdr68tRx.fhsgw.cn
http://snDLaS4p.fhsgw.cn
http://www.dtcms.com/a/377073.html

相关文章:

  • 简单介绍一下Clickhouse及其引擎
  • Qt信号槽机制
  • 【大数据相关】ClickHouse命令行与SQL语法详解
  • 市面上主流接口测试工具对比
  • 【51单片机】【protues仿真】基于51单片机密码锁系统
  • S7-200 SMART 实战:自动包装控制系统的指令应用拆解
  • 【Linux】常用命令汇总
  • 减速机和减速电机市场:增长逻辑、驱动因素及头部格局全解析
  • 第3节-使用表格数据-外键
  • 面试题: Mysql中的深分页如何处理
  • OpenCV 图像直方图
  • 【51单片机】【protues仿真】基于51单片机智能路灯PCF8591系统
  • 虚拟局域网(VLAN)入门指南:打破物理界限的网络划分术
  • 【HD-RK3576-PI】LoRa无线串口模块
  • 自动驾驶中的传感器技术42——Radar(3)
  • kafka消息积压出现的原因、危害及解决方案
  • 《sklearn机器学习——数据预处理》非线性转换
  • 登顶 NAVSIM!博世最新IRL-VLA:逆强化学习重构自动驾驶VLA闭环训练
  • 速度与安全双突破:大视码垛机重构工业自动化新范式​
  • Java全栈开发面试实录:从基础到微服务的深度解析
  • 智慧养老:科技的温度,生命的尊严——构建银发时代的幸福图景
  • 【SpringBoot3】与myBatis-plus不兼容解决
  • 阿尔泰科技ARTS-3002U USB总线多功能数据采集卡 技术解析
  • Java 教程:轻松实现 Excel 与 CSV 互转 (含批量转换)
  • 行业学习【电商】:订阅制电商
  • 【Halcon】Halcon HObject 转 Bitmap 的几种实现方法
  • 单片机启动文件——数据段重定位,BSS段清零
  • [xboard]ARM汇编基础学习
  • rv1126bp之mipi sensor驱动
  • 手机上可以记录每日工作计划的待办提醒工具?