当前位置: 首页 > news >正文

爬虫学习笔记(三)--Http协议

思维导图

上面思维导图提取的原文是2026王道计网P286~290 

URL最前面(URL传输过程中遵循HTTP协议)

协议

计算机传输的数据实际上就是二进制0和1,协议就是规定这一串二进制数字的前几位代表什么、中间几位代表什么、后几位代表什么

HTTP(超文本传输协议)-无连接、可靠

传递网站相关内容的基本都用HTTP,因为对于超文本HT进行了规定,网页源代码采用的就是超文本标记语言HTML

 HTTP报文结构

请求头常见

User-Agent:请求载体的身份标识(用什么浏览器、什么操作系统、设备访问的)

Referer:防盗链--这次请求是从哪个页面来的(反爬会用到)

cookie:本地字符串数据信息(用户登录信息,反爬的token)

响应头常见

cookie:同请求头

token字样的字符串:防止各种攻击和反爬

请求方式

get:查询--显式提交

post:更改--隐式提交

相关文章:

  • 厚铜PCB如何兼顾质量与成本?供应商设计规范执行的黄金平衡点
  • 【行业特化篇2】金融行业简历特化指南:合规性要求与风险控制能力的艺术化呈现
  • 软考-软件设计师中级备考 6、数据结构 图
  • 鸿蒙NEXT开发组件截图和窗口截图工具类SnapshotUtil(ArkTs)
  • 榕壹云信用租赁系统:基于ThinkPHP+MySQL+UniApp的全链路免押租赁解决方案
  • 声纹监测技术在新能源汽车的应用场景解析
  • FPGA-数字时钟
  • 深入浅出限流算法(一):简单但有“坑”的固定窗口计数器
  • ORM、Hibernate 与 MyBatis 详解:选择合适的框架
  • 2025年渗透测试面试题总结-拷打题库24(题目+回答)
  • Ethan独立开发产品日报 | 2025-04-27
  • 系统架构-DSSAABSD
  • Django 缓存框架
  • 华为云空间安卓版存储扩展与文件管理体验测评
  • AI大模型学习十四、白嫖腾讯Cloud Studio AI环境 通过Ollama+Dify+DeepSeek构建生成式 AI 应用-接入DeepSeek大模型
  • 使用 ELK 实现全链路追踪:从零到一的实践指南
  • 阿里云服务器(ECS)基础指南:从入门到核心场景解析​
  • ubuntu新增磁盘挂载
  • Jackson 使用方法详解
  • 操作系统八股问——连载ing
  • 经济日报整版聚焦“妈妈岗”:就业路越走越宽,有温度重实效
  • 大四本科生已发14篇SCI论文?重庆大学:成立工作组核实
  • 王日春已任教育部社会科学司司长,此前系人教社总编辑
  • “用鲜血和生命凝结的深厚情谊”——习近平主席署名文章中的中俄友好故事
  • 商务部新闻发言人就中美经贸高层会谈答记者问
  • 安赛乐米塔尔深化在华战略布局,VAMA总经理:做中国汽车板竞争力前三