爬虫-协议基础
1.http协议概念
2.服务器和客户端对接方式:
请求:
请求头:
请求方式和url网址
附加信息是验证消息这种,确认一下安全。判断一下是不是你这个浏览器发出来的,判断是不是手机电脑发出来的
请求体:
问的内容,“周杰伦帅不帅”
状态码 | 含义 | 说明 |
---|---|---|
200 | OK | 请求成功,服务器返回了数据 |
301 | Moved Permanently | 永久重定向(网址已永久迁移) |
302 | Found | 临时重定向(网址暂时跳转) |
400 | Bad Request | 客户端请求错误(如参数无效) |
403 | Forbidden | 服务器拒绝访问(如权限不足) |
404 | Not Found | 请求的资源不存在 |
500 | Internal Server Error | 服务器内部错误 |
响应:
响应头:
状态行:
协议和上面的对应,状态码:判断有没有问题,
200没问题,302重定向,404url错误,500:服务器错误
响应头:
cookie,验证消息,解密的key
响应体:
服务器返回的真正客户端要用的内容(HTML,json)等
3.调试方法
所有的内容,都在headers里面,但是已经重组过了
注:
类可以根据不同的直接打印,不然默认地址,也可以使用方法。
class Cat:def __init__(self, name, age):self.name = nameself.age = agedef __repr__(self):return f"<猫咪: {self.name} ({self.age}岁)>"def meow(self):return "喵~"# 使用示例
my_cat = Cat("橘胖", 3)
print(my_cat) # 输出: <猫咪: 橘胖 (3岁)>
print(my_cat.meow()) # 输出: 喵~
概念 | 说明 |
---|---|
类 (Class) | 对象的蓝图(如 Response ) |
实例 (Instance) | 根据类创建的具体对象(如 response ) |
__repr__ | 定义对象在解释器中的显示方式 |
__str__ | 定义对象在 print() 时的显示方式 |
魔法方法 | 双下划线开头结尾的方法,实现特殊功能 |