当前位置：首页 > news >正文

【Linux网络-HTTP协议】HTTP基础概念+构建HTTP

news 2025/10/16 17:51:06

代码定位：南毅c/Linux - Gitee.com

HTTP协议

介绍

虽然我们说，应用层协议是我们程序猿自己定的.但实际上,已经有大佬们定义了一些现成的,又非常好用的应用层协议,供我们直接参考使用。HTTP(超文本传输协议)就是其中之一。

在互联网世界中，HTTP（HyperText Transfer Protocol，超文本传输协议）是一个至关重要的协议。它定义了客户端（如浏览器）与服务器之间如何通信，以交换或传输超文本（如 HTML 文档）。

HTTP 协议是客户端与服务器之间通信的基础。客户端通过 HTTP 协议向服务器发送请求，服务器收到请求后处理并返回响应。HTTP 协议是一个无连接、无状态的协议，即每次请求都需要建立新的连接，且服务器不会保存客户端的状态信息。

认识URL

平时我们俗称的“网址”其实说的就是 URL

协议名称://server ip[:80]/a/b/c/d/e.html

为什么第一张图片有端口号，第二张实际网址却没有端口号呢？

默认端口：对于HTTP（超文本传输协议）请求，默认端口号是80；对于HTTPS（安全超文本传输协议）请求，默认端口号是443。当客户端（如浏览器）访问这些默认端口时，通常不需要在网址中指定端口号

用户友好性：为了简化用户的操作和提高用户体验，浏览器和网站设计者通常省略默认端口号，因为大多数用户不需要知道这些细节。

惯例：随着时间的推移，省略默认端口号已经成为一种标准和惯例。除非访问非标准端口，否则在网址中包含端口号是不常见的。

安全性：在HTTPS成为Web安全标准之后，大多数网站都迁移到了443端口。由于HTTPS请求默认使用443端口，因此没有必要在网址中显示端口号

以下是一些具体情况：

当你输入 http://www.example.com 时，浏览器默认会访问 http://www.example.com:80。
当你输入 https://www.example.com 时，浏览器默认会访问 https://www.example.com:443。

只有在以下情况下，你才需要在网址中指定端口号：

访问非标准端口的Web服务。
开发者在本地机器上运行Web服务器，并使用非标准端口进行测试。

例如，如果你正在本地开发一个Web应用程序，并且你的服务器在端口3000上运行，那么你需要输入 http://localhost:3000 来访问该服务。

谈一谈URL后半部分的资源

我们用网络的目的就是接受信息发送信息，比如我们要下载一个视频就需要向服务器发送请求，服务器接收请求后再将资源发送到手机，这些资源全部都在服务器端，Linux操作系统适合做后端服务器，Linux下一切皆文件，我们要访问资源，以及服务器把资源返回给客户端都需要找到对应的资源，在Linux下通过路径就可以定位到资源

urlencode和urldecode

urlencode 和 urldecode 是处理URL中查询字符串（query string）的两种常见方法。这些方法确保URL中的特殊字符被正确编码和解码，以便它们可以在网络中安全传输。

urlencode

urlencode 是一个函数，它将字符串转换为可以在URL中安全使用的格式。在URL中，某些字符具有特殊含义，例如 & 用于分隔参数，= 用于赋值，而空格可能表示参数的结束。如果这些字符是参数值的一部分，它们就需要被编码。

以下是 urlencode 常见的转换规则：

空格转换为 + 或 %20
特殊字符（如 ! # $ & ' ( ) * + , : ; = ? @ [ ]）转换为 % 后跟它们对应的十六进制值

例如，假设我们有一个查询字符串参数 name=John Doe，使用 urlencode 后，它可能被转换为 name=John+Doe 或 name=John%20Doe。

urldecode

urldecode 是 urlencode 的逆过程。它将经过 urlencode 处理的字符串转换回原始字符串。这通常在服务器端进行，因为服务器需要知道用户发送的确切参数值。

继续上面的例子，如果服务器接收到 name=John+Doe 或 name=John%20Doe，urldecode 将其转换回原始字符串 name=John Doe。

HTTP协议请求与响应格式

HTTP（Hypertext Transfer Protocol，超文本传输协议）是用于从服务器传输超文本到本地浏览器的传输协议。它定义了客户端（通常是浏览器）和服务器之间交换数据的请求和响应格式。

我们先看下面的HTTP初步设计思路在再回来看这里的后续内容

HTTP（超文本传输协议）请求通常由以下几个部分组成：

请求行：包括请求方法、URL 和 HTTP 版本。
请求报头（Headers）：包含了关于客户端环境和请求本身的信息。
空行：请求头和请求体之间必须有一个空行。用于将报头和有效载荷进行分离（封装）空行\r\n
请求体（可选）：包含请求的数据，例如表单数据或上传的文件。

以下是一个简单的 HTTP GET 请求示例：

GET /index.html HTTP/1.1
Host: www.example.com
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Accept-Language: en-US,en;q=0.5
Accept-Encoding: gzip, deflate
Connection: keep-alive
Upgrade-Insecure-Requests: 1

在这个例子中：

GET 是请求方法，表明客户端想要获取服务器上的资源。
/index.html 是请求的资源路径。
HTTP/1.1 是使用的 HTTP 版本。

以下是一些常见的 HTTP 请求方法：

请求方法	描述
GET	请求指定的页面信息，并返回实体主体
POST	向服务器提交数据，数据包含在请求体中
PUT	向服务器提交数据，通常用于更新资源
DELETE	请求服务器删除指定的页面
HEAD	类似于 GET 请求，但服务器不会返回请求的页面主体，只返回响应头
OPTIONS	允许客户端查看服务器支持的 HTTP 方法
PATCH	是对 PUT 方法的补充，用于对资源进行部分更新

URI：我们要访问资源的路径

HTTP版本：http/1.0 http/1.1 http/2.0

请求报头（Headers）提供了关于请求、响应或者其他的发送信息，以下是一些常见的请求头字段

请求头字段	描述
Host	指定请求的服务器的域名和端口号
User-Agent	包含发出请求的用户代理软件信息
Accept	指定客户端能够接收的内容类型
Accept-Language	指定客户端接受的语言
Accept-Encoding	指定客户端能够解码的响应内容编码方式
Connection	控制不同请求/响应之间的网络连接的选项

请求体（Body）通常用于 POST 和 PUT 请求，它包含了要发送给服务器的数据。例如，提交表单数据时，请求体可能如下所示

Content-Type: application/x-www-form-urlencoded

name=John+Doe&age=30&city=New+York

在这个例子中，请求体包含了一些键值对，它们通过 & 符号连接，并且每个键和值之间用 = 符号分隔。Content-Type 请求头指明了请求体的内容类型。

我们在看一看HTTP响应就简洁明了了

HTTP设计思路

TcpServer.hpp

语法解释

我们在执行这里加上读数据

读到一个请求--->交个上层处理--->再把结果响应出去

Http.hpp初步设计

我们根据回掉函数设计执行函数内容返回一个空串

接着我们用浏览器访问我们的服务器

我们的服务器就接收到了请求

接着我们加一些元素

我们看到的其实是一个长长的字符串，只不过打印出来的时候格式被解析了

Http.hpp设计

我们已经见过了HTTP的请求与响应，那么我们现在重新设计一下这个文件

首先将请求内容长长的字符串进行反序列化

我们将来读到一个请求，一定要先构建一个结构化请求

反序列的过程我们要手动获取请求行，请求报头和正文，其中请求报头我们放在vector内

基本的反序列化

测试

进一步反序列化

我们之前是放在vector内部的，现在我们要像kv一样，给你Host我们取Host的内容，因此这里我们引入unordered_map

测试已经全部解析出来了

现在我们加两个函数，返回我们的url，以及要访问的资源

我们进行第一次测试

我们再进行第二次测试，这时候我们输入http://47.120.76.87:8889/a/b/c/a.html

此时我们也就发现我们请求的url会发生变化

一般网站都会添加首页，比如百度https://www.baidu.com

但是我们也可以百度一下，你就知道

一般情况下/index.html就是我们的首页文件，这样我们就可以通过两种方式访问一个页面，现在我们也为我们的网页设置一个首页，我们放在wwwroot目录下

我们在请求行解析的路径处理一下

接下来我们构建响应

响应构建

基本属性

接着将请求发送的数据进行序列化

也就是将收到的请求，填充到响应的描述中，并且合并成一个长的完整的字符串

接下来读取文件内容

此时我们在class HttpServer内设计

接着构建响应获取内容

然后我们访问

再访问http://47.120.76.87:8888/index.html

这样首页创建完成了，并且带不带index.html都能访问到同一个页面

接着我们往网站加入一些元素，加入一些图片

我们明明只是进入主页，为什么还多进了image下的文件呢

这是因为获得一个完整的网页，浏览器首先要得到html，根据html标签，检测出我们还要获取其他资源，浏览器会继续发器http请求

我们也知道我们网页还需要登陆页面，注册页面等

各个页面之间是怎么转换的呢？

我们在这里又需要认识一个新标签链接标签

HTML中的链接标签用于创建指向其他网页、文件、位置、电子邮件地址或任何其他资源的超链接。链接标签是 <a>，并且通常包含以下属性：

href：指定链接的目标地址。
target：指定在哪里打开链接。例如，_blank 表示在新窗口或标签页中打开链接。
title：提供链接的额外信息，当鼠标悬停在链接上时显示

基本链接

<a href="https://www.example.com">访问示例网站</a>

打开新窗口或标签页

<a href="https://www.example.com" target="_blank">在新窗口中访问示例网站</a>

链接到同一页面的特定部分

<a href="#section1">跳转到页面的一节</a>

带标题的链接，当鼠标悬停在链接上时，将显示标题文本。

<a href="https://www.example.com" title="这是示例网站的链接">访问示例网站</a>

首先我们先建立几个文件

我们在index.html添加如下内容

访问服务器，就多了登陆页面

点进去后就跳转到登陆页面了

再往里补充报头信息，将文件类型转换成对应的Content-Type；以及状态码及其对应描述

查看全文

http://www.dtcms.com/a/46913.html

MySQL中like模糊查询如何优化?

2025AI 有哪些重要的发展趋势？

Centos7部署k8s（单master节点安装）

协议-Airkiss

LINUX网络基础 - 初识网络，理解网络协议

一、Redis 通用命令大全

SoapUI 结合 Postman 测试 WebService 协议

一个py文件搞定mysql查询+Json转换+表数据提取+根据数据条件生成excel文件+打包运行一条龙

AI日记app

前端文件分片上传深度解析：从原理到实践

leetcode日记（74）扰乱字符串

记录一次跨库连表的坑

Java中用Map＜String,Object＞存储层次结构

数据结构（初阶）（五）----栈

解决下载支持gpu的pytorch问题

云原生网络篇——万级节点服务网格与智能流量治理

[密码学实战]Java生成SM2根证书及用户证书

【零基础C语言】第四节数组

系统架构设计师—计算机基础篇—计算机网络

leetcode 59. 螺旋矩阵 II 中等

DeepSeek效应初现：Grok-3补刀ChatGPT，OpenAI已在ICU？

如何理解语言模型

【算法】875. 快速幂

代码随想录刷题day35|（二叉树篇）二叉树的非递归遍历（前序+后序）

解决各大浏览器中http地址无权限调用麦克风摄像头问题（包括谷歌，Edge，360，火狐）后续会陆续补充

Mac mini M4安装nvm 和node

化学工业领域 - 基础化工、精细化工、煤化工极简理解

（十一）基于vue3+mapbox-GL实现模拟高德实时导航轨迹播放

REACT学习第三幕--沉睡花园

Pseudo-Q: Generating Pseudo Language Queries for Visual Grounding