当前位置: 首页 > news >正文

深入理解Web服务与HTTP协议

在现代互联网应用开发中,Web服务和HTTP协议扮演着至关重要的角色。本文将深入探讨什么是Web服务,以及作为其基石的HTTP协议的基本概念、工作机制及其重要性。
Web服务是一种通过网络提供接口和服务的技术,它允许不同的应用程序通过网络进行通信和数据交换。Web服务通常使用HTTP作为通信协议,基于XML或JSON格式的数据传输,并且可以跨越不同的平台和编程语言实现互操作性。

WEB 服务和HTTP协议

Internet 因特网

因特网是"Internet”的中文译名,它起源于美国的五角大楼,它的前身是美国国防部高级研究计划局
(ARPA)主持研制的ARPAnet。20世纪50年代末,正处于冷战时期。当时美国军方为了自己的计算机网络在受到袭击时,即使部分网络被摧毁,其余部分仍能保持通信联系,便由美国国防部的高级研究计划局(ARPA)建设了一个军用网,叫做"阿帕网”(ARPAnet)。
1969年正式启用阿帕网,当时仅连接了4台计算机,供科学家们进行计算机联网实验用,这就是因特网的前身。
到70年代,ARPAnet已经有了好几十个计算机网络,但是每个网络只能在网络内部的计算机之间互联通信,不同计算机网络之间仍然不能互通。为此, ARPA又设立了新的研究项目,支持学术界和工业界进行有关的研究,研究的主要内容就是想用一种新的方法将不同的计算机局域网互联,形成"互联网”。研究人员称之为"internetwork”,简称"Internet”。在研究实现互联的过程中,计算机软件起了主要的作用。
1974年,出现了连接分组网络的协议,其中就包括了TCP/IP协议。TCP/IP有一个非常重要的特点,就是开放性,即TCP/IP的规范和Internet的技术都是公开的。目的就是使任何厂家生产的计算机都能相互通信,使Internet成为一个开放的系统,这正是后来Internet得到飞速发展的重要原因。ARPA在1982年接受了TCP/IP,选定Internet为主要的计算机通信系统,并把其它的军用计算机网络都转换到TCP/IP。1983年,ARPAnet分成两部分:一部分军用,称为MILNET;另一部分仍称ARPAnet,供民用。
1986年,美国国家科学基金组织(NSF)将分布在美国各地的5个为科研教育服务的超级计算机中心互联,并支持地区网络,形成SNSFnet。1988 年,SNSFnet替代ARPAnet成为Internet的主干网。NSFnet主干网利用了在ARPAnet中已证明是非常成功的TCP/IP技术,准许各大学、政府或私人科研机构的络加入。1989年,ARPAnet解散,Internet从军用转向民用。
Internet的发展引起了商家的极大兴趣。1992年,美国IBM、MCI、MERIT三家公司联合组建了一个高级网络服务公司(SNS),建立了一个新的网络,叫做SNSnet,成为Internet的另一个主干网。它与
SNSFnet不同,NSFnet是由国家出资建立的,而SNSnet则是SNS 公司所有,从而使Internet开始走向商业化。
1995年4月30日,SNSFnet正式宣布停止运作。而此时Internet的骨干网已经覆盖了全球91个国家,主
机已超过400万台。而在当前,因特网仍以惊人的速度向前发展
在90年代,超文本标识语言(HTML),即一个可以获得因特网的图像信息的超文本因特网协议被采
用,使每一个人可以产生自己的图像页面(网址),然后成为一个巨大的虚拟超文本网络的组成部分。这个增强型的因特网又被非正式地称为万维网,与此同时产生了数量庞大的新用户群。于是,许多人用"因特网” 一词指这个网络的物理结构,包括连接所有事物的客户机、服务器和网络;而用"万维网”一词指利用这个网络可以访问的所有网站和信息。

Internet 和中国

北京时间1987年9月14日,物理研究员钱天白建立起一个网络节点,通过电话拨号连接到国际互联网,向他的德国朋友发出来自中国的第一封电子邮件:Across the Great Wall we can reach every corner in the world,自此,中国与国际计算机网络开始连接在一起
在这里插入图片描述
1990年10月,钱天白教授代表中国正式在国际互联网络信息中心的前身DDN-NIC注册登记了我国的顶级域名CN,并且从此开通了使用中国顶级域名CN的国际电子邮件服务。由于当时中国尚未正式连入Internet,所以委托德国卡尔斯鲁厄大学运行CN域名服务器。
1993年3月2日, 中国科学院高能物理研究所租用AT&T公司的国际卫星信道接入美国斯坦福线性加速器中心(SLAC)的64K专线正式开通,专线开通后,美国政府以Internet上有许多科技信息和其它各种资源,不能让社会主义国家接入为由,只允许这条专线进入美国能源网而不能连接到其它地方。尽管如此,这条专线仍是我国部分连入Internet的第一根专线。
1994年4月20日,中国通过一条64k的国际专线全功能接入国际互联网,成为国际互联网大家庭中的第77个成员,正式开启了互联网时代。随后,中科院高能物理研究所推出第一个WWW网站和第一套网页。
1994年5月21日, 在钱天白教授和德国卡尔斯鲁厄大学的协助下,中国科学院计算机网络信息中心完成了中国国家顶级域名(CN)服务器的设置,改变了中国CN顶级域名服务器一直放在国外的历史。
1995年5月17日, 第27个世界电信日,邮电部正式宣布,向国内社会开放计算机互联网接入服务。
1995年5月,北京的中关村南大街上出现了一块巨大的广告牌,"中国离信息高速公路还有多远?向北
1500米。”那个位置就是一家叫"瀛海威”的网络科教馆,瀛海威正是information highway的音译,作为
中国第一个互联网接入服务商,瀛海威几乎就是当时互联网的代名词

1996年1月,中国互联网全国骨干网建成并正式开通,开始提供服务
1995年4月,马云凑了两万块钱,成立杭州海博网络公司,专门给企业做主页
1997年5月,丁磊创立网易
1998年2月, 张朝阳创立搜狐
1998年6月18日,刘强东在中关村创办京东公司,代理销售光磁产品
1998年11月,马化腾和张志东成立深圳市腾讯计算机系统有限公司,OICQ开通
1998年12月, 新浪网成立,关键人物:王志东
1999年5月18日,中国第一家电子商务企业8848.com成立,创始人王峻涛也曾被誉为"中国电子商务教父”。2000年底,调查显示接近70%的人说上网买东西首选 8848
2000年1月,李彦宏创建了百度
2003年5月,阿里巴巴集团在创立淘宝网
2003年10月,淘宝网首次推出支付宝服务
2009年11月, 阿里开始举办双十一购物狂欢节
2012年1月11日淘宝商城正式更名为“天猫”
2014年9月19日阿里巴巴集团于纽约证券交易所正式挂牌上市
2004年1月,京东多媒体网正式开通,启用域名www.jdlaser.com
2010年4月,雷军创办小米
2011年1月21日,腾讯公司推出微信 (WeChat)
2012年3月,今日头条由张一鸣于创建
2012年7月10日,北京小桔科技有限公司成立,滴滴司机端3个月后北京上线
2016年9月20日, 字节跳动上线抖音
中国互联网连接世界
1885年台湾建省,首任巡抚刘铭传派人与福州船政联系,使用船政电报学堂毕业生为技术人员,于1887年铺设成功台湾淡水至福州川石海底电缆,全长117海里。这是我国自行设计安装的第一条海底电缆。此电缆毁于第二次世界大战我国于1989年开始投入到全球海底光缆的投资与建设中来,并于1993年实现了首条国际海底光缆的登陆(中日之间C-J海底光缆系统);随后在1997年,我国参与建设的全球海底光缆系统(FLAG)建成并投入运营,这也是第一条在我国登陆的洲际海底光缆中国连接世界目前共有8条光缆,四个登陆站允许入境,目前我国的登陆站设立在三个城市的四个地区,分别是山东青岛登陆站(隶属中国联通)、上海崇明登陆站(隶属中国电信)、上海南汇登陆站(隶属中国联通)和广东汕头登陆站(隶属中国电信)
1993年3月2日,中国科学院高能物理研究所租用AT&T公司的国际卫星信道建立的接入美国SLAC国家实验室的64K专线正式开通,成为我国连入Internet的第一根专线。
参考链接: http://www.ihep.cas.cn/kxcb/kpcg/jsywl/201407/t20140714_4156699.html
下图是海底光缆
在这里插入图片描述

HTTP 超文本传输协议

HTTP 相关概念
互联网:是网络的网络,是所有类型网络的母集。
因特网:世界上最大的互联网网络。即因特网概念从属于互联网概念。习惯上,大家把连接在因特网上的计算机都成为主机。
万维网:WWW(world wide web)万维网并非某种特殊的计算机网络,是一个大规模的、联机式的信息贮藏库,使用链接的方法能非常方便地从因特网上的一个站点访问另一个站点(超链技术),具有提供分布式服务的特点。万维网是一个分布式的超媒体系统,是超文本系统的扩充,基于B/S架构实现
URL:万维网使用统一资源定位符(Uniform Resource Locator)来标志万维网上的各种文档,并使每个文档在整个因特网的范围内具有唯一的标识符URL。
HTTP:为解决"用什么样的网络协议来实现整个因特网上的万维网文档”这一难题,就要使万维网客户程序(以浏览器为主,但不限于浏览器)与万维网服务器程序之间的交互遵守严格的协议,即超文本传送协议(HyperText Transfer Protocol)。HTTP是处于应用层的协议,使用TCP传输层协议进行可靠的传送。因此,需要特别提醒的是,万维网是基于因特网的一种广泛因特网应用系统,且万维网采用的是HTTP(80/TCP)和 HTTPS(443/TCP)的传输协议,但因特网还有其他的网络应用系统(如:FTP、SMTP等等)。
HTML:为了解决"怎样使不同作者创作的不同风格的万维网文档,都能在因特网上的各种主机上显示出来,同时使用户清楚地知道在什么地方存在着链接”这一问题,万维网使用超文本标记语言(HyperText Markup Language),使得万维网页面的设计者可以很方便地用链接从页面的某处链接到因特网的任何一个万维网页面,并且能够在自己的主机品目上将这些页面显示出来。HTML与txt一样,仅仅是是一种文档,不同之处在于,这种文档专供于浏览器上为浏览器用户提供统一的界面呈现的统一规约。且具备结构化的特征,这是txt所不具备的强制规定。
浏览器访问网站的过程
在这里插入图片描述

HTTP 协议通信过程

HTTP(HyperText Transfer Protocol,超文本传输协议)是一种用于分布式、协作式和超媒体信息系统的应用层协议。HTTP是万维网的数据通信的基础设计HTTP最初的目的是为了提供一种远距离共享知识的方式,借助多文档进行关联实现超文本,连成相互参阅的WWW(world wide web,万维网)

HTTP的发展是由蒂姆·伯纳斯-李(Tim Berners-Lee)于1989年在欧洲核子研究组织(CERN)所发起。HTTP的标准制定由万维网协会(World Wide Web Consortium,W3C)和互联网工程任务组
(Internet Engineering Task Force,IETF)进行协调,最终发布了一系列的RFC,其中最著名的是
1999年6月公布的 RFC 2616,定义了HTTP协议中现今广泛使用的一个版本——HTTP 1.1版
HTTP服务通信过程
在这里插入图片描述
HTTP协议分层
在这里插入图片描述

HTTP 相关技术

WEB 开发语言
http:Hyper Text Transfer Protocol 应用层协议,默认端口: 80/tcp
WEB前端开发语言:

  • html
  • css
  • javascript

html
Hyper Text Markup Language 超文本标记语言,编程语言,主要负责实现页面的结构示
范例:html 语言

<html><head><meta http-equiv=Content-Type content="text/html;charset=utf-8"><title>HTML语言</title></head><body><img src="http://www.html.com/wp-content/uploads/2017/09/logo.png" ><h1 style="color:red">欢迎</h1><p><a href=http://www.cao.com>曹哥</a>欢迎你</p></body></html>#注意:html文件编码为utf-8编码

CSS
Cascading Style Sheet 层叠样式表, 定义了如何显示(装扮) HTML 元素,比如:字体大小和颜色属性等。样式通常保存在外部的 .css 文件中,用于存放一些HTML文件的公共属性,从而通过仅编辑一个简单的 CSS 文档,可以同时改变站点中所有页面的布局和外观
示例:css

 #test.html 建议用Vscode创建文件,用记事本可能会出现乱码
<html><head><meta http-equiv=Content-Type content="text/html;charset=utf-8"><link rel="stylesheet" type="text/css" href="mystyle.css" /></head><body><h1>这是 heading 1</h1><p>这是一段普通的段落。请注意,该段落的文本是红色的。在 body 选择器中定义了本页面中的默认文本颜色。</p><p class="ex">该段落定义了 class="ex"。该段落中的文本是蓝色的。</p></body></html>#mystyle.cssbody {color:red}h1 {color:#00ff00}p.ex {color:rgb(0,0,255)}

Js
javascript,实现网页的动画效果,但实属于静态资源
Java和javascript的关系: 周杰和周杰伦的关系(N50牛康康语录)
示例:javascript

 <!DOCTYPE html><html><head><meta http-equiv=Content-Type content="text/html;charset=utf-8"></head><body><h2>我的第一个 JavaScript</h2><button type="button"onclick="document.getElementById('demo').innerHTML = Date()">
点击这里来显示日期和时间
</button><p id="demo"></p></body></html>

MIME
MIME : Multipurpose Internet Mail Extensions 多用途因特网邮件扩展
文件 /etc/mime.types ,来自于mailcap包
MIME格式:type/subtype txt html jpg bmp
参考链接:https://developer.mozilla.org/zh-CN/docs/Web/HTTP/Basics_of_HTTP/MIME_Types
http://www.w3school.com.cn/media/media_mimeref.asp
示例

text/plain    txt asc text pm el c h cc hh cxx hxx f90 conf log
text/html     html htm
text/css 
image/jpeg    jpg jpeg
image/png 
video/mp4 
application/javascript 

URI和URL
参考链接
https://developer.mozilla.org/zhCN/docs/Web/HTTP/Basics_of_HTTP/Identifying_resources_on_the_Web
URI: Uniform Resource Identifier 统一资源标识,分为URL 和 URN
URN:Uniform Resource Naming,统一资源命名
示例: P2P下载使用的磁力链接是URN的一种实现

magnet:?xt=urn:btih:1E45C21458681BFECBEB72D77A2500762D6F799F

URL:Uniform Resource Locator,统一资源定位符,用于描述某服务器某特定资源位置
两者区别:URN如同一个人的名称,而URL代表一个人的住址。换言之,URN定义某事物的身份,而
URL提供查找该事物的方法。URN仅用于命名,而不指定地址
URL组成
在这里插入图片描述

<scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>
scheme:方案,访问服务器以获取资源时要使用哪种协议
user:用户,某些方案访问资源时需要的用户名
password:密码,用户对应的密码,中间用:分隔
Host:主机,资源宿主服务器的主机名或IP地址
port:端口,资源宿主服务器正在监听的端口号,很多方案有默认端口号
path:路径,服务器资源的本地名,由一个/将其与前面的URL组件分隔
params:参数,指定输入的参数,参数为名/值对,多个参数,用;分隔
query:查询,传递参数给程序,如数据库,用?分隔,多个查询用&分隔
frag:片段,一小片或一部分资源的名字,此组件在客户端使用,用#分隔

URL示例

rtsp://videoserver/video_demo/  
#Real Time Streaming Protocol
gcomm://10.0.0.8,10.0.0.18,10.0.0.28 
https://list.jd.com/list.html?
cat=670,671,672&ev=14_2&sort=sort_totalsales15_desc&trans=1
http://apache.org/index.html#projects-list

网站访问量

网站访问量统计的重要指标
IP(独立IP):即Internet Protocol,指独立IP数。一天内来自相同客户机IP 地址只计算一次,记录远
程客户机IP地址的计算机访问网站的次数,是衡量网站流量的重要指标。
PV(访问量): 即Page View, 页面浏览量或点击量,用户每次刷新即被计算一次,PV反映的是浏览
某网站的页面数,PV与来访者的数量成正比,PV并不是页面的来访者数量,而是网站被访问的页
面数量。
UV(独立访客):即Unique Visitor,访问网站的一台电脑为一个访客。一天内相同的客户端只被计算一次。可以理解成访问某网站的电脑的数量。网站判断来访电脑的身份是通过cookies实现的。如
果更换了IP后但不清除cookies,再访问相同网站,该网站的统计中UV数是不变的。
网站统计:http://www.alexa.cn/rank/
范例:网站访问统计

1. 甲乙丙三人在同一台通过 ADSL 上网的电脑上(中间没有断网),分别访问 www.wang.com 网站,并
且每人共用一个浏览器,各个浏览了2个页面,那么网站的流量统计是:
IP: 1   PV:6    UV:12. 若三人都是ADSL重新拨号后,各个使用不同的浏览器,分别浏览了2个页面,则
IP: 3   PV:6    UV:3

网站访问量 PV,I,UV统计方法
使用文本工具,比如awk提取IP,sort排序、uniq统计去重后统计IP数。
第三方统计工具进行pv统计,比如: 百度统计、腾讯分析、piwik、开发自研统计平台。

HTTP工作机制

一次http事务包括:

  • http请求:http request
  • http响应:http response

Web资源:web resource, 一个网页由多个资源(文件)构成,打开一个页面,通常会有多个资源展示出来,但是每个资源都要单独请求。因此,一个"Web 页面”通常并不是单个资源,而是一组资源的集合
资源类型

  • 静态文件:无需服务端做出额外处理,服务器端和客户端的文件内容相同
    常见文件后缀:.html, .txt, .jpg, .js, .css, .mp3, .avi
  • 动态文件:服务端执行程序,返回执行的结果,服务器端和客户端的文件内容不相同
    常见文件后缀:.php, .jsp ,.asp
    HTTP 连接请求
    在这里插入图片描述
    串行和并行连接
    在这里插入图片描述
    串行,持久连接和管道
    在这里插入图片描述
    提高HTTP连接性能
  • 并行连接:通过多条TCP连接发起并发的HTTP请求
  • 持久连接:keep-alive,重用TCP连接,以消除连接和关闭的时延,以事务个数和时间来决定是否关闭连接
  • 管道化连接:通过共享TCP连接,发起并发的多个HTTP请求,但需要也要按发起请求的顺序来接收响应,实现难度很大,很多代理服务器和浏览器不支持
  • 复用的连接:交替传送请求和响应报文(实验阶段)

HTTP 协议版本

HTTP 1.X 协议

RFC Hypertext Transfer Protocol – HTTP/1.1

 https://tools.ietf.org/html/rfc2616

http/0.9:
1991,原型版本,功能简陋,只有一个命令GET。GET /index.html,服务器只能回应HTML格式字符
串,不能回应别的格式
http/1.0
1996年5月,支持cache, MIME, method
每个TCP连接只能发送一个请求,发送数据完毕,连接就关闭,如果还要请求其他资源,就必须再新建一个连接引入了POST命令和HEAD命令头信息是 ASCII 码,后面数据可为任何格式。服务器回应时会告诉客户端,数据是什么格式,即Content-Type字段的作用。这些数据类型总称为MIME 多用途互联网邮件扩展,每个值包括一级类型和二级类型,预定义的类型,也可自定义类型, 常见Content-Type值:text/xml image/jpeg audio/mp3
http/1.1
1997年1月,引入了持久连接(persistent connection),即TCP连接默认不关闭,可以被多个请求复用,不用声明Connection: keep-alive。对于同一个域名,大多数浏览器允许同时建立6个持久连接引入了管道机制,即在同一个TCP连接里,客户端可以同时发送多个请求,进一步改进了HTTP协议的效率。
新增方法:PUT、PATCH、OPTIONS、DELETE。
同一个TCP连接里,所有的数据通信是按次序进行的。服务器只能顺序处理回应,前面的回应慢,会有许多请求排队,造成"队头堵塞"(Head-of-line blocking)。
为避免上述问题,两种方法:一是减少请求数,二是同时多开持久连接。
网页优化技巧,如合并脚本和样式表、将图片嵌入CSS代码、域名分片(domain sharding)等。
HTTP 协议不带有状态,每次请求都必须附上所有信息。请求的很多字段都是重复的,浪费带宽,影响速度。
HTTP1.0和HTTP1.1的区别
缓存处理,在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准,
HTTP1.1则引入了更多的缓存控制策略例如Entity tag,If-Unmodified-Since, If-Match, If-None
Match等更多可供选择的缓存头来控制缓存策略
带宽优化及网络连接的使用,HTTP1.0中,存在一些浪费带宽的现象,例如:客户端只是需要某个
对象的一部分,而服务器却将整个对象送过来了,并且不支持断点续传功能,HTTP1.1则在请求头
引入了range头域,它允许只请求资源的某个部分,即返回码是206(Partial Content),方便了
开发者自由的选择以便于充分利用带宽和连接
错误通知的管理,在HTTP1.1中新增24个状态响应码,如409(Conflict)表示请求的资源与资源当
前状态冲突;410(Gone)表示服务器上的某个资源被永久性的删除
Host 头处理,在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址,因此,请求消息中的URL并
没有传递主机名(hostname)。但随着虚拟主机技术的发展,在一台物理服务器上可以存在多个
虚拟主机(Multi-homed Web Servers),并且它们共享一个IP地址。HTTP1.1的请求消息和响应
消息都应支持Host头域,且请求消息中如果没有Host头域会报告一个错误(400 Bad Request)
长连接,HTTP 1.1支持持久连接(PersistentConnection)和请求的流水线(Pipelining)处理,
在一个TCP连接上可以传送多个HTTP请求和响应,减少了建立和关闭连接的消耗和延迟,在
HTTP1.1中默认开启Connection: keep-alive,弥补了HTTP1.0每次请求都要创建连接的缺点
HTTP1.0和1.1的问题
HTTP1.x在传输数据时,每次都需要重新建立连接,无疑增加了大量的延迟时间,特别是在移动端
更为突出
HTTP1.x在传输数据时,所有传输的内容都是明文,客户端和服务器端都无法验证对方的身份,无
法保证数据的安全性
HTTP1.x在使用时,header里携带的内容过大,增加了传输的成本,并且每次请求header基本不
怎么变化,尤其在移动端增加用户流量
虽然HTTP1.x支持了keep-alive,来弥补多次创建连接产生的延迟,但是keep-alive使用多了同样会
给服务端带来大量的性能压力,并且对于单个文件被不断请求的服务(例如图片存放网站),keep
alive可能会极大的影响性能,因为它在文件被请求之后还保持了不必要的连接很长时间
HTTPS协议:
为解决安全问题,网景在1994年创建了HTTPS,并应用在网景导航者浏览器中。 最初,HTTP是与SSL一起使用的;在SSL逐渐演变到TLS时(其实两个是一个东西,只是名字不同而已),最新的HTTPS也由在2000年五月公布的RFC 2818正式确定下来。HTTPS就是安全版的HTTP,目前大型网站基本实现全站HTTPS
HTTPS特点

  • HTTPS协议需要到CA申请证书,一般免费证书很少,需要交费
  • HTTP协议运行在TCP之上,所有传输的内容都是明文,HTTPS运行在SSL/TLS之上,SSL/TLS运行在TCP之上,所有传输的内容都经过加密的
  • HTTP和HTTPS使用的是不同的连接方式,端口不同,前者是80,后者是443
  • HTTPS可以有效的防止运营商劫持,解决了防劫持的一个大问题
  • HTTPS 实现过程降低用户访问速度,但经过合理优化和部署,HTTPS 对速度的影响还是可以接受的

HTTP 2.0 协议

SPDY协议
SPDY:2009年谷歌研发,综合HTTPS和HTTP两者有点于一体的传输协议,主要特点:

  • 降低延迟,针对HTTP高延迟的问题,SPDY优雅的采取了多路复用(multiplexing)。多路复用通
    过多个请求stream共享一个tcp连接的方式,解决了HOL blocking的问题,降低了延迟同时提高了
    带宽的利用率
  • 请求优先级(request prioritization)。多路复用带来一个新的问题是,在连接共享的基础之上有
    可能会导致关键请求被阻塞。SPDY允许给每个request设置优先级,重要的请求就会优先得到响
    应。比如浏览器加载首页,首页的html内容应该优先展示,之后才是各种静态资源文件,脚本文件等加载,可以保证用户能第一时间看到网页内容
  • header压缩。HTTP1.x的header很多时候都是重复多余的。选择合适的压缩算法可以减小包的大
    小和数量
  • 基于HTTPS的加密协议传输,大大提高了传输数据的可靠性
  • 服务端推送(server push),采用了SPDY的网页,例如网页有一个sytle.css的请求,在客户端收到sytle.css数据的同时,服务端会将sytle.js的文件推送给客户端,当客户端再次尝试获取sytle.js时就可以直接从缓存中获取到,不用再发请求了

HTTP2协议
http/2.0:2015年发布,HTTP2.0是SPDY的升级版

  • 头信息和数据体都是二进制,称为头信息帧和数据帧
  • 复用TCP连接,在一个连接里,客户端和浏览器都可以同时发送多个请求或回应,且不用按顺序响应,避免了"队头堵塞",此双向的实时通信称为多工(Multiplexing)
  • 引入头信息压缩机制(header compression),头信息使用gzip或compress压缩后再发送;客户端和服务器同时维护一张头信息表,所有字段都会存入这个表,生成一个索引号,不发送同样字段,只发送索引号,提高速度
  • HTTP/2 允许服务器有新数据时未经请求,主动向客户端发送资源,而无需客户端拉取,即服务器推送(server push)

HTTP2.0和SPDY区别

  • HTTP2.0 支持明文 HTTP 传输,而 SPDY 强制使用 HTTPS
  • HTTP2.0 消息头的压缩算法采用 HPACK,而非 SPDY 采用的 DEFLATE

HTTP 版本速度比较

https://http2.akamai.com/demo/http2-lab.html

HTTP 3.0 协议

2020年发布 HTTP/3 的草案,2022年6月正式发布,使用QUIC(基于UDP协议)的新协议代替TCP。
它在传输层引入流作为一等公民,多个QUIC流共享相同的快速连接,因此不需要额外的握手,来创建新连接,QUIC流是独立交付的,在大多数情况下,丢包仅影响一个流,并不影响其他流,这就是QUIC 在传输层消除队头阻塞的方法。
QUIC是为移动互联网重度使用而设计的,携带智能手机的人们经常从一个网络切换到另一个网络,如果使用TCP,从一个网络切换到另一个网络是很慢的。

QUIC实现了一个称为连接ID的概念,它允许连接在IP地址和网络接口之间快速可靠地移动。

尽管HTTP/3刚刚发布,号称已经有25%的网站开始使用,许多浏览器也支持它。
QUIC的数据包格式
从协议栈可以看出:QUIC = HTTP/2 + TLS + UDP
QUIC的数据包分为Header和Data部分,其中Header是明文传输,包括Flags是标志位,Connection ID是连接ID,可用于连接迁移,QUIC Version是QUIC的版本号,Packet Number是包序号,用于保证可靠传输;Data部分是密文传输,是一些数据帧,有很多数据帧类型:Stream、ACK、Padding、
Blocked等,其中Stream帧传输应用数据。

HTTP 请求访问的完整过程

在这里插入图片描述
一次完整的http请求处理过程
1、建立连接:接收或拒绝连接请求
2、接收请求:接收客户端请求报文中对某资源的一次请求的过程
Web访问响应模型(Web I/O)

  • 单进程I/O模型:启动一个进程处理用户请求,而且一次只处理一个,多个请求被串行响应
  • 多进程I/O模型:并行启动多个进程,每个进程响应一个连接请求
  • 复用I/O结构:启动一个进程,同时响应N个连接请求
  • 复用的多进程I/O模型:启动M个进程,每个进程响应N个连接请求,同时接收M*N个请求

处理请求:服务器对请求报文进行解析,并获取请求的资源及请求方法等相关信息,根据方法,资
源,首部和可选的主体部分对请求进行处理
常用请求Method: GET、POST、HEAD、PUT、DELETE、TRACE、OPTIONS
访问资源:
服务器获取请求报文中请求的资源web服务器,即存放了web资源的服务器,负责向请求者提供对方
请求的静态资源,或动态运行后生成的资源
构建响应报文:
一旦Web服务器识别除了资源,就执行请求方法中描述的动作,并返回响应报文。响应报文中 包含
有响应状态码、响应首部,如果生成了响应主体的话,还包括响应主体
1)响应实体:如果事务处理产生了响应主体,就将内容放在响应报文中回送过去。响应报文中通常包括:
描述了响应主体MIME类型的Content-Type首部
描述了响应主体长度的Content-Length
实际报文的主体内容
2)URL重定向:web服务构建的响应并非客户端请求的资源,而是资源另外一个访问路径
3)MIME类型: Web服务器要负责确定响应主体的MIME类型。多种配置服务器的方法可将MIME类型与资源管理起来
发送响应报文
Web服务器通过连接发送数据时也会面临与接收数据一样的问题。服务器可能有很多条到各个客户
端的连接,有些是空闲的,有些在向服务器发送数据,还有一些在向客户端回送响应数据。服务器要记录连接的状态,还要特别注意对持久连接的处理。对非持久连接而言,服务器应该在发送了整条报文之后,关闭自己这一端的连接。对持久连接来说,连接可能仍保持打开状态,在这种情况下,服务器要正确地计算Content-Length首部,不然客户端就无法知道响应什么时候结束
记录日志
最后,当事务结束时,Web服务器会在日志文件中添加一个条目,来描述已执行的事务

总结
Web服务和HTTP协议为现代互联网提供了强大的基础设施,使得不同系统之间的交互变得更加容易和高效。无论你是新手还是有经验的开发者,了解这些基本概念都将对你的工作大有裨益。随着技术的进步,Web服务和HTTP协议也在不断发展,例如HTTP/2和即将到来的HTTP/3,它们带来了性能上的显著提升和新特性。保持对最新趋势的关注,可以帮助你更好地设计和实现高质量的Web服务。希望这篇博客能为你提供有价值的信息,帮助你在Web服务领域更加得心应手。

http://www.dtcms.com/a/347098.html

相关文章:

  • 55 C++ 现代C++编程艺术4-元编程
  • 总结:Maven多仓库多镜像源配置
  • 26.内置构造函数
  • STM32F1 USART介绍及应用
  • 【读书笔记】《从0到1》
  • MacOS + Android Studio:将 Git 仓库从 HTTP 切换为 SSH 并解决权限问题
  • VLOOKUP专题训练
  • 【Win】Motrix+Aria2浏览器下载加速
  • DeepSeek V3.1 横空出世:重新定义大语言模型的边界与可能
  • Qt5 项目的构建与部署详细讲解
  • 【Android】Fragment生命周期详解
  • 链表漫游指南:C++ 指针操作的艺术与实践
  • 【RK3576】【Android14】Android平台跟文件系统
  • PostgreSQL表分区与复杂查询性能优化实践指南
  • 【AI基础:神经网络】17、神经网络基石:从MP神经元到感知器全解析 - 原理、代码、异或困境与突破
  • 当 /etc/sysctl.d/ 目录下存在多个配置文件且配置项冲突时最终会使用哪个配置项
  • 嵌入式linux开发板 IP配置
  • Redis配置与数据类型详解及缓存优化实践
  • 使用VLLM部署大模型embedding/chat 的API
  • 秋招面试准备
  • Git的下载安装和使用以及和IDEA的关联
  • PLECS 中使用 C-Script 来模拟 NTC 热敏电阻(如 NTC3950B)
  • Spring Boot 校验分组(Validation Groups)高级用法全指南
  • 从词源和输出生成等角度详细解析PHP中常用文件操作类函数
  • Mac简单测试硬盘读写速度
  • 计算机网络 TLS握手中三个随机数详解
  • 鸿蒙应用网络开发实战:HTTP、WebSocket、文件下载与网络检测全攻略
  • Ubuntu 操作系统深度解析:从入门到精通(2025 最新版)
  • AP5414 LED驱动芯片:高效灵活,专业级照明解决方案
  • 20250823解决荣品RD-RK3588-MID核心板的底板的adb不通