当用户在浏览器输入一个 URL 并访问服务器时, 这个请求是如何到达对应的 Servlet 的?
当用户在浏览器输入一个 URL 并按下回车键后,这个请求到达对应的 Servlet 的过程涉及多个层面和组件。下面是我们一起分析一下:
-
浏览器解析 URL:
- 用户输入
http://www.example.com:8080/myapp/userServlet?action=login
- 浏览器解析出:
- 协议 (Protocol):
http
- 主机名 (Hostname):
www.example.com
- 端口 (Port):
8080
(如果是http
默认 80,https
默认 443,这里显式指定了 8080) - 路径 (Path):
/myapp/userServlet
- 查询参数 (Query String):
action=login
- 协议 (Protocol):
- 用户输入
-
DNS 查询:
- 浏览器首先检查本地缓存中是否有
www.example.com
对应的 IP 地址。 - 如果没有,它会向操作系统的 DNS 解析器发出请求。
- 操作系统会检查自己的缓存,然后可能向本地网络配置的 DNS 服务器(通常由 ISP 提供)发送查询。
- DNS 服务器会进行递归或迭代查询,最终从权威 DNS 服务器获取
www.example.com
的 IP 地址(例如192.168.1.100
)。 - 这个 IP 地址返回给浏览器。
- 浏览器首先检查本地缓存中是否有
-
建立 TCP 连接:
- 浏览器使用获取到的 IP 地址 (
192.168.1.100
) 和端口号 (8080
) 与服务器发起一个 TCP 连接。 - 这通常涉及 TCP 的三次握手(SYN, SYN-ACK, ACK)过程,确保客户端和服务器之间建立了可靠的通信通道。
- 如果是 HTTPS 请求,在 TCP 连接建立之后,还会进行 SSL/TLS 握手,以建立安全的加密通道。
- 浏览器使用获取到的 IP 地址 (
-
发送 HTTP 请求:
- TCP 连接建立后,浏览器会构建一个 HTTP 请求报文,并通过这个连接发送给服务器。
- 请求报文示例:
GET /myapp/userServlet?action=login HTTP/1.1 Host: www.example.com:8080 User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) ... Accept: text/html,application/xhtml+xml,... Accept-Language: en-US,en;q=0.5 Connection: keep-alive // ... 其他头部信息
- 关键部分是请求行 (
GET /myapp/userServlet?action=login HTTP/1.1
) 和Host
头部。
-
服务器接收请求 (Web 服务器 / 应用服务器):
- 请求到达服务器的 IP 地址和指定端口 (
192.168.1.100:8080
)。 - 监听器 (Listener/Connector): 在这个端口上监听的是 Servlet 容器(如 Tomcat, Jetty, JBoss/WildFly, WebLogic 等)的连接器组件。例如,Tomcat 的 Coyote Connector。
- 可选的 Web 服务器 (如 Apache HTTP Server, Nginx): 有时,在 Servlet 容器前面会有一个专门的 Web 服务器。这个 Web 服务器可能处理静态内容、SSL 终止、负载均衡等,并将动态内容的请求(如 Servlet 请求)通过特定协议(如 AJP 或 HTTP 代理)转发给 Servlet 容器。如果存在这种情况,那么首先是这个 Web 服务器接收请求,然后转发。
- 请求到达服务器的 IP 地址和指定端口 (
-
Servlet 容器处理请求:
- 解析请求: Servlet 容器的连接器接收到原始的 HTTP 请求字节流,并将其解析成一个
HttpServletRequest
对象和一个HttpServletResponse
对象。 - 上下文 (Context/Web Application) 选择:
- 容器会根据请求 URL 的路径部分(
/myapp/userServlet
)来确定哪个 Web 应用(也称为上下文,Context)应该处理这个请求。 - 在 Tomcat 中,这通常是通过匹配在
server.xml
或各个 Web 应用的context.xml
中定义的上下文路径(Context Path,例如/myapp
)来完成的。 - 一旦确定了是
myapp
这个 Web 应用来处理请求,后续的处理就在这个 Web 应用的范围内进行。
- 容器会根据请求 URL 的路径部分(
- 解析请求: Servlet 容器的连接器接收到原始的 HTTP 请求字节流,并将其解析成一个
-
Servlet 映射 (Servlet Mapping):
- 在选定的 Web 应用 (
myapp
) 内部,Servlet 容器需要根据请求 URI 的剩余部分 (/userServlet
) 来找到具体的 Servlet 来处理请求。 - 这个映射规则定义在 Web 应用的部署描述符
web.xml
文件中,或者通过 Servlet 3.0+ 的注解 (@WebServlet
) 来定义。 web.xml
方式:<servlet><servlet-name>MyUserServlet</servlet-name><servlet-class>com.example.UserServlet</servlet-class> </servlet> <servlet-mapping><servlet-name>MyUserServlet</servlet-name><url-pattern>/userServlet</url-pattern> <!-- 这个模式匹配请求 --> </servlet-mapping>
- 注解方式 (在
com.example.UserServlet.java
文件中):package com.example;import javax.servlet.annotation.WebServlet; import javax.servlet.http.HttpServlet; // ...其他导入@WebServlet("/userServlet") // 这个注解的 URL 模式匹配请求 public class UserServlet extends HttpServlet {// ... servlet 代码 }
- 容器会查找与
/userServlet
匹配的url-pattern
。匹配规则通常有:- 精确匹配:
/userServlet
完全匹配。 - 路径匹配: 例如
/user/*
会匹配/user/login
,/user/profile
等。 - 扩展名匹配: 例如
*.do
会匹配所有以.do
结尾的路径。 - 默认 Servlet: 如果没有其他匹配,可能会交给一个默认的 Servlet(通常用于处理静态资源或返回 404)。
- 精确匹配:
- 在本例中,
/userServlet
会精确匹配到名为MyUserServlet
(或直接通过注解指定的UserServlet
类)的 Servlet。
- 在选定的 Web 应用 (
-
过滤器链 (Filter Chain) - 如果有:
- 在请求到达目标 Servlet 之前,它可能会经过一个或多个过滤器 (
javax.servlet.Filter
)。 - 过滤器的映射也定义在
web.xml
或通过@WebFilter
注解。 - 过滤器可以检查请求、修改请求/响应头、记录日志、进行身份验证/授权等。
- 如果过滤器链中的某个过滤器决定不再将请求传递下去,它可以直接生成响应,请求就不会到达目标 Servlet。
- 在请求到达目标 Servlet 之前,它可能会经过一个或多个过滤器 (
-
Servlet 实例化和调用:
- 如果这是第一次请求这个 Servlet,或者 Servlet 实例尚未被创建,Servlet 容器会:
- 加载 Servlet 类 (
com.example.UserServlet
)。 - 创建 Servlet 的一个实例。
- 调用该实例的
init()
方法(只调用一次,在 Servlet 生命周期中)。
- 加载 Servlet 类 (
- 如果 Servlet 实例已经存在,容器会直接使用它。
- 容器然后调用 Servlet 实例的
service(HttpServletRequest, HttpServletResponse)
方法,并将之前创建的HttpServletRequest
和HttpServletResponse
对象传递给它。 HttpServlet
的service()
方法会根据 HTTP 请求的方法(GET, POST, PUT, DELETE 等)调用相应的doGet()
,doPost()
,doPut()
,doDelete()
等方法。在我们的例子中,因为是GET
请求,所以会调用UserServlet
的doGet()
方法。
- 如果这是第一次请求这个 Servlet,或者 Servlet 实例尚未被创建,Servlet 容器会:
-
Servlet 处理请求:
UserServlet
的doGet()
方法现在开始执行业务逻辑。- 它可以从
HttpServletRequest
对象中获取参数(如request.getParameter("action")
会得到 “login”)、头部信息、请求体等。 - 它可以与后端服务、数据库等交互。
- 它会使用
HttpServletResponse
对象来设置响应状态码、响应头,并写入响应体(例如 HTML 页面、JSON 数据等)。
-
响应返回:
- 当 Servlet 的
doGet()
(或其他doXXX
) 方法执行完毕后,控制权返回给 Servlet 容器。 - 如果之前有过滤器,响应会反向通过过滤器链,允许过滤器修改响应。
- Servlet 容器将
HttpServletResponse
对象中的内容(状态行、头部、响应体)组装成一个 HTTP 响应报文。 - 通过之前建立的 TCP 连接,将 HTTP 响应报文发送回浏览器。
- 当 Servlet 的
-
浏览器渲染:
- 浏览器接收到 HTTP 响应。
- 如果响应是 HTML,浏览器会解析 HTML、CSS,执行 JavaScript,并渲染页面给用户看。
- 如果 HTTP 头部中
Connection: keep-alive
,TCP 连接可能会保持打开状态以备后续请求;否则,连接可能会关闭。
这个过程涉及了网络通信、DNS 解析、TCP/IP 协议栈、Web 服务器(可选)、Servlet 容器内部的复杂机制(连接器、上下文管理、Servlet 映射、过滤器、Servlet 生命周期管理)。核心在于 Servlet 容器如何根据请求的 URL 将其路由到正确的 Web 应用,并进一步路由到该应用中正确的 Servlet。