- 该系列博文主要是介绍Web应用容器的一些原理。
- 结合JavaEE的基础只是,介绍核心思想和实现机制
- 介绍容器中其他组件,系列一。
前言
1、Servlet容器是如何工作的?
- 创建一个
Request对象,用可能会在Servlet中使用的信息填充该Request对象; - 创建一个调用
Servlet的response对象,用来向WEB客户端发送响应; - 调用
Servlet的service()方法,将Request对象和Response对象。
复习Servlet的生命周期
- Servlet 通过调用
init ()方法进行初始化。- Servlet 调用
service()方法来处理客户端的请求。- Servlet 通过调用
destroy()方法终止(结束)。- 最后,Servlet 是由 JVM 的垃圾回收器进行垃圾回收的。
2、Catalina
Catalina是一个成熟的软件,设计和开发的十分优雅,功能结构也是模块化的,主要分为以下两个模块:连接器:负责将请求和容器相关联,为每个接收到的HTTP请求创建一个request对象和一个response,然后将处理过程交给容器。容器:从连接器中接受到request和response对象,并调用相应的Servlet的service()方法。
第一章 简单的Web服务器
- 通过复习
Java套接字编程,搭建一个简单的Web服务器,同时复习了计算机网络的相关知识以及JavaIO中的输入输出流相关操作。
WEB服务器的工作原理
- 服务器利用相应的
服务器套接字(ServerSocket)(又称连接套接字,欢迎套接字(WelcomeSocket))对相应的IP地址和端口进行监听,等待客户端发送相关连接请求; 客户端的套接字(ClientSocket)提出连接请求,要连接的目标是ServerSocket。为此,CllientSocket必须首先描述它要连接的服务器的套接字,指出服务器端套接字的地址Host和端口号port,然后就向服务器端套接字提出连接请求;- 当
服务器端套接字(ServerSocket)监听到或者说接收到客户端套接字(ClientSocket)的连接请求时,就响应客户端套接字的请求,建立一个新的线程,把服务器端套接字的描述发 给客户端,一旦客户端确认了此描述,双方就正式建立连接。而服务器端套接字继续处于监听状态,继续接收其他客户端套接字的连接请求;服务器端套接字(ServerSocket)在收到请求时会调用accept()方法为客户端创建一个新的套接字连接套接字(connection socket),实质上和客户端建立连接之后进行通信的是连接套接字
在编写过程中遇到的问题:(待解决)
编写代码时抛出异常:
java.net.SocketException: Software caused connection abort: socket write error.
- 通过debug初步分析的结果是在浏览器生成发送给客户端响应时的输出流的
write()函数出现了问题,查阅资料显示为在write()时输出流被提前关闭
测试过程中存在的问题:
IE浏览器测试成功,谷歌浏览器测试失败.
第二章 一个简单的Servlet容器
Servlet容器的搭建
-
基于第一章WEB服务器的搭建,(第一章的WEB服务器只能访问服务器端的静态资源),在能访问静态资源
static resources的基础之上,能够处理Servlet对应的相关请求并调用Servlet对应的类的方法。 -
采用类加载器加载URI中对应的Servlet类名对应的类 + newInstance() 实例化的方法来实例化Servlet类
new关键字 和 newInstance实例化的区别
new关键字 和 newInstance实例化的区别
- 创建对象的方式不一样,前者是创建一个新对象,后者是使用类加载机制.
- new创建一个类的时候,这个类可以没有被加载。但是使用newInstance()方法的时候,就必须保证:
- 1、这个类已经加载;
- 2、这个类已经连接了。
- newInstance: 弱类型。低效率。只能调用无参构造。
new: 强类型。相对高效。能调用任何public构造。
ServletServerTwo相比ServletSeverOne
- 使用了外观模式Facade(结构型)
外观模式
- 概述:我们通过外观的包装,使应用程序只能看到外观对象,而不会看到具体的细节对象,这样无疑会降低应用程序的复杂度,并且提高了程序的可维护性。
- 为子系统中的一组接口提供一个一致的界面, Facade模式定义了一个高层接口,这个接口使得这一子系统更加容易使用。引入外观角色之后,用户只需要直接与外观角色交互,用户与子系统之间的复杂关系由外观角色来实现,从而降低了系统的耦合度
连接器
连接器:用于更好地创建Request(HttpServletRequest)对象和Response(HttpServletResponse)对象,并传递给service()方法
Servlet,GenericServlet,HttpServlet之间的异同:Servlet简介与Servlet和HttpServlet运行的流程
StringManager
每个包对应的
StringManager实例,用于读取当前包下的存放异常和错误消息的properties文件。
- 每个包对应一个
StringManager实例,采用单例模式进行单例对象的获取,以包名package name作为入参。
单例模式复习:通过将构造方法私有化,使用公有化的方法来调用构造方法来保证单例。
- 通过将包名
package name作为键值对的键,在StringManager对应的HashTable中去查找,使用StringManager的getManager()方法来获取到StringManger实例。 - 获取到
StringManager实例后,再使用getString(String key),以错误码作为入参来获取具体的错误信息。
HttpConnector
- 等待
Http请求 - 为每个请求创建相应的
HttpProcessor实例 - 调用
process()方法
HttpProcessor
主要任务
- 创建一个
HttpRequest对象- 同时引入
HTTP请求的Header和Cookie和请求参数以及相关方法。
- 同时引入
- 创建一个
HttpResponse对象 - 解析
HTTP请求的第一行内容和请求头信息,填充HttpRequest对象 - 将
Socket作为入参,调用process(),并根据URI判断请求类型并作出相应的处理,把创建的HttpRequest和HttpResponse对象传递给不同类型的处理器。 - 使用
StringManager来发送错误消息
解析HTTP请求:
- 读取套接字的输入流;调用输入流的
read()方法,从请求行中获取到了方法、URI、HTTP协议版本等信息; - 解析请求行:
- 会使用
SocketInputStream的相关方法来解析请求头并提取出URI,再根据URI格式解析出URI中的相关信息(其中主要包括Pathname、查询字符串Search和JSessionID),再为这些相关信息创建相应的对象,存储在HttpRequest中
- 会使用
JSESSIONID,用于携带会话标识符,会话标识符通常是作为Cookie嵌入的,但是当浏览器禁用了Cookie时,也可以将会话标识符嵌入到查询字符串中
-
解析请求头:
- 在读取了请求头的名称和值后,调用
HttpRequest的addHeader()方法,将其添加到HttpRequest对象的HashMap中。 - 由于请求头中可能包含一些属性设置信息。例如
Content-type,Content-length,Cookies等,则进行相应的处理后再填充到HttpRequest对象中。
- 在读取了请求头的名称和值后,调用
-
解析
Cookie- 什么是
Cookie?
Cookie :
Cookie实际上是一小段的文本信息(键/值的形式)。客户端请求服务器,如果服务器需要记录该用户状态,就使用response向客户端浏览器颁发一个Cookie。客户端浏览器会把Cookie保存起来。当浏览器再请求该网站时,浏览器把请求的网址连同该Cookie一同提交给服务器。服务器检查该Cookie,以此来辨认用户状态。服务器还可以根据需要修改Cookie的内容。
产生原因: 由于HTTP是一种无状态的协议,服务器单从网络连接上无从知道客户身份。故需要引入一种来跟踪客户端的会话信息。
参考博文:Cookie/Session机制详解- 核心函数
parseCookieHeader(): 由于Cookie中存放的值是键/值的形式,例如:

其中各个键值对之间是以分号进行分隔的,键和值之间又是以=号进行连接,所以该函数便是充分利用字符串的格式特性来对Cookie使用while()循环来进行解析。
源码如下:
public static Cookie[] parseCookieHeader(String header) { if (header != null && header.length() >= 1) { ArrayList cookies = new ArrayList(); //注意循环体中的59和61,其实是ASCII码 while(header.length() > 0) { int semicolon = header.indexOf(59); if (semicolon < 0) { semicolon = header.length(); } if (semicolon == 0) { break; } String token = header.substring(0, semicolon); if (semicolon < header.length()) { header = header.substring(semicolon + 1); } else { header = ""; } try { int equals = token.indexOf(61); if (equals > 0) { String name = token.substring(0, equals).trim(); String value = token.substring(equals + 1).trim(); cookies.add(new Cookie(name, value)); } } catch (Throwable var7) { ; } } return (Cookie[])cookies.toArray(new Cookie[cookies.size()]); } else { return new Cookie[0]; } } - 什么是
-
获取参数
- 常见的获取参数的方法有
getParameterMap(),getParameter(),getParameterNames(),getParameterValues(),这些方法都是在对请求报文中的参数进行了解析的基础之上展开的,都会调用parseParameter()方法。
GET请求报文中的参数位于URI中的查询字符串;POST请求报文的参数则会存储在HashMap中,而且是一个比较特殊的HashMap(ParameterMap),其中ParameterMap被设计成了一种相对安全的机制(只有在locked的布尔值为false时,才能对HashMap进行相应的修改),被设计成这种机制是因为HashMap本身的线程安全问题。
- 常见的获取参数的方法有
