- 该系列博文主要是介绍Web应用容器的一些原理。
- 结合JavaEE的基础只是,介绍核心思想和实现机制
- 介绍容器中其他组件,系列一。
前言
1、Servlet容器是如何工作的?
- 创建一个
Request
对象,用可能会在Servlet
中使用的信息填充该Request
对象; - 创建一个调用
Servlet
的response
对象,用来向WEB客户端发送响应; - 调用
Servlet
的service()
方法,将Request
对象和Response
对象。
复习Servlet的生命周期
- Servlet 通过调用
init ()
方法进行初始化。- Servlet 调用
service()
方法来处理客户端的请求。- Servlet 通过调用
destroy()
方法终止(结束)。- 最后,Servlet 是由 JVM 的垃圾回收器进行垃圾回收的。
2、Catalina
Catalina
是一个成熟的软件,设计和开发的十分优雅,功能结构也是模块化的,主要分为以下两个模块:连接器
:负责将请求和容器相关联,为每个接收到的HTTP请求创建一个request
对象和一个response
,然后将处理过程交给容器。容器
:从连接器中接受到request
和response
对象,并调用相应的Servlet
的service()
方法。
第一章 简单的Web服务器
- 通过复习
Java套接字编程
,搭建一个简单的Web服务器
,同时复习了计算机网络的相关知识以及JavaIO
中的输入输出流
相关操作。
WEB服务器的工作原理
- 服务器利用相应的
服务器套接字(ServerSocket)
(又称连接套接字,欢迎套接字(WelcomeSocket)
)对相应的IP地址和端口进行监听,等待客户端发送相关连接请求; 客户端的套接字(ClientSocket)
提出连接请求,要连接的目标是ServerSocket
。为此,CllientSocket
必须首先描述它要连接的服务器的套接字,指出服务器端套接字的地址Host
和端口号port
,然后就向服务器端套接字
提出连接请求;- 当
服务器端套接字(ServerSocket)
监听到或者说接收到客户端套接字(ClientSocket)
的连接请求时,就响应客户端套接字
的请求,建立一个新的线程,把服务器端套接字
的描述发 给客户端,一旦客户端确认了此描述,双方就正式建立连接。而服务器端套接字
继续处于监听状态,继续接收其他客户端套接字
的连接请求;服务器端套接字(ServerSocket)
在收到请求时会调用accept()
方法为客户端创建一个新的套接字连接套接字(connection socket)
,实质上和客户端建立连接之后进行通信的是连接套接字
在编写过程中遇到的问题:(待解决)
编写代码时抛出异常:
java.net.SocketException: Software caused connection abort: socket write error.
- 通过debug初步分析的结果是在浏览器生成发送给客户端响应时的输出流的
write()
函数出现了问题,查阅资料显示为在write()时输出流被提前关闭
测试过程中存在的问题:
IE浏览器测试成功,谷歌浏览器测试失败.
第二章 一个简单的Servlet容器
Servlet容器的搭建
-
基于第一章WEB服务器的搭建,(第一章的WEB服务器只能访问服务器端的静态资源),在能访问静态资源
static resources
的基础之上,能够处理Servlet
对应的相关请求并调用Servlet
对应的类的方法。 -
采用类加载器加载URI中对应的Servlet类名对应的类 + newInstance() 实例化的方法来实例化Servlet类
new关键字 和 newInstance实例化的区别
new关键字 和 newInstance实例化的区别
- 创建对象的方式不一样,前者是创建一个新对象,后者是使用类加载机制.
- new创建一个类的时候,这个类可以没有被加载。但是使用newInstance()方法的时候,就必须保证:
- 1、这个类已经加载;
- 2、这个类已经连接了。
- newInstance: 弱类型。低效率。只能调用无参构造。
new: 强类型。相对高效。能调用任何public构造。
ServletServerTwo相比ServletSeverOne
- 使用了外观模式Facade(结构型)
外观模式
- 概述:我们通过外观的包装,使应用程序只能看到外观对象,而不会看到具体的细节对象,这样无疑会降低应用程序的复杂度,并且提高了程序的可维护性。
- 为子系统中的一组接口提供一个一致的界面, Facade模式定义了一个高层接口,这个接口使得这一子系统更加容易使用。引入外观角色之后,用户只需要直接与外观角色交互,用户与子系统之间的复杂关系由外观角色来实现,从而降低了系统的耦合度
连接器
连接器
:用于更好地创建Request(HttpServletRequest)
对象和Response(HttpServletResponse)
对象,并传递给service()
方法
Servlet,GenericServlet,HttpServlet之间的异同:Servlet简介与Servlet和HttpServlet运行的流程
StringManager
每个包对应的
StringManager
实例,用于读取当前包下的存放异常和错误消息的properties
文件。
- 每个包对应一个
StringManager
实例,采用单例模式进行单例对象的获取,以包名package name
作为入参。
单例模式复习:通过将构造方法私有化,使用公有化的方法来调用构造方法来保证单例。
- 通过将包名
package name
作为键值对的键,在StringManager
对应的HashTable
中去查找,使用StringManager
的getManager()
方法来获取到StringManger
实例。 - 获取到
StringManager
实例后,再使用getString(String key)
,以错误码作为入参来获取具体的错误信息。
HttpConnector
- 等待
Http
请求 - 为每个请求创建相应的
HttpProcessor
实例 - 调用
process()
方法
HttpProcessor
主要任务
- 创建一个
HttpRequest
对象- 同时引入
HTTP
请求的Header
和Cookie
和请求参数以及相关方法。
- 同时引入
- 创建一个
HttpResponse
对象 - 解析
HTTP
请求的第一行内容和请求头信息,填充HttpRequest
对象 - 将
Socket
作为入参,调用process()
,并根据URI
判断请求类型并作出相应的处理,把创建的HttpRequest
和HttpResponse
对象传递给不同类型的处理器。 - 使用
StringManager
来发送错误消息
解析HTTP
请求:
- 读取套接字的输入流;调用输入流的
read()
方法,从请求行中获取到了方法
、URI
、HTTP协议版本
等信息; - 解析请求行:
- 会使用
SocketInputStream
的相关方法来解析请求头并提取出URI
,再根据URI
格式解析出URI
中的相关信息(其中主要包括Pathname
、查询字符串Search
和JSessionID
),再为这些相关信息创建相应的对象,存储在HttpRequest
中
- 会使用
JSESSIONID
,用于携带会话标识符,会话标识符通常是作为Cookie
嵌入的,但是当浏览器禁用了Cookie
时,也可以将会话标识符嵌入到查询字符串中
-
解析请求头:
- 在读取了请求头的名称和值后,调用
HttpRequest
的addHeader()
方法,将其添加到HttpRequest
对象的HashMap
中。 - 由于请求头中可能包含一些属性设置信息。例如
Content-type
,Content-length
,Cookies
等,则进行相应的处理后再填充到HttpRequest
对象中。
- 在读取了请求头的名称和值后,调用
-
解析
Cookie
- 什么是
Cookie
?
Cookie :
Cookie
实际上是一小段的文本信息(键/值的形式)。客户端请求服务器,如果服务器需要记录该用户状态,就使用response
向客户端浏览器颁发一个Cookie
。客户端浏览器会把Cookie
保存起来。当浏览器再请求该网站时,浏览器把请求的网址连同该Cookie
一同提交给服务器。服务器检查该Cookie
,以此来辨认用户状态。服务器还可以根据需要修改Cookie
的内容。
产生原因: 由于HTTP是一种无状态的协议,服务器单从网络连接上无从知道客户身份。故需要引入一种来跟踪客户端的会话信息。
参考博文:Cookie/Session机制详解- 核心函数
parseCookieHeader()
: 由于Cookie
中存放的值是键/值
的形式,例如:
其中各个键值对之间是以分号进行分隔的,键和值之间又是以=
号进行连接,所以该函数便是充分利用字符串的格式特性来对Cookie
使用while()
循环来进行解析。
源码如下:
public static Cookie[] parseCookieHeader(String header) { if (header != null && header.length() >= 1) { ArrayList cookies = new ArrayList(); //注意循环体中的59和61,其实是ASCII码 while(header.length() > 0) { int semicolon = header.indexOf(59); if (semicolon < 0) { semicolon = header.length(); } if (semicolon == 0) { break; } String token = header.substring(0, semicolon); if (semicolon < header.length()) { header = header.substring(semicolon + 1); } else { header = ""; } try { int equals = token.indexOf(61); if (equals > 0) { String name = token.substring(0, equals).trim(); String value = token.substring(equals + 1).trim(); cookies.add(new Cookie(name, value)); } } catch (Throwable var7) { ; } } return (Cookie[])cookies.toArray(new Cookie[cookies.size()]); } else { return new Cookie[0]; } }
- 什么是
-
获取参数
- 常见的获取参数的方法有
getParameterMap()
,getParameter()
,getParameterNames()
,getParameterValues()
,这些方法都是在对请求报文中的参数进行了解析的基础之上展开的,都会调用parseParameter()
方法。
GET
请求报文中的参数位于URI
中的查询字符串;POST
请求报文的参数则会存储在HashMap
中,而且是一个比较特殊的HashMap(ParameterMap)
,其中ParameterMap
被设计成了一种相对安全的机制(只有在locked
的布尔值为false
时,才能对HashMap
进行相应的修改),被设计成这种机制是因为HashMap
本身的线程安全问题。
- 常见的获取参数的方法有