深入剖析Tomcat读书笔记(一)

  • 该系列博文主要是介绍Web应用容器的一些原理。
  • 结合JavaEE的基础只是,介绍核心思想和实现机制
  • 介绍容器中其他组件,系列一。

前言

1、Servlet容器是如何工作的?

  • 创建一个Request对象,用可能会在Servlet中使用的信息填充该Request对象;
  • 创建一个调用Servletresponse对象,用来向WEB客户端发送响应;
  • 调用Servletservice()方法,将Request对象和Response对象。

复习Servlet的生命周期

  • Servlet 通过调用 init () 方法进行初始化。
  • Servlet 调用 service() 方法来处理客户端的请求。
  • Servlet 通过调用 destroy() 方法终止(结束)。
  • 最后,Servlet 是由 JVM 的垃圾回收器进行垃圾回收的。

2、Catalina

  • Catalina是一个成熟的软件,设计和开发的十分优雅,功能结构也是模块化的,主要分为以下两个模块:
    • 连接器 :负责将请求和容器相关联,为每个接收到的HTTP请求创建一个request对象和一个response,然后将处理过程交给容器。
    • 容器:从连接器中接受到requestresponse对象,并调用相应的Servletservice()方法。

第一章 简单的Web服务器

  • 通过复习Java套接字编程,搭建一个简单的Web服务器,同时复习了计算机网络的相关知识以及JavaIO中的输入输出流相关操作。

WEB服务器的工作原理

  • 服务器利用相应的服务器套接字(ServerSocket)(又称连接套接字,欢迎套接字(WelcomeSocket))对相应的IP地址和端口进行监听,等待客户端发送相关连接请求;
  • 客户端的套接字(ClientSocket)提出连接请求,要连接的目标是ServerSocket。为此,CllientSocket必须首先描述它要连接的服务器的套接字,指出服务器端套接字的地址Host和端口号port,然后就向服务器端套接字提出连接请求;
  • 服务器端套接字(ServerSocket)监听到或者说接收到客户端套接字(ClientSocket)的连接请求时,就响应客户端套接字的请求,建立一个新的线程,把服务器端套接字的描述发 给客户端,一旦客户端确认了此描述,双方就正式建立连接。而服务器端套接字继续处于监听状态,继续接收其他客户端套接字的连接请求;服务器端套接字(ServerSocket)在收到请求时会调用accept()方法为客户端创建一个新的套接字连接套接字(connection socket),实质上和客户端建立连接之后进行通信的是连接套接字

在编写过程中遇到的问题:(待解决)

编写代码时抛出异常:

java.net.SocketException: Software caused connection abort: socket write error.

  • 通过debug初步分析的结果是在浏览器生成发送给客户端响应时的输出流的write()函数出现了问题,查阅资料显示为在write()时输出流被提前关闭

测试过程中存在的问题:

IE浏览器测试成功,谷歌浏览器测试失败.

第二章 一个简单的Servlet容器

Servlet容器的搭建

  • 基于第一章WEB服务器的搭建,(第一章的WEB服务器只能访问服务器端的静态资源),在能访问静态资源static resources的基础之上,能够处理Servlet对应的相关请求并调用Servlet对应的类的方法。

  • 采用类加载器加载URI中对应的Servlet类名对应的类 + newInstance() 实例化的方法来实例化Servlet类

new关键字 和 newInstance实例化的区别

new关键字 和 newInstance实例化的区别

  • 创建对象的方式不一样,前者是创建一个新对象,后者是使用类加载机制.
  • new创建一个类的时候,这个类可以没有被加载。但是使用newInstance()方法的时候,就必须保证:
    • 1、这个类已经加载;
    • 2、这个类已经连接了。
  • newInstance: 弱类型。低效率。只能调用无参构造。
    new: 强类型。相对高效。能调用任何public构造。

参考博客:newInstance() 和 new 有什么区别?

ServletServerTwo相比ServletSeverOne

  • 使用了外观模式Facade(结构型)

外观模式

  • 概述:我们通过外观的包装,使应用程序只能看到外观对象,而不会看到具体的细节对象,这样无疑会降低应用程序的复杂度,并且提高了程序的可维护性。
  • 为子系统中的一组接口提供一个一致的界面, Facade模式定义了一个高层接口,这个接口使得这一子系统更加容易使用。引入外观角色之后,用户只需要直接与外观角色交互,用户与子系统之间的复杂关系由外观角色来实现,从而降低了系统的耦合度

参考博客:设计模式(九)外观模式Facade(结构型)

连接器

  • 连接器:用于更好地创建Request(HttpServletRequest)对象和Response(HttpServletResponse)对象,并传递给service()方法

Servlet,GenericServlet,HttpServlet之间的异同:Servlet简介与Servlet和HttpServlet运行的流程

StringManager

每个包对应的StringManager实例,用于读取当前包下的存放异常和错误消息的properties文件。

  • 每个包对应一个StringManager实例,采用单例模式进行单例对象的获取,以包名package name作为入参。

单例模式复习:通过将构造方法私有化,使用公有化的方法来调用构造方法来保证单例。

  • 通过将包名package name作为键值对的键,在StringManager对应的HashTable中去查找,使用StringManagergetManager()方法来获取到StringManger实例。
  • 获取到StringManager实例后,再使用getString(String key),以错误码作为入参来获取具体的错误信息。

HttpConnector

  • 等待Http请求
  • 为每个请求创建相应的HttpProcessor实例
  • 调用process()方法

HttpProcessor

主要任务

  • 创建一个HttpRequest对象
    • 同时引入HTTP请求的HeaderCookie和请求参数以及相关方法。
  • 创建一个HttpResponse对象
  • 解析HTTP请求的第一行内容和请求头信息,填充HttpRequest对象
  • Socket作为入参,调用process(),并根据URI判断请求类型并作出相应的处理,把创建的HttpRequestHttpResponse对象传递给不同类型的处理器。
  • 使用StringManager来发送错误消息

解析HTTP请求:

  • 读取套接字的输入流;调用输入流的read()方法,从请求行中获取到了方法URIHTTP协议版本等信息;
  • 解析请求行:
    image
    • 会使用SocketInputStream的相关方法来解析请求头并提取出URI,再根据URI格式解析出URI中的相关信息(其中主要包括Pathname查询字符串SearchJSessionID),再为这些相关信息创建相应的对象,存储在HttpRequest

JSESSIONID,用于携带会话标识符,会话标识符通常是作为Cookie嵌入的,但是当浏览器禁用了Cookie时,也可以将会话标识符嵌入到查询字符串中
image

  • 解析请求头:

    • 在读取了请求头的名称和值后,调用HttpRequestaddHeader()方法,将其添加到HttpRequest对象的HashMap中。
    • 由于请求头中可能包含一些属性设置信息。例如Content-type,Content-length,Cookies等,则进行相应的处理后再填充到HttpRequest对象中。
  • 解析Cookie

    • 什么是Cookie

    Cookie :
    Cookie实际上是一小段的文本信息(键/值的形式)。客户端请求服务器,如果服务器需要记录该用户状态,就使用response向客户端浏览器颁发一个Cookie。客户端浏览器会把Cookie保存起来。当浏览器再请求该网站时,浏览器把请求的网址连同该Cookie一同提交给服务器。服务器检查该Cookie,以此来辨认用户状态。服务器还可以根据需要修改Cookie的内容。
    产生原因: 由于HTTP是一种无状态的协议,服务器单从网络连接上无从知道客户身份。故需要引入一种来跟踪客户端的会话信息。
    参考博文:Cookie/Session机制详解

    • 核心函数parseCookieHeader() : 由于Cookie中存放的值是键/值的形式,例如:
      image
      其中各个键值对之间是以分号进行分隔的,之间又是以=号进行连接,所以该函数便是充分利用字符串的格式特性来对Cookie使用while()循环来进行解析。
      源码如下
        public static Cookie[] parseCookieHeader(String header) {
        if (header != null && header.length() >= 1) {
            ArrayList cookies = new ArrayList();
            //注意循环体中的59和61,其实是ASCII码
            while(header.length() > 0) {
                int semicolon = header.indexOf(59);
                if (semicolon < 0) {
                    semicolon = header.length();
                }
    
                if (semicolon == 0) {
                    break;
                }
    
                String token = header.substring(0, semicolon);
                if (semicolon < header.length()) {
                    header = header.substring(semicolon + 1);
                } else {
                    header = "";
                }
    
                try {
                    int equals = token.indexOf(61);
                    if (equals > 0) {
                        String name = token.substring(0, equals).trim();
                        String value = token.substring(equals + 1).trim();
                        cookies.add(new Cookie(name, value));
                    }
                } catch (Throwable var7) {
                    ;
                }
            }
    
            return (Cookie[])cookies.toArray(new Cookie[cookies.size()]);
        } else {
            return new Cookie[0];
        }
    }
    
  • 获取参数

    • 常见的获取参数的方法有getParameterMap(),getParameter(),getParameterNames(),getParameterValues(),这些方法都是在对请求报文中的参数进行了解析的基础之上展开的,都会调用parseParameter()方法。
    • GET请求报文中的参数位于URI中的查询字符串
    • POST请求报文的参数则会存储在HashMap中,而且是一个比较特殊的HashMap(ParameterMap),其中ParameterMap被设计成了一种相对安全的机制(只有在locked的布尔值为false时,才能对HashMap进行相应的修改),被设计成这种机制是因为HashMap本身的线程安全问题。