Tomcat学习实录

发表于 2024-10-21 更新于 2024-10-28 分类于 Java系列阅读次数：

本文字数： 4.7k 阅读时长 ≈ 17 分钟

前言

Tomcat的设计思路，整体架构，设计精髓
Tomcat的线程模型详解及其调优
Tomcat的类加载机制和热加载部署的实现原理

知识点总结

一、Tomcat 核心概念

Tomcat 的核心组件及其作用？
- Connector：处理网络连接（HTTP/HTTPS/AJP），将请求交给 Container。
- Container：包含 Engine（虚拟主机）、Host（域名）、Context（Web 应用）、Wrapper（Servlet）。
- Service：组合 Connector 和 Container，一个 Tomcat 实例可包含多个 Service。
Tomcat 的请求处理流程是什么？
- 客户端请求 → Connector 接收 → 解析生成 Request/Response → 传递给 Engine → 匹配 Host/Context/Wrapper → 调用 Servlet 的 service() 方法。
Tomcat 的类加载机制有什么特点？
- 自定义类加载器（WebappClassLoader），每个 Web 应用独立加载类，隔离不同应用的类库，防止冲突。
- 加载顺序：WEB-INF/classes → WEB-INF/lib → Common → Shared → System 类加载器。

二、Tomcat 源码实现

Tomcat 的启动流程（源码层面）？
- 入口类 Bootstrap.main() → 初始化 Catalina → 加载 server.xml → 创建 Server/Service/Connector/Container → 启动组件（Lifecycle 接口）。
- 关键类：Catalina（主控类）、StandardServer、StandardService、Connector（协议处理）。
Connector 的底层实现（BIO/NIO/APR）？
- BIO：阻塞式 IO，每个请求分配一个线程（org.apache.tomcat.util.net.JIoEndpoint）。
- NIO：非阻塞 IO，基于 Java NIO（org.apache.tomcat.util.net.NioEndpoint），Tomcat 8.5+ 默认使用 NIO。
- APR：基于本地库（Apache Portable Runtime），性能更高，但依赖本地环境。
Tomcat 如何处理一个 HTTP 请求（源码流程）？
- NioEndpoint 接收 Socket → 封装为 SocketWrapper → 交给 Http11Processor 解析 HTTP 报文 → 生成 Request → 调用 CoyoteAdapter.service() → 路由到对应 Servlet。
Wrapper 如何关联到具体的 Servlet？
- 在 web.xml 或注解中定义 Servlet 映射，Tomcat 解析后生成 Wrapper 实例，通过 Wrapper.allocate() 创建或复用 Servlet 实例。

三、Spring Boot 内嵌 Tomcat

Spring Boot 如何内嵌 Tomcat？
- 通过 spring-boot-starter-web 引入 tomcat-embed-core 依赖，启动时自动创建 Tomcat 实例，替代传统 WAR 包部署。
- 关键类：TomcatServletWebServerFactory（创建 Tomcat 实例）、TomcatWebServer（启动 Tomcat）。
内嵌 Tomcat 的启动流程？
- Spring Boot 启动 → ServletWebServerApplicationContext 初始化 → 调用 TomcatServletWebServerFactory.getWebServer() → 创建 Tomcat 实例并配置 Connector/Context → 启动 Tomcat。
如何自定义内嵌 Tomcat 的参数？
- 通过 application.properties 配置（如 server.tomcat.max-threads=200）。
- 自定义 TomcatConnectorCustomizer 或 TomcatContextCustomizer Bean。
Spring Boot 中如何注册 Servlet/Filter？
- 方式1：通过 ServletRegistrationBean 或 FilterRegistrationBean。
- 方式2：使用 @WebServlet 或 @WebFilter 注解，并添加 @ServletComponentScan 扫描。

四、性能调优与高级特性

Tomcat 的调优参数有哪些？
- maxThreads：处理请求的最大线程数。
- acceptCount：等待队列长度（队列满时拒绝连接）。
- connectionTimeout：连接超时时间。
- enableLookups：禁用 DNS 查询（设为 false 提升性能）。
Tomcat 的 Session 管理机制？
- 默认使用 StandardManager 将 Session 序列化到磁盘（SESSION.ser），集群环境下可配置 DeltaManager 或 PersistentManager。
Tomcat 的 Valve 是什么？
- 类似 Servlet Filter 的组件，用于在请求处理链中插入逻辑（如日志、权限），实现类为 AccessLogValve、RemoteIpValve 等。

五、源码与设计思想

Tomcat 的 Lifecycle 设计模式？
- 组件（如 Server、Service）实现 Lifecycle 接口，通过 LifecycleBase 抽象类管理状态（INIT、START、STOP），支持事件监听。
Pipeline 和 Valve 的设计原理？
- 每个 Container（如 Engine、Host）有一个 Pipeline，按顺序执行 Valve 链，最后一个 Valve 调用下层 Container 的 Pipeline。
Tomcat 的类加载为何打破双亲委派？
- 为了实现应用隔离：Web 应用的类优先由 WebappClassLoader 加载，而不是父加载器，避免不同应用的同名类冲突。

六、Spring Boot 内嵌 Tomcat 底层原理

内嵌 Tomcat 与独立 Tomcat 的区别？
- 内嵌 Tomcat 由 Spring Boot 通过代码启动，无需 server.xml；独立 Tomcat 通过脚本启动，依赖外部配置。
如何替换内嵌 Tomcat 为 Jetty 或 Undertow？
- 排除 spring-boot-starter-tomcat，引入 spring-boot-starter-jetty 或 spring-boot-starter-undertow。
Spring Boot 如何初始化内嵌 Tomcat 的 Context？
- 通过 TomcatServletWebServerFactory 创建 StandardContext，加载 META-INF/resources（静态资源）和 WEB-INF（Servlet 相关）。

附：Tomcat 核心组件对比

组件	作用	实现类
Connector	处理网络请求	`NioEndpoint`
Engine	虚拟主机容器	`StandardEngine`
Host	代表一个域名	`StandardHost`
Context	对应一个 Web 应用	`StandardContext`
Wrapper	封装 Servlet 实例	`StandardWrapper`

附：Spring Boot 内嵌 Tomcat 启动流程

SpringApplication.run() → 创建 AnnotationConfigServletWebServerApplicationContext。
调用 refreshContext() → 触发 ServletWebServerApplicationContext.onRefresh()。
通过 TomcatServletWebServerFactory 创建 TomcatWebServer 实例。
初始化 Connector 并绑定端口，启动 Tomcat。

掌握这些内容后，建议结合 Tomcat 源码（如 Connector、NioEndpoint 类）和 Spring Boot 自动配置（ServletWebServerFactoryAutoConfiguration）深入理解。

Tomcat架构相关

Tomcat核心： Http服务器+Servlet容器
Tomcat请求调用链
Tomcat架构模型

Tomcat 要实现 2 个核心功能：

处理 Socket 连接，负责网络字节流与 Request 和 Response 对象的转化。
加载和管理 Servlet，以及具体处理 Request 请求。
因此 Tomcat 设计了两个核心组件连接器（Connector）和容器（Container）来分别做这两件事情。连接器负责对外交流，容器负责内部处理。

Tomcat核心组件

Server组件

指的就是整个 Tomcat 服务器，包含多组服务（Service），负责管理和启动各个Service，同时监听 8005 端口发过来的 shutdown 命令，用于关闭整个容器。

Service组件

每个 Service 组件都包含了若干用于接收客户端消息的 Connector 组件和处理请求的Engine 组件。 Service 组件还包含了若干 Executor 组件，每个 Executor 都是一个线程池，它可以为 Service 内所有组件提供线程池执行任务。
Service组件架构示意图

为什么这么设计？

Tomcat 为了实现支持多种 I/O 模型和应用层协议，一个容器可能对接多个连接器，就好比一个房间有多个门，但是单独的连接器或者容器都不能对外提供服务，需要把它们组装起来才能工作，组装后这个整体叫作 Service 组件。
Service 本身没有做什么重要的事情，只是在连接器和容器外面多包了一层，把它们组装在一起。Tomcat 内可能有多个Service，这样的设计也是出于灵活性的考虑。通过在 Tomcat 中配置多个 Service，可以实现通过不同的端口号来访问同一台机器上部署的不同应用。

Connector组件

连接器对 Servlet 容器屏蔽了不同的应用层协议及 I/O 模型，无论是 HTTP 还是AJP，在容器中获取到的都是一个标准的 ServletRequest 对象。连接器需要实现的功能：

监听网络端口。
接受网络连接请求。
读取请求网络字节流。
根据具体应用层协议（HTTP/AJP）解析字节流，生成统一的 Tomcat Request对象。
将 Tomcat Request 对象转成标准的 ServletRequest。
调用 Servlet 容器，得到 ServletResponse。
将 ServletResponse 转成 Tomcat Response 对象。
将 Tomcat Response 转成网络字节流。
将响应字节流写回给浏览器。

连接器需要完成 3 个$\color{red}{高内聚}$的功能：

网络通信。
应用层协议解析。
Tomcat Request/Response 与 ServletRequest/ServletResponse 的转化。

分别对应的三个功能来实现这3个功能：

EndPoint 负责提供字节流给 Processor；
Processor 负责提供 Tomcat Request 对象给 Adapter；
Adapter 负责提供 ServletRequest 对象给容器。

ProtocalHandle组件

ProtocalHandler架构示意图

Tomcat线程模型相关

主题要点

理解IO模型的本质：是为了解决什么问题，为什么会有不同的IO模型设计，重点理解IO模型中的IO多路复用和异步IO
主从Reactor多线程模型在Tomcat中的实现

关于阻塞唤醒

linux线程阻塞示意图
阻塞的本质就是将进程的task_struct移出运行队列，添加到等待队列，并且将进程的状态的置为TASK_UNINTERRUPTIBLE或者TASK_INTERRUPTIBLE，重新触发一次 CPU调度让出 CPU

IO模型下的异步/同步，阻塞/非阻塞问题

I/O 模型是为了解决内存和外部设备速度差异的问题。
我们平时说的阻塞或非阻塞是指应用程序在发起 I/O 操作时，是立即返回还是等待。
而同步和异步，是指应用程序在与内核通信时，数据从内核空间到应用空间的拷贝，是由内核主动发起还是由应用程序来触发。
如果是需要应用程序主动再次发起，那就是同步；反之，由内核空间自己将数据拷贝到用户进程缓冲区，那就是异步；

Socket Read系统调用过程

通过一个例子来理解，以Linux操作系统为例，一次socket read 系统调用的过程：

首先 CPU 在用户态执行应用程序的代码，访问进程虚拟地址空间的用户空间；
read 系统调用时 CPU 从用户态切换到内核态，执行内核代码，内核检测到Socket 上的数据未就绪时，将进程的task_struct结构体从运行队列中移到等待队列，并触发一次 CPU 调度，这时进程会让出 CPU；
当网卡数据到达时，内核将数据从内核空间拷贝到用户空间的 Buffer，接着将进程的task_struct结构体重新移到运行队列，这样进程就有机会重新获得 CPU 时间片，系统调用返回，CPU 又从内核态切换到用户态，访问用户空间的数据。

总结：
当用户线程发起 I/O 调用后，网络数据读取操作会经历两个步骤：

用户线程等待内核将数据从网卡拷贝到内核空间。（数据准备阶段）
内核将数据从内核空间拷贝到用户空间（应用进程的缓冲区）。

各种 I/O 模型的区别就是：它们实现这两个步骤的方式是不一样的。也就是对这两个步骤的优化过程
IO调用用户态和内核态数据交换示意图

Unix(Linux)下的5种IO模型

Linux 系统下的 I/O 模型有 5 种：

同步阻塞I/O（bloking I/O）
同步非阻塞I/O（non-blocking I/O）
I/O多路复用（multiplexing I/O）
信号驱动式I/O（signal-driven I/O）(不常用)
异步I/O（asynchronous I/O）

同步阻塞IO模型分类
各种IO模型行为的差异对比示意图：
各种IO模型行为差异

一个非常简单的在Java中实现的BIO：

public class BioServer {
	// 数据准备和数据读取阶段两步阻塞
    public static void main(String[] args) {
        ExecutorService executorService = Executors.newCachedThreadPool();
        try {
            // 启动服务，绑定8080端口
            ServerSocket serverSocket = new ServerSocket();
            serverSocket.bind(new InetSocketAddress(8080));
            System.out.println("开启服务");

            while (true){
                System.out.println("等待客户端建立连接");
                // 监听8080端口，获取客户端连接
                Socket socket = serverSocket.accept(); //阻塞
                System.out.println("建立连接："+socket);
                // 用线程池，模拟多连接场景，否则会一直阻塞（BIO的缺点）
                executorService.submit(()->{
                    //TODO 业务处理
                    try {
                        handler(socket);
                    } catch (IOException e) {
                        e.printStackTrace();
                    }
                });

            }
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            //TODO 资源回收
        }
    }

    private static void handler(Socket socket) throws IOException {
        while(true){
            byte[] bytes = new byte[1024];
            System.out.println("等待读取数据");
            int read = socket.getInputStream().read(bytes); // 阻塞
            if(read !=-1) {
                System.out.println("读取客户端发送的数据：" +
                        new String(bytes, 0, read));
            }else {
                break;
            }
        }

    }
}

Tomcat实现的IO模型

IO模型	描述
BIO（JIoEndpoint）	同步阻塞式IO，即Tomcat使用传统的java.io进行操作。该模式下每个请求都会创建一个线程，对性能开销大，不适合高并发场景。优点是稳定，适合连接数目小且固定架构。
NIO（NioEndpoint）	同步非阻塞式IO，jdk1.4 之后实现的新IO。该模式基于多路复用选择器监测连接状态再同步通知线程处理，从而达到非阻塞的目的。比传统BIO能更好的支持并发性能。Tomcat 8.0之后默认采用该模式。NIO方式适用于连接数目多且连接比较短（轻操作）的架构，比如聊天服务器，弹幕系统，服务器间通讯，编程比较复杂
AIO (Nio2Endpoint)	异步非阻塞式IO，jdk1.7后之支持。与nio不同在于不需要多路复用选择器，而是请求处理线程执行完成进行回调通知，继续执行后续操作。Tomcat 8之后支持。一般适用于连接数较多且连接时间较长的应用
APR（AprEndpoint）	全称是 Apache Portable Runtime/Apache可移植运行库)，是ApacheHTTP服务器的支持库。AprEndpoint 是通过 JNI 调用 APR 本地库而实现非阻塞 I/O 的。使用需要编译安装APR 库

注意： Linux 内核没有很完善地支持异步 I/O 模型，因此 JVM 并没有采用原生的 Linux 异步 I/O，而是在应用层面通过 epoll 模拟了异步 I/O 模型。因此在 Linux 平台上，JavaNIO 和 Java NIO.2 底层都是通过 epoll 来实现的，但是 Java NIO 更加简单高效。

Tomcat对线程池的扩展

Tomcat的线程池管理线程的时候，首次遇到投放失败的时候，会有一个重新向阻塞队列里面投放的过程。
由于自己定义了一个TaskQueue（继承LinkedBlockingQueue）,这里面对offer方法重写了就遇到了一个很有意思的问题：
对于原生的Java线程池定义的阻塞队列，当前线程池核心队列满的同时小于最大线程的时候，是不会创建非核心线程的，是直接往队列里面丢。
而在tomcat重新的offer方法里面，这种情况会直接返回false，让其放入队列失败，进而直接去创建非核心线程去了。
贴上两段代码：

//// 代码位置：org.apache.tomcat.util.threads.ThreadPoolExecutor#executeInternal
/**
     * Executes the given task sometime in the future.  The task
     * may execute in a new thread or in an existing pooled thread.
     *
     * If the task cannot be submitted for execution, either because this
     * executor has been shutdown or because its capacity has been reached,
     * the task is handled by the current {@link RejectedExecutionHandler}.
     *
     * @param command the task to execute
     * @throws RejectedExecutionException at discretion of
     *         {@code RejectedExecutionHandler}, if the task
     *         cannot be accepted for execution
     * @throws NullPointerException if {@code command} is null
     */
    private void executeInternal(Runnable command) {
        if (command == null) {
            throw new NullPointerException();
        }
        /*
         * Proceed in 3 steps:
         *
         * 1. If fewer than corePoolSize threads are running, try to
         * start a new thread with the given command as its first
         * task.  The call to addWorker atomically checks runState and
         * workerCount, and so prevents false alarms that would add
         * threads when it shouldn't, by returning false.
         *
         * 2. If a task can be successfully queued, then we still need
         * to double-check whether we should have added a thread
         * (because existing ones died since last checking) or that
         * the pool shut down since entry into this method. So we
         * recheck state and if necessary roll back the enqueuing if
         * stopped, or start a new thread if there are none.
         *
         * 3. If we cannot queue task, then we try to add a new
         * thread.  If it fails, we know we are shut down or saturated
         * and so reject the task.
         */
        int c = ctl.get();
        if (workerCountOf(c) < corePoolSize) {
            if (addWorker(command, true)) {
                return;
            }
            c = ctl.get();
        }
        if (isRunning(c) && workQueue.offer(command)) {
            int recheck = ctl.get();
            if (! isRunning(recheck) && remove(command)) {
                reject(command);
            } else if (workerCountOf(recheck) == 0) {
                addWorker(null, false);
            }
        }
        else if (!addWorker(command, false)) {
            reject(command);
        }
    }

TaskQueue的实现：

// 代码位置 org.apache.tomcat.util.threads.TaskQueue#offer
@Override
    public boolean offer(Runnable o) {
      //we can't do any checks
        if (parent==null) {
            return super.offer(o);
        }
        //we are maxed out on threads, simply queue the object
        if (parent.getPoolSizeNoLock() == parent.getMaximumPoolSize()) {
            return super.offer(o);
        }
        //we have idle threads, just add it to the queue
        if (parent.getSubmittedCount() <= parent.getPoolSizeNoLock()) {
            return super.offer(o);
        }
        //if we have less threads than maximum force creation of a new thread
        // 注意看这里
        if (parent.getPoolSizeNoLock() < parent.getMaximumPoolSize()) {
            return false;
        }
        //if we reached here, we need to add it to the queue
        return super.offer(o);
    }

线程上下文加载器

在 JVM 的实现中有一条隐含的规则，默认情况下，如果一个类由类加载器 A 加载，那么这个类的依赖类也是由相同的类加载器加载。

Tomcat 为每个 Web 应用创建一个 WebAppClassLoarder 类加载器，并在启动Web 应用的线程里设置线程上下文加载器，这样 Spring 在启动时就将线程上下文加载器取出来，用来加载 Bean。

线程上下文加载器是一种类加载器传递机制，因为这个类加载器保存在线程私有数据里，只要是同一个线程，一旦设置了线程上下文加载器，在线程后续执行过程中就能把这个类加载器取出来用。

1 2	// 直接取出对应线程的类加载器，取出来用即可 Thread.currentThread().getContextClassLoader()

线程上下文加载器不仅仅可以用在 Tomcat 和 Spring 类加载的场景里，核心框架类需要加载具体实现类时都可以用到它，比如我们熟悉的 JDBC 就是通过上下文类加载器来加载不同的数据库驱动的。

Tomcat热加载与热部署

在项目开发过程中，经常要改动Java/JSP 文件，但是又不想重新启动Tomcat，有两种方式:热加载和热部署。热部署表示重新部署应⽤，它的执⾏主体是Host。热加载表示重新加载class，它的执⾏主体是Context。

思考：Tomcat 是如何用后台线程来实现热加载和热部署的？

Tomcat开启后台线程执行周期性任务

Tomcat 通过开启后台线程ContainerBase.ContainerBackgroundProcessor，使得各个层次的容器组件都有机会完成一些周期性任务。我们在实际工作中，往往也需要执行一些周期性的任务，比如监控程序周期性拉取系统的健康状态，就可以借鉴这种设计。

Tomcat9 是通过 ScheduledThreadPoolExecutor 来开启后台线程的，它除了具有线程池的功能，还能够执行周期性的任务

Tomcat调优

Tomcat 的关键指标

Tomcat 的关键指标有吞吐量、响应时间、错误数、线程池、CPU 以及 JVM 内存。
前三个指标是我们最关心的业务指标，Tomcat 作为服务器，就是要能够又快有好地处理请求，因此吞吐量要大、响应时间要短，并且错误数要少。
后面三个指标是跟系统资源有关的，当某个资源出现瓶颈就会影响前面的业务指标，比如线程池中的线程数量不足会影响吞吐量和响应时间；但是线程数太多会耗费大量 CPU，也会影响吞吐量；当内存不足时会触发频繁地 GC，耗费 CPU，最后也会反映到业务指标上来。

Tomcat线程池的并发调优

直接看表格参数即可

IO模型	描述
threadPriority	(int)线程优先级，默认是5
daemon	(boolean) 是否deamon线程，默认为true
namePrefix	(String) 线程前缀
maxThreads	(int) 线程池中的最大线程数，默认是200
minSpareThreads	(int) 最小线程数（线程空闲超过一段时间会被回收），默认是25
maxldleTime	(int) 线程最大的空闲时间，超过这个时间线程就会回收，直到线程数剩下minSpareThreads个，默认值是一分钟
maxQueueSize	(int) 线程池中任务队列的最大长度，默认是Integer.MAX_VALUE
prestartminSpareThreads	(boolean) 是否在线程池启动时就创建minSpareThreads 个线程，默认为false