一、Docker 基础概念
Docker 镜像与容器的关系
概念定义
-
Docker 镜像
- 是一个只读模板,包含运行应用程序所需的所有依赖项(代码、运行时环境、库、环境变量等)。
- 镜像通过分层存储(Layer)实现高效复用,每一层代表一个修改步骤(如安装依赖、复制文件等)。
- 镜像是静态的,不可直接修改,需通过构建(
docker build
)生成新版本。
-
Docker 容器
- 是镜像的运行时实例,基于镜像启动后生成一个可读写的文件系统层(容器层)。
- 容器是动态的,可以运行、暂停、停止或删除。
- 每个容器相互隔离,拥有独立的进程空间、网络和存储。
核心关系
-
镜像 → 容器:
镜像是容器的“蓝图”,容器是镜像的“运行态”。类似“类”与“对象”的关系。
例如:通过docker run <image>
命令从镜像启动容器。 -
容器 → 镜像:
容器的修改(如安装软件)可通过docker commit
保存为新镜像(不推荐,应使用 Dockerfile 重建)。
分层结构示例
- 镜像分层(只读):
Layer 3: ADD app.jar /app # 应用代码 Layer 2: RUN apt-get install jdk # 安装JDK Layer 1: FROM ubuntu:20.04 # 基础镜像
- 容器层(读写):
在镜像层之上添加一个可写层,存储运行时产生的数据(如日志、临时文件)。
使用场景
- 镜像:
- 分发应用(如推送至 Docker Hub)。
- 作为 CI/CD 流水线的构建产物。
- 容器:
- 运行微服务实例。
- 快速部署测试环境(如
docker run -it
进入交互式终端)。
常见误区
- 误以为容器是轻量级虚拟机:
容器共享主机内核,本质是隔离的进程,而非独立操作系统。 - 直接修改容器并提交为镜像:
会导致镜像臃肿且不可维护,应通过 Dockerfile 重建。 - 混淆镜像与容器存储:
删除容器不会影响镜像,但删除镜像会导致依赖它的容器无法重启(需先停止容器)。
示例命令
# 从镜像启动容器
docker run -d --name myapp nginx:latest
# 查看运行中的容器
docker ps
# 查看本地镜像
docker images
# 将容器保存为镜像(不推荐生产使用)
docker commit myapp myapp-custom
Dockerfile 的作用
Dockerfile 是一个文本文件,用于定义如何构建 Docker 镜像。它包含了一系列指令和参数,用于指定基础镜像、安装依赖、复制文件、设置环境变量等操作。Docker 引擎通过读取 Dockerfile 中的指令,自动构建出符合要求的镜像。
核心作用
- 自动化构建镜像:通过脚本化的方式定义镜像构建过程,避免手动操作带来的不一致性。
- 可重复性:确保在不同环境中构建出的镜像完全一致。
- 版本控制:Dockerfile 可以纳入代码仓库,便于跟踪镜像的变更历史。
Dockerfile 的结构
Dockerfile 由一系列指令组成,每条指令对应镜像构建的一个步骤。指令通常按从上到下的顺序执行,每条指令会生成一个新的镜像层。
常用指令及说明
-
FROM
指定基础镜像,所有构建都基于该镜像开始。
示例:FROM openjdk:11-jre
-
WORKDIR
设置工作目录,后续指令(如RUN
、COPY
)默认在此目录下执行。
示例:WORKDIR /app
-
COPY
将本地文件或目录复制到镜像中。
示例:COPY target/myapp.jar app.jar
-
RUN
在构建过程中执行命令(如安装依赖、编译代码)。
示例:RUN apt-get update && apt-get install -y curl
-
ENV
设置环境变量,供后续指令或容器运行时使用。
示例:ENV JAVA_OPTS="-Xmx512m"
-
EXPOSE
声明容器运行时监听的端口(仅起文档作用,实际端口映射需通过docker run -p
指定)。
示例:EXPOSE 8080
-
CMD
指定容器启动时默认执行的命令(可被docker run
覆盖)。
示例:CMD ["java", "-jar", "app.jar"]
-
ENTRYPOINT
类似CMD
,但定义的命令不可被docker run
覆盖(通常与CMD
结合使用)。
示例:ENTRYPOINT ["java", "-jar"]
示例:构建 Java 应用的 Dockerfile
# 使用官方 OpenJDK 11 作为基础镜像
FROM openjdk:11-jre
# 设置工作目录
WORKDIR /app
# 复制编译好的 JAR 文件到镜像中
COPY target/myapp.jar app.jar
# 设置环境变量
ENV JAVA_OPTS="-Xmx512m"
# 声明暴露端口
EXPOSE 8080
# 定义容器启动命令
CMD ["java", "-jar", "app.jar"]
注意事项
-
指令顺序:
- 将变化频率低的指令(如
FROM
、ENV
)放在前面,利用 Docker 缓存加速构建。 - 变化频率高的指令(如
COPY
、RUN
)尽量靠后。
- 将变化频率低的指令(如
-
多阶段构建:
对于需要编译的 Java 项目,建议使用多阶段构建以减少最终镜像大小。
示例:# 第一阶段:编译 FROM maven:3.8.4 AS build COPY src /app/src COPY pom.xml /app RUN mvn -f /app/pom.xml clean package # 第二阶段:运行 FROM openjdk:11-jre COPY --from=build /app/target/myapp.jar /app.jar CMD ["java", "-jar", "/app.jar"]
-
避免敏感信息:
不要直接在 Dockerfile 中硬编码密码或密钥,应通过环境变量或 Docker Secrets 传递。 -
.dockerignore
文件:
类似.gitignore
,用于排除不需要复制到镜像中的文件(如本地开发配置文件、日志等)。
镜像分层存储机制
概念定义
镜像分层存储机制是 Docker 的核心设计之一,它通过联合文件系统(UnionFS) 将镜像的每一层叠加在一起,形成一个完整的文件系统。每一层都是只读的,只有在容器运行时才会在最上层添加一个可写层(容器层)。
分层结构
- 基础层(Base Layer):通常是操作系统层(如
alpine
、ubuntu
等)。 - 中间层(Intermediate Layers):每一层代表 Dockerfile 中的一条指令(如
RUN
、COPY
、ADD
等)。 - 容器层(Container Layer):容器启动时添加的可写层,所有运行时修改(如文件写入、日志生成)都保存在这一层。
工作原理
- 写时复制(Copy-on-Write, CoW):如果容器需要修改某个文件,Docker 会将该文件从镜像层复制到容器层进行修改,而镜像层保持不变。
- 分层共享:多个镜像可以共享相同的基础层,节省存储空间。
优势
- 存储效率:相同的基础层可以被多个镜像复用,减少磁盘占用。
- 构建速度:Docker 会缓存未改变的层,加速后续构建。
- 安全性:镜像层只读,避免运行时污染镜像。
示例分析
以下是一个简单的 Dockerfile 及其分层结构:
FROM openjdk:11-jre-slim # 基础层(Layer 1)
COPY app.jar /opt/app.jar # 新增层(Layer 2)
ENTRYPOINT ["java", "-jar", "/opt/app.jar"]
构建后镜像的分层:
openjdk:11-jre-slim
的所有层(只读)。- 包含
/opt/app.jar
的新增层(只读)。
注意事项
- 层数过多:每条 Dockerfile 指令都会生成一个新层,过多的层会导致镜像臃肿。建议合并相关指令(如多个
RUN
合并为一行)。 - 缓存失效:修改某一层后,后续所有层的缓存都会失效。合理排序指令(如将频繁变动的层放在最后)。
- 大文件处理:
ADD
或COPY
大文件时会生成完整的新层,建议使用.dockerignore
排除无关文件。
查看镜像分层
通过 docker history
命令查看镜像的分层信息:
docker history <镜像名称>
输出示例:
IMAGE CREATED CREATED BY SIZE
abc123 2 days ago /bin/sh -c #(nop) ENTRYPOINT ["java","-ja... 0B
def456 2 days ago /bin/sh -c #(nop) COPY file:abc123 /opt/app... 5MB
ghi789 2 weeks ago /bin/sh -c #(nop) CMD ["bash"] 0B
jkl012 2 weeks ago /bin/sh -c #(nop) ADD file:xyz456 /tmp 10MB
二、Java 应用镜像构建准备
JDK 基础镜像选择
概念定义
JDK 基础镜像是构建 Java 应用镜像的起点,它提供了运行 Java 程序所需的基本环境,包括 Java 运行时、工具链和库文件。Docker 官方和第三方提供了多种 JDK 基础镜像,适用于不同的开发和生产需求。
常见 JDK 基础镜像类型
-
官方镜像(OpenJDK)
openjdk:<version>
:标准 OpenJDK 镜像,包含完整的 JDK。openjdk:<version>-jdk
:明确标注为 JDK 版本(与 JRE 区分)。openjdk:<version>-jre
:仅包含 JRE,体积更小,适合生产环境。
-
发行版变体
eclipse-temurin
:由 Eclipse Adoptium 维护的 OpenJDK 发行版(原 AdoptOpenJDK)。amazoncorretto
:亚马逊维护的 OpenJDK 发行版,长期支持(LTS)。ibm-semeru
:IBM 提供的 OpenJDK 发行版。
-
轻量级镜像
alpine
版本(如openjdk:17-alpine
):基于 Alpine Linux,体积极小,但可能缺少某些库(如 glibc)。slim
版本(如openjdk:17-slim
):基于 Debian Slim,比完整版更轻量。
选择标准
-
版本匹配
- 确保镜像版本与开发环境一致(如 JDK 11/17/21)。
- 示例:
FROM eclipse-temurin:17-jdk
-
生产优化
- 优先选择
-jre
或-slim
镜像以减少体积。 - 示例:
FROM eclipse-temurin:17-jre-jammy
- 优先选择
-
安全与维护
- 选择长期支持(LTS)版本(如 JDK 11/17)。
- 推荐使用维护活跃的发行版(如 Temurin/Corretto)。
注意事项
-
Alpine 的兼容性问题
- Alpine 使用 musl libc,可能导致某些 Java 库(如 Netty)异常。
- 解决方案:改用
-slim
或标准镜像。
-
镜像分层优化
- 多阶段构建时,编译阶段用
-jdk
,运行阶段用-jre
。
FROM eclipse-temurin:17-jdk AS build # 编译代码... FROM eclipse-temurin:17-jre COPY --from=build /app /app
- 多阶段构建时,编译阶段用
-
时区与语言设置
- 显式配置时区避免日志时间错误:
ENV TZ=Asia/Shanghai RUN ln -snf /usr/share/zoneinfo/$TZ /etc/localtime
示例推荐
- 开发/测试环境:
FROM eclipse-temurin:17-jdk
- 生产环境:
FROM eclipse-temurin:17-jre-jammy
应用打包方式(JAR/WAR)
概念定义
在 Java 技术体系中,JAR(Java Archive) 和 WAR(Web Application Archive) 是两种常见的应用打包格式,用于将 Java 程序或 Web 应用打包成单个文件,便于部署和分发。
-
JAR:
- 全称为 Java Archive,是一种基于 ZIP 格式的文件,用于打包 Java 类文件(
.class
)、资源文件(如配置文件、图片等)以及元数据(如MANIFEST.MF
)。 - 通常用于 独立应用程序 或 库文件(如依赖库)。
- 可以通过
java -jar
命令直接运行(如果包含Main-Class
配置)。
- 全称为 Java Archive,是一种基于 ZIP 格式的文件,用于打包 Java 类文件(
-
WAR:
- 全称为 Web Application Archive,是专门为 Java Web 应用 设计的打包格式。
- 除了包含 JAR 的内容外,还包含 Web 相关的文件(如
web.xml
、JSP、HTML、CSS、JS 等)。 - 需要部署到 Servlet 容器(如 Tomcat、Jetty)中运行。
使用场景
特性 | JAR | WAR |
---|---|---|
用途 | 独立应用、库文件 | Web 应用 |
运行方式 | java -jar 或作为依赖库使用 | 部署到 Servlet 容器(如 Tomcat) |
包含内容 | 类文件、资源文件、MANIFEST.MF | 类文件、Web 资源、web.xml |
典型项目 | Spring Boot 应用、工具库 | 传统 Java Web 项目(Servlet/JSP) |
常见误区与注意事项
-
混淆 JAR 和 WAR:
- JAR 适用于独立应用或库,而 WAR 专为 Web 应用设计。
- 错误示例:尝试将 WAR 文件直接通过
java -jar
运行(无法执行)。
-
Spring Boot 的默认打包方式:
- Spring Boot 默认生成 可执行 JAR(内嵌 Tomcat),而非 WAR。
- 如果需要部署到外部容器(如 Tomcat),需显式配置为 WAR 打包。
-
MANIFEST.MF 的作用:
- 在 JAR 中,
MANIFEST.MF
可以指定Main-Class
,使其可执行。 - 在 WAR 中,
web.xml
(或注解)定义 Web 应用的入口。
- 在 JAR 中,
-
多模块项目的打包:
- 子模块通常打包为 JAR(供其他模块依赖),而 Web 模块打包为 WAR。
示例代码
1. 构建可执行 JAR(Maven)
<!-- pom.xml -->
<project>
<modelVersion>4.0.0</modelVersion>
<groupId>com.example</groupId>
<artifactId>my-app</artifactId>
<version>1.0</version>
<packaging>jar</packaging> <!-- 默认即为 jar -->
<build>
<plugins>
<plugin>
<groupId>org.apache.maven.plugins</groupId>
<artifactId>maven-jar-plugin</artifactId>
<configuration>
<archive>
<manifest>
<mainClass>com.example.Main</mainClass> <!-- 指定主类 -->
</manifest>
</archive>
</configuration>
</plugin>
</plugins>
</build>
</project>
2. 构建 WAR(Maven)
<!-- pom.xml -->
<project>
<modelVersion>4.0.0</modelVersion>
<groupId>com.example</groupId>
<artifactId>my-webapp</artifactId>
<version>1.0</version>
<packaging>war</packaging> <!-- 指定为 war 打包 -->
<dependencies>
<dependency>
<groupId>javax.servlet</groupId>
<artifactId>javax.servlet-api</artifactId>
<version>4.0.1</version>
<scope>provided</scope> <!-- 容器提供 -->
</dependency>
</dependencies>
</project>
3. Spring Boot 切换为 WAR 打包
<!-- pom.xml -->
<packaging>war</packaging> <!-- 修改为 war -->
<dependencies>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-tomcat</artifactId>
<scope>provided</scope> <!-- 使用外部 Tomcat -->
</dependency>
</dependencies>
总结
- JAR:适合独立应用或库,简单轻量。
- WAR:专为 Web 应用设计,需依赖 Servlet 容器。
- 现代趋势:Spring Boot 推广了可执行 JAR(内嵌服务器),减少了 WAR 的使用场景。
工作目录设置
概念定义
工作目录(Working Directory)在 Docker 镜像构建过程中指的是容器内部的一个目录路径,用于存放应用程序的代码、依赖和其他相关文件。通过设置工作目录,可以确保后续的指令(如 COPY
、RUN
等)都在该目录下执行,从而简化路径管理和文件操作。
使用场景
- 简化路径管理:避免在
COPY
或RUN
指令中频繁使用绝对路径。 - 标准化目录结构:确保镜像内的文件组织结构一致,便于维护。
- 多阶段构建:在复杂构建过程中,为不同阶段设置独立的工作目录。
常见误区或注意事项
- 路径不存在:如果工作目录不存在,Docker 会自动创建,但建议显式创建以确保路径正确。
- 相对路径问题:后续指令中的相对路径是基于工作目录的,需注意路径的上下文。
- 权限问题:确保工作目录的权限允许应用程序读写(例如,非 root 用户运行时可能需要调整权限)。
示例代码
以下是一个典型的 Dockerfile 示例,展示如何设置和使用工作目录:
# 基础镜像
FROM openjdk:11-jre-slim
# 创建工作目录并设置为工作目录
RUN mkdir -p /app
WORKDIR /app
# 将本地文件复制到工作目录
COPY target/myapp.jar ./myapp.jar
# 设置启动命令(基于工作目录)
CMD ["java", "-jar", "myapp.jar"]
高级用法
- 动态工作目录:可以通过环境变量动态设置工作目录:
ENV APP_HOME=/app WORKDIR $APP_HOME
- 多阶段构建中的工作目录:
# 构建阶段 FROM maven:3.8.4 AS builder WORKDIR /build COPY pom.xml . RUN mvn dependency:go-offline COPY src ./src RUN mvn package # 运行阶段 FROM openjdk:11-jre-slim WORKDIR /app COPY --from=builder /build/target/myapp.jar . CMD ["java", "-jar", "myapp.jar"]
环境变量配置
概念定义
环境变量(Environment Variables)是操作系统或容器运行时提供给应用程序的一组动态键值对。在Docker构建Java镜像时,环境变量常用于:
- 传递运行时配置参数(如数据库连接信息)
- 控制应用程序行为(如开启调试模式)
- 设置JVM参数(如内存分配)
Docker中的配置方式
1. Dockerfile配置
ENV JAVA_OPTS="-Xmx512m"
ENV DB_URL="jdbc:mysql://prod-db:3306/app"
2. 运行时注入
docker run -e "SPRING_PROFILES_ACTIVE=prod" my-java-app
3. 通过.env文件
# .env文件内容
CACHE_SIZE=200
TIMEOUT=30
运行命令:
docker run --env-file .env my-java-app
Java应用读取方式
1. System类读取
String dbUrl = System.getenv("DB_URL");
2. Spring Boot读取
# application.properties
spring.datasource.url=${DB_URL}
最佳实践
-
敏感信息处理:永远不要将密码等敏感信息硬编码在Dockerfile中,应使用:
docker run -e "DB_PASSWORD=$(vault read secret/db)"
-
默认值设置:
ENV LOG_LEVEL="INFO"
-
多阶段构建:在最终镜像中清理不必要的环境变量
FROM openjdk:11 as builder ENV BUILD_ONLY_VAR="temp" FROM openjdk:11 # 这里不会继承BUILD_ONLY_VAR
常见问题
-
变量覆盖顺序:
docker run -e
最高优先级- Dockerfile中的
ENV
次之 - 系统环境变量最低
-
Java热更新问题:
// 错误!Java进程启动后环境变量不可变 String newVar = System.getenv("NEW_VAR");
-
字符转义:
ENV SPECIAL_CHARS="value with spaces and \"quotes\""
调试技巧
查看容器环境变量:
docker exec -it my-container env
检查变量是否生效:
docker inspect --format='{{range .Config.Env}}{{println .}}{{end}}' my-image
三、Dockerfile 核心指令
FROM 指令选择基础镜像
概念定义
FROM
指令是 Dockerfile 中的第一条指令(除注释和 ARG 外),用于指定构建镜像的基础镜像。基础镜像提供了新镜像的初始文件系统层,后续指令将在此基础上进行修改和扩展。
基础镜像类型
对于 Java 应用,常见的基础镜像选择包括:
-
官方 OpenJDK 镜像
- 标签格式:
openjdk:<version>-<jdk-type>
- 示例:
FROM openjdk:17-jdk-slim
- 变体:
jdk
:完整 JDK(包含开发工具)jre
:仅运行时环境slim
:精简版(删除不必要文件)alpine
:基于 Alpine Linux(极简)
- 标签格式:
-
厂商镜像(如 Amazon Corretto)
FROM amazoncorretto:17-alpine-jdk
-
操作系统镜像 + 手动安装 JDK
FROM ubuntu:22.04 RUN apt-get update && apt-get install -y openjdk-17-jdk
选择标准
-
版本匹配
- 确保基础镜像的 Java 版本与项目需求一致
- 生产环境推荐使用 LTS 版本(如 Java 11/17)
-
镜像大小
- 层级对比(以 Java 17 为例):
openjdk:17-jdk
:~500MBopenjdk:17-jdk-slim
:~300MBopenjdk:17-jdk-alpine
:~150MB
- 层级对比(以 Java 17 为例):
-
安全更新
- 优先选择官方维护的镜像
- 定期检查镜像的 CVE 漏洞报告
最佳实践示例
# 生产环境推荐
FROM eclipse-temurin:17-jre-jammy
# 开发/构建环境
FROM maven:3.8.6-eclipse-temurin-17 AS builder
常见误区
-
使用 latest 标签
- 错误示例:
FROM openjdk:latest
- 问题:可能导致不可预期的版本变化
- 错误示例:
-
过度精简
- 使用 Alpine 镜像时需注意:
- 可能缺少某些库(如 glibc)
- 可能影响 JVM 性能
- 使用 Alpine 镜像时需注意:
-
开发/生产环境混淆
- 构建阶段可使用 JDK 镜像
- 运行时应切换为 JRE 镜像减小体积
多阶段构建示例
# 第一阶段:使用完整JDK构建
FROM maven:3.8.6-eclipse-temurin-17 AS build
COPY . .
RUN mvn package
# 第二阶段:使用最小化JRE运行
FROM eclipse-temurin:17-jre-jammy
COPY --from=build /target/app.jar /app.jar
ENTRYPOINT ["java", "-jar", "/app.jar"]
镜像验证
构建后可通过以下命令验证:
docker run --rm your-image java -version
docker inspect your-image | grep -i size
COPY/ADD 指令添加文件
概念定义
在 Dockerfile 中,COPY
和 ADD
都是用于将文件从构建上下文(或远程 URL)复制到镜像中的指令。它们的主要功能是将文件从主机系统添加到 Docker 镜像的文件系统中。
主要区别
-
COPY:
- 仅支持将本地文件或目录复制到镜像中。
- 语法更简单,行为更明确。
- 推荐用于大多数场景,除非需要 ADD 的特殊功能。
-
ADD:
- 除了 COPY 的功能外,还支持:
- 自动解压 tar 文件(如果是本地 tar 文件)
- 从远程 URL 下载文件(但不推荐用于生产环境)
- 行为比 COPY 更复杂,容易造成意外结果。
- 除了 COPY 的功能外,还支持:
基本语法
COPY <源路径>... <目标路径>
COPY ["<源路径1>",... "<目标路径>"] # 用于包含空格的路径
ADD <源路径>... <目标路径>
ADD ["<源路径1>",... "<目标路径>"] # 用于包含空格的路径
使用场景
-
COPY 的典型用法:
# 复制单个文件 COPY target/myapp.jar /app/myapp.jar # 复制整个目录 COPY src/main/resources /app/resources # 使用通配符 COPY *.jar /app/
-
ADD 的特殊用法:
# 自动解压本地 tar 文件 ADD application.tar.gz /app/ # 从 URL 添加文件(不推荐) ADD https://example.com/file.txt /tmp/
注意事项
-
路径规则:
- 源路径必须在构建上下文中(不能是 …/file 这样的路径)
- 目标路径是容器内的绝对路径,或相对于 WORKDIR 的路径
-
文件权限:
- 复制的文件会保留原始权限(需配合 USER 指令使用)
- 可以使用
--chown
选项改变文件所有者:COPY --chown=user:group file.txt /app/
-
ADD 的注意事项:
- 从 URL 下载的文件不会自动解压
- 自动解压功能只适用于本地 tar 文件
- URL 下载功能不稳定,建议使用 RUN curl/wget
-
最佳实践:
- 优先使用 COPY 而不是 ADD
- 需要解压 tar 文件时再考虑 ADD
- 远程文件下载应该使用 RUN 配合 curl/wget
示例:构建 Java 应用镜像
FROM openjdk:11-jre-slim
# 创建应用目录
WORKDIR /app
# 复制 JAR 文件(使用 COPY 而非 ADD)
COPY target/myapp.jar ./app.jar
# 复制配置文件目录
COPY config ./config
# 设置启动命令
CMD ["java", "-jar", "app.jar"]
常见错误
-
路径错误:
# 错误:试图复制构建上下文外的文件 COPY ../file.txt /app/
-
ADD 的意外解压:
# 如果 archive.tar 是 tar 文件,会被自动解压 ADD archive.tar /app/
-
URL 下载问题:
# 不推荐:下载的文件可能变化,且不会自动解压 ADD https://example.com/app.tar.gz /app/
通过合理使用 COPY 和 ADD 指令,可以有效地构建出符合需求的 Docker 镜像,特别是对于 Java 应用程序的部署场景。
RUN 指令执行命令
概念定义
RUN
指令是 Dockerfile 中的核心指令之一,用于在构建镜像时执行指定的命令。这些命令会在当前镜像层之上创建一个新的层,并将执行结果(如安装的软件、创建的文件等)提交到该层中。RUN
指令通常用于安装软件包、配置环境、下载文件等操作。
语法格式
RUN
指令有两种语法格式:
-
Shell 格式:命令通过
/bin/sh -c
执行。RUN <command>
示例:
RUN apt-get update && apt-get install -y curl
-
Exec 格式:直接执行命令,不通过 Shell。
RUN ["executable", "param1", "param2"]
示例:
RUN ["/bin/bash", "-c", "echo Hello, Docker!"]
使用场景
-
安装依赖:在构建 Java 镜像时,通常需要安装 JDK 或其他工具。
RUN apt-get update && apt-get install -y openjdk-11-jdk
-
下载文件:下载并解压应用程序或依赖包。
RUN curl -O https://example.com/app.tar.gz && tar -xzf app.tar.gz
-
配置环境:设置环境变量或配置文件。
RUN echo "JAVA_HOME=/usr/lib/jvm/java-11-openjdk" >> /etc/environment
-
构建项目:编译 Java 项目或运行构建工具(如 Maven、Gradle)。
RUN mvn clean package
常见误区与注意事项
-
合并命令:多个
RUN
指令会创建多个镜像层,可能导致镜像体积过大。建议通过&&
将多个命令合并为一个RUN
指令。# 不推荐 RUN apt-get update RUN apt-get install -y curl # 推荐 RUN apt-get update && apt-get install -y curl
-
清理缓存:安装软件后,及时清理不必要的缓存文件以减少镜像大小。
RUN apt-get update && apt-get install -y curl \ && rm -rf /var/lib/apt/lists/*
-
避免冗余操作:确保
RUN
指令中的命令是必要的,避免重复执行相同操作。 -
使用 Exec 格式的场景:当需要避免 Shell 处理特殊字符(如环境变量)时,可以使用 Exec 格式。
示例代码
以下是一个完整的 Dockerfile 示例,展示如何通过 RUN
指令构建 Java 镜像:
# 使用基础镜像
FROM ubuntu:20.04
# 安装 JDK 和 Maven
RUN apt-get update && apt-get install -y \
openjdk-11-jdk \
maven \
&& rm -rf /var/lib/apt/lists/*
# 设置工作目录
WORKDIR /app
# 复制项目文件
COPY . .
# 构建项目
RUN mvn clean package
# 设置启动命令
CMD ["java", "-jar", "target/app.jar"]
总结
RUN
指令是 Dockerfile 中用于执行命令的关键指令,合理使用可以高效构建镜像。通过合并命令、清理缓存和避免冗余操作,可以优化镜像的层数和体积。在构建 Java 镜像时,RUN
指令常用于安装 JDK、构建项目等操作。
EXPOSE 声明端口
概念定义
EXPOSE
是 Dockerfile 中的一个指令,用于声明容器在运行时监听的网络端口。它并不会实际打开或映射端口,只是作为文档说明容器会使用哪些端口。例如:
EXPOSE 8080
EXPOSE 8443
使用场景
- 文档化端口:帮助开发者和运维人员了解容器需要暴露哪些端口。
- 与
-p
参数配合:运行容器时通过docker run -p 主机端口:容器端口
实际映射端口。 - 多端口服务:如 Java 应用同时监听 HTTP(8080)和 HTTPS(8443)端口时。
注意事项
- 不会自动映射:
EXPOSE
只是声明,必须通过-p
或--publish
参数才能从主机访问。 - 协议支持:默认是 TCP,如需 UDP 需显式声明:
EXPOSE 53/udp
- 动态端口:如果使用随机主机端口(如
-p 8080
),仍需先声明EXPOSE 8080
。
示例代码
# 基于 OpenJDK 的 Java 应用镜像
FROM openjdk:11-jre
COPY target/myapp.jar /app.jar
# 声明容器内监听的端口
EXPOSE 8080
EXPOSE 8443
ENTRYPOINT ["java", "-jar", "/app.jar"]
常见误区
- 认为 EXPOSE 会自动开放端口:实际需要
docker run -p
或 Docker Compose 的ports
配置。 - 忽略协议类型:默认 TCP 可能不适用于 UDP 服务(如 DNS)。
- 与 Docker Compose 混淆:Compose 中
expose
仅用于容器间通信,对外暴露仍需ports
。
CMD 与 ENTRYPOINT 的区别与使用
基本概念
CMD 和 ENTRYPOINT 都是 Dockerfile 中用于指定容器启动时运行的命令的指令,但它们在行为上有重要区别:
- CMD:提供容器默认的执行命令,可以被
docker run
时指定的命令覆盖 - ENTRYPOINT:配置容器启动时运行的固定命令,
docker run
的参数会作为附加参数
语法格式
# Shell 格式(会被包装在 /bin/sh -c 中执行)
CMD command param1 param2
ENTRYPOINT command param1 param2
# Exec 格式(推荐格式)
CMD ["executable", "param1", "param2"]
ENTRYPOINT ["executable", "param1", "param2"]
使用场景对比
典型 CMD 使用场景
FROM openjdk:17
COPY target/myapp.jar /app.jar
CMD ["java", "-jar", "/app.jar"]
- 允许用户在运行时覆盖命令:
docker run myimage java -jar /app.jar --debug
典型 ENTRYPOINT 使用场景
FROM openjdk:17
COPY target/myapp.jar /app.jar
ENTRYPOINT ["java", "-jar", "/app.jar"]
- 运行时参数会追加到命令后:
docker run myimage --debug
等价于执行java -jar /app.jar --debug
组合使用模式
最佳实践是组合使用两者:
ENTRYPOINT ["java", "-jar", "/app.jar"]
CMD ["--spring.profiles.active=prod"]
- 运行时可以完全覆盖 CMD:
docker run myimage --debug
- 或不带参数使用默认 CMD
Java 应用的特殊注意事项
-
信号传递问题:
- 必须使用 Exec 格式才能确保 Java 进程能正确接收 SIGTERM 信号
- Shell 格式会导致 Java 进程无法正常响应
docker stop
-
JVM 参数处理:
ENTRYPOINT ["java", "-Djava.security.egd=file:/dev/./urandom", "-jar", "/app.jar"]
-
多参数处理:
ENTRYPOINT ["java", "-Xms512m", "-Xmx512m", "-jar", "/app.jar"] CMD ["--spring.config.location=file:/config/application.yml"]
调试技巧
-
覆盖 ENTRYPOINT 进行调试:
docker run --entrypoint /bin/sh -it myimage
-
查看最终执行的命令:
docker inspect --format='{{.Config.Entrypoint}}' myimage docker inspect --format='{{.Config.Cmd}}' myimage
最佳实践建议
- 对 Java 应用总是优先使用 Exec 格式
- 将不变的参数放在 ENTRYPOINT,可变参数放在 CMD
- 考虑使用环境变量进行参数化配置
ENTRYPOINT ["java", "-jar", "/app.jar"] CMD ["${JAVA_OPTS}"]
四、构建优化技巧
多阶段构建减少镜像体积
概念定义
多阶段构建(Multi-stage Build)是 Docker 17.05 版本引入的一项功能,允许在单个 Dockerfile 中使用多个 FROM
指令,每个 FROM
指令代表一个新的构建阶段。通过这种方式,可以仅将必要的文件和依赖复制到最终的镜像中,从而显著减少镜像体积。
使用场景
- 编译型语言(如 Java):在构建阶段使用完整的 JDK 和构建工具(如 Maven、Gradle),但在最终镜像中仅保留运行时所需的 JRE 和编译后的 JAR 文件。
- 依赖管理:避免将构建工具(如 npm、pip)和中间文件(如
.git
、缓存文件)打包到最终镜像中。 - 安全优化:减少镜像中的潜在漏洞,因为最终镜像仅包含运行时必需的组件。
常见误区或注意事项
- 阶段命名:可以为每个阶段命名(如
FROM maven:3.8.4-jdk-11 AS builder
),方便后续引用。 - 文件复制:使用
COPY --from=<stage>
从之前的阶段复制文件,而不是从主机复制。 - 依赖清理:即使在多阶段构建中,也应在每个阶段结束时清理不必要的文件(如缓存、临时文件)。
- 最小化基础镜像:最终阶段应使用尽可能小的基础镜像(如
openjdk:11-jre-slim
)。
示例代码
以下是一个典型的使用多阶段构建的 Java 项目 Dockerfile:
# 第一阶段:构建阶段
FROM maven:3.8.4-jdk-11 AS builder
# 复制源代码和构建配置
WORKDIR /app
COPY pom.xml .
COPY src ./src
# 构建项目
RUN mvn clean package -DskipTests
# 第二阶段:运行时阶段
FROM openjdk:11-jre-slim
# 从构建阶段复制编译结果
WORKDIR /app
COPY --from=builder /app/target/myapp.jar ./myapp.jar
# 暴露端口并运行应用
EXPOSE 8080
ENTRYPOINT ["java", "-jar", "myapp.jar"]
优势
- 体积更小:最终镜像仅包含 JRE 和 JAR 文件,而不包含 JDK、Maven 和源代码。
- 更安全:减少了攻击面,因为构建工具和中间文件不会出现在最终镜像中。
- 构建更高效:可以利用 Docker 的缓存机制,仅在代码或依赖变更时重新运行构建阶段。
进阶技巧
- 使用 Alpine 镜像:进一步减小体积(如
openjdk:11-jre-alpine
),但需注意可能缺少某些库。 - 分层优化:将不经常变更的层(如依赖)放在前面,以利用缓存。
.dockerignore
文件:忽略不必要的文件(如.git
、target/
),加速构建过程。
.dockerignore 文件使用
概念定义
.dockerignore
文件是 Docker 构建镜像时用于排除不需要的文件和目录的配置文件。它的作用类似于 .gitignore
,可以避免将不必要的文件(如日志、缓存、本地配置文件等)复制到 Docker 镜像中,从而减小镜像体积并提高构建效率。
使用场景
- 减小镜像体积:排除开发环境中的临时文件、日志、缓存等无用文件。
- 提高构建速度:减少
COPY
或ADD
指令需要处理的文件数量。 - 避免敏感信息泄露:防止将本地配置文件(如
.env
、密钥文件)意外打包到镜像中。 - 优化构建上下文:减少发送到 Docker 守护进程的上下文大小。
语法规则
- 基本匹配:
*.log
:忽略所有.log
文件。temp/
:忽略temp
目录及其所有内容。
- 排除特定文件:
!README.md
:不忽略README.md
(即使其他规则匹配)。
- 注释:
- 以
#
开头的行是注释。
- 以
- 通配符:
*
匹配任意数量的字符(不包括路径分隔符/
)。**
匹配任意层级的目录(如**/node_modules
)。?
匹配单个字符。
示例文件
# 忽略所有 .git 目录和文件
.git/
# 忽略日志文件
*.log
# 忽略 node_modules 目录(任意层级)
**/node_modules/
# 忽略本地配置文件
.env
config/local.yml
# 但保留重要的 README 文件
!README.md
常见误区
-
路径问题:
.dockerignore
中的路径是相对于构建上下文的根目录的,而不是 Dockerfile 所在目录。- 错误示例:如果构建上下文是项目根目录,而 Dockerfile 在子目录
docker/
中,.dockerignore
仍然应该从项目根目录的角度编写。
-
忽略规则不生效:
- 确保
.dockerignore
文件位于构建上下文的根目录。 - 检查规则是否被更具体的
!
规则覆盖。
- 确保
-
过度忽略:
- 避免忽略运行应用所需的文件(如依赖项、配置文件等)。
-
与 Dockerfile 的冲突:
- 即使文件被
.dockerignore
忽略,Dockerfile
中显式COPY
或ADD
的文件仍会被包含。
- 即使文件被
注意事项
-
构建上下文优化:
- 尽量将
.dockerignore
文件放在构建上下文的根目录。 - 仅包含构建和运行镜像所需的文件。
- 尽量将
-
敏感文件保护:
- 始终将密钥、凭据等敏感文件添加到
.dockerignore
,避免意外泄露。
- 始终将密钥、凭据等敏感文件添加到
-
测试忽略规则:
- 使用
docker build --no-cache
测试忽略规则是否生效,避免缓存干扰。
- 使用
-
多阶段构建的配合:
- 在多阶段构建中,
.dockerignore
会影响所有阶段的构建上下文。
- 在多阶段构建中,
依赖分层缓存优化
概念定义
依赖分层缓存优化是 Docker 镜像构建中的一种高效策略,通过合理分层(Layer)和缓存机制,减少重复构建时间并优化镜像体积。在 Java 镜像构建中,通常利用依赖项(如 Maven/Gradle 依赖)的稳定性,将其单独作为一层缓存,避免每次代码改动时重新下载依赖。
核心原理
- 分层机制:Docker 镜像由多个只读层(Layer)组成,每一条指令(如
COPY
、RUN
)生成一个新层。 - 缓存失效:若某一层的内容或之前的层发生变化,后续所有层的缓存均会失效。
- 依赖分离:将依赖文件(如
pom.xml
或build.gradle
)与源代码分开复制,确保仅当依赖变更时才会触发依赖层重新构建。
使用场景
- 频繁构建:开发阶段需要快速迭代,但依赖项不常变化。
- 大型项目:依赖较多(如 Spring Boot 项目),下载依赖耗时较长。
- CI/CD 流水线:减少构建时间,提升部署效率。
实现示例(Maven 项目)
# 阶段1:构建依赖层
FROM maven:3.8.6-openjdk-11 AS builder
WORKDIR /app
# 先单独复制 pom.xml 并下载依赖(利用缓存)
COPY pom.xml .
RUN mvn dependency:go-offline -B
# 阶段2:构建应用
COPY src ./src
RUN mvn package -DskipTests
# 阶段3:最终镜像
FROM openjdk:11-jre-slim
COPY --from=builder /app/target/myapp.jar /app.jar
ENTRYPOINT ["java", "-jar", "/app.jar"]
关键优化点
- 依赖预下载:
mvn dependency:go-offline
提前下载所有依赖到本地仓库。 - 分层顺序:先复制
pom.xml
再复制代码,确保代码修改不会导致依赖层缓存失效。 - 多阶段构建:最终镜像仅包含运行时必需的 JAR 文件,丢弃构建工具链。
常见误区
- 未锁定依赖版本:若
pom.xml
中使用SNAPSHOT
或范围版本(如1.0.*
),可能导致缓存意外失效。 - 忽略
.dockerignore
:未排除target/
等目录可能导致无关文件被复制,破坏缓存。 - 过度分层:过多
RUN
指令会产生冗余层,反而增加镜像体积。
高级技巧
- Gradle 项目:使用
--build-cache
并缓存/root/.gradle/caches
目录。 - 增量构建:结合 CI 系统的持久化缓存(如 GitHub Actions 的
cache
功能)。 - 基础镜像选择:优先使用官方镜像的
-slim
或-alpine
版本减少层体积。
验证效果
通过以下命令观察构建过程中的缓存利用情况:
docker build --no-cache=false -t my-java-app . # 普通构建
docker build -t my-java-app . # 修改代码后重建(观察缓存命中)
时区与语言环境配置
在构建 Java 应用的 Docker 镜像时,时区和语言环境(Locale)的配置是一个容易被忽视但非常重要的细节。不正确的配置可能导致日志时间戳错误、日期时间处理异常、国际化(i18n)功能失效等问题。
为什么需要配置时区和语言环境?
- 时间一致性:确保容器内的时间与宿主机器或业务需求保持一致
- 日期格式化:影响
SimpleDateFormat
等日期时间类的行为 - 国际化支持:影响货币、数字、消息等本地化显示
- 排序规则:影响字符串比较和排序的结果
常见配置方法
1. 基础镜像选择
选择已包含时区数据的镜像作为基础:
FROM eclipse-temurin:17-jdk-jammy # Ubuntu-based with tzdata
2. 显式设置时区
对于基于 Debian/Ubuntu 的镜像:
RUN apt-get update && \
apt-get install -y tzdata && \
ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime && \
echo "Asia/Shanghai" > /etc/timezone
对于基于 Alpine 的镜像:
RUN apk add --no-cache tzdata && \
cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime && \
echo "Asia/Shanghai" > /etc/timezone
3. 语言环境设置
# 对于 Debian/Ubuntu
RUN apt-get install -y locales && \
locale-gen zh_CN.UTF-8 en_US.UTF-8 && \
update-locale LANG=zh_CN.UTF-8
ENV LANG zh_CN.UTF-8
ENV LANGUAGE zh_CN:zh
ENV LC_ALL zh_CN.UTF-8
# 对于 Alpine
RUN apk add --no-cache locale && \
echo "zh_CN.UTF-8 UTF-8" > /etc/locale.gen && \
locale-gen
ENV LANG zh_CN.UTF-8
ENV LANGUAGE zh_CN:zh
ENV LC_ALL zh_CN.UTF-8
Java 应用中的相关配置
即使正确配置了容器环境,Java 应用中也需要相应处理:
- 启动参数设置:
java -Duser.timezone=Asia/Shanghai -Duser.language=zh -Duser.country=CN -jar app.jar
- 代码中指定时区:
TimeZone.setDefault(TimeZone.getTimeZone("Asia/Shanghai"));
验证配置
构建镜像后可以运行以下命令验证:
docker run --rm your-image date
docker run --rm your-image locale
docker run --rm your-image java -XshowSettings:properties -version
常见问题与解决方案
-
时间差8小时问题:
- 确保容器和主机都配置了相同的时区
- 检查数据库连接的时区设置
-
语言环境不生效:
- 确认基础镜像包含所需的locale数据
- 检查环境变量是否被正确设置
-
Alpine镜像的特殊性:
- Alpine使用musl libc,某些locale处理与glibc不同
- 可能需要额外安装
libintl
等包
最佳实践
- 在Dockerfile中明确设置时区和语言环境
- 保持开发、测试、生产环境的一致性
- 对于国际化应用,考虑构建多阶段镜像或使用环境变量动态配置
- 在CI/CD流水线中加入时区和locale的验证步骤
完整示例
FROM eclipse-temurin:17-jdk-jammy
# 设置时区
RUN ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime && \
echo "Asia/Shanghai" > /etc/timezone
# 设置语言环境
RUN apt-get update && \
apt-get install -y locales && \
locale-gen zh_CN.UTF-8 en_US.UTF-8 && \
update-locale LANG=zh_CN.UTF-8
ENV LANG zh_CN.UTF-8
ENV LANGUAGE zh_CN:zh
ENV LC_ALL zh_CN.UTF-8
# 复制应用
COPY target/app.jar /app.jar
# 启动命令
ENTRYPOINT ["java", "-Duser.timezone=Asia/Shanghai", "-jar", "/app.jar"]
五、常见问题解决
时区不一致问题
概念定义
时区不一致问题指的是在 Docker 容器中运行的 Java 应用程序与宿主机或预期时区不一致,导致时间显示、日志记录或时间相关功能出现偏差的现象。默认情况下,Docker 容器通常使用 UTC 时区(协调世界时),而开发者可能期望使用本地时区(如东八区)。
使用场景
- 日志时间戳:应用程序日志的时间戳与本地时间不符。
- 定时任务:基于时间的任务调度(如
cron
或@Scheduled
)因时区差异提前或延后触发。 - 日期处理:数据库时间字段、API 返回的日期时间值与预期不一致。
常见误区或注意事项
- 仅修改 Java 时区:仅通过
-Duser.timezone=Asia/Shanghai
设置 JVM 参数可能不足,因为基础镜像的系统时区未同步修改。 - 忽略基础镜像时区:部分精简的 Docker 基础镜像(如
alpine
)可能未预装时区数据,需手动安装。 - 硬编码时区:在代码中硬编码时区(如
TimeZone.setDefault
)会降低可移植性,建议通过环境变量配置。
解决方案
1. 修改 Dockerfile 设置时区
# 使用 alpine 基础镜像时需安装 tzdata
FROM openjdk:11-jre-alpine
RUN apk add --no-cache tzdata \
&& cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime \
&& echo "Asia/Shanghai" > /etc/timezone
# 或使用 debian 系基础镜像
FROM openjdk:11
RUN ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime \
&& echo "Asia/Shanghai" > /etc/timezone
# 设置 JVM 时区参数(可选,确保双重保障)
ENV JAVA_OPTS="-Duser.timezone=Asia/Shanghai"
2. 通过环境变量动态传递时区
FROM openjdk:11
ENV TZ=Asia/Shanghai
RUN ln -sf /usr/share/zoneinfo/$TZ /etc/localtime && echo $TZ > /etc/timezone
3. 验证时区
构建镜像后运行容器并检查时区:
docker run -it your-java-image date
# 应输出类似:Mon Jul 1 14:00:00 CST 2024
高级场景
若需支持多时区动态切换,可在启动容器时传递环境变量:
docker run -e TZ=America/New_York your-java-image
内存限制配置
概念定义
内存限制配置是指在 Docker 容器中为 Java 应用程序设置内存使用上限的过程。通过合理配置内存限制,可以确保容器内的 Java 应用不会占用过多主机资源,同时避免因内存不足导致的性能问题或崩溃。
使用场景
- 多容器环境:在 Kubernetes 或 Docker Swarm 等编排工具中运行多个容器时,限制内存可以防止单个容器占用过多资源。
- 资源隔离:确保 Java 应用不会因内存泄漏或无限制增长而影响其他服务。
- 云环境:在云平台(如 AWS ECS、Azure Container Instances)中,内存限制直接影响计费,合理配置可以优化成本。
常见配置方式
-
Docker 内存限制:
-m
或--memory
:设置容器的最大内存使用量。--memory-swap
:设置内存和交换分区的总限制。--memory-reservation
:设置内存的软限制(容器优先使用,但不强制)。
示例:
docker run -m 512m --memory-swap 1g openjdk:11 java -jar app.jar
-
JVM 内存参数:
-Xmx
:设置 Java 堆的最大内存。-Xms
:设置 Java 堆的初始内存。-XX:MaxMetaspaceSize
:设置元空间的最大内存(Java 8+)。
示例:
docker run openjdk:11 java -Xmx256m -Xms128m -jar app.jar
常见误区与注意事项
-
未协调 Docker 和 JVM 内存限制:
- 如果 Docker 内存限制为 512MB,而 JVM 的
-Xmx
设置为 1GB,可能导致容器被 OOM Killer 终止。 - 建议:JVM 的
-Xmx
应小于 Docker 的内存限制(预留约 10%-20% 给非堆内存和系统进程)。
- 如果 Docker 内存限制为 512MB,而 JVM 的
-
忽略非堆内存:
- JVM 除了堆内存(
-Xmx
),还包括元空间、线程栈、直接内存等。需为这些区域预留空间。
- JVM 除了堆内存(
-
交换分区的影响:
- 默认情况下,Docker 允许使用交换分区(
--memory-swap
等于--memory
的两倍),但交换分区会显著降低性能。建议显式设置--memory-swap
或禁用。
- 默认情况下,Docker 允许使用交换分区(
-
容器化 Java 版本差异:
- Java 8 与 Java 11+ 的内存模型不同(如元空间代替永久代),需根据版本调整参数。
最佳实践示例
-
Docker 与 JVM 协同配置:
# Docker 限制 512MB 内存,JVM 堆内存限制 384MB(预留 128MB 给非堆) docker run -m 512m openjdk:11 java -Xmx384m -XX:MaxMetaspaceSize=64m -jar app.jar
-
使用环境变量动态配置:
FROM openjdk:11 ENV JAVA_OPTS="-Xmx384m -XX:MaxMetaspaceSize=64m" CMD java ${JAVA_OPTS} -jar app.jar
运行时可覆盖:
docker run -m 512m -e JAVA_OPTS="-Xmx256m" my-java-image
-
监控与调优:
- 使用
docker stats
监控容器内存使用。 - 结合 JVM 工具(如
jcmd
、jstat
)分析堆和非堆内存。
- 使用
容器内应用调试
概念定义
容器内应用调试是指在 Docker 容器中运行的 Java 应用程序出现问题时,通过一系列工具和技术手段进行问题诊断和修复的过程。由于容器环境的隔离性,调试方式与传统的本地调试有所不同,通常需要结合容器特性进行。
使用场景
- 应用启动失败:容器启动后立即退出,需要查看日志或进入容器排查。
- 运行时异常:应用在容器中运行时报错(如空指针、资源不足等)。
- 性能问题:CPU/内存占用过高,线程阻塞等需要分析。
- 网络问题:容器间通信失败或外部服务连接异常。
调试方法
1. 日志查看
# 查看容器标准输出日志
docker logs <容器ID>
# 持续跟踪日志(类似tail -f)
docker logs -f <容器ID>
# 结合grep过滤关键错误
docker logs <容器ID> | grep "ERROR"
2. 进入容器交互模式
# 以bash交互方式进入正在运行的容器
docker exec -it <容器ID> /bin/bash
# 容器没有bash时使用sh
docker exec -it <容器ID> /bin/sh
# 检查Java进程
ps aux | grep java
# 查看JVM参数
jcmd <PID> VM.flags
3. 远程调试(重要)
在Dockerfile中暴露调试端口:
FROM openjdk:11
EXPOSE 5005 # 默认JPDA端口
CMD ["java", "-agentlib:jdwp=transport=dt_socket,server=y,suspend=n,address=*:5005", "-jar", "app.jar"]
启动容器时映射端口:
docker run -p 8080:8080 -p 5005:5005 my-java-app
IDE配置示例(IntelliJ IDEA):
- Run -> Edit Configurations
- 添加Remote JVM Debug
- 填写Host(localhost)和Port(5005)
4. 内存分析
# 生成堆转储文件
docker exec <容器ID> jmap -dump:live,format=b,file=/tmp/heap.hprof <PID>
# 将转储文件复制到宿主机
docker cp <容器ID>:/tmp/heap.hprof .
# 或用jcmd生成(JDK7+推荐)
docker exec <容器ID> jcmd <PID> GC.heap_dump /tmp/heap.hprof
5. 性能分析
# 查看线程栈
docker exec <容器ID> jstack <PID> > thread_dump.log
# 持续监控(类似top)
docker exec <容器ID> jstat -gcutil <PID> 1000 10
常见问题与解决方案
问题1:容器立即退出
# 查看退出码
docker inspect <容器ID> | grep ExitCode
# 常见原因:
# - 143:SIGTERM信号终止(内存不足)
# - 137:OOM被系统杀死
问题2:端口冲突
# 查看容器端口绑定
docker port <容器ID>
# 检查宿主机端口占用
netstat -tuln | grep <端口号>
问题3:时区不一致
# 解决方案:Dockerfile中设置时区
RUN ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
高级技巧
- 临时修改容器:
# 在运行的容器中临时安装工具
docker exec -it <容器ID> apt-get update && apt-get install -y procps
- 使用调试镜像:
FROM openjdk:11-jdk # 使用包含调试工具的JDK镜像
- 健康检查:
HEALTHCHECK --interval=30s --timeout=3s \
CMD curl -f http://localhost:8080/health || exit 1
- 多阶段构建调试:
# 构建阶段使用完整JDK
FROM openjdk:11-jdk as builder
...
# 运行阶段使用JRE但保留调试工具
FROM openjdk:11-jre
COPY --from=builder /app .
注意事项
- 生产环境慎用调试模式(会降低性能且存在安全风险)
- 容器内资源有限,大内存操作可能导致OOM
- 调试完成后及时关闭暴露的调试端口
- 建议使用专门的调试镜像(如openjdk:jdk而非openjdk:jre)
日志文件处理
概念定义
日志文件处理是指在 Docker 构建 Java 镜像时,对应用程序生成的日志文件进行管理、存储和输出的过程。Java 应用通常使用日志框架(如 Log4j、Logback、java.util.logging)生成日志,而在容器化环境中,需要确保日志能够被正确收集、持久化或输出到标准流(stdout/stderr)。
使用场景
- 调试与故障排查:日志是排查容器内 Java 应用问题的主要依据。
- 日志聚合:在微服务架构中,需要将多个容器的日志集中到日志系统(如 ELK、Fluentd)。
- 持久化存储:避免容器重启后日志丢失。
- 性能监控:通过日志分析应用性能(如请求延迟、错误率)。
常见误区与注意事项
- 直接写入容器内文件系统:
- 容器内文件系统是临时的,重启后日志会丢失。
- 正确做法:将日志输出到
stdout/stderr
,由 Docker 日志驱动处理。
- 日志文件未轮转:
- 日志文件可能无限增长,占用磁盘空间。
- 解决方案:配置日志框架的滚动策略(如 Logback 的
TimeBasedRollingPolicy
)。
- 忽略日志级别:
- 生产环境应避免输出
DEBUG
日志,以减少 I/O 开销。
- 生产环境应避免输出
- 未分离应用日志与访问日志:
- 如使用 Tomcat,需分别处理
catalina.out
和应用日志。
- 如使用 Tomcat,需分别处理
示例代码
1. 日志输出到 stdout(推荐)
在 logback.xml
中配置 ConsoleAppender
:
<configuration>
<appender name="STDOUT" class="ch.qos.logback.core.ConsoleAppender">
<encoder>
<pattern>%d{yyyy-MM-dd HH:mm:ss} [%thread] %-5level %logger{36} - %msg%n</pattern>
</encoder>
</appender>
<root level="INFO">
<appender-ref ref="STDOUT" />
</root>
</configuration>
2. 日志文件持久化
通过 Docker 卷(Volume)挂载日志目录:
FROM openjdk:11
VOLUME /app/logs
COPY target/myapp.jar /app/
CMD ["java", "-jar", "/app/myapp.jar"]
运行容器时挂载卷:
docker run -v /host/logs:/app/logs my-java-image
3. 使用 Logrotate 轮转日志
在 Dockerfile 中安装 Logrotate:
FROM openjdk:11
RUN apt-get update && apt-get install -y logrotate
COPY logrotate.conf /etc/logrotate.d/myapp
logrotate.conf
示例:
/app/logs/*.log {
daily
rotate 7
compress
missingok
notifempty
}
高级实践
- 使用 Sidecar 容器收集日志:
- 通过共享卷让一个专用容器处理日志(如 Fluentd)。
- JSON 格式日志:
- 便于日志系统(如 ELK)解析:
<encoder class="net.logstash.logback.encoder.LogstashEncoder"/>
- 便于日志系统(如 ELK)解析:
- 动态日志级别调整:
- 通过 Spring Boot Actuator 或 JMX 动态修改日志级别。
六、实际构建示例
Spring Boot JAR 镜像构建
概念定义
Spring Boot JAR 镜像构建是指将 Spring Boot 应用程序打包成一个可执行的 JAR 文件,然后通过 Docker 将其封装为一个容器镜像的过程。这种构建方式通常利用 Spring Boot 的嵌入式服务器(如 Tomcat、Jetty 或 Undertow),使得应用程序可以作为一个独立的 JAR 文件运行。
使用场景
- 微服务架构:在微服务环境中,每个服务通常是一个独立的 Spring Boot 应用,通过 JAR 镜像构建可以方便地部署和管理。
- 云原生应用:Spring Boot JAR 镜像适合在云平台(如 Kubernetes、Docker Swarm)上运行,便于扩展和运维。
- 快速迭代开发:开发人员可以通过 JAR 镜像快速构建、测试和部署应用,提高开发效率。
常见误区或注意事项
- 镜像大小:Spring Boot JAR 文件通常较大,可能导致镜像体积膨胀。可以通过多阶段构建(multi-stage build)来优化。
- 启动时间:JAR 镜像的启动时间可能较长,尤其是在冷启动时。可以通过调整 JVM 参数或使用 GraalVM 原生镜像来优化。
- 依赖管理:确保所有依赖项都正确打包到 JAR 文件中,避免运行时出现类加载问题。
- 配置文件:注意区分开发、测试和生产环境的配置文件,避免在镜像中硬编码配置。
示例代码
以下是一个典型的 Dockerfile 示例,用于构建 Spring Boot JAR 镜像:
# 第一阶段:构建 JAR 文件
FROM maven:3.8.4-openjdk-11 AS builder
WORKDIR /app
COPY pom.xml .
RUN mvn dependency:go-offline
COPY src/ /app/src/
RUN mvn package -DskipTests
# 第二阶段:运行 JAR 文件
FROM openjdk:11-jre-slim
WORKDIR /app
COPY --from=builder /app/target/your-application.jar /app/your-application.jar
EXPOSE 8080
ENTRYPOINT ["java", "-jar", "your-application.jar"]
多阶段构建优化
多阶段构建可以有效减小最终镜像的大小。以下是一个优化后的 Dockerfile 示例:
# 第一阶段:构建 JAR 文件
FROM maven:3.8.4-openjdk-11 AS builder
WORKDIR /app
COPY pom.xml .
RUN mvn dependency:go-offline
COPY src/ /app/src/
RUN mvn package -DskipTests
# 第二阶段:运行 JAR 文件(使用更小的基础镜像)
FROM adoptopenjdk:11-jre-hotspot
WORKDIR /app
COPY --from=builder /app/target/your-application.jar /app/your-application.jar
EXPOSE 8080
ENTRYPOINT ["java", "-jar", "your-application.jar"]
启动参数优化
可以通过调整 JVM 参数来优化应用程序的启动时间和内存使用:
ENTRYPOINT ["java", "-Xms128m", "-Xmx256m", "-jar", "your-application.jar"]
总结
Spring Boot JAR 镜像构建是一种简单且高效的方式,适合大多数 Spring Boot 应用的容器化部署。通过多阶段构建和 JVM 参数优化,可以进一步提升镜像的性能和效率。
使用 Docker 构建 Tomcat WAR 部署镜像
概念定义
Tomcat WAR 部署镜像是指基于 Docker 容器技术,将 Java Web 应用程序(WAR 文件)与 Apache Tomcat 服务器打包在一起的镜像。这种镜像允许开发者将应用程序及其运行环境作为一个整体进行分发和部署,确保在不同环境中运行的一致性。
使用场景
- 快速部署:简化 Java Web 应用的部署流程,无需手动配置 Tomcat 环境。
- 环境一致性:解决开发、测试和生产环境之间的差异问题。
- CI/CD 集成:与持续集成/持续部署工具(如 Jenkins、GitLab CI)无缝集成。
- 微服务架构:作为微服务的一个独立单元运行。
构建步骤
1. 准备 WAR 文件
确保你的 Java Web 项目已经打包为 WAR 文件,例如 myapp.war
。
2. 编写 Dockerfile
创建一个 Dockerfile
,内容如下:
# 使用官方 Tomcat 镜像作为基础
FROM tomcat:9.0-jdk11-openjdk
# 删除默认的 ROOT 应用(可选)
RUN rm -rf /usr/local/tomcat/webapps/ROOT
# 将 WAR 文件复制到 Tomcat 的 webapps 目录
COPY myapp.war /usr/local/tomcat/webapps/ROOT.war
# 暴露 Tomcat 默认端口
EXPOSE 8080
# 启动 Tomcat
CMD ["catalina.sh", "run"]
3. 构建镜像
在包含 Dockerfile
和 myapp.war
的目录中运行:
docker build -t my-tomcat-app .
4. 运行容器
docker run -d -p 8080:8080 --name myapp-container my-tomcat-app
高级配置
1. 自定义 Tomcat 配置
如果需要修改 Tomcat 的配置文件(如 server.xml
),可以在 Dockerfile 中添加:
COPY server.xml /usr/local/tomcat/conf/
2. 环境变量
通过环境变量配置应用:
ENV MY_APP_ENV=production
3. 数据卷
持久化 Tomcat 日志或应用数据:
docker run -d -p 8080:8080 -v /path/to/logs:/usr/local/tomcat/logs my-tomcat-app
常见问题与注意事项
- WAR 文件路径:确保
COPY
指令中的 WAR 文件路径正确。 - 端口冲突:检查主机上的 8080 端口是否被占用。
- 内存限制:Java 应用可能需要调整 JVM 内存参数:
docker run -d -p 8080:8080 -e JAVA_OPTS="-Xmx512m -Xms256m" my-tomcat-app
- 时区设置:如果需要设置容器时区:
ENV TZ=Asia/Shanghai RUN ln -snf /usr/share/zoneinfo/$TZ /etc/localtime && echo $TZ > /etc/timezone
- 镜像大小优化:使用多阶段构建减少镜像体积:
FROM maven:3.6-jdk-11 AS build COPY . /app RUN mvn -f /app/pom.xml clean package FROM tomcat:9.0-jdk11-openjdk COPY --from=build /app/target/myapp.war /usr/local/tomcat/webapps/ROOT.war
验证部署
访问 http://localhost:8080
查看应用是否正常运行。可以通过以下命令查看日志:
docker logs -f myapp-container
多模块项目构建方案
概念定义
多模块项目构建方案是指将一个大型Java项目拆分为多个相互关联的子模块(Module),每个子模块可以独立开发、测试和构建,最终通过父项目(Parent Project)统一管理和协调依赖关系的构建方式。这种方案通常使用Maven或Gradle作为构建工具。
使用场景
- 大型项目:代码量庞大,需要分模块管理
- 功能解耦:不同功能模块需要独立开发和部署
- 依赖管理:模块间有清晰的依赖关系
- 团队协作:不同团队负责不同模块的开发
常见结构
parent-project/
├── pom.xml (父POM)
├── module-a/
│ ├── src/
│ └── pom.xml
├── module-b/
│ ├── src/
│ └── pom.xml
└── module-common/
├── src/
└── pom.xml
Maven实现方案
父项目配置
<!-- parent/pom.xml -->
<project>
<modelVersion>4.0.0</modelVersion>
<groupId>com.example</groupId>
<artifactId>parent-project</artifactId>
<version>1.0.0</version>
<packaging>pom</packaging>
<modules>
<module>module-a</module>
<module>module-b</module>
<module>module-common</module>
</modules>
<dependencyManagement>
<dependencies>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-dependencies</artifactId>
<version>2.7.0</version>
<type>pom</type>
<scope>import</scope>
</dependency>
</dependencies>
</dependencyManagement>
</project>
子模块配置
<!-- module-a/pom.xml -->
<project>
<parent>
<groupId>com.example</groupId>
<artifactId>parent-project</artifactId>
<version>1.0.0</version>
</parent>
<artifactId>module-a</artifactId>
<dependencies>
<dependency>
<groupId>com.example</groupId>
<artifactId>module-common</artifactId>
<version>${project.version}</version>
</dependency>
</dependencies>
</project>
Gradle实现方案
settings.gradle
rootProject.name = 'parent-project'
include 'module-a'
include 'module-b'
include 'module-common'
父build.gradle
// 配置所有子模块的公共设置
subprojects {
apply plugin: 'java'
repositories {
mavenCentral()
}
dependencies {
// 公共依赖
}
}
子模块build.gradle
dependencies {
implementation project(':module-common')
// 其他模块特定依赖
}
注意事项
- 循环依赖:避免模块间的循环依赖
- 版本管理:统一管理依赖版本(推荐使用dependencyManagement)
- 构建顺序:确保被依赖的模块先构建
- 测试隔离:模块应能独立运行单元测试
- 打包策略:
- 每个模块单独打包
- 或聚合为一个整体包
构建命令
- Maven:
mvn clean install
(在父项目目录执行) - Gradle:
gradle build
(在根项目目录执行)
高级技巧
- Profile管理:不同环境使用不同配置
- 自定义生命周期:添加特定构建阶段
- 依赖范围控制:合理使用compile/runtime/test等scope
- 多模块Docker构建:为每个模块生成独立镜像
常见问题解决方案
- 模块间资源访问:使用classpath资源加载
- 热部署:配置spring-boot-devtools
- 版本冲突:使用
mvn dependency:tree
分析依赖 - 构建性能:
- 并行构建(Maven: -T 1C)
- 增量编译
- 构建缓存(Gradle)
生产环境最佳实践:Docker 构建 Java 镜像
1. 使用多阶段构建(Multi-stage Builds)
多阶段构建可以显著减小最终镜像的体积,同时避免将构建工具和中间文件打包到生产镜像中。
# 第一阶段:构建阶段
FROM maven:3.8.4-openjdk-11 AS builder
WORKDIR /app
COPY pom.xml .
RUN mvn dependency:go-offline
COPY src/ ./src/
RUN mvn package -DskipTests
# 第二阶段:生产阶段
FROM openjdk:11-jre-slim
WORKDIR /app
COPY --from=builder /app/target/myapp.jar ./app.jar
EXPOSE 8080
ENTRYPOINT ["java", "-jar", "app.jar"]
2. 使用合适的基础镜像
- 优先选择官方镜像(如
openjdk
) - 生产环境推荐使用
-slim
或-alpine
变体 - 固定镜像版本(避免使用
latest
标签)
3. 优化镜像层
- 将不经常变化的指令(如依赖安装)放在前面
- 合并相关指令减少层数
- 使用
.dockerignore
文件排除不必要的文件
4. 安全最佳实践
- 不要以 root 用户运行容器:
RUN addgroup -S spring && adduser -S spring -G spring USER spring
- 定期更新基础镜像和安全补丁
- 扫描镜像中的漏洞(如使用 Trivy、Clair)
5. 资源限制和 JVM 调优
- 设置内存限制并相应调整 JVM 参数:
ENV JAVA_OPTS="-XX:MaxRAMPercentage=75.0" ENTRYPOINT exec java $JAVA_OPTS -jar app.jar
- 在运行容器时设置资源限制:
docker run -d --memory=1g --cpus=2 my-java-app
6. 日志处理
- 将日志输出到标准输出/错误流
- 避免将日志写入容器文件系统
- 考虑使用日志驱动或边车容器收集日志
7. 健康检查
HEALTHCHECK --interval=30s --timeout=3s \
CMD curl -f http://localhost:8080/actuator/health || exit 1
8. 环境配置
- 使用环境变量进行配置:
ENV SPRING_PROFILES_ACTIVE=production
- 敏感信息应通过 secrets 或配置中心管理
9. 构建优化
- 利用构建缓存(合理排序 Dockerfile 指令)
- 在 CI/CD 流水线中使用缓存镜像层
- 考虑使用 BuildKit 提高构建性能
10. 监控和指标
- 暴露 Prometheus 指标端点
- 集成 APM 工具(如 OpenTelemetry)
- 确保包含必要的监控代理
通过遵循这些最佳实践,您可以构建出安全、高效且易于维护的 Java 应用 Docker 镜像,适合在生产环境中运行。