Docker 镜像安全

Begindev 编辑部 April 1, 2026

构建强大容器安全的根本原则并非始于运行时，而是从 Docker 镜像被构思和构建的那一刻起就已经决定了。一个不安全的 Docker 镜像，就像是地基打得不牢靠的建筑物，会破坏后续所有的安全措施，让你的应用极易受到攻击。

本章将深入探讨加固 Docker 镜像和 Dockerfile 的关键实践与注意事项，为你容器化的应用建立安全的基线。我们将一起探索如何在镜像构建过程中，通过周密的设计选择来显著减少攻击面、贯彻最小权限原则，并防止敏感数据的意外泄露，从而为构建更安全的 Docker 环境搭建好舞台。

1. 安全镜像设计原则

保护 Docker 镜像安全是一个迭代的过程，核心在于从底层开始尽量减少潜在的攻击面并遵循安全最佳实践。通过将这些原则直接融入到你的 Dockerfile 和构建流水线中，你能为应用打造一个更具弹性的基础。

1.1 最小化攻击面

一个镜像包含的组件、二进制文件和依赖库越少，存在漏洞或被利用的机会就越小。每一个额外的软件包、文件或指令，都在无形中增加了潜在的攻击面。

1.2 使用精简的基础镜像

你选择的基础镜像可能是决定镜像安全性最重要的因素。较小的基础镜像通常意味着较小的攻击面，因为它包含的预装包和实用工具更少。

官方镜像：始终优先选择 Docker Hub 上的官方镜像。这些镜像由供应商或社区维护，经常进行漏洞扫描，并且普遍遵循最佳实践。
Alpine Linux：alpine 是非常受欢迎的基础镜像选择，因为它的体积极其小巧。它使用 musl libc 和 BusyBox，生成的镜像通常只有几兆字节。

真实案例 1：一家大型云服务提供商为各种运行环境（Python、Node.js）提供基于精简 Alpine 镜像的 Serverless 无服务器函数。由于底层环境被精简到了极致，这使得客户部署应用时的冷启动时间大幅缩短，安全足迹也更小。

Distroless 镜像：由 Google 开发的 distroless 镜像仅仅包含你的应用程序及其运行时的依赖项。它们不包含包管理器、Shell 控制台或其他标准的操作系统组件。通过移除这些常见的攻击媒介，极大地提升了安全性。

真实案例 2：一家处理敏感金融交易的机构部署了一个处理支付数据的微服务。为了确保最高级别的镜像安全，他们为 Java 应用使用了 gcr.io/distroless/java 基础镜像。这个镜像精简到甚至没有 ls 或 bash 命令，如果漏洞被利用，极大地限制了攻击者探索或操纵容器的能力。

应用特定的 slim 或 onbuild 镜像：许多官方镜像都提供 slim 或 onbuild 变体。例如，python:3.9-slim-buster 提供了一个基于 Debian 的 Python 运行环境，但去除了完整 Debian 镜像中那些不必要的文档、开发工具或系统实用程序。

1.3 移除不必要的包和文件

在镜像构建过程中，避免安装应用程序运行并非绝对需要的软件包。如果某些包仅在构建过程需要（例如编译器），请确保在同一个 RUN 层中将它们删除，以免它们成为最终镜像的一部分，或者你也可以利用多阶段构建。

假设场景：“EcoWebApp” 团队开发了一个 Python Web 应用。为了图方便，他们最初的 Dockerfile 在一个 RUN 命令中安装了 git、make、gcc 以及许多 Python 开发库。这导致镜像大小达到了 800MB。在安全审计后发现，应用的运行时根本不需要这些工具。通过重构 Dockerfile，仅安装运行时依赖并确保清理临时文件，镜像大小缩小到了 150MB，同时清除了数百个潜在的漏洞。

1.4 善用 .dockerignore

.dockerignore 文件的作用类似于 .gitignore，它可以防止指定的文件和目录被复制到构建上下文中。这对于避免将敏感文件、开发产物或庞大且不必要的目录包含到你的镜像层中至关重要。

.dockerignore 中常见的包含项示例：

.git/
.vscode/
node_modules/ (如果是要在容器内安装，而不是复制预编译好的)
*.log
*.env (或其他包含敏感秘钥的配置文件)
tmp/
dist/ (如果它不是最终产物)
README.md

2. 贯彻最小权限原则

容器应以执行其功能所需的最小权限运行。在容器内以 root 用户身份运行应用程序是一种常见的反模式（Anti-pattern），这会显著放大系统被攻破后的影响。

2.1 以非 Root 用户运行

默认情况下，Docker 容器内的进程以 root 身份运行。Dockerfile 中的 USER 指令可以指定运行后续命令的用户。最佳实践是创建一个专门的非 root 用户，并在运行应用程序之前切换到该用户。

真实案例 1：一个 Nginx Web 服务器的 Docker 镜像通常会以 nginx 或 www-data 用户身份运行 nginx 进程。如果攻击者利用了 Nginx 的漏洞，由于被破坏的进程只有有限的系统权限，就能防止攻击者轻易修改关键系统文件或越权逃逸。

真实案例 2：在容器中运行的 Jenkins CI/CD 代理需要执行构建任务。该代理的 Dockerfile 创建了一个具有唯一 UID 和 GID 的特定 jenkins 用户。USER jenkins 指令确保所有构建步骤都在这个低权限用户下执行，从而减少了恶意构建脚本尝试执行系统级操作时的爆炸半径。

2.2 设置合适的文件权限

将非 root 用户策略与严格的文件权限结合起来。确保应用程序文件归非 root 用户所有，并且需要写入访问权限的目录设置了合理的权限，通常不应是全局可写的。

使用 RUN chown -R <user>:<group> /app 更改应用程序目录的所有权。
使用 RUN chmod -R go-w /app 移除不需要全局可写（world-writable）权限的地方。

3. 信任与不可变性

确保镜像的完整性和来源，并防止敏感数据意外泄露，对于安全的软件供应链来说至关重要。

3.1 选择官方及受信任的基础镜像

始终从受信任的来源开始构建基础镜像，主要是 Docker Hub 的官方镜像。如果使用私有镜像仓库，请确保对谁可以发布镜像进行严格的控制，并对镜像进行扫描和签名。

3.2 固定镜像版本

永远不要在生产环境镜像中使用 latest 标签。 latest 标签是可变的，并且会随着时间推移而改变，这会导致构建不可重现。如果底层镜像更新了破坏性的更改或新的漏洞，还会导致意外行为或安全风险。

与其使用 FROM node:latest，不如使用 FROM node:16.14.2-alpine 或 FROM node:lts-alpine。这保证了你的构建具有确定性，并让你能掌控何时更新依赖项。

真实案例：一家公司后端依赖特定版本的 Java 应用服务器。通过将镜像固定为 tomcat:9.0.58-jdk11-openjdk-slim-buster，他们确保了生产环境部署始终使用这个确切的、经过测试的版本，从而防止了自动化基础镜像更新可能带来的兼容性问题，或引入在测试版本中不存在的漏洞。

3.3 避免在镜像中硬编码敏感数据

绝对不要将机密信息（API 密钥、数据库凭据、私钥）直接嵌入到 Docker 镜像中。一旦构建了镜像，包含在其中的任何内容都会成为层的一部分，很难被彻底删除，从而可能暴露给任何有权访问该镜像的人。

机密信息应该在运行时通过环境变量、Docker Secrets（用于 Swarm 集群）、Kubernetes Secrets 或外部的机密管理工具（如 HashiCorp Vault）传递给容器。

假设场景：一个开发团队不小心将他们的 AWS 访问密钥包含在了一个 .env 文件中，该文件被复制到了 Docker 镜像中。随后这个镜像被推送到公开的 Docker Hub 仓库。攻击者发现了该镜像，提取了 AWS 密钥，并利用它部署了恶意的 EC2 实例，造成了巨额财务损失并可能访问了敏感数据。

4. 构建过程安全

你编写 Dockerfile 指令的方式也会产生安全影响，这不仅仅关乎最终镜像里有什么。

4.1 使用 COPY 替代 ADD

与 COPY 相比，ADD 指令具有额外的功能。它可以自动解压缩文件，还可以从 URL 获取文件。虽然方便，但这也增加了复杂性和潜在的攻击媒介。

从 URL 执行 ADD 可能会引入不受信任的内容。
如果压缩包是恶意的，自动提取可能会导致“Zip 炸弹（zip bomb）”攻击或路径穿越问题。

最佳实践：对于本地文件使用 COPY；如果需要获取远程文件，请在 RUN 命令中使用 curl 或 wget，并在必要时执行显式的安全校验。

4.2 战略性地安排 Dockerfile 指令顺序

利用 Docker 的分层缓存机制来为你服务。将不常更改的指令（如安装系统依赖）放在 Dockerfile 的前面。后面层的更改只会使它之后的层失效，从而加快构建速度。从安全的角度来看，这意味着：

先放稳定的基础镜像：FROM 指令。
接下来是系统依赖：RUN apt-get update && apt-get install -y ...
应用依赖：COPY requirements.txt .，然后 RUN pip install -r requirements.txt。
最后是应用代码：COPY . .

这也意味着，如果你因为某个应用依赖出现漏洞而需要重新构建，最初的、更稳定的层（基础操作系统、核心系统工具）可能会保持缓存状态不被触及，从而降低了无意中从这些层引入新漏洞的几率。

5. 实战演示：构建安全镜像

让我们用一个简单的 Python Web 应用程序来说明这些原则。

5.1 不安全的 Dockerfile 示例

下面是一个基础 Flask 应用程序的不安全 Dockerfile 示例：

# 不安全的 Dockerfile
FROM python:latest

# 安装系统依赖（包含了不必要的构建工具）
RUN apt-get update && \
    apt-get install -y build-essential curl git && \
    rm -rf /var/lib/apt/lists/*

# 设置工作目录
WORKDIR /app

# 复制应用代码（可能会连带包含敏感文件）
ADD . /app

# 安装 Python 依赖
RUN pip install flask gunicorn

# 暴露端口
EXPOSE 8000

# 以 root 用户身份运行
CMD ["gunicorn", "--bind", "0.0.0.0:8000", "app:app"]

假设有一个简单的 app.py：

# app.py
from flask import Flask, request

app = Flask(__name__)

@app.route('/')
def hello():
    return f"Hello, Docker! Your request was from {request.remote_addr}\n"

if __name__ == '__main__':
    app.run(host='0.0.0.0', port=8000)

同目录下可能还有一个 secrets.env 文件：

DB_PASSWORD=mysecretpassword
API_KEY=anothersecretkey

如果我们构建这个镜像 (docker build -t insecure-app .) 然后运行它 (docker run -p 8000:8000 insecure-app)，应用程序也许能跑起来，但它存在几个严重的安全缺陷：

FROM python:latest：使用了可变的 latest 标签。
build-essential curl git：安装了运行时不需要的开发工具和实用程序，显著增加了镜像体积和攻击面。
ADD . /app：极其容易将敏感文件（如 secrets.env）复制到镜像中。
以 root 运行：默认情况下，应用以提升的特权运行。

为了演示最后一点，如果你进入正在运行的容器（docker exec -it <container_id> bash），你会发现你是 root。

docker build -t insecure-app .
# ... 输出信息 ...
docker run -d -p 8000:8000 insecure-app
# ... 输出容器 ID ...
docker exec -it <container_id> bash
root@<container_id>:/app# whoami
root
root@<container_id>:/app# ls -la secrets.env # 如果 secrets.env 存在的话
-rw-r--r-- 1 root root 38 Feb 1 10:00 secrets.env
root@<container_id>:/app# exit

5.2 安全的 Dockerfile 示例

让我们运用最佳实践重构前面的示例。

首先，在同一目录创建一个 .dockerignore 文件：

# .dockerignore
.git
__pycache__
*.pyc
*.env
*.log

现在，这是改进后的 Dockerfile：

# 用于 Flask 应用的安全 Dockerfile

# --- 构建阶段 ---
FROM python:3.9.10-slim-buster AS build_deps

# 安装 Python 包所需的构建依赖
# 这一层利用 `build_deps` 实现了多阶段构建的优势，
# 虽然多阶段构建在后续章节会详细讲解。
# 目前，只需关注“最小化依赖”这个概念。
RUN apt-get update && \
    apt-get install -y --no-install-recommends gcc libpq-dev && \
    rm -rf /var/lib/apt/lists/*

# 设置依赖安装的工作目录
WORKDIR /app

# 仅复制 requirements 文件用于安装依赖
COPY requirements.txt .

# 安装 Python 依赖
RUN pip install --no-cache-dir -r requirements.txt

# --- 最终镜像阶段 ---
FROM python:3.9.10-slim-buster

# 创建一个非 root 用户和用户组
# 定义 UID 和 GID 以提高一致性和安全性
ARG APP_USER=appuser
ARG APP_UID=1000
ARG APP_GID=1000

RUN groupadd -r -g ${APP_GID} ${APP_USER} && \
    useradd -r -g ${APP_USER} -u ${APP_UID} -s /sbin/nologin -c "Application User" ${APP_USER}

# 设置工作目录
WORKDIR /app

# 复制应用文件（经过 .dockerignore 过滤后）
# 使用 COPY 替代 ADD
COPY app.py .
COPY --from=build_deps /usr/local/lib/python3.9/site-packages /usr/local/lib/python3.9/site-packages

# 设置应用目录的所有权和权限
# 确保 appuser 拥有正确的权限
RUN chown -R ${APP_USER}:${APP_USER} /app && \
    chmod -R 755 /app && \
    chmod 644 /app/app.py

# 切换到非 root 用户
USER ${APP_USER}

# 暴露端口（作为元数据，而非实际网络开放）
EXPOSE 8000

# 运行应用程序的命令
# 用于敏感信息的环境变量应在运行时传递，而不是在镜像中。
CMD ["gunicorn", "--bind", "0.0.0.0:8000", "app:app"]

以及 requirements.txt：

Flask==2.0.2
gunicorn==20.1.0

让我们来构建这个安全镜像：

docker build -t secure-app .
# ... 输出信息 ...
docker run -d -p 8000:8000 secure-app
# ... 输出容器 ID ...
docker exec -it <container_id> bash
# 终端提示符可能甚至不会显示 root，或者如果设置了 nologin，你可能会收到权限被拒绝的提示。
# 如果你能获取 shell，尝试输入：
whoami
# appuser
ls -la secrets.env # 由于 .dockerignore 的存在，该文件不应该在镜像中
# ls: cannot access 'secrets.env': No such file or directory
exit

关键改进与原理解析：

FROM python:3.9.10-slim-buster：使用了特定、不可变且极简的基础镜像版本。这是 Debian (Buster) 的 slim 变体，比完整的 Debian 镜像小得多。
多阶段构建概念 (FROM ... AS build_deps)：通过在临时阶段安装构建时的依赖项，然后仅将产物（此例中为安装好的 Python 包）复制到最终阶段，演示了移除不必要工具的原则。最终镜像不包含 gcc 或 libpq-dev。
没有 build-essential：仅安装了编译 Python 包必需的构建时包（gcc, libpq-dev），并且这些包已从最终镜像中剔除。
COPY requirements.txt . 在 COPY app.py . 之前：利用了 Docker 缓存。如果 requirements.txt 没有改变，pip install 层将被缓存，从而在仅修改 app.py 时加快重构速度。
pip install --no-cache-dir：防止 pip 存储缓存文件，进一步缩减镜像体积。
非 Root 用户 (APP_USER, USER appuser)：创建了一个专门的非 root 用户 appuser，应用程序在该用户下运行。这大幅降低了潜在安全事故带来的冲击。
chown 和 chmod：正确的权限保证了应用用户只拥有必要的文件所有权，且不存在不必要的全局写入权限。
.dockerignore：防止敏感文件（.env）和开发产物被复制到镜像中。
COPY vs ADD：明确地将 COPY 用于本地文件。
运行时机密：明确规定敏感数据必须在运行时传入，不得嵌入。