Docker镜像构建
程序员文章站
2022-05-23 09:16:48
一、简介 在构建容器化应用时,相当重要的步骤莫过于镜像制作,本文将介绍镜像制作方法以及镜像制作的建议。通常镜像的制作有两种方式: 使用现有的容器使用docker commit 生成镜像 使用Dockerfile进行镜像构建 采用docker commit 生成的镜像实际上是容器内的文件系统进行修改在 ......
一、简介
在构建容器化应用时,相当重要的步骤莫过于镜像制作,本文将介绍镜像制作方法以及镜像制作的建议。通常镜像的制作有两种方式:
- 使用现有的容器使用docker commit 生成镜像
- 使用dockerfile进行镜像构建
采用docker commit 生成的镜像实际上是容器内的文件系统进行修改在进行提交,而运行的容器实际上是在镜像的文件系统顶层添加了一层读写层,所都的修改都是基于这一层,当生成镜像时会将这一层数据保存,所以每次使用commit提交镜像时候都会比原来多一层,这样会使得镜像越来越大并且不易维护。同时,对于镜像使用者来说完全不透明,使用者不清楚该镜像怎么样构建的,是否安全等,这种方式及其不推荐。
而使用dockerfile构建镜像,对于使用者来说完全透明,构建镜像的每一个步骤都在dockerfile文件中描述的清清楚楚,同时当需要对镜像修改时候,只需修改dockerfile文件中的指令,维护镜像只需要维护一个dockerfile,这也是镜像构建的最佳方式。当然,要使用dockerfile就必须明白dockerfile的语法和各个指令,以下将作详细介绍。
二、dockerfile介绍
dockerfile实际上就是一个文本文件,只不过这里的文件内容被docker deamon识别从而进行镜像构建。
使用dockerfile步骤:
1.编写dockerfile文件,用于描述镜像生成的步骤
2.使用docker build -t name:tag 命令构建镜像
语法规则
1.#号代表注解。
2.dockerfile每一行都是以某个指令(约定大写字母)开始,后面可加参数构成完整指令,用于描述镜像构建步骤。
3.指令从上倒下依次执行
4.dockerfile的第一个指令一定是from指令,用于指定基础镜像
5.dockerfile还可以使用.dockerignore文件来忽略在制作镜像时候需要忽略的文件或者目录,列如使用copy指令时候忽略某些文件或者目录。
6.所有指令参数为数组时,最好使用双引号
环境变量引用
1.若要在dockerfile中引环境变量则使用$variable_name或${variable_name}
2.当变量为空或者变量值未设置可以使用${variable_name:-value}来指定变量的默认值
docker build命令
docker build 命令用于基于dockerfile构建镜像,使用语法:
docker build [options] path | url | -
其中path代表含有dockfile的目录,当然也可以是url中含有dockerfile
常用选项:
- -t, --tag list 指定生成镜像标签,格式为name:tag
- -f, --file string 单独指定dockerfile文件位置
- --build-arg list 设置构建时的变量
- --no-cache 构建镜像时候不使用缓存
快速开始
构建一个简单的nginx镜像:
1.创建一个目录用于存放dockerfile
mkdir /opt/demo -p cd /opt/demo/
2.编辑dockerfile文件,如果文件名称不是dockerfile需要用-f指定名称。
from centos:latest #指定基础镜像为centos label author=“wd” #指明作者 run yum install -y yum epel-release && yum install -y nginx && echo "${hostname}-nginx server" > /usr/share/nginx/html/index.html #运行命令安装nginx cmd [ "/usr/sbin/nginx", "-g", "daemon off;", "-c", "/etc/nginx/nginx.conf”] #启动容器运行的命令
3.构建镜像
[root@app51 demo]# docker build -t nginx:v1 ./ sending build context to docker daemon 2.048kb step 1/4 : from centos:latest ---> 1e1148e4cc2c step 2/4 : label author="wd" ---> using cache ---> 8eb3ffcb8ba3 step 3/4 : run yum install -y yum epel-release && yum install -y nginx && echo "${hostname}-nginx server" > /usr/share/nginx/html/index.html ---> using cache ---> ac91999a716e step 4/4 : cmd [ "/usr/sbin/nginx", "-g", "daemon off;", "-c", "/etc/nginx/nginx.conf"] ---> running in 323afd4ac89d removing intermediate container 323afd4ac89d ---> 6403c553fd04 successfully built 6403c553fd04 successfully tagged nginx:v1
4.利用制作的镜像启动容器,并查看是否运行成功.
[root@app51 demo]# docker run -d --name nginx-demo-c1 -p 8088:80 nginx:v1 08812b7def62c9ad7879dfa4182bc28a20f524e2dbc5eb6e4fe63d2b67be3cc9 [root@app51 demo]# curl http://127.0.0.1:8088 60e5de135132-nginx server #访问成功 [root@app51 demo]#
以上的dockerfile中的每一行是一个指令,用于描述镜像生成的步骤,以下将介绍这些指令用法。
三、指令详解
from
from指令是最重要且必须为dockerfile中的第一个非注视指令,用于为构建的镜像指定基础镜像。后续指令运行环境基于该基础镜像,构建镜像时候默认会先从主机上寻找镜像,若不存在时则从docker hub上拉取镜像。
语法 :
from <repository> from <repository>[:<tag>] from <repository>@<digest>
解释:
repository:镜像仓库
tag:镜像标签,省略就是latest
digest:镜像哈希码
示例:
from centos:latest
label
label用于为镜像提供元数据信息,其数据格式为key=value。
语法 :
label <key>=<value> <key>=<value> <key>=<value> ...
示例:
label "com.example.vendor"="acme incorporated” label maintainer="svendowideit@home.org.au"
maintainer (deprecated)
用于提供镜像提供者的信息,可以在docker任何位置。该语法可能废弃,推荐使用label
语法:
maintainer <message>
解释:
message:可以是任意文本信息
示例:
maintainer "wd <xxx@163.com>"
copy
用于主机中的文件或者复制到镜像中
语法:
copy [--chown=<user>:<group>] <src>... <dest> copy [--chown=<user>:<group>] ["<src>",... "<dest>"]
解释:
src:源文件或者目录,支持通配符。如果src是目录,src目录自己不会被复制,复制的是目录中的文件
dest:容器中文件系统目录,如果目录不存在自动创建创建。
user:复制到容器中的文件所属用户
group:复制到容器中的文件所属用户组
注意事项:
- 如果复制的src或dest中存在空格字符需使用第二种加双引号方式
- src必须是 build的上下文目录(dockerfile同级目录或子目录),不能是父目录或者绝对路径
- 如果指定来多个src或者src中使用了通配符,则dest必须是一个目录,且必须以/结尾
示例:
copy hom* /mydir/ #拷贝以hom开头的的所有文件 copy hom?.txt /mydir/ #?代表占位符,可以拷贝
add
add指令类似于copy,但是add比copy更强大,支持tar文件和url路径
语法:
add [--chown=<user>:<group>] <src>... <dest> add [--chown=<user>:<group>] ["<src>",... "<dest>"]
解释
src:源文件或者目录,支持通配符。如果src是目录,src目录自己不会被复制,复制的是目录中的文件
dest:容器中文件系统目录,如果目录不存在自动创建创建。
user:复制到容器中的文件所属用户
group:复制到容器中的文件所属用户组
注意事项:
- 当src是url时,如果dest不以/结尾,则src指定的文件将被下载并且被创建为dest,如果dest以/结尾,则src指定下载的文件会保存在dest目录下。
- 当src是一个本地目录的一个tar压缩格式文件,其在容器中会被展开为目录,类型与tar -x命令,通过url下载的tar文件则不会被解压。
- 如果指定来多个src或者src中使用了通配符,则dest必须是一个目录,且必须以/结尾,多个文件一同被复制在dest目录下
示例:
add hom* /mydir/ add hom?.txt /mydir/
workdir
用于为dockerfile中的各个指定设置工作目录,可以使用多次,当使用相对路径时目录是基于前一个workdir指令。
语法 :
workdir dirpath
示例:
workdir /usr/local
env
用于为镜像定义所需的环境变量,并可被dockfile中位于其以后的指令所调用,如add、copy、run等调用格式为$variable_name或者${variable_name},此外在启动容器时候这些变量也是存在的。
语法:
env <key> <value> env <key>=<value> ...
注意:
- 第一种格式中key之后的所有值会被作为value,因此一次只能设置一个变量
- 第二种格式可一次性设置多个变量,每个变量为一个key=value的键值对,如果value种包含空格,可以用反斜线(\)转义,也可以通过对value加引号进行标识,此外反斜线也可用于续行,多个变量时候建议使用。
示例:
env myname="john doe” \ mydog=rex \ mycat=fluffy env mycat fluffy
run
用于在build过程中运行的程序,可以是任何指令,可以指定多个run
语法:
run <command> #shell 格式默认linux采用/bin/sh -c,windows采用cmd /s /c run ["executable", "param1", "param2”] #可执行程序格式
示例:
run yum install -y nginx run ["/bin/bash", "-c", "echo hello"]
expose
用于为容器暴露端口到外部,用于实现通讯,类似于docker run的-p选项
语法:
expose <port> [<port>/<protocol>...]
解释:
port:端口
protocol:协议,可以是udp或tcp,默认tcp
示例:
expose 8080 expose 8080/udp 8088/tcp
volume
用于在image中创建一个挂载目录,以挂载宿主机上的目录
语法:
volume <path> volume ["path"]
解释:
path:代表容器中的目录,与docker run 不同,dockerfile中不能指定宿主机目录,默认使用docker管理的挂载点
示例:
volume ["/var/log/“] volume /myvol
cmd
用于为在镜像启动为容时候提供的默认命令,该指定可以有多个,但是只有最后一个生效。
语法 :
cmd command param1 param2 #shell格式,含有shell环境 cmd ["executable","param1","param2”] #可执行程序格式 cmd ["param1","param2”] #第三种用于为entrypoint提供默认参数
注意:
- 在第一种格式中command 通常是一个shell命令,且默认以/bin/sh -c来运行它,这意味着此进程在容器的的pid不为1,不能接受unix信号,因此使用docker stop <container>命令停止容器时,此进程接受不到sigterm信号。
- 第二种格式是可执行程序运行方式,不会以"/bin/sh -c”来发起,无shell环境,所有shell变量不能引用,但是可以用"/bin/bash -c”作为启动命令达到第一种格式效果
- 第三种格式需要结合entrypoint使用,作用是为其提供默认参数
entrypoint
类似于cmd功能,用于为启动容器指定默认启动命令,与cmd不同的是entrypoint命令不会随着docker run 后使用的命令覆盖而会把命令作为参数,除非docker run 参数中指定了—entrypoint
语法 :
entrypoint <command> entrypoint ["<executable>", "<param1>", "<param2>"]
注意事项:
- 与cmd类似,第一种方式默认会以/bin/sh -c 启动,而第二种则不会,也就意味着没有shell环境
- 通常entrpoint用于使用entrpoint脚本启动
- 当cmd与entrypoint同时存在时,cmd的参数为entrypoint提供
示例:
[“nginx”,"-g","daemon off"]
user
用于指定构建镜像时run、cmd、entrypoint等指令使用的用户或uid,默认情况容器运行身份为root
语法 :
user <user>[:<group>] user <uid>[:<gid>]
注意事项:
- 指定的user或者group必须在容器中存在,否则指令会运行失败
示例:
user nginx
stopsignal
该指令用于设置容器停止时向容器内进程发送的信号,列如 9 、sigkill、sigterm。
语法:
stopsignal signal
示例:
stopsignal sigkill
注意事项:
- 向容器发送信号只能被pid=1的进程所接收,当pid=1进程不是应用进程时候,应用进程收不到终止信号。
healthcheck
该指令在1.12版本中添加,用于对容器中的应用进行健康检查,不做检查使用none。当对容器做了健康检查时候,检查值为0表示成功,非0表示不健康。
语法:
healthcheck [options] cmd command
其中options有如下选项:
- --interval=duration 检查间隔(默认: 30s)
- --timeout=duration 超时时间(默认t: 30s)
- --start-period=duration 等待检查的时间,默认0s代表一启动就检查 (默认: 0s)
- --retries=n (default: 3) 重试次数
示例:
healthcheck --interval=5m --timeout=3s \ cmd curl -f http://localhost/ || exit 1
shell
将可执行程序运行为shell环境,默认以/bin/sh -c运行
语法:
shell ["executable", "parameters"]
示例:
shell ["echo", “hello"] #等价于 run echo hello
arg
该指令用于在build过程中提供参数,而在命令行使用--build-arg <varname>=<value>来传递参数值,这样可以使用参数进行构建镜像。
语法:
arg <name>[=<default value>]
示例:
dockerfile
from nginx arg conf="/tmp/nginx.conf" label author=wd run touch "${conf}"
构建镜像:
[root@app51 ~]# docker build --build-arg conf='/etc/test.conf' -t nginx:v15.2 ./ sending build context to docker daemon 225.6mb step 1/4 : from nginx ---> f09fe80eb0e7 step 2/4 : arg conf="/tmp/nginx.conf" ---> using cache ---> ac081589c644 step 3/4 : label author=wd ---> using cache ---> 53b9b0ba4460 step 4/4 : run touch "${conf}" ---> running in 50debe96f876 removing intermediate container 50debe96f876 ---> d8680a2433bc successfully built d8680a2433bc successfully tagged nginx:v15.2
运行容器查看:
[root@app51 ~]# docker run --rm nginx:v15.2 ls /etc/test.conf -l -rw-r--r-- 1 root root 0 feb 27 11:18 /etc/test.conf
onbuld
用于在dockerfile中定义一个触发器,当制作出来的镜像被别人用于基础镜像时候自动触发。
语法:
onbuild [instruction]
解释:
instruction:指令可以是run 、copy等
注意事项:
- onbuild不会触发from指令。
- 在镜像标签中应明确指出onbuild关键字,以标记使用其基础镜像会触发其他指令
示例:
onbuild add . /app/src onbuild run /usr/local/bin/python-build --dir /app/src
四、使用multi-stage
在构建镜像过程中,我们可能只需要某些镜像的产物,比如在运行一个go程序需要先go程序包编译后才运行,如果在一个镜像里面完成,先要经过安装编译环境,程序编译完再安装运行环境,最后运行程序,这样的镜像体积往往比较大,不利于我们使用。而真正我们需要的镜像是只有程序包和运行环境,编译环境的构建在运行容器时候是不需要的,所以docker提供了一种解决方案就是multi-stage(多阶段构建)。
docker允许多个镜像的构建可以使用同一个dockerfile,每个镜像构建过程可以称之为一个stage,简单理解就是一个from指令到下一个from指令,而每个stage可使用上一个stage过程的产物或环境(其实还支持其他镜像的),这样一来,最终所得镜像体积相对较小。不仅如此多阶段构建同样可以很方便地将多个彼此依赖的项目通过一个dockerfile就可轻松构建出期望的容器镜像,而不用担心镜像太大、项目环境依赖等问题。
通过上述介绍,我们可以在第一个stage将go程序编译得到编译后程序包,然后在第二个stage中直接拷贝编译好的go程序包到运行环境中,最后的镜像中就只有程序包和运行环境。以下作为示例:
from golang:1.7.3 workdir /go/src/github.com/alexellis/href-counter/ run go get -d -v golang.org/x/net/html copy app.go . run cgo_enabled=0 goos=linux go build -a -installsuffix cgo -o app . from alpine:latest run apk --no-cache add ca-certificates workdir /root/ copy --from=0 /go/src/github.com/alexellis/href-counter/app . cmd ["./app"]
在以上dockerfile中存在两个from指令,也就是两个stage,第一个stage用于构建产物,而在第二个stage中使用copy --from=0 意思将第一个stage中的/go/src/github.com/alexellis/href-counter/app拷贝到.目录,第二个stage仅仅相当于执行copy就有了构建产物,不用在安装编译环境,镜像会很缩小。
命名stage
默认情况下,stage未命名,可以通过整数来引用它们,第一个stage表示0,第二个表1以此类推。 但是,当有多个stage时候,这样会显得麻烦,docker提供as 语法可以为stage命名:
from golang:1.7.3 as builder
然后在另一个stage中使用:
copy --from=builder /go/src/github.com/alexellis/href-counter/app .
使用本地stage
除了可以使用dockerfile中的stage外,构建镜像时候还可以直接使用本地已存在的环境和产物,例如:
copy --from=nginx:latest /etc/nginx/nginx.conf /nginx.conf
构建镜像建议
- 基础镜像尽量选择比体积较小的镜像,如每个官方发行的alpine镜像。虽然这版本镜像比较小,但是与之带来的是利用该类镜像运行的容器中排错的命令很少;
- 使用run指令时候,尽量把多个run指令合并为一个,通常做法是使用&&符号;
- 通过multi-stage方法减少一些不必要使用的环境来减小镜像;
- 安装完成软件同时删除一些不需要的文件或目录;
ref: