欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

全面讲解Docker容器技术的基本概念

程序员文章站 2022-06-25 17:04:57
这篇文章主要介绍了Docker的基本概念,并帮助读者区分了Docker与传统虚拟机的不同,Docker是时下最火爆的容器虚拟化技术,需要的朋友可以参考下... 15-12-14...

什么是docker?
docker的英文本意是码头工人,也就是搬运工,这种搬运工搬运的是集装箱(container),集装箱里面装的可不是商品货物,而是任意类型的app,docker把app(叫payload)装在container内,通过linux container技术的包装将app变成一种标准化的、可移植的、自管理的组件,这种组件可以在你的latop上开发、调试、运行,最终非常方便和一致地运行在production环境下。
docker的核心底层技术是lxc(linux container),docker在其上面加了薄薄的一层,添加了许多有用的功能。这篇*上的问题和答案很好地诠释了docker和lxc的区别,能够让你更好的了解什么是docker, 简单翻译下就是以下几点:
docker提供了一种可移植的配置标准化机制,允许你一致性地在不同的机器上运行同一个container;而lxc本身可能因为不同机器的不同配置而无法方便地移植运行;
docker以app为中心,为应用的部署做了很多优化,而lxc的帮助脚本主要是聚焦于如何机器启动地更快和耗更少的内存;
docker为app提供了一种自动化构建机制(dockerfile),包括打包,基础设施依赖管理和安装等等;
docker提供了一种类似git的container版本化的机制,允许你对你创建过的容器进行版本管理,依靠这种机制,你还可以下载别人创建的container,甚至像git那样进行合并;
docker container是可重用的,依赖于版本化机制,你很容易重用别人的container(叫image),作为基础版本进行扩展;
docker container是可共享的,有点类似github一样,docker有自己的index,你可以创建自己的docker用户并上传和下载docker image;
docker提供了很多的工具链,形成了一个生态系统;这些工具的目标是自动化、个性化和集成化,包括对paas平台的支持等;
那么docker有什么用呢?对于运维来说,docker提供了一种可移植的标准化部署过程,使得规模化、自动化、异构化的部署成为可能甚至是轻松简单的事情;而对于开发者来说,docker提供了一种开发环境的管理方法,包括映像、构建、共享等功能。
docker vs. vm
从下图可以看出,vm是一个运行在宿主机之上的完整的操作系统,vm运行自身操作系统会占用较多的cpu、内存、硬盘资源。docker不同于vm,只包含应用程序以及依赖库,基于libcontainer运行在宿主机上,并处于一个隔离的环境中,这使得docker更加轻量高效,启动容器只需几秒钟之内完成。由于docker轻量、资源占用少,使得docker可以轻易的应用到构建标准化的应用中。但docker目前还不够完善,比如隔离效果不如vm,共享宿主机操作系统的一些基础库等;网络配置功能相对简单,主要以桥接方式为主;查看日志也不够方便灵活。
全面讲解Docker容器技术的基本概念

另外,ibm发表了一篇关于虚拟机和linux container性能对比的论文,论文中实际测试了虚拟机和linux container在cpu、内存、存储io以及网络的负载情况,结果显示docker容器本身几乎没有什么开销,但是使用aufs会一定的性能损耗,不如使用docker volume,docker的nat在较高网络数据传输中会引入较大的工作负载,带来额外的开销。不过container的性能与native相差不多,各方面的性能都一般等于或者优于虚拟机。container和虚拟机在io密集的应用中都需要调整优化以更好的支持io操作,两者在io密集型的应用中都应该谨慎使用。
docker组件
全面讲解Docker容器技术的基本概念

docker是cs架构,主要由下面三部分组成:
docker daemon: 运行在宿主机上,docker守护进程,用户通过docker client(docker命令)与docker daemon交互
docker client: docker 命令行工具,是用户使用docker的主要方式,docker client与docker daemon通信并将结果返回给用户,docker client也可以通过socket或者restful api访问远程的docker daemon
docker hub/registry: 共享和管理docker镜像,用户可以上传或者下载上面的镜像,官方地址为https://registry.hub.docker.com/,也可以搭建自己私有的docker registry。
了解了docker的组成,再来了解一下docker的两个主要概念:
docker image:镜像是只读的,镜像中包含有需要运行的文件。镜像用来创建container,一个镜像可以运行多个container;镜像可以通过dockerfile创建,也可以从docker hub/registry上下载。
docker container:容器是docker的运行组件,启动一个镜像就是一个容器,容器是一个隔离环境,多个容器之间不会相互影响,保证容器中的程序运行在一个相对安全的环境中。
docker网络
docker的网络功能相对简单,没有过多复杂的配置,docker默认使用birdge桥接方式与容器通信,启动docker后,宿主机上会产生docker0这样一个虚拟网络接口, docker0不是一个普通的网络接口, 它是一个虚拟的以太网桥,可以为绑定到docker0上面的网络接口自动转发数据包,这样可以使容器与宿主机之间相互通信。每次docker创建一个容器,会产生一对虚拟接口,在宿主机上执行ifconfig,会发现多了一个类似veth****这样的网络接口,它会绑定到docker0上,由于所有容器都绑定到docker0上,容器之间也就可以通信。
在宿主机上执行ifconfig,会看到docker0这个网络接口, 启动一个container,再次执行ifconfig, 会有一个类似veth****的interface,每个container的缺省路由是宿主机上docker0的ip,在container中执行netstat -r可以看到如下图所示内容:
全面讲解Docker容器技术的基本概念

容器中的默认网关跟docker0的地址是一样的:
全面讲解Docker容器技术的基本概念

当容器退出之后,veth*虚拟接口也会被销毁。
除bridge方式,docker还支持host、container、none三种网络通信方式,使用其它通信方式,只要在docker启动时,指定--net参数即可,比如:

复制代码
代码如下:

docker run -i -t --net=host ubuntu /bin/bash

host方式可以让容器无需创建自己的网络协议栈,而直接访问宿主机的网络接口,在容器中执行ip addr会发现与宿主机的网络配置是一样的,host方式让容器直接使用宿主机的网络接口,传输数据的效率会更加高效,避免bridge方式带来的额外开销,但是这种方式也可以让容器访问宿主机的d-bus等网络服务,可能会带来意想不到的安全问题,应谨慎使用host方式;container方式可以让容器共享一个已经存在容易的网络配置; none方式不会对容器的网络做任务配置,需要用户自己去定制。
docker生态
随着docker迅速火遍全球, 以docker为基础的生态系统也迅速的发展起来,从以部署和运行container为基础的coreos到各种各样的管理工具和paas软件,docker以及生态产品都在迅猛发展,以下介绍几个代表性的软件。
首先介绍coreos,它的出现极大地推动了docker技术的推广和发展,coreos是专门为大规模服务部署而设计的一种新的linux发行版,通过运行轻量级的容器方便扩展和维护大规模的服务。它具有以下特点:
coreos使用container管理服务(容器即服务),即以容器的角度去管理服务,服务的代码和依赖都打包到容器里,打包后的容器直接在coreos上运行管理。通过容器用户不再需要关注虚拟机环境等,极大地降低了服务和系统环境的耦合性。另外部署在coreos的多个容器都运行在各自独立的环境中,不会相互影响。
coreos专门为cluster等大规模部署而设计,提供了etcd进行服务发现,以及fleet管理容器保证服务可用。
coreos更加精简,比如ram使用比普通linux低40%。
coreos采用双分区模式(dual-partition),主分区为主动模式,负责系统运行,被动模式分区负责系统更新,更新时将整个coreos系统下载下来。
coreos是为集群服务而设计的,提供了etcd、fleet等管理工具管理容器和服务。etcd是一种类似zookeeper的分布式key/value存储服务,用于服务发现和配置管理。fleet是容器管理工具,保证服务的可用性,当某个机器的服务不可用时,fleet会将服务迁移到其它机器上运行。
docker生态中还有一个非常重要的容器管理工具--kubernetes,它是google开源的用于在集群环境中管理、维护、自动扩展容器,通过kubernetes可以很方便地在多个机器上管理和部署容器服务。现在已经得到ibm、microsoft、redhat等多个大公司的支持。
在kubernetes中pod是一个基本单元,一个pod可以是提供相同功能的多个container,这些容器会被部署在同一个minion上。replication controller定义了多个pod或者容器需要运行,如果当前集群中运行的pod或容器达不到配置的数量,replication controller会调度容器在多个minion上运行,保证集群中的pod数量。service则定义真实对外提供的服务,一个service会对应后端运行的多个container。kubernetes的架构由一个master和多个minion组成,master通过api提供服务,接受kubectl的请求来调度管理整个集群。minion是运行kubelet的机器,它接受master的指令创建pod或者容器。
最后介绍一下基于docker实现的paas软件,docker paas软件中以deis和flynn最为知名。deis是基于docker和coreos实现的轻量级的paas,受到heroku的启发,遵循“十二要素”构建应用方法。deis是以应用程序为中心设计的,分为build、release、run三个阶段,用户执行"git push"后,deis使用docker 容器编译并将编译结果保存在docker镜像;发布阶段,一次build和配置文件产生一个数字标识的发布镜像,将发布镜像保存到docker registry中以供后续发布到线上运行;运行阶段应用镜像会被调度到主机上运行,并更新相应的路由。flynn与deis类似,也是以应用为中心,flynn组件分为两层,layer0是底层资源的抽象,主要负责资源调度以及服务发现等,为上层应用容器的运行提供底层资源调度支持;layer1处理具体应用,通过docker容器编译、部署和维护上层应用程序。
相关标签: Docker