Kubernets volume
原文: https://kubernetes.io/docs/concepts/storage/volumes/
容器中的文件是短暂存在的,这会导致一定的问题。首先,当容器挂掉之后,kubelete会重启他,但是文件会丢失掉;其次,在一个pod中运行的各个容器经常需要共享文件。kubernetes的volume就是用来解决这些问题的。
背景
docker也有volume的概念,但是有点松散和缺乏管理。在Docker里,一个volume简单来说就是磁盘上或者另外一个容器中的目录,没有生命周期管理,而且直到最近也只支持本地磁盘的volume。Docker能支持volume driver,但是实用性很受限(docker 1.7 每个容器只支持一种volume driver,而且不能给volume传递参数)。
一个kubernetes的volume,有非常明确的跟Pod一样的生命周期。因此,一个volume比同一个pod中的所有容器都活得长,而且数据是不受容器重启影响的。当然,pod没了,volume也就没了。可能比这更重要的是,kubernetes支持多种类型的volumes,而且一个pod可以同时使用多种voluems。
本质上来说,一个vlomue就是一个目录,可能在里面放了一些数据,这个目录可以被pod里的容器访问。致于这个目录哪儿来的,他背后是什么设备,他的内容是啥,这就要看具体是哪种类型的volume了。
要使用一个volume,需要pod声明提供什么volume(使用spec.volumes字段) 和挂载到哪些容器中 (使用spec.containers.volumeMounts字段).
容器里的进程看到的文件系统,是由docker镜像和volumes组合起来的。Docker镜像是文件系统的root,而其他volumes都是挂载在某个具体的目录上。volumes不能挂载到其他volumes中,也不能有指向其他volume的hard link. Pod中的每个容器必须单独制定挂载那个volume。
TL;DR:
k8s的volume就是好就是好就是好.
Volume类型
kubernets支持这些volume类型:
- emptyDir
- hostPath
- gcePresistentDisk
- awsElasticBlockStore
- nfs
- iscsi
- flocker
- glusterfs
- rbd
- cephfs
- gitRepo
- secret
- persistentVolumeClaim
- downwardAPI
- azureFileVolume
- azureDisk
- vsphereVolume
- Quobyte
- PortworxVolume
- ScaleIO
欢迎你们贡献其他的类型。
emptyDir
emptyDir volume是在Pod被分配到一个Node上之后,最先创建出来的,而且一只存在到Pod不在这个node上了为止。 看名字就看得出来,他是一个空目录。该pod中的容器都可以在emptyDir volume中读写到相同的文件,尽管这个volume可能被挂载在不同容器的不同目录。 当一个Pod不管什么原因被从所在的Node上移除了,emptyDir里的数据也就被永久删除了。 NOTE: 如果仅仅是容器挂掉了,不会导致pod被从node上移除,所以enmptyDir中的数据还是安全的。
一些常见的用途:
- scratch space, such as for a disk-based merge sort
- 长时间计算的检查点用来从crash中恢复
- holding files that a content-manager container fetches while a webserver container serves the data
默认来说,emptyDir volume存储在哪儿是看你的机器的,可能是普通磁盘,可能是SSD,也可能是网络存储,主要看你的环境。但是,你也可以通过把 emptryDir.medium 的值改成 “Memory”, 这样kubernets就会给你挂个tmpfs (基于RAM的文件系统)。虽然tmpfs很快,但是不像磁盘,当机器重启之后,就没了,而且你消耗的空间还要算在容器的内存限制里。
Example Pod
apiVersion: v1
kind: Pod
metadata:
name: test-pd
spec:
containers:
- image: gcr.io/google_containers/test-webserver
name: test-container
volumeMounts:
- mountPath: /cache
name: cache-volume
volumes:
- name: cache-volume
emptyDir: {}
hostPath
hostPath volume 挂载一个宿主机上的目录到你的Pod里。 这可能不是大多是Pod需要用到的,但是他为某些应用提供了一个途径。
举个例子,可以这么用:
- 运行一个容器可能要访问docker内部的什么东西,可以把/var/lib/docker挂进去
- 在一个容器里运行cAdvisor, 把/dev/cgroups挂进去
注意点:
相同配置的pod(必须用podTemplate创建出来的)可能在不同node上的行为不一样,因为不同node上的同一目录上中文件内容不一样。当kubernetes在做调度的时候,如果需要考虑资源情况的话,是管不到hostPath里使用的资源的宿主机上的root用户创建的目录只能被root用户操作。你可能需要在容器里也用root用户运行,或者在宿主机上修改对应目录的权限。
ExamplePod
apiVersion: v1
kind: Pod
metadata:
name: test-pd
spec:
containers:
-image: [gcr.io/google_containers/test-webserver](http://gcr.io/google_containers/test-webserver)
name: test-container
volumeMounts:
-mountPath: /test-pd
name: test-volume
volumes:
-name: test-volume
hostPath: # directory location on host
path: /data
gcePersistentDisk
gcePersistentDisk volume挂载一个Goole Compute Engine(GCE)的 PersistentDisk 到你的pod中。
反正用不到,先不管了。
awsElasticBlockStore
反正也用不到,先不管了
nfs
nfs volume允许一个NFS挂载到你的pods里。不像emptyDir一样会在Pod移除时被擦除掉,nfs volume的内容是受保护的,不会被干掉,只是被unmount掉而已。这就是说,一个NFS volume可以预填充数据,而且这些数据可以在不同pod之间使用。NFS可以同时被多个writer挂载。
有点意思,看个例子:
https://github.com/kubernetes/kubernetes/tree/master/examples/volumes/nfs
iscsi, flocker,glusterfs,rbd,cephfs都用不到,先不管了
gitRepo
gitRepo volume是一个用来展示volume插件能力的例子.他会挂载一个空目录,并且clone一个git库进来供pod使用。在不远的将来,这样的volume们可能会改成更解耦的模型,而不是扩展kubernets的API。
来看个例子:
apiVersion: v1
kind: Pod
metadata:
name: server
spec:
containers:
-image: nginxname:nginx
volumeMounts:
-mountPath: /mypath
name: git-volume
volumes:
-name: git-volume
gitRepo:
repository: "[email protected]:me/my-git-repository.git"
revision: "22f1d8406d464b0c0874075539c1f2e96c253775"
secret
secret volume是用来给pod传递敏感信息的,比如密码。你可以用kubernets API存储秘密信息,然后他们当成文件挂载到需要使用他们的Pod中,这样就可以避免直接跟kubernets发生联系。secret volumes是基于tmpfs的,所以它们永远不会被写到持久化存储上。
提示: 你需要在使用之前先通过kubernets API创建一个secret
persistentVolumeClaim
persistentVolumeClaim volume是用来挂载一个PersitentVolume到pod中的。PersistentVolume是一种让用户在不需要关心具体细节的情况下申请耐用存储(比如GCE PersistentDisk, 或者 ISCSI volume)的方式。
downwardAPi, FlexVolume, AzureFileVolume, AzureDiskVolum, vsphereVolume, Quobyte, PortworxVolume, ScaleIO 先不管了
使用子路径
有些时候,在一个pod中的一个volume可能有多种用途。volumeMounts.subPath 属性可以用来指定一个volume的子路径而不是他的根目录。
来看个例子, 这个例子是一个运行LAMP的pod,使用了一个共享的volume. html内容映射到他的html目录,数据库映射到mysql目录。请看:
apiVersion: v1
kind: Pod
metadata:
name: my-lamp-site
spec:
containers:
- name: mysql
image: mysql
volumeMounts:
- mountPath: /var/lib/mysql
name: site-data
subPath: mysql
- name: php
image: php
volumeMounts:
- mountPath: /var/www/html
name: site-data
subPath: html
volumes:
- name: site-data
persistentVolumeClaim:
claimName: my-lamp-site-data