Docker 彻底删除私有库镜像的操作
首先看看网上一般的做法
私有库默认是不支持删除镜像的,需要修改config.yml配置文件,在storage节点下加入 delete: enabled: true ,然后重启私有库。
docker 提供的镜像删除api为:
repository 为镜像的repository
reference 为镜像push成功后生成的 digest:sha256 值
获取 digest :
注意:
--header "accept: application/vnd.docker.distribution.manifest.v2+json" 这个header 是必须要加的,不加的话content-type 是v1+prettyjws,获取的digest是错误的!!
例:
删除镜像:
例:
删除后我们查看下私有库
就会发现刚删除的那个tag不见了。但是如果在执行命令的前后车库内私有库镜像存储目录的文件大小,会发现并没有多大的变化
显然数据并没有被真的删除,我们还需要运行docker提供的垃圾回收命令。
垃圾回收
我们需要登录 私有库所在的服务器,然后执行命令:
当然,也可以进入到私有库的容器中,再执行:
这种方法特别麻烦,只能删tag,不会删repository,删除之后会在blobs目录下留下很多空文件夹,而且如果一个repository下有多个tag,而这些tag的数据相同的话,删除其中一个tag会同时把所有tag都删了
虽然网上有删除私有库镜像的python脚本,但是我感觉并不好用。
我是不会满足于此的,于是我自己写了个sh脚本,先来看看效果。
脚本还有一些人性化的提示,而且sh脚本通俗易懂,容易扩展,脚本我也上传到github上了,有兴趣的可以下载试试。
github地址:
下载运行:
然后就可以使用docker-delete命令了,如果你觉得脚本有哪些用着不舒服的地方,可以编辑脚本自己改改
原理解析:
(在以下的截图中 /opt/data/registry是我运行容器时私有库镜像存储目录挂载到本地的目录)
私有库镜像存储目录下有两个文件夹 blobs和 repositories
其中repositories目录下是以镜像repository命名的几个文件
也就是说想要知道私有库有哪些镜像,直接看这个文件夹有哪些子文件夹就知道了
而在每个镜像repository文件夹/_manifests/tags目录下可以 看到该镜像有哪些tag
但是镜像的真实数据并不在repositories目录下,而是以数据块的方式存储在blobs目录下,一个镜像被分成多个数据块,也就是执行垃圾回收命令时输出的 ‘marking blob …‘那样的关联关系,而镜像和数据块之间的关联关系就是在 repositories/镜像repository/_manifests/revisions/sha256/ 目录下的sha256值。
在以sha256值命名的目录下有个link的文件,内容就是这个sha256值
经过我测试发现,只要这个link文件被删除,然后在私有库容器内执行垃圾回收命令‘ registry garbage-collect /etc/docker/registry/config.yml',那么这个sha256值关联的blobs就会被彻底删除
但是,一个镜像可能有很多个tag,那么这个sha256值关联的 blobs数据 到底属于哪个 tag呢?
我们进到镜像的某个tag/index/sha256/ 目录,会发现 有个 sha256值命名的文件夹,而且这个sha256值 在之前的revisions/sha256/ 下存在。在这个文件夹下也有个link文件,保存了该sha256值。
所以根据我的理解,当我们调用docker提供的api 删除一个tag时,会在这个镜像的tag/index/sha256/<sha256值>/link文件中获取sha256值,然后看是不是还有其他tag也关联了这个sha256值,如果有的话,只删除这个tag文件夹,如果没有的话,那么在删除这个tag的文件的同时还会删掉 revisions/sha256/ 目录下的 改sha256对应的link文件,这样的话,当在容器内执行垃圾回收的命令时,就会彻底删除该sha256值关联的blobs数据。
特别注意:
在彻底删除一个镜像的数据后,需要重启下私有库容器,如果不重启的话,你再push该镜像到私有库时,总是会输出 layer already exists ,似乎是push上去了,但是如果你删除本地的该镜像,然后再pull ,就会报错。
当然,我写的脚本里是有这个步骤的
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。
上一篇: 一些快速测试U盘质量的方法