欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  网络运营

Docker 彻底删除私有库镜像的操作

程序员文章站 2022-12-06 11:07:19
首先看看网上一般的做法私有库默认是不支持删除镜像的,需要修改config.yml配置文件,在storage节点下加入 delete: enabled: true ,然后重启私有库。docker 提供的...

首先看看网上一般的做法

私有库默认是不支持删除镜像的,需要修改config.yml配置文件,在storage节点下加入 delete: enabled: true ,然后重启私有库。

Docker 彻底删除私有库镜像的操作

docker 提供的镜像删除api为:

repository 为镜像的repository

reference 为镜像push成功后生成的 digest:sha256 值

获取 digest :

注意:

--header "accept: application/vnd.docker.distribution.manifest.v2+json" 这个header 是必须要加的,不加的话content-type 是v1+prettyjws,获取的digest是错误的!!

例:

Docker 彻底删除私有库镜像的操作

删除镜像:

例:

删除后我们查看下私有库

就会发现刚删除的那个tag不见了。但是如果在执行命令的前后车库内私有库镜像存储目录的文件大小,会发现并没有多大的变化

显然数据并没有被真的删除,我们还需要运行docker提供的垃圾回收命令。

垃圾回收

我们需要登录 私有库所在的服务器,然后执行命令:

当然,也可以进入到私有库的容器中,再执行:

这种方法特别麻烦,只能删tag,不会删repository,删除之后会在blobs目录下留下很多空文件夹,而且如果一个repository下有多个tag,而这些tag的数据相同的话,删除其中一个tag会同时把所有tag都删了

虽然网上有删除私有库镜像的python脚本,但是我感觉并不好用。

我是不会满足于此的,于是我自己写了个sh脚本,先来看看效果。

Docker 彻底删除私有库镜像的操作

Docker 彻底删除私有库镜像的操作

Docker 彻底删除私有库镜像的操作

脚本还有一些人性化的提示,而且sh脚本通俗易懂,容易扩展,脚本我也上传到github上了,有兴趣的可以下载试试。

github地址:

下载运行:

然后就可以使用docker-delete命令了,如果你觉得脚本有哪些用着不舒服的地方,可以编辑脚本自己改改

原理解析:

(在以下的截图中 /opt/data/registry是我运行容器时私有库镜像存储目录挂载到本地的目录)

私有库镜像存储目录下有两个文件夹 blobs和 repositories

Docker 彻底删除私有库镜像的操作

其中repositories目录下是以镜像repository命名的几个文件

也就是说想要知道私有库有哪些镜像,直接看这个文件夹有哪些子文件夹就知道了

而在每个镜像repository文件夹/_manifests/tags目录下可以 看到该镜像有哪些tag

Docker 彻底删除私有库镜像的操作

但是镜像的真实数据并不在repositories目录下,而是以数据块的方式存储在blobs目录下,一个镜像被分成多个数据块,也就是执行垃圾回收命令时输出的 ‘marking blob …‘那样的关联关系,而镜像和数据块之间的关联关系就是在 repositories/镜像repository/_manifests/revisions/sha256/ 目录下的sha256值。

Docker 彻底删除私有库镜像的操作

在以sha256值命名的目录下有个link的文件,内容就是这个sha256值

经过我测试发现,只要这个link文件被删除,然后在私有库容器内执行垃圾回收命令‘ registry garbage-collect /etc/docker/registry/config.yml',那么这个sha256值关联的blobs就会被彻底删除

但是,一个镜像可能有很多个tag,那么这个sha256值关联的 blobs数据 到底属于哪个 tag呢?

我们进到镜像的某个tag/index/sha256/ 目录,会发现 有个 sha256值命名的文件夹,而且这个sha256值 在之前的revisions/sha256/ 下存在。在这个文件夹下也有个link文件,保存了该sha256值。

Docker 彻底删除私有库镜像的操作

所以根据我的理解,当我们调用docker提供的api 删除一个tag时,会在这个镜像的tag/index/sha256/<sha256值>/link文件中获取sha256值,然后看是不是还有其他tag也关联了这个sha256值,如果有的话,只删除这个tag文件夹,如果没有的话,那么在删除这个tag的文件的同时还会删掉 revisions/sha256/ 目录下的 改sha256对应的link文件,这样的话,当在容器内执行垃圾回收的命令时,就会彻底删除该sha256值关联的blobs数据。

特别注意:

在彻底删除一个镜像的数据后,需要重启下私有库容器,如果不重启的话,你再push该镜像到私有库时,总是会输出 layer already exists ,似乎是push上去了,但是如果你删除本地的该镜像,然后再pull ,就会报错。

当然,我写的脚本里是有这个步骤的

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。