如何清洗 Git Repo 代码仓库
程序员文章站
2022-03-08 12:22:57
...
相信不少团队的代码仓库 Git Repo 变得越来越大。除了代码的提交外,时常有人会把二进制文件比如 Jar 包或者不小心把不改提交到代码库的文件提交到代码库中,比如用户名密码之类的保密信息。如何清洗代码仓库 Git Repo,彻底从历史中删除此类文件呢?
手动清理
如果你们的代码仓库问题比较少,只有几个不该提交的文件,可以参考 Atlassian 的一篇关于维护 Git Repo 的文章(见文章最后的链接)。
大致过程如下:
首先进行 Git 垃圾回收:
git gc --auto
其次查看 Git 仓库占用空间:
$ du -hs .git/objects 45M .git/objects
然后找出历史中超过一定大小的文件,最后在历史中删除并且提交。如果感兴趣手动处理这个过程可以参照文章后边的链接。
相关的几个命令:
清理历史中的文件:
git filter-branch --force --index-filter 'git rm --cached --ignore-unmatch ****/nohup.out' --prune-empty --tag-name-filter cat -- --all git filter-branch --index-filter 'git rm --cached --ignore-unmatch ****/nohup.out' HEAD git for-each-ref --format="%(refname)" refs/original/ | xargs -n 1 git update-ref -d
强制提交覆盖:
git reflog expire --expire=now --all git gc --prune=now git push --all --force git push --all --tags --force
但是这个方案有 2 个问题:1. 处理速度慢,尝试清理 2 G 大小的代码库,用了 1 晚上还没跑完。2. 只能按文件名清理,如果不同的路径有同样的文件名就无法处理了,可能误删文件或者忽略某些文件。当然有个非常好的解决方案完美解决了这个问题。
自动清理
答案就是 bfg-repo-cleaner,这是一个 Java 写的清理工具,多线程处理清理过程,命令很简单,只需要几分钟就清理了之前 1 晚上都跑不完的任务:
java -jar bfg-1.11.7.jar --delete-files *.zip myrepo.git java -jar bfg-1.11.7.jar --delete-files *.log myrepo.git java -jar bfg-1.11.7.jar --delete-files *.out myrepo.git java -jar bfg-1.11.7.jar --strip-blobs-bigger-than 1M myrepo.git
附上几个常用的但又不常见的 git 小技巧:
复制代码仓库:
git clone --bare /var/www/html/myrepo.git
Git 后悔药,覆盖最后一次修改:
git add . git commit --amend git push origin master -f
Git 放弃本地修改:
git checkout .
Git 销毁最后一次提交:
git reset --hard HEAD^ git push -f origin HEAD^:master
打包时候嵌入版本号:
git rev-parse HEAD > version.txt
文章中涉及的链接:
- https://confluence.atlassian.com/display/BITBUCKET/Maintaining+a+Git+Repository
- http://rtyley.github.io/bfg-repo-cleaner/
- http://www.d-wood.com/blog/2014/10/03_6965.html
上一篇: 敏捷开发与 DevOps 实战
推荐阅读
-
mac如何用git更新代码
-
【前端开发环境】前端使用GIT管理代码仓库需要掌握的几个必备技巧和知识点总结
-
使用KubeAdm部署Kubernetes集群——如何访问google代码仓库及Yum源
-
【前端开发环境】前端使用GIT管理代码仓库需要掌握的几个必备技巧和知识点总结
-
git clone下来的代码如何放在指定路径
-
如何将代码push到github远程仓库
-
下载安装Git并将代码从本地仓库提交到码云远程仓库
-
git本地仓库关联多个remote,怎么用本地一个分支向不同remote不同分支推送代码
-
SAE上应用的Git代码仓库管理基本操作讲解
-
GIT的使用(Gitlab上传本地仓库代码,Webstorm修改更新)