一个让 git clone 提速几十倍的小技巧

这是我参与更文挑战的第2天,活动详情查看: 更文挑战git

不知道你们有没有遇到比较大的项目,git clone 很慢很慢,甚至会失败的那种。你们会怎么处理的呢?github

可能会考虑换一个下载源,可能会经过一些手段提升网速,可是若是这些都试过了仍是比较慢呢?typescript

今天我就遇到了这个问题,我须要把 typescript 代码从 gitlab 下载下来,可是速度特别慢:shell

git clone https://github.com/microsoft/TypeScript ts
复制代码

等了好久仍是没下载完,因而我加了一个参数:markdown

git clone https://github.com/microsoft/TypeScript --depth=1 ts
复制代码

这样速度提升了几十倍,瞬间下载完了。gitlab

加上 --depth 会只下载一个 commit,因此内容少了不少,速度也就上去了。post

并且下载下来的内容是能够继续提交新的 commit、建立新的分支的。不影响后续开发,只是不能切换到历史 commit 和历史分支。测试

我用个人一个项目测试过,我首先下载了一个 commit:spa

而后作一下改动,以后 git add、commit、push,可以正常提交:指针

建立新分支也能正常提交。惟一的缺点就是不能切换到历史 commit 和历史分支。

在一些场景下仍是比较有用的:当须要切换到历史分支的时候也能够计算须要几个 commit,而后再指定 depth,这样也能够提升速度。

你们有没有想过,这样能行的原理是什么?

git 原理

git 是经过一些对象来保存信息的:

  • glob 对象存储文件内容
  • tree 对象存储文件路径
  • commit 对象存储 commit 信息,关联 tree

以一个 commit 为入口,关联的全部的 tree 和 blob,就是这个 commit 的内容。

commit 之间相互关联,而 head、branch、tag 等是指向具体 commit 的指针。能够在 .git/refs 下看到。这样就基于 commit 实现了分支、tag 等概念。

git 就是经过这三个对象来实现的版本管理和分支切换的功能,全部 objects 能够在 .git/objects 下看到。

这就是 git 的原理。

主要理解 blob、tree、commit 这三个 object,还有 head、tag、branch、remote 等 ref。

能下载单个 commit 的原理

咱们知道了 git 是经过某一个 commit 作为入口来关联全部的 object,那若是咱们不须要历史天然就能够只下载一个 commit。

这样依然基于那个 commit 建立新的 commit,关联新的 blob、tree 等。可是历史的 commit、tree、blob 由于都没有下载下来因此没法切回去,相应的 tag、branch 等指针也不行。这就是咱们下载了单个 commit 却依然能够建立新的分支、commit 等的原理。

总结

遇到大的 git 项目的时候,能够经过添加 --depth 参数使得速度极大提高,历史 commit 越多,下载速度提高越大。

并且下载下来的项目依然能够进行后续开发,能够建立新的 commit 和新的分支、tag,只是不能切换到历史 commit、分支、tag。

咱们梳理了 git 的原理:经过 tree、blob、commit 这三个 object 来存储文件和提交信息,经过 commit 之间的关联来实现分支、标签等功能。commit 是入口,关联全部的 tree 和 blob。

咱们下载了一个 commit,就是下载了他关联的全部 tree、blob,还有一些 refs (包括tag、branch 等),这就是 --depth 的原理。

但愿你们在不须要切换到历史 commit 和分支的场景下能够用这个技巧来提高大项目的 git clone 速度。

相关文章
相关标签/搜索