前面一篇文章介绍了Git对象模型,接下来咱们就进入".git"目录看看到底有什么东西,目录中哪些东西又跟Git对象模型相关。结合这个目录,咱们将进一步了解Git的工做原理。git
下面就开始进入.git目录了,经过"ls"命令能够看到.git目录中的文件和子目录:web
对于这些文件和目录,下面给出了一些基本的描述。在后面后有logs、objects、refs、index和HEAD更详细的介绍shell
Git中的引用是个很是重要的概念,对于理解分支(branch)、HEAD指针以及reflog很是有帮助。app
Git系统中的分支名、远程分支名、tag等都是指向某个commit的引用。好比master分支,origin/master远程分支,命名为V1.0.0.0的tag等都是引用,它们经过保存某个commit的SHA1哈希值指向某个commit。spa
HEAD也是一个引用,通常状况下间接指向你当前所在的分支的最新的commit上。HEAD跟Git中通常的引用不一样,它并不包含某个commit的SHA1哈希值,而是包含当前所在的分支,因此HEAD直接指向当前所在的分支,而后间接指向当前所在分支的最新提交。3d
为了更形象的解释上面的描述,咱们首先查看".git/HEAD"的内容:指针
ref: refs/heads/master
这就表示HEAD是一个指向master分支的引用,而后咱们能够根据引用路径打开"refs/heads/master"文件,内容以下:code
4ea6c317a67e73b0befcb83c36b915c1481f2efe
根据前面一片文章的介绍,咱们经过这个哈希值查看对象的类型和内容,能够看到这个哈希值对应一个commit,而且经过"git log"能够发现这个commit就是master分支上最新的提交。对象
因此能够看到,全部的内容都是环环相扣的,咱们经过HEAD找到一个当前分支,而后经过当前分支的引用找到最新的commit,而后经过commit能够找到整个对象关系模型,看下图:blog
直到如今咱们都没有开始介绍分支(branch),这里也不许备介绍分支,只是想大概展现一下引用和分支的关系。
假设咱们如今除了master分支,又建立了一个release-1.0.0.1的分支,再次查看".git/refs/heads/"目录,能够看到除了master文件以外,又多了一个release-1.0.0.1文件,查看给文件的内容也是一个哈希值。
经过"git show-ref --heads"命令就能够产看全部的头,这些都是HEAD的候选值:
根据前面的讲解,这个commit就是就是release-1.0.0.1分支上最新的提交。一样,当咱们把当前分支切换到release-1.0.0.1的时候,HEAD文件的内容也会相应的变成:
ref: refs/heads/release-1.0.0.1
看过第二篇文章的同窗必定还记得咱们是怎么根据reflog去获得一个commit哈希值,而后把repo退回到一个指定的状态。
接下了,咱们进入".git/logs"文件夹,能够看到这个文件夹也有一个HEAD文件和refs目录,些就是记录reflog的地方。
查看HEAD文件的内容,发现这个文件将会包含全部分支的reflog记录:
0000000000000000000000000000000000000000 601b527296fea232c84b3661abcbff0576b1272c WilberTian <Wilber***.com> 1419759347 +0800 commit (initial): add calc.py into repo 601b527296fea232c84b3661abcbff0576b1272c c2163e267380f71373f29f922e7089abbb741772 WilberTian <Wilber***.com> 1419769538 +0800 commit: add sub function in calc.py c2163e267380f71373f29f922e7089abbb741772 4ea6c317a67e73b0befcb83c36b915c1481f2efe WilberTian <Wilber***.com> 1419771391 +0800 commit: add app.py, __init__.py and calc.py 4ea6c317a67e73b0befcb83c36b915c1481f2efe 4ea6c317a67e73b0befcb83c36b915c1481f2efe WilberTian <Wilber***.com> 1419822744 +0800 checkout: moving from master to release-1.0.0.1
进入".git/logs/refs"目录,一样会有master和release-1.0.0.1两个文件,两个文件将会保存各自分支的reflog记录
master的内容:
0000000000000000000000000000000000000000 601b527296fea232c84b3661abcbff0576b1272c WilberTian <Wilber***.com> 1419759347 +0800 commit (initial): add calc.py into repo 601b527296fea232c84b3661abcbff0576b1272c c2163e267380f71373f29f922e7089abbb741772 WilberTian <Wilber***.com> 1419769538 +0800 commit: add sub function in calc.py c2163e267380f71373f29f922e7089abbb741772 4ea6c317a67e73b0befcb83c36b915c1481f2efe WilberTian <Wilber***.com> 1419771391 +0800 commit: add app.py, __init__.py and calc.py
release-1.0.0.1的内容:
0000000000000000000000000000000000000000 4ea6c317a67e73b0befcb83c36b915c1481f2efe WilberTian <Wilber***.com> 1419822744 +0800 branch: Created from master
前面文章咱们也提到过index/stage,就是更新的暂存区,下面就来看看index文件。
index(索引)示一个存放了已排序的路径的二进制文件,而且每一个路径都对应一个SHA1哈希值。在Git系统中,能够经过"git ls-files --stage"来显示index文件的内容:
从命令的输出能够看到,全部的记录都对应仓库中的文件(包含全路径)。经过"git cat-file"命令查看app.py对应的哈希值,能够看到这个哈希值就是表明app.py的blob对象。
如今咱们更新app.py文件,加上一个"div(16, 4)"的调用并经过"git add"添加到暂存区,这时发现index中app.py对象的哈希值已经变化了。
经过这个例子,咱们也能够理解diff操做应该会有怎样的输出了:
前面提到全部的Git对象都会存放在".git/objects"目录中,对象SHA1哈希值的前两位是文件夹名称,后38位做为对象文件名。
因此,咱们前面提到的master上最新的commit对象的哈希值是"4ea6c317a67e73b0befcb83c36b915c1481f2efe",那么这个对象会被存储在".git/objects/4e/a6c317a67e73b0befcb83c36b915c1481f2efe"。进入objects目录后,咱们确实找到了这个文件。
在Git系统中有两种对象存储的方式,松散对象存储和打包对象存储。
松散对象存储就是前面提到的,每个对象都被写入一个单独文件中,对象SHA1哈希值的前两位是文件夹名称,后38位做为对象文件名。
对于松散存储,把每一个文件的每一个版本都做为一个单独的对象,它的效率比较低,并且浪费空间。因此就有了经过打包文件(packfile)的存储方式。
Git使用打包文件(packfile)去节省空间.。在这个格式中,,Git只会保存第二个文件中改变了的部分,而后用一个指针指向类似的那个文件。
通常Git系统会自动完成打包的工做,在已经发生过打包的Git仓库中,".git/objects/pack"目录下会成对出现不少"pack-***.idx"和"pack-***.pack"文件。关于打包就介绍这么多了,暂时尚未去研究两个文件的内容和原理。
这篇文章结合了前一篇的Git对象模型,探索了.git文件夹,经过引用,reflog以及索引的介绍,相信会对Git的工做原理有了更多的了解。
经过这两篇文章介绍下来,感受对谜同样的Git也慢慢的熟悉了起来。