[转发]深刻理解git,从研究git目录开始

转发学习的啦。git

彷佛不多有人在读某个git快速教程的时候会说:“这个关于git的快速教程太酷了!读完了用起git来超级舒服,而且我一点也不怕本身会破坏什么东西。”web

 

对git的初学者来讲,刚接触git时就像进入了一个他不会听/说当地语言的陌生国度。若是你知道本身在哪里而且知道怎么走,那就很好。可是若是你迷路了,那麻烦就大了。数据结构

 

市面上已经有不少关于学习git基本指令的文章,所以这篇文章不讲这个。这里咱们将试着从不一样的角度来理解。工具

 

新手们一般都很惧怕git,的确,git确实是一个很强大的工具,但它对使用者并不友好。大量的新概念,一个指令在不一样的状况下作彻底不一样的事情,各类隐含的反馈……学习

 

我认为克服这个困难的一个可行方法就是在git的平常commit/puah以外再多作一点工做,若是花点时间来理解一下git是如何产生的,能帮咱们避免不少麻烦。测试

 理解.gitspa

当你创建了一个git repo,使用git init,git便建立了一个奇妙的目录:.git指针

 

这个文件夹里包含了git工做时所须要的全部信息。须要明确的是,若是想从你的项目中移除git,但保留项目文件,只须要删除.git文件夹便可。可是,为何要这样作呢?对象

|── HEADblog

|── branches

|── config

|── description

|── hooks

| |── pre-commit.sample

| |── pre-push.sample

| └── ...

|── info

| └── exclude

|── objects

| |── info

| └── pack

└── refs

|── heads

└── tags

 

这是你第一次commit以前.git文件夹的样子。

 

HEAD:这个咱们稍后再说。

 

config:这个文件夹里是你的保存设置,这里将写入远程URL,好比你的邮箱、用户名等。每一次在控制端使用“git config”,它都会在这里结束。

 

description:被gitweb (Github的原型)用来显示对repo的描述。

 

hooks:这里有一个有趣的特性。Git有一套能够自动运行在任何一个有意义的git阶段下的脚本,叫作hooks。hooks能够运行在commit/rebase/pull等等状态的以前或以后。脚本的名称决定了它何时被执行。一个有用的pre-push脚本的例子将会被运行以测试控制器(远程控制)中的全部样式规则保持一致。

 

info - exclude:能够将你不想被git处理的文件放到.gitignore文件夹里。被排除的文件能够作到相同的事情,除了它不能被共享。若是你不想将你的自定义IDE关联到congif文件里,就可使用这个。虽然大部分状况下,.gitignore就足够了。

 commit的内部是什么?

每次你建立了一个文件并跟踪它,git都会将其压缩并存储到本身的数据结构中。这个压缩对象有一个独特的名字、一个哈希码,存储在对象目录下。

 

在研究对象目录前,咱们要问一个问题,什么是commit。这里commit能够看作是工做目录的一种快照,但不只仅是快照。

 

实际上当你commit时,git只作两件事情来创造你工做目录的快照:

  1. 若是文件没有修改,git仅仅增长压缩文件的名字(hash)到快照中。

  2. 若是文件被修改过,git就将其压缩,再将压缩后的文件存储到对象文件夹中。而后再添加这个压缩文件的文件名(hash)到快照中去。

 

这是一个简化的描述,实际整个过程会复杂一点。

 

一旦快照文件被创建,它也会被压缩并用hash文件命名。那么这些压缩文件在什么地方呢?答案:对象文件夹。

|── 4c

| └── f44f1e3fe4fb7f8aa42138c324f63f5ac85828 // hash

|── 86

| └── 550c31847e518e1927f95991c949fc14efc711 // hash

|── e6

| └── 9de29bb2d1d6434b8b29ae775ad8c2e48c5391 // hash

|── info 

└── pack 

当我建立了一个名为file_1.txt的空文件并commit以后,对象目录应该是如上所看到的样子。请注意若是你的文件的哈希码是“89faaee…”,git将会吧这个文件储存在名为“89”的子目录下,而且命名这个文件为“faaee…”。

 

你看到右边有3个hash字样。一个对应的是个人file_1.txt文件,另外一个对应的是我commit时所建立的快照文件。那么第三个呢?这是由于commit自己也是一个对象,它也会被压缩并被存储在对象文件夹中。

 

记住,一个commit指令实际上包含4件事:

  • 工做目录的快照文件的名称(哈希码)

  • 注释

  • 提交者信息

  • Parent commit的哈希码

 

而后,大家能够本身看一下若是不压缩commit文件时会发生什么:

 

// 查看历史,你会很容易就找到你的commit哈希码

// 你也没必要粘贴所有的哈希码,只要足够就能够了

// 创造了独特哈希码的字符串

git cat-file -p 4cf44f1e3fe4fb7f8aa42138c324f63f5ac85828

获得结果:

tree 86550c31847e518e1927f95991c949fc14efc711

author Pierre De Wulf <test@gmail.com> 1455775173 -0500

committer Pierre De Wulf <test@gmail.com> 1455775173 -0500

commit A

你看,正如咱们所指望的,咱们获得了快照文件的哈希码、做者信息、和个人commit信息。

 

这里有两件很重要的事情:

  • 正如所指望的,那个名为“86550…”的快照哈希文件也是一个对象,而且可以在对象文件夹中被找到。

  • 由于这是个人第一个commit,因此没有Parent。

 

快照文件本质上是什么呢?

git cat-file -p 86550c31847e518e1927f95991c949fc14efc711

100644 blob e69de29bb2d1d6434b8b29ae775ad8c2e48c5391 file_1.txt

这里,咱们找到咱们对象存储器中以前存储的最后一个对象,咱们快照文件中仅有的对象。这是一个blob,但不是咱们今天要讲的。

 

分支、标签、HEAD,它们都同样。

 

因此,如今你明白了git中的任何事情均可以用一个正确的hash来获得。如今,让咱们来看一看HEAD。那么,HEAD中又有什么呢?

cat HEAD

ref: refs/heads/master

这不是一个哈希码,但它有价值,由于HEAD能够被认为是一个指向你正在使用的分支的指针。如今,咱们看一下refs/heads/master内部,咱们会看到以下信息:

 

cat refs/heads/master

4cf44f1e3fe4fb7f8aa42138c324f63f5ac85828

是否是很眼熟?是的,这和咱们第一次commit时的哈希码是彻底同样的。这说明 branches和tags无非就是一个指向commit的指针。

 

这意味着你能够删除全部你想删除的branches和tags,而它们所指向的 commit会仍然保留在这里。仅仅是访问commit更困难一点。

如今你应该明白,当你用一堆其它的指令来命令“压缩”你目前的工做目录并储存在对象文件夹时,git实际上都作了些什么。若是你对这些工具足够熟悉,你就应该彻底知道哪些文件应该包含在commit中,而哪些文件不该该。

 

个人意思是commit并不真的是你工做目录的快照,而是你想要commit的文件的快照。那么在你保存你想要commit的文件以前,git将它们保存在哪里呢?它将这些文件保存在索引文件。这里咱们就不继续往下深究了,感兴趣的读者请继续研究。

相关文章
相关标签/搜索