Learn Git in 30 days——第 07 天:解析 Git 资料结构 - 索引结构

发布时间 2023-08-28 20:28:28作者: ☆星空物语☆

写的非常好的一个Git系列文章,强烈推荐

原文链接:https://github.com/doggy8088/Learn-Git-in-30-days/tree/master/zh-cn

我们知道在 Git 里两个重要的资料结构,分別是「物件」与「索引」,这篇文章主要用来解说「索引」的细节。使用 Git 版本控制的过程中,或许你可以很轻易的了解 git 指令的用法,不过那很容易流于死记,无法灵活运用,连 Linus Torvalds 都在邮件清单(Mailing List)中提到:「在使用者了解索引的意义之前,是无法完整了解 Git 的能力的」,因此,了解「索引」的用途十分重要。

关于索引

简单来说,「索引」的目的主要用来记录「有哪些文件即将要被提交到下一个 commit 版本中」。

换句话说,「如果你想要提交一个版本到 Git 仓库,那么你一定要先更新索引状态,变更才会被提交出去。」

这里的「索引」其实在国外很多文章里曾经出现过很多別名,但其意思都是相同的,各位以后看到相关单字千万不要被混淆了。

  • Index (索引)
  • Cache (快照)
  • Directory cache (目录快照)
  • Current directory cache (当前目录快照)
  • Staging area (等待被 commit 的地方)
  • Staged files (等待被 commit 的文件)

举个例子来说,指令 git diff --cached 就与 git diff --staged 是完全同义的。

操作索引的指令

由于「索引」对 Git 来说十分重要,在大多数的指令中都会有跟 Git 索引相关的参数可用,不过我们大致列出几个直接与「索引」相关的指令来解说。

在解说指令之前,各位可以先看看以下示意图,这说明了通过指令改变状态的生命周期,事实上,这些改变的过程,都是在更新「索引档」的过程:

image

首先,先介绍四种文件状态:

  • untracked (未追踪的,代表尚未被加入 Git 仓库的文件状态)
  • unmodified (未修改的,代表文件第一次被加入,或是文件内容与 HEAD 内容一致的状态)
  • modified (已修改的,代表文件已经被编辑过,或是文件内容与 HEAD 内容不一致的状态)
  • staged (等待被 commit 的,代表下次执行 git commit 会将这些文件全部送入版本库)

git status

取得 工作目录 (working tree) 下的状态。

由于先前已经讲过仓库、工作目录、物件与索引之间的关系,我们用一句话说明这关系:

Git 仓库的运作,是将工作目录里的变化,通过更新索引的方式,将资料写入成 Git 物件。
 

这里的 git status 指令,目的是显示出 目前最新版 与 索引档 之间的差异,这当中的差异包含了一些微妙的关系,我们用一个例子来解释这层关系。

以下是执行 git status 的结果:

G:\git-demo>git status
# On branch master
# Changes to be committed:
#   (use "git reset HEAD <file>..." to unstage)
#
#       new file:   c.txt
#
# Changes not staged for commit:
#   (use "git add <file>..." to update what will be committed)
#   (use "git checkout -- <file>..." to discard changes in working directory)
#
#       modified:   a.txt
#
# Untracked files:
#   (use "git add <file>..." to include in what will be committed)
#
#       b.txt
 

这里你会看到有三种不同的分组,分別是:

  • Changes to be committed (准备提交的变更)
    • 这区有个 new file: c.txt 文件,代表 c.txt 是一个新文件,而且已经被标示可提交。
    • 这代表着几件事:
      1. 目前最新版 并没有 c.txt 这个文件
      2. 索引档 已经加入了这个 c.txt 文件
      3. 所以该文件会在执行 git commit 之后被存入下一个版本
  • Changes not staged for commit (尚未准备提交的变更)
    • 这区有个 modified: a.txt 文件,代表 a.txt 已经被变更,但尚未标示可提交。 (not staged)
    • 这代表着几件事:
      1. 目前最新版 也有 a.txt 这个文件
      2. 索引档 尚未加入 a.txt 这个文件
      3. 所以该文件就算执行了 git commit 也不会在下一版中出现
  • Untracked files (未追踪的变更)
    • 这区有个 b.txt 文件,代表 b.txt 尚未被追踪。(untracked)
    • 这代表着几件事:
      1. 目前最新版 没有 b.txt 这个文件
      2. 索引档 也没有 b.txt 这个文件
      3. 所以该文件就算执行了 git commit 也不会在下一版中出现

所以你可以看到,执行 git status 就是为了查出 目前最新版 与 索引档 之间的差异,最终只有 目前最新版 与 索引档 之间有差异的变更,才会真正储存到下一个 commit 物件里。

git add

git add 指令,是为了将目前「工作目录」的变更写入到「索引档」里。

使用 git add -u 则可以仅将「更新」或「删除」的文件变更写入到「索引档」中。

git rm

我们以 git rm 为例,当你直接在文件系统中删除一个文件,这只是从「工作目录」中删除而已,并没有更新到索引档,你可以利用 git status 看到这层改变,不过若要真正把「删除」的状态写进索引档的话,则要靠 git rm filename 更新索引档。

在执行 git rm filename 的时候,除了更新索引档之外,连工作目录下的文件也会一并被删除。若你只想删除索引档中的该档,又要保留工作目录下的实体文件,那么你可以在指令列加上 --cached 参数,就能做到,例如:

git rm --cached a.txt 
 

git mv

使用 git mv oldname newname 可以将文件更名,执行此命令会同时更新索引与变更工作目录下的实体文件。

git commit

这个指令,则是把「索引档」与「目前最新版」中的资料比对出差异,然后把差异部分提交变更成一个 commit 物件。

git ls-files

在索引档之中,预设就包含了 目前最新版 的所有文件,外加你在工作目录中新增文件且通过 git add 更新索引档后的那些文件。通过 git ls-files 命令,可以列出所有目前已经储存在「索引档」中的那些文件路径。

从如下图范例,你应该可以看出这几个指令之间的关系:

image

今日小结

Git 里的「索引」是 Git 版控中最重要的观念,有了这层观念,也自然能得知,为什么每次提交变更都要打一些指令把变更给加进去。当然,也有许多好用的 GUI 工具可以帮你少打许多指令,不过在我们正式开始使用 Git 的 GUI 工具之前,我们还是多靠指令把观念给建立再说吧!