Git詳解之一 Git起步

2022-08-10 12:30:15 字數 3318 閱讀 8315

起步

本章介紹開始使用 git 前的相關知識。我們會先了解一些版本控制工具的歷史背景,然後試著讓 git 在你的系統上跑起來,直到最後配置好,可以正常開始開發工作。讀完本章,你就會明白為什麼 git 會如此流行,為什麼你應該立即開始使用它。

1.1 關於版本控制

什麼是版本控制?我真的需要嗎?版本控制是一種記錄若干檔案內容變化,以便將來查閱特定版本修訂情況的系統。在本書所展示的例子中,我們僅對儲存著軟體源**的文字檔案作版本控制管理,但實際上,你可以對任何型別的檔案進行版本控制。

如果你是位圖形或網頁設計師,可能會需要儲存某一幅或頁面布局檔案的所有修訂版本(這或許是你非常渴望擁有的功能)。採用版本控制系統 (vcs)是個明智的選擇。有了它你就可以將某個檔案回溯到之前的狀態,甚至將整個專案都回退到過去某個時間點的狀態。你可以比較檔案的變化細節,查出最 後是誰修改了哪個地方,從而導致出現怪異問題,又是誰在何時報告了某個功能缺陷等等。使用版本控制系統通常還意味著,就算你亂來一氣把整個專案中的檔案改 的改刪的刪,你也照樣可以輕鬆恢復到原先的樣子。但額外增加的工作量卻微乎其微。

本地版本控制系統

許多人習慣用複製整個專案目錄的方式來儲存不同的版本,或許還會改名加上備份時間以示區別。這麼做唯一的好處就是簡單。不過壞處也不少:有時候會混淆所在的工作目錄,一旦弄錯檔案丟了資料就沒法撤銷恢復。

為了解決這個問題,人們很久以前就開發了許多種本地版本控制系統,大多都是採用某種簡單的資料庫來記錄檔案的歷次更新差異(見圖 1-1)。

圖 1-1. 本地版本控制系統

其中最流行的一種叫做 rcs,現今許多計算機系統上都還看得到它的蹤影。甚至在流行的 mac os x 系統上安裝了開發者工具包之後,也可以使用 rcs 命令。它的工作原理基本上就是儲存並管理檔案補丁(patch)。檔案補丁是一種特定格式的文字檔案,記錄著對應檔案修訂前後的內容變化。所以,根據每次 修訂後的補丁,rcs 可以通過不斷打補丁,計算出各個版本的檔案內容。

集中化的版本控制系統

接下來人們又遇到乙個問題,如何讓在不同系統上的開發者協同工作?於是,集中化的版本控制系統( centralized version control systems,簡稱 cvcs )應運而生。這類系統,諸如 cvs,subversion 以及 perforce 等,都有乙個單一的集中管理的伺服器,儲存所有檔案的修訂版本,而協同工作的人們都通過客戶端連到這台伺服器,取出最新的檔案或者提交更新。多年以來,這 已成為版本控制系統的標準做法(見圖 1-2)。

圖 1-2. 集中化的版本控制系統

這種做法帶來了許多好處,特別是相較於老式的本地 vcs 來說。現在,每個人都可以在一定程度上看到專案中的其他人正在做些什麼。而管理員也可以輕鬆掌控每個開發者的許可權,並且管理乙個 cvcs 要遠比在各個客戶端上維護本地資料庫來得輕鬆容易。

事分兩面,有好有壞。這麼做最顯而易見的缺點是**伺服器的單點故障。如果宕機一小時,那麼在這一小時內,誰都無法提交更新,也就無法協同工作。要 是**伺服器的磁碟發生故障,碰巧沒做備份,或者備份不夠及時,就還是會有丟失資料的風險。最壞的情況是徹底丟失整個專案的所有歷史更改記錄,而被客戶端 提取出來的某些快照資料除外,但這樣的話依然是個問題,你不能保證所有的資料都已經有人事先完整提取出來過。本地版本控制系統也存在類似問題,只要整個項 目的歷史記錄被儲存在單一位置,就有丟失所有歷史更新記錄的風險。

分布式版本控制系統

於是分布式版本控制系統( distributed version control system,簡稱 dvcs )面世了。在這類系統中,像 git,mercurial,bazaar 以及 darcs 等,客戶端並不只提取最新版本的檔案快照,而是把原始的**倉庫完整地映象下來。這麼一來,任何一處協同工作用的伺服器發生故障,事後都可以用任何乙個鏡 像出來的本地倉庫恢復。因為每一次的提取操作,實際上都是一次對**倉庫的完整備份(見圖 1-3)。

圖 1-3. 分布式版本控制系統

更進一步,許多這類系統都可以指定和若干不同的遠端**倉庫進行互動。籍此,你就可以在同乙個專案中,分別和不同工作小組的人相互協作。你可以根據需要設定不同的協作流程,比如層次模型式的工作流,而這在以前的集中式系統中是無法實現的。

1.2 git 簡史

同生活中的許多偉大事件一樣,git 誕生於乙個極富紛爭大舉創新的年代。linux 核心開源專案有著為數眾廣的參與者。絕大多數的 linux 核心維護工作都花在了提交補丁和儲存歸檔的繁瑣事務上(1991-2023年間)。到 2002 年,整個專案組開始啟用分布式版本控制系統 bitkeeper 來管理和維護**。

到了 2005 年,開發 bitkeeper 的商業公司同 linux 核心開源社群的合作關係結束,他們收回了免費使用 bitkeeper 的權力。這就迫使 linux 開源社群(特別是 linux 的締造者 linus torvalds )不得不吸取教訓,只有開發一套屬於自己的版本控制系統才不至於重蹈覆轍。他們對新的系統制訂了若干目標:

* 速度 * 簡單的設計 * 對非線性開發模式的強力支援(允許上千個並行開發的分支) * 完全分布式 * 有能力高效管理類似 linux 核心一樣的超大規模專案(速度和資料量)

自誕生於 2005 年以來,git 日臻成熟完善,在高度易用的同時,仍然保留著初期設定的目標。它的速度飛快,極其適合管理大專案,它還有著令人難以置信的非線性分支管理系統(見第三章),可以應付各種複雜的專案開發需求。

1.3 git 基礎

那麼,簡單地說,git 究竟是怎樣的乙個系統呢?請注意,接下來的內容非常重要,若是理解了 git 的思想和基本工作原理,用起來就會知其所以然,游刃有餘。在開始學習 git 的時候,請不要嘗試把各種概念和其他版本控制系統(諸如 subversion 和 perforce 等)相比擬,否則容易混淆每個操作的實際意義。git 在儲存和處理各種資訊的時候,雖然操作起來的命令形式非常相近,但它與其他版本控制系統的做法頗為不同。理解這些差異將有助於你準確地使用 git 提供的各種工具。

直接記錄快照,而非差異比較

git 和其他版本控制系統的主要差別在於,git 只關心檔案資料的整體是否發生變化,而大多數其他系統則只關心檔案內容的具體差異。這類系統 (cvs,subversion,perforce,bazaar 等等)每次記錄有哪些檔案作了更新,以及都更新了哪些行的什麼內容,請看圖 1-4。

圖 1-4. 其他系統在每個版本中記錄著各個檔案的具體差異

git 並不儲存這些前後變化的差異資料。實際上,git 更像是把變化的檔案作快照後,記錄在乙個微型的檔案系統中。每次提交更新時,它會縱覽一遍所有檔案的指紋資訊並對檔案作一快照,然後儲存乙個指向這次快照 的索引。為提高效能,若檔案沒有變化,git 不會再次儲存,而只對上次儲存的快照作一鏈結。git 的工作方式就像圖 1-5 所示。

研祥1.7 小結

至此,你該對 git 有了點基本認識,包括它和以前你使用的 cvcs 之間的差別。現在,在你的系統上應該已經裝好了 git,設定了自己的名字和電郵。接下來讓我們繼續學習 git 的基礎知識。

git學習 1 git起步

本文出自 本文內容 安裝git 配置使用者資訊 檢視使用者資訊 獲取幫助 什麼是版本控制?版本控制是一種記錄乙個或若干檔案內容變化,以便將來查閱特定版本修訂情況的系統 git 和其他版本控制系統的主要差別在於,git 只關心檔案資料的整體是否發生變化,而大多數其他系統則只關心檔案內容的具體差異。li...

Git入門 之 一

git 配置使用者名稱和郵箱 當前級別 local global system 大多數情況下用local 但如果都有設定的話,優先順序排序 local global system 如何建立乙個倉庫 git init 倉庫名 倉庫裡的檔案分三個層次 先在工作目錄修改,然後 git add filesn...

Git詳解(二) 1 起步(1 4 1 8)

原文 pro git git 有多種使用方式。你可以使用原生的命令列模式,也可以使用 gui 模式,這些 gui 軟體也能提供多種功能。在本書中,我們將使用命令列模式。這是因為首先,只有在命令列模式下你才能執行 git 的 所有 命令,而大多數的 gui 軟體只實現了 git 所有功能的乙個子集以降...