」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 程式設計 > Mini-git,了解檔案如何儲存在 Git 物件中

Mini-git,了解檔案如何儲存在 Git 物件中

發佈於2024-08-24
瀏覽:553

Mini-git, Understanding How Files Are Stored in Git Objects

昨天,我開始自己實現 Git 的核心功能之一——具體來說,檔案如何儲存、Git 物件是什麼以及哈希和壓縮的過程。我花了 4 個小時進行開發,在本文中,我將向您介紹我的思考過程和方法。

當您提交文件時會發生什麼?

當您在 Git 中提交文件時,會在幕後發生幾個重要步驟:

檔案壓縮:

使用 zlib 演算法壓縮檔案的內容以減少其大小。此壓縮內容儲存在 Git 物件資料庫中。

哈希計算:

從壓縮檔案內容產生唯一的 SHA-1 雜湊值。此雜湊用作 Git 物件資料庫中檔案的識別碼。

儲存對象:

目標檔案儲存在 .mygit/objects 目錄中,由雜湊值的前兩個字元組織。這種結構使得更容易有效地管理和檢索物件。
更新提交資訊:

示範檔案如何儲存在git中。
我已經實現了提交功能,考慮了一個文件

  1. 對於每個文件,我都計算了哈希值
  2. 在物件資料夾內,建立新資料夾,其名稱等於雜湊的前兩個字元。
  3. 並在該資料夾內建立一個文件,以剩餘的雜湊值作為名稱。 (該檔案儲存提交檔案的壓縮格式)
  4. 透過比較檔案新計算的雜湊值和上次計算的雜湊值偵測到變更

檢測變化

我根據自己的方法實作了這個演算法,但是 Git 對這些操作使用了更有效率的演算法。

  1. 從oldContent和newContent中提取行數組
  2. 創建了一個 Map 將行儲存為鍵,索引儲存為值
  3. 創建了兩個新數組來儲存 oldContent 和 newContent 中公共行的索引 4.例如: OldCommonarray = [0 , 3] 那麼刪除的行將是 [1,2]

GitHub 儲存庫
領英

非常感謝您抽出時間。

版本聲明 本文轉載於:https://dev.to/keerthivardhan1/mini-git-understanding-how-files-are-stored-in-git-objects-5bfb?1如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • Flexbox、Box 或 Flexbox:您應該使用哪種顯示屬性?
    Flexbox、Box 或 Flexbox:您應該使用哪種顯示屬性?
    靈活盒子模型:顯示:Flex、Box、Flexbox在 CSS3 領域,靈活盒子模型徹底改變了方式我們佈局元素。然而,豐富的顯示屬性值可能會令人困惑。 display: flex、display: box 和 display: flexbox 有什麼差別? Display: BoxFirefox 2...
    程式設計 發佈於2024-11-17
  • 如何在不使用 Python 的情況下使用 C++ 計算複雜的數學表達式?
    如何在不使用 Python 的情況下使用 C++ 計算複雜的數學表達式?
    如何在不整合Python 的情況下評估C 中的自訂數學表達式在沒有外部庫或運行時環境的情況下評估C 中的複雜數學表達式可能具有挑戰性。然而,ExprTk 庫提供了一個優雅且高效的解決方案。 讓我們考慮一個範例表達式:3 sqrt(5) pow(3, 2) log(5)使用ExprTk,我...
    程式設計 發佈於2024-11-17
  • 在 Go 中使用 WebSocket 進行即時通信
    在 Go 中使用 WebSocket 進行即時通信
    构建需要实时更新的应用程序(例如聊天应用程序、实时通知或协作工具)需要一种比传统 HTTP 更快、更具交互性的通信方法。这就是 WebSockets 发挥作用的地方!今天,我们将探讨如何在 Go 中使用 WebSocket,以便您可以向应用程序添加实时功能。 在这篇文章中,我们将介绍: WebSoc...
    程式設計 發佈於2024-11-17
  • 如何在 PHP 中組合兩個關聯數組,同時保留唯一 ID 並處理重複名稱?
    如何在 PHP 中組合兩個關聯數組,同時保留唯一 ID 並處理重複名稱?
    在 PHP 中組合關聯數組在 PHP 中,將兩個關聯數組組合成一個數組是常見任務。考慮以下請求:問題描述:提供的代碼定義了兩個關聯數組,$array1 和 $array2。目標是建立一個新陣列 $array3,它合併兩個陣列中的所有鍵值對。 此外,提供的陣列具有唯一的 ID,而名稱可能重疊。要求是建...
    程式設計 發佈於2024-11-17
  • Bootstrap 4 Beta 中的列偏移發生了什麼事?
    Bootstrap 4 Beta 中的列偏移發生了什麼事?
    Bootstrap 4 Beta:列偏移的刪除和恢復Bootstrap 4 在其Beta 1 版本中引入了重大更改柱子偏移了。然而,隨著 Beta 2 的後續發布,這些變化已經逆轉。 從 offset-md-* 到 ml-auto在 Bootstrap 4 Beta 1 中, offset-md-*...
    程式設計 發佈於2024-11-17
  • API 設計中 HTTP 狀態碼的終極參考
    API 設計中 HTTP 狀態碼的終極參考
    在 Web 开发和 API 设计领域,HTTP 状态代码在客户端和服务器之间传达请求结果方面发挥着至关重要的作用。这些代码提供了一种标准化的方式来指示在处理 HTTP 请求期间发生的特定条件、成功或错误。了解这些状态代码对于开发人员至关重要,因为它有助于调试、错误处理和创建更强大的应用程序。 ...
    程式設計 發佈於2024-11-17
  • gRPC 和 Go:建立高效能 Web 服務
    gRPC 和 Go:建立高效能 Web 服務
    介紹 在微服務和分散式系統的世界中,服務之間的高效通訊至關重要。這就是 Google 開發的高效能 RPC(遠端過程呼叫)框架 gRPC 發揮作用的地方。與 Go(一種專為簡單和高效而設計的靜態類型編譯程式語言)相結合,gRPC 可以幫助您建立強大且可擴展的 Web 服務。 ...
    程式設計 發佈於2024-11-17
  • 如何使用 Spring 在 Hibernate 4 中定義與註解的關係?
    如何使用 Spring 在 Hibernate 4 中定義與註解的關係?
    使用Spring 在Hibernate 4 中使用註解定義關係要在Hibernate 4 中為提供的類別Foo 使用註解實現各種類型的關係和Bar,讓我們深入研究一下具體情況。 一對多單向關係:使用@OneToMany註解和List屬性。保持 Bar 類別不變。這建立了一對多關係,其中 Foo 可以...
    程式設計 發佈於2024-11-17
  • 如何在 Python 中即時串流處理輸出?
    如何在 Python 中即時串流處理輸出?
    在進程執行過程中連續輸出顯示在Python腳本中,我們經常利用子程序來執行外部程序。雖然這是一個強大的功能,但在檢索其輸出之前等待進程完成可能會令人沮喪。為了解決這個問題,讓我們探索一種在進程運行時連續串流傳輸進程輸出的方法。 傳統上,我們使用 subprocess.communicate() 來擷...
    程式設計 發佈於2024-11-17
  • 如何在 PHP 中選擇正確的使用者瀏覽器偵測方法?
    如何在 PHP 中選擇正確的使用者瀏覽器偵測方法?
    使用PHP 進行可靠的用戶瀏覽器檢測確定最佳方法當涉及到PHP 中的用戶瀏覽器檢測時,選擇使用$_SERVER ['HTTP_USER_AGENT'] 和get_browser 函數出現。每種方法都有其優點和缺點。 $_SERVER['HTTP_USER_AGENT'...
    程式設計 發佈於2024-11-17
  • 如何在 PHP 中反序列化 jQuery 序列化表單?
    如何在 PHP 中反序列化 jQuery 序列化表單?
    在PHP 中反序列化jQuery 序列化表單利用jQuery 的$('#form').serialize() 方法提交表單資料時到一個PHP頁面,問題就出現了:我們如何在PHP中反序列化它? PHP jQuery序列化表單的反序列化PHP的parse_str()函數提供了有效的解決方...
    程式設計 發佈於2024-11-17
  • 如何在不使用代理程式的情況下追蹤 JAX-WS 中的 XML 請求和回應?
    如何在不使用代理程式的情況下追蹤 JAX-WS 中的 XML 請求和回應?
    在沒有代理的情況下跟踪JAX-WS 中的XML 請求/響應利用JAX-WS 參考實現,可以訪問原始請求/無需使用代理即可回應Web 服務的XML。這可以透過設定啟用日誌記錄通訊的系統屬性來實現。以下是完成此動作的程式碼:System.setProperty("com.sun.xml.ws....
    程式設計 發佈於2024-11-17
  • 大批
    大批
    方法是可以在物件上呼叫的 fns 數組是對象,因此它們在 JS 中也有方法。 slice(begin):將陣列的一部分提取到新數組中,而不改變原始數組。 let arr = ['a','b','c','d','e']; // Usecase: Extract till index ...
    程式設計 發佈於2024-11-17
  • 正規表示式夠了嗎?驗證電子郵件地址的全面指南
    正規表示式夠了嗎?驗證電子郵件地址的全面指南
    確保電子郵件地址的有效性:綜合指南驗證電子郵件地址的有效性是資料驗證的一個重要面向。 Regex(正規表示式)提供了一個強大的工具,可確保使用者輸入符合特定的電子郵件格式。然而,子網域電子郵件地址的存在經常在驗證過程中帶來挑戰。 基於正規表示式的驗證的局限性雖然正則表達式對於檢查基本資訊很有用電子郵...
    程式設計 發佈於2024-11-17
  • 如何使用 PHP 和 MySQL 查詢結果來擷取父節點下的所有子節點、孫節點和後代節點?
    如何使用 PHP 和 MySQL 查詢結果來擷取父節點下的所有子節點、孫節點和後代節點?
    使用PHP 和MySQL 查詢父級下的所有子節點、孫節點等節點原始問題: 檢索與父節點關聯的所有子節點、孫節點和後續後代節點是使用分層資料結構時的常見任務。這個問題出現在資料庫表採用鄰接表模型進行資料組織的場景。 使用遞迴的方法:為了解決這個問題,遞迴被證明是一種有效的方法。以下是如何使用遞歸來實現...
    程式設計 發佈於2024-11-17

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3