”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > Mini-git,了解文件如何存储在 Git 对象中

Mini-git,了解文件如何存储在 Git 对象中

发布于2024-08-24
浏览:377

Mini-git, Understanding How Files Are Stored in Git Objects

昨天,我开始自己实现 Git 的核心功能之一——具体来说,文件如何存储、Git 对象是什么以及哈希和压缩的过程。我花了 4 个小时进行开发,在本文中,我将向您介绍我的思考过程和方法。

当您提交文件时会发生什么?

当您在 Git 中提交文件时,会在幕后发生几个重要步骤:

文件压缩:

使用 zlib 算法压缩文件的内容以减小其大小。此压缩内容存储在 Git 对象数据库中。

哈希计算:

从压缩文件内容生成唯一的 SHA-1 哈希值。此哈希用作 Git 对象数据库中文件的标识符。

存储对象:

目标文件存储在 .mygit/objects 目录中,由哈希值的前两个字符组织。这种结构使得更容易有效地管理和检索对象。
更新提交信息:

演示文件如何存储在git中。
我已经实现了提交功能,考虑了一个文件

  1. 对于每个文件,我都计算了哈希值
  2. 在对象文件夹内,创建新文件夹,其名称等于哈希的前两个字符。
  3. 并在该文件夹内创建一个文件,以剩余的哈希值作为名称。(该文件存储提交文件的压缩格式)
  4. 通过比较文件新计算的哈希值和上次计算的哈希值检测到更改

检测变化

我根据自己的方法实现了这个算法,但是 Git 对这些操作使用了更高效的算法。

  1. 从oldContent和newContent中提取行数组
  2. 创建了一个 Map 将行存储为键,索引存储为值
  3. 创建了两个新数组来存储 oldContent 和 newContent 中公共行的索引 4.例如: OldCommonarray = [0 , 3] 那么删除的行将是 [1,2]

GitHub 存储库
领英

非常感谢您抽出时间。

版本声明 本文转载于:https://dev.to/keerthivardhan1/mini-git-understanding-how-files-are-stored-in-git-objects-5bfb?1如有侵犯,请联系[email protected]删除
最新教程 更多>
  • 在 Go 中使用 WebSocket 进行实时通信
    在 Go 中使用 WebSocket 进行实时通信
    构建需要实时更新的应用程序(例如聊天应用程序、实时通知或协作工具)需要一种比传统 HTTP 更快、更具交互性的通信方法。这就是 WebSockets 发挥作用的地方!今天,我们将探讨如何在 Go 中使用 WebSocket,以便您可以向应用程序添加实时功能。 在这篇文章中,我们将介绍: WebSoc...
    编程 发布于2024-11-17
  • Flexbox、Box 或 Flexbox:您应该使用哪种显示属性?
    Flexbox、Box 或 Flexbox:您应该使用哪种显示属性?
    灵活盒子模型:显示:Flex、Box、Flexbox在 CSS3 领域,灵活盒子模型彻底改变了方式我们布局元素。然而,丰富的显示属性值可能会令人困惑。 display: flex、display: box 和 display: flexbox 之间有什么区别?Display: BoxFirefox ...
    编程 发布于2024-11-17
  • 如何在不使用 Python 的情况下使用 C++ 计算复杂的数学表达式?
    如何在不使用 Python 的情况下使用 C++ 计算复杂的数学表达式?
    如何在不集成 Python 的情况下评估 C 中的自定义数学表达式在没有外部库或运行时环境的情况下评估 C 中的复杂数学表达式可能具有挑战性。然而,ExprTk 库提供了一个优雅且高效的解决方案。让我们考虑一个示例表达式:3 sqrt(5) pow(3, 2) log(5)使用 Expr...
    编程 发布于2024-11-17
  • 如何使用 MySQL 查找今天生日的用户?
    如何使用 MySQL 查找今天生日的用户?
    如何使用 MySQL 识别今天生日的用户使用 MySQL 确定今天是否是用户的生日涉及查找生日匹配的所有行今天的日期。这可以通过一个简单的 MySQL 查询来实现,该查询将存储为 UNIX 时间戳的生日与今天的日期进行比较。以下 SQL 查询将获取今天有生日的所有用户: FROM USERS ...
    编程 发布于2024-11-17
  • 如何在 PHP 中组合两个关联数组,同时保留唯一 ID 并处理重复名称?
    如何在 PHP 中组合两个关联数组,同时保留唯一 ID 并处理重复名称?
    在 PHP 中组合关联数组在 PHP 中,将两个关联数组组合成一个数组是一项常见任务。考虑以下请求:问题描述:提供的代码定义了两个关联数组,$array1 和 $array2。目标是创建一个新数组 $array3,它合并两个数组中的所有键值对。 此外,提供的数组具有唯一的 ID,而名称可能重合。要求...
    编程 发布于2024-11-17
  • Bootstrap 4 Beta 中的列偏移发生了什么?
    Bootstrap 4 Beta 中的列偏移发生了什么?
    Bootstrap 4 Beta:列偏移的删除和恢复Bootstrap 4 在其 Beta 1 版本中引入了重大更改柱子偏移了。然而,随着 Beta 2 的后续发布,这些变化已经逆转。从 offset-md-* 到 ml-auto在 Bootstrap 4 Beta 1 中, offset-md-*...
    编程 发布于2024-11-17
  • API 设计中 HTTP 状态代码的终极参考
    API 设计中 HTTP 状态代码的终极参考
    在 Web 开发和 API 设计领域,HTTP 状态代码在客户端和服务器之间传达请求结果方面发挥着至关重要的作用。这些代码提供了一种标准化的方式来指示在处理 HTTP 请求期间发生的特定条件、成功或错误。了解这些状态代码对于开发人员至关重要,因为它有助于调试、错误处理和创建更强大的应用程序。 ...
    编程 发布于2024-11-17
  • gRPC 和 Go:构建高性能 Web 服务
    gRPC 和 Go:构建高性能 Web 服务
    介绍 在微服务和分布式系统的世界中,服务之间的高效通信至关重要。这就是 Google 开发的高性能 RPC(远程过程调用)框架 gRPC 发挥作用的地方。与 Go(一种专为简单和高效而设计的静态类型编译编程语言)相结合,gRPC 可以帮助您构建强大且可扩展的 Web 服务。 ...
    编程 发布于2024-11-17
  • 如何使用 Spring 在 Hibernate 4 中定义与注解的关系?
    如何使用 Spring 在 Hibernate 4 中定义与注解的关系?
    使用 Spring 在 Hibernate 4 中使用注释定义关系要在 Hibernate 4 中为提供的类 Foo 使用注释实现各种类型的关系Bar,让我们深入研究一下具体情况。一对多单向关系:使用 @OneToMany 注释和 List 属性配置 Foo 类。保持 Bar 类不变。这建立了一对多...
    编程 发布于2024-11-17
  • 如何在 Python 中实时流处理输出?
    如何在 Python 中实时流处理输出?
    进程执行过程中连续输出显示在Python脚本中,我们经常利用子进程来执行外部程序。虽然这是一个强大的功能,但在检索其输出之前等待进程完成可能会令人沮丧。为了解决这个问题,让我们探索一种在进程运行时连续流式传输进程输出的方法。传统上,我们使用 subprocess.communicate() 来捕获进...
    编程 发布于2024-11-17
  • 除了“if”语句之外:还有哪些地方可以在不进行强制转换的情况下使用具有显式“bool”转换的类型?
    除了“if”语句之外:还有哪些地方可以在不进行强制转换的情况下使用具有显式“bool”转换的类型?
    无需强制转换即可上下文转换为 bool您的类定义了对 bool 的显式转换,使您能够在条件语句中直接使用其实例“t”。然而,这种显式转换提出了一个问题:“t”在哪里可以在不进行强制转换的情况下用作 bool?上下文转换场景C 标准指定了四种值可以根据上下文转换为 bool 的主要场景:语句:if、w...
    编程 发布于2024-11-17
  • 如何在 PHP 中选择正确的用户浏览器检测方法?
    如何在 PHP 中选择正确的用户浏览器检测方法?
    使用 PHP 进行可靠的用户浏览器检测确定最佳方法当涉及到 PHP 中的用户浏览器检测时,选择使用 $_SERVER ['HTTP_USER_AGENT'] 和 get_browser 函数出现。每种方法都有其优点和缺点。$_SERVER['HTTP_USER_AGENT&#...
    编程 发布于2024-11-17
  • 如何在 PHP 中反序列化 jQuery 序列化表单?
    如何在 PHP 中反序列化 jQuery 序列化表单?
    在 PHP 中反序列化 jQuery 序列化表单利用 jQuery 的 $('#form').serialize() 方法提交表单数据时到一个PHP页面,问题就出现了:我们如何在PHP中反序列化它?PHP jQuery序列化表单的反序列化PHP的parse_str()函数提供了有效的...
    编程 发布于2024-11-17
  • 如何在不使用代理的情况下跟踪 JAX-WS 中的 XML 请求和响应?
    如何在不使用代理的情况下跟踪 JAX-WS 中的 XML 请求和响应?
    在没有代理的情况下跟踪 JAX-WS 中的 XML 请求/响应利用 JAX-WS 参考实现,可以访问原始请求/无需使用代理即可响应 Web 服务的 XML。这可以通过设置启用日志记录通信的系统属性来实现。下面是完成此操作的代码:System.setProperty("com.sun.xml...
    编程 发布于2024-11-17
  • 大批
    大批
    方法是可以在对象上调用的 fns 数组是对象,因此它们在 JS 中也有方法。 slice(begin):将数组的一部分提取到新数组中,而不改变原始数组。 let arr = ['a','b','c','d','e']; // Usecase: Extract till index p...
    编程 发布于2024-11-17

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3