”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > 如何使用 etcd Raft 库构建自己的分布式 KV 存储系统

如何使用 etcd Raft 库构建自己的分布式 KV 存储系统

发布于2024-07-30
浏览:416

How to Build Your Own Distributed KV Storage System Using the etcd Raft Library

介绍

raftexample是etcd提供的示例,演示了etcd raft共识算法库的使用。 raftexample最终实现了一个提供REST API的分布式键值存储服务。

本文将对raftexample的代码进行阅读和分析,希望能够帮助读者更好地理解如何使用etcd raft库以及raft库的实现逻辑。

建筑学

raftexample的架构非常简单,主要文件如下:

  • main.go: 负责组织 raft 模块、httpapi 模块、kvstore 模块之间的交互;
  • raft.go: 负责与raft库交互,包括提交提案、接收需要发送的RPC消息、进行网络传输等;
  • httpapi.go:负责提供REST API,作为用户请求的入口;
  • kvstore.go: 负责持久化存储提交的日志条目,相当于raft协议中的状态机。

写请求的处理流程

写入请求通过 HTTP PUT 请求到达 httpapi 模块的 ServeHTTP 方法。

curl -L http://127.0.0.1:12380/key -XPUT -d value

通过switch匹配到HTTP请求方法后,进入PUT方法处理流程:

  • 从HTTP请求体中读取内容(即值);
  • 通过kvstore模块的Propose方法构造提案(添加以key为key、value为value的键值对);
  • 由于没有数据可返回,所以向客户端响应204 StatusNoContent;

通过raft算法库提供的Propose方法将proposal提交给raft算法库。

提案的内容可以是添加新的键值对、更新已有的键值对等

// httpapi.go
v, err := io.ReadAll(r.Body)
if err != nil {
    log.Printf("Failed to read on PUT (%v)\n", err)
    http.Error(w, "Failed on PUT", http.StatusBadRequest)
    return
}
h.store.Propose(key, string(v))
w.WriteHeader(http.StatusNoContent)

接下来我们看看kvstore模块的Propose方法,看看提案是如何构造和处理的。

在Propose方法中,我们首先使用gob对要写入的键值对进行编码,然后将编码后的内容传递给proposeC,proposeC是负责将kvstore模块构建的proposal传输到raft模块的通道。

// kvstore.go
func (s *kvstore) Propose(k string, v string) {
    var buf strings.Builder
    if err := gob.NewEncoder(&buf).Encode(kv{k, v}); err != nil {
        log.Fatal(err)
    }
    s.proposeC 



由kvstore构造并传递给proposeC的proposal由raft模块中的serveChannels方法接收和处理。

在确认proposeC没有被关闭后,raft模块使用raft算法库提供的Propose方法将proposal提交给raft算法库进行处理。

// raft.go
select {
    case prop, ok := 



提案提交后,遵循raft算法流程。提案最终将转发到领导节点(如果当前节点不是领导节点,并且您允许追随者转发提案,由 DisableProposalForwarding 配置控制)。 Leader 会将提案作为日志条目添加到其 raft 日志中,并与其他 follower 节点同步。被视为已提交后,将应用到状态机并将结果返回给用户。

但是,由于etcd raft库本身不处理节点之间的通信、追加到raft日志、应用到状态机等,所以raft库只准备这些操作所需的数据。实际操作必须由我们来执行。

因此,我们需要从raft库接收这些数据,并根据其类型进行相应的处理。 Ready方法返回一个只读通道,通过该通道我们可以接收需要处理的数据。

需要注意的是,接收到的数据包括多个字段,例如要应用的快照、要附加到raft日志的日志条目、要通过网络传输的消息等。

继续我们的写请求示例(Leader节点),收到相应数据后,我们需要持久保存快照、HardState和Entries,以处理服务器崩溃引起的问题(例如,一个follower为多个候选人投票)。 HardState 和 Entries 共同构成了本文中提到的所有服务器上的持久状态。持久保存它们后,我们可以应用快照并追加到 raft 日志中。

由于我们当前是leader节点,raft库会返回MsgApp类型的消息给我们(对应论文中的AppendEntries RPC)。我们需要将这些消息发送到跟随者节点。这里,我们使用etcd提供的rafthttp进行节点通信,并使用Send方法将消息发送给follower节点。

// raft.go
case rd := 



接下来,我们使用publishEntries方法将提交的raft日志条目应用到状态机。如前所述,在 raftexample 中,kvstore 模块充当状态机。在publishEntries方法中,我们将需要应用到状态机的日志条目传递给commitC。与之前的proposeC类似,commitC负责将raft模块认为已提交的日志条目传输到kvstore模块,以应用到状态机。

// raft.go
rc.commitC 



在kvstore模块的readCommits方法中,从commitC读取的消息被gob解码以检索原始键值对,然后将其存储在kvstore模块内的map结构中。

// kvstore.go
for commit := range commitC {
    ...
    for _, data := range commit.data {
        var dataKv kv
        dec := gob.NewDecoder(bytes.NewBufferString(data))
        if err := dec.Decode(&dataKv); err != nil {
            log.Fatalf("raftexample: could not decode message (%v)", err)
        }
        s.mu.Lock()
        s.kvStore[dataKv.Key] = dataKv.Val
        s.mu.Unlock()
    }
    close(commit.applyDoneC)
}

回到raft模块,我们使用Advance方法通知raft库我们已经处理完从Ready通道读取的数据,准备处理下一批数据。

之前,在leader节点上,我们使用Send方法向follower节点发送MsgApp类型的消息。 follower节点的rafthttp监听相应的端口,接收请求并返回响应。无论是follower节点收到的请求,还是leader节点收到的响应,都会通过Step方法提交到raft库处理。

raftNode实现了rafthttp中的Raft接口,调用Raft接口的Process方法来处理接收到的请求内容(如MsgApp消息)。

// raft.go
func (rc *raftNode) Process(ctx context.Context, m raftpb.Message) error {
    return rc.node.Step(ctx, m)
}

上面描述了raftexample中一个写请求的完整处理流程。

概括

本文的内容到此结束。通过概述raftexample的结构以及详细说明一个写请求的处理流程,希望能够帮助您更好地理解如何使用etcd raft库构建自己的分布式KV存储服务。

如果有任何错误或问题,请随时评论或直接给我留言。谢谢。

参考

  • https://github.com/etcd-io/etcd/tree/main/contrib/raftexample

  • https://github.com/etcd-io/raft

  • https://raft.github.io/raft.pdf

版本声明 本文转载于:https://dev.to/justlorain/how-to-build-your-own-distributed-kv-storage-system-using-the-etcd-raft-library-2j69?1如有侵犯,请联系[email protected]删除
最新教程 更多>
  • FCS API 与 Insight Ease:比特币 API 服务的简单比较
    FCS API 与 Insight Ease:比特币 API 服务的简单比较
    如果您热衷于比特币 API,那么选择正确的 API 非常重要。特别是如果您是开发人员、金融分析师或经营一家金融科技公司。您会听到的两个流行名称是 FCS API 和 Insight Ease。但哪一个更好呢?让我们仔细观察一下它们的比较,特别是当涉及到加密货币实时汇率 API、加密货币 API 交...
    编程 发布于2024-11-02
  • 如何在不修改HTML的情况下用JavaScript监听表单提交事件?
    如何在不修改HTML的情况下用JavaScript监听表单提交事件?
    在 JavaScript 中监听表单提交事件而不修改 HTML在本文中,我们解决了在不修改 HTML 的情况下监听表单提交事件的常见挑战必须修改 HTML 代码。我们不依赖 HTML 中的 onClick 或 onSubmit 属性,而是提供纯 JavaScript 解决方案。为了实现这一点,我们利...
    编程 发布于2024-11-02
  • Document.getElementById 与 jQuery $():主要区别是什么?
    Document.getElementById 与 jQuery $():主要区别是什么?
    Document.getElementById vs jQuery $():比较分析深入研究 Web 开发领域时,了解普通版本之间的细微差别JavaScript 和 jQuery 可能至关重要。本文研究了两个看似相同的代码片段之间的细微差别:var contents = document.getEl...
    编程 发布于2024-11-02
  • 在 Java 中使用方法和变量句柄进行运行时对象访问和操作
    在 Java 中使用方法和变量句柄进行运行时对象访问和操作
    反射和方法/var 句柄是 Java 中的两个强大功能,允许开发人员在运行时访问和操作对象。然而,它们在访问和处理对象的方式上有所不同。 让我们看一个如何使用反射来访问类中方法的示例。我们将从一个名为“MyClass”的简单类开始,它有一个私有字符串变量和该变量的 getter 方法。为了创建这个对...
    编程 发布于2024-11-02
  • 如何在 Python 中使用内置函数验证 IP 地址?
    如何在 Python 中使用内置函数验证 IP 地址?
    Python 中的 IP 地址验证验证 IP 地址的有效性是编程中的常见任务。从用户处接收字符串形式的 IP 地址时,必须对其进行验证,以确保它们符合正确的格式和结构。要在 Python 中有效验证 IP 地址,请考虑以下方法:无需手动解析 IP 地址,而是利用套接字模块中的内置 inet_aton...
    编程 发布于2024-11-02
  • 我需要学习编程方面的帮助
    我需要学习编程方面的帮助
    您好,我是一名系统工程专业的学生,​​我觉得我在课程中学到的编程知识不多。我想自学,因为我对这个话题非常感兴趣。这就是我在这个网站上向了解编程的人寻求帮助的原因。如果有人知道学习编程的最佳课程,从基础开始并进步到更专业的水平,那将会有很大的帮助。 我感兴趣的语言: Java JavaScript P...
    编程 发布于2024-11-02
  • 如何将 gorm.Model 集成到具有日期时间支持的 Protocol Buffer 定义中?
    如何将 gorm.Model 集成到具有日期时间支持的 Protocol Buffer 定义中?
    将 gorm.Model 集成到 Protocol Buffer 定义中将 gorm 的 gorm.Model 字段集成到 protobuf 定义中时,由于 proto3 中缺乏日期时间支持,出现了挑战。本文探讨了此问题的解决方案。ProtoBuf 字段类型映射CreatedAt、UpdatedAt...
    编程 发布于2024-11-02
  • 修补您的 Discord 活动的网络请求,以实现顺利的 CSP 合规性
    修补您的 Discord 活动的网络请求,以实现顺利的 CSP 合规性
    通过Discord运行Discord活动时,您可能会遇到内容安全策略(CSP)问题。您可以通过确保网络请求遵循 Discord 代理 规则来修复这些问题。 这可以手动完成...或者你可以让@robojs/patch处理它。 什么是CSP? 内容安全策略 (CSP) 是一种安全标准,...
    编程 发布于2024-11-02
  • 推荐项目:删除课程表查看数据
    推荐项目:删除课程表查看数据
    LabEx 的这个项目释放了数据库管理的力量,提供了在数据库中创建和操作视图的全面学习体验。无论您是崭露头角的数据库管理员还是经验丰富的开发人员,该项目都提供了宝贵的机会来增强您的技能并获得对数据管理世界的实际见解。 深入了解基础知识 在这个项目中,您将踏上了解数据库中视图的核心概念...
    编程 发布于2024-11-02
  • 模拟网络请求变得容易:集成 Jest 和 MSW
    模拟网络请求变得容易:集成 Jest 和 MSW
    Writing unit tests that involve mocking or stubbing API calls can feel overwhelming—I’ve been there myself. In this article, I’ll guide you through a ...
    编程 发布于2024-11-02
  • 使用 Javascript 的哈希映射
    使用 Javascript 的哈希映射
    介绍 哈希映射(Hash Map),也称为哈希表(Hash Table),是一种实现关联数组抽象数据类型的数据结构,是一种可以将键映射到值的结构。 它使用哈希函数来计算存储桶或槽数组的索引,从中可以找到所需的值。 哈希映射的主要优点是它的效率。插入新的键值对、删除键值对以及查...
    编程 发布于2024-11-02
  • HTPX 简介:适用于 JavaScript 和 Node.js 的轻量级多功能 HTTP 客户端
    HTPX 简介:适用于 JavaScript 和 Node.js 的轻量级多功能 HTTP 客户端
    作为开发人员,我们的 Web 应用程序通常需要一个可靠且高效的 HTTP 客户端,无论我们是在浏览器中使用 JavaScript 还是在服务器端使用 Node.js 进行构建。这就是我创建 HTPX 的原因——一个强大的、轻量级的解决方案,旨在简化 HTTP 请求,同时为现代开发提供一系列功能。 在...
    编程 发布于2024-11-02
  • 使用自然语言通过法学硕士生成简单的 Python GUI .... 在不到几分钟的时间内
    使用自然语言通过法学硕士生成简单的 Python GUI .... 在不到几分钟的时间内
    Thought that building Python GUIs took hours of tedious coding? Welcome to an exciting new era! Not only can tools like Github Copilot help with code ...
    编程 发布于2024-11-02
  • Dev、Oops 和 WEBAPP 故事
    Dev、Oops 和 WEBAPP 故事
    作为 DevOps 专业人员开发桌面 Web 应用程序感觉就像在广阔而复杂的海洋中航行。随着技术融合,Web、桌面和基于云的应用程序之间的界限变得模糊,迫使 DevOps 深入传统上由前端占据的领域 终端开发商。选择正确的框架变得至关重要,但挑战往往在于筛选当今可用的众多选项。例如,Vite、Rea...
    编程 发布于2024-11-02
  • 释放您的 Django 潜力:适合 4 人的项目创意和资源
    释放您的 Django 潜力:适合 4 人的项目创意和资源
    Django 时事通讯 - 2024 年 10 月 Django 简介和项目想法 如果您希望开始使用 Django 或提高自己的技能,请考虑以下一些宝贵的资源和项目想法: Django 项目想法 对于那些想要尝试或构建自己的作品集的人来说,Djang...
    编程 发布于2024-11-02

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3