”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > 如何使用 etcd Raft 库构建自己的分布式 KV 存储系统

如何使用 etcd Raft 库构建自己的分布式 KV 存储系统

发布于2024-07-30
浏览:898

How to Build Your Own Distributed KV Storage System Using the etcd Raft Library

介绍

raftexample是etcd提供的示例,演示了etcd raft共识算法库的使用。 raftexample最终实现了一个提供REST API的分布式键值存储服务。

本文将对raftexample的代码进行阅读和分析,希望能够帮助读者更好地理解如何使用etcd raft库以及raft库的实现逻辑。

建筑学

raftexample的架构非常简单,主要文件如下:

  • main.go: 负责组织 raft 模块、httpapi 模块、kvstore 模块之间的交互;
  • raft.go: 负责与raft库交互,包括提交提案、接收需要发送的RPC消息、进行网络传输等;
  • httpapi.go:负责提供REST API,作为用户请求的入口;
  • kvstore.go: 负责持久化存储提交的日志条目,相当于raft协议中的状态机。

写请求的处理流程

写入请求通过 HTTP PUT 请求到达 httpapi 模块的 ServeHTTP 方法。

curl -L http://127.0.0.1:12380/key -XPUT -d value

通过switch匹配到HTTP请求方法后,进入PUT方法处理流程:

  • 从HTTP请求体中读取内容(即值);
  • 通过kvstore模块的Propose方法构造提案(添加以key为key、value为value的键值对);
  • 由于没有数据可返回,所以向客户端响应204 StatusNoContent;

通过raft算法库提供的Propose方法将proposal提交给raft算法库。

提案的内容可以是添加新的键值对、更新已有的键值对等

// httpapi.go
v, err := io.ReadAll(r.Body)
if err != nil {
    log.Printf("Failed to read on PUT (%v)\n", err)
    http.Error(w, "Failed on PUT", http.StatusBadRequest)
    return
}
h.store.Propose(key, string(v))
w.WriteHeader(http.StatusNoContent)

接下来我们看看kvstore模块的Propose方法,看看提案是如何构造和处理的。

在Propose方法中,我们首先使用gob对要写入的键值对进行编码,然后将编码后的内容传递给proposeC,proposeC是负责将kvstore模块构建的proposal传输到raft模块的通道。

// kvstore.go
func (s *kvstore) Propose(k string, v string) {
    var buf strings.Builder
    if err := gob.NewEncoder(&buf).Encode(kv{k, v}); err != nil {
        log.Fatal(err)
    }
    s.proposeC 



由kvstore构造并传递给proposeC的proposal由raft模块中的serveChannels方法接收和处理。

在确认proposeC没有被关闭后,raft模块使用raft算法库提供的Propose方法将proposal提交给raft算法库进行处理。

// raft.go
select {
    case prop, ok := 



提案提交后,遵循raft算法流程。提案最终将转发到领导节点(如果当前节点不是领导节点,并且您允许追随者转发提案,由 DisableProposalForwarding 配置控制)。 Leader 会将提案作为日志条目添加到其 raft 日志中,并与其他 follower 节点同步。被视为已提交后,将应用到状态机并将结果返回给用户。

但是,由于etcd raft库本身不处理节点之间的通信、追加到raft日志、应用到状态机等,所以raft库只准备这些操作所需的数据。实际操作必须由我们来执行。

因此,我们需要从raft库接收这些数据,并根据其类型进行相应的处理。 Ready方法返回一个只读通道,通过该通道我们可以接收需要处理的数据。

需要注意的是,接收到的数据包括多个字段,例如要应用的快照、要附加到raft日志的日志条目、要通过网络传输的消息等。

继续我们的写请求示例(Leader节点),收到相应数据后,我们需要持久保存快照、HardState和Entries,以处理服务器崩溃引起的问题(例如,一个follower为多个候选人投票)。 HardState 和 Entries 共同构成了本文中提到的所有服务器上的持久状态。持久保存它们后,我们可以应用快照并追加到 raft 日志中。

由于我们当前是leader节点,raft库会返回MsgApp类型的消息给我们(对应论文中的AppendEntries RPC)。我们需要将这些消息发送到跟随者节点。这里,我们使用etcd提供的rafthttp进行节点通信,并使用Send方法将消息发送给follower节点。

// raft.go
case rd := 



接下来,我们使用publishEntries方法将提交的raft日志条目应用到状态机。如前所述,在 raftexample 中,kvstore 模块充当状态机。在publishEntries方法中,我们将需要应用到状态机的日志条目传递给commitC。与之前的proposeC类似,commitC负责将raft模块认为已提交的日志条目传输到kvstore模块,以应用到状态机。

// raft.go
rc.commitC 



在kvstore模块的readCommits方法中,从commitC读取的消息被gob解码以检索原始键值对,然后将其存储在kvstore模块内的map结构中。

// kvstore.go
for commit := range commitC {
    ...
    for _, data := range commit.data {
        var dataKv kv
        dec := gob.NewDecoder(bytes.NewBufferString(data))
        if err := dec.Decode(&dataKv); err != nil {
            log.Fatalf("raftexample: could not decode message (%v)", err)
        }
        s.mu.Lock()
        s.kvStore[dataKv.Key] = dataKv.Val
        s.mu.Unlock()
    }
    close(commit.applyDoneC)
}

回到raft模块,我们使用Advance方法通知raft库我们已经处理完从Ready通道读取的数据,准备处理下一批数据。

之前,在leader节点上,我们使用Send方法向follower节点发送MsgApp类型的消息。 follower节点的rafthttp监听相应的端口,接收请求并返回响应。无论是follower节点收到的请求,还是leader节点收到的响应,都会通过Step方法提交到raft库处理。

raftNode实现了rafthttp中的Raft接口,调用Raft接口的Process方法来处理接收到的请求内容(如MsgApp消息)。

// raft.go
func (rc *raftNode) Process(ctx context.Context, m raftpb.Message) error {
    return rc.node.Step(ctx, m)
}

上面描述了raftexample中一个写请求的完整处理流程。

概括

本文的内容到此结束。通过概述raftexample的结构以及详细说明一个写请求的处理流程,希望能够帮助您更好地理解如何使用etcd raft库构建自己的分布式KV存储服务。

如果有任何错误或问题,请随时评论或直接给我留言。谢谢。

参考

  • https://github.com/etcd-io/etcd/tree/main/contrib/raftexample

  • https://github.com/etcd-io/raft

  • https://raft.github.io/raft.pdf

版本声明 本文转载于:https://dev.to/justlorain/how-to-build-your-own-distributed-kv-storage-system-using-the-etcd-raft-library-2j69?1如有侵犯,请联系[email protected]删除
最新教程 更多>
  • 如何修复 macOS 上 Django 中的“配置不正确:加载 MySQLdb 模块时出错”?
    如何修复 macOS 上 Django 中的“配置不正确:加载 MySQLdb 模块时出错”?
    MySQL配置不正确:相对路径的问题在Django中运行python manage.py runserver时,可能会遇到以下错误:ImproperlyConfigured: Error loading MySQLdb module: dlopen(/Library/Python/2.7/site-...
    编程 发布于2024-12-19
  • Bootstrap 4 Beta 中的列偏移发生了什么?
    Bootstrap 4 Beta 中的列偏移发生了什么?
    Bootstrap 4 Beta:列偏移的删除和恢复Bootstrap 4 在其 Beta 1 版本中引入了重大更改柱子偏移了。然而,随着 Beta 2 的后续发布,这些变化已经逆转。从 offset-md-* 到 ml-auto在 Bootstrap 4 Beta 1 中, offset-md-*...
    编程 发布于2024-12-19
  • 除了“if”语句之外:还有什么地方可以在不进行强制转换的情况下使用具有显式“bool”转换的类型?
    除了“if”语句之外:还有什么地方可以在不进行强制转换的情况下使用具有显式“bool”转换的类型?
    无需强制转换即可上下文转换为 bool您的类定义了对 bool 的显式转换,使您能够在条件语句中直接使用其实例“t”。然而,这种显式转换提出了一个问题:“t”在哪里可以在不进行强制转换的情况下用作 bool?上下文转换场景C 标准指定了四种值可以根据上下文转换为的主要场景bool:语句:if、whi...
    编程 发布于2024-12-19
  • 插入数据时如何修复“常规错误:2006 MySQL 服务器已消失”?
    插入数据时如何修复“常规错误:2006 MySQL 服务器已消失”?
    插入记录时如何解决“一般错误:2006 MySQL 服务器已消失”介绍:将数据插入 MySQL 数据库有时会导致错误“一般错误:2006 MySQL 服务器已消失”。当与服务器的连接丢失时会出现此错误,通常是由于 MySQL 配置中的两个变量之一所致。解决方案:解决此错误的关键是调整wait_tim...
    编程 发布于2024-12-19
  • 大批
    大批
    方法是可以在对象上调用的 fns 数组是对象,因此它们在 JS 中也有方法。 slice(begin):将数组的一部分提取到新数组中,而不改变原始数组。 let arr = ['a','b','c','d','e']; // Usecase: Extract till index p...
    编程 发布于2024-12-19
  • 在 Go 中使用 WebSocket 进行实时通信
    在 Go 中使用 WebSocket 进行实时通信
    构建需要实时更新的应用程序(例如聊天应用程序、实时通知或协作工具)需要一种比传统 HTTP 更快、更具交互性的通信方法。这就是 WebSockets 发挥作用的地方!今天,我们将探讨如何在 Go 中使用 WebSocket,以便您可以向应用程序添加实时功能。 在这篇文章中,我们将介绍: WebSoc...
    编程 发布于2024-12-19
  • 如何在 PHP 中组合两个关联数组,同时保留唯一 ID 并处理重复名称?
    如何在 PHP 中组合两个关联数组,同时保留唯一 ID 并处理重复名称?
    在 PHP 中组合关联数组在 PHP 中,将两个关联数组组合成一个数组是一项常见任务。考虑以下请求:问题描述:提供的代码定义了两个关联数组,$array1 和 $array2。目标是创建一个新数组 $array3,它合并两个数组中的所有键值对。 此外,提供的数组具有唯一的 ID,而名称可能重合。要求...
    编程 发布于2024-12-19
  • 如何使用 MySQL 查找今天生日的用户?
    如何使用 MySQL 查找今天生日的用户?
    如何使用 MySQL 识别今天生日的用户使用 MySQL 确定今天是否是用户的生日涉及查找生日匹配的所有行今天的日期。这可以通过一个简单的 MySQL 查询来实现,该查询将存储为 UNIX 时间戳的生日与今天的日期进行比较。以下 SQL 查询将获取今天有生日的所有用户: FROM USERS ...
    编程 发布于2024-12-19
  • 尽管代码有效,为什么 POST 请求无法捕获 PHP 中的输入?
    尽管代码有效,为什么 POST 请求无法捕获 PHP 中的输入?
    解决 PHP 中的 POST 请求故障在提供的代码片段中:action=''而不是:action="<?php echo $_SERVER['PHP_SELF'];?>";?>"检查 $_POST数组:表单提交后使用 var_dump 检查 $_POST 数...
    编程 发布于2024-12-19
  • 为什么我的 Spring Boot 应用程序不自动创建数据库架构?
    为什么我的 Spring Boot 应用程序不自动创建数据库架构?
    在 Spring Boot 中自动创建数据库架构启动 Spring Boot 应用程序时,可能会遇到自动创建数据库架构的问题。以下故障排除步骤旨在解决此问题:1.实体类包:确保实体类位于使用@EnableAutoConfiguration注解的类的同一个包或子包中。否则,Spring 将不会检测实体...
    编程 发布于2024-12-18
  • CSS3 过渡是否提供事件来检测起点和终点?
    CSS3 过渡是否提供事件来检测起点和终点?
    了解 CSS3 过渡事件CSS3 过渡允许在 Web 元素上实现流畅的动画和视觉效果。为了增强用户体验并使操作与这些转换同步,监控其进度非常重要。本文解决了 CSS3 是否提供事件来检查过渡何时开始或结束的问题。W3C CSS 过渡草案W3C CSS 过渡草案规定CSS 转换会触发相应的 DOM 事...
    编程 发布于2024-12-18
  • Java 中可以手动释放内存吗?
    Java 中可以手动释放内存吗?
    Java 中的手动内存释放与垃圾回收与 C 不同,Java 采用托管内存框架来处理内存分配和释放由垃圾收集器 (GC) 自动执行。这种自动化方法可以提高内存利用率并防止困扰 C 程序的内存泄漏。Java 中可以手动释放内存吗?由于 Java 的内存管理是由GC,它没有提供像 C 中的 free() ...
    编程 发布于2024-12-18
  • Java 1.6 中如何可靠地确定文件是否为符号链接?
    Java 1.6 中如何可靠地确定文件是否为符号链接?
    在 Java 1.6 中验证符号链接确定符号链接的存在对于各种文件处理操作至关重要。在 Java 中,识别符号链接时需要考虑一些潜在问题,特别是在目录遍历的上下文中。检查符号链接的一种常见方法是比较文件的绝对路径和规范路径。规范路径表示文件的标准化路径,而绝对路径可能包括符号链接。传统上,概念是如果...
    编程 发布于2024-12-17
  • 如何使背景颜色透明,同时保持文本不透明?
    如何使背景颜色透明,同时保持文本不透明?
    背景颜色的不透明度而不影响文本在 Web 开发领域,实现透明度通常对于增强视觉吸引力和网站元素的功能。一项常见的要求是对 div 背景应用透明度,同时保留所包含文本的不透明度。这可能会带来挑战,特别是在确保跨浏览器兼容性方面。rgba 解决方案最有效且得到广泛支持的解决方案是利用“RGBA”(红、绿...
    编程 发布于2024-12-17
  • PHP 字符串比较:`==`、`===` 或 `strcmp()` – 您应该使用哪个运算符?
    PHP 字符串比较:`==`、`===` 或 `strcmp()` – 您应该使用哪个运算符?
    PHP 中的字符串比较:'=='、'===' 或 'strcmp()'?PHP 中的字符串比较PHP 可以使用不同的运算符来完成,例如“==”、“===”或“strcmp()”函数。此比较涉及检查两个字符串是否相等。'==' 与 ...
    编程 发布于2024-12-17

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3