」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 程式設計 > 如何使用 etcd Raft 庫建立自己的分散式 KV 儲存系統

如何使用 etcd Raft 庫建立自己的分散式 KV 儲存系統

發佈於2024-07-30
瀏覽:180

How to Build Your Own Distributed KV Storage System Using the etcd Raft Library

介绍

raftexample是etcd提供的示例,演示了etcd raft共识算法库的使用。 raftexample最终实现了一个提供REST API的分布式键值存储服务。

本文将对raftexample的代码进行阅读和分析,希望能够帮助读者更好地理解如何使用etcd raft库以及raft库的实现逻辑。

建筑学

raftexample的架构非常简单,主要文件如下:

  • main.go: 负责组织 raft 模块、httpapi 模块、kvstore 模块之间的交互;
  • raft.go: 负责与raft库交互,包括提交提案、接收需要发送的RPC消息、进行网络传输等;
  • httpapi.go:负责提供REST API,作为用户请求的入口;
  • kvstore.go: 负责持久化存储提交的日志条目,相当于raft协议中的状态机。

写请求的处理流程

写入请求通过 HTTP PUT 请求到达 httpapi 模块的 ServeHTTP 方法。

curl -L http://127.0.0.1:12380/key -XPUT -d value

通过switch匹配到HTTP请求方法后,进入PUT方法处理流程:

  • 从HTTP请求体中读取内容(即值);
  • 通过kvstore模块的Propose方法构造提案(添加以key为key、value为value的键值对);
  • 由于没有数据可返回,所以向客户端响应204 StatusNoContent;

通过raft算法库提供的Propose方法将proposal提交给raft算法库。

提案的内容可以是添加新的键值对、更新已有的键值对等

// httpapi.go
v, err := io.ReadAll(r.Body)
if err != nil {
    log.Printf("Failed to read on PUT (%v)\n", err)
    http.Error(w, "Failed on PUT", http.StatusBadRequest)
    return
}
h.store.Propose(key, string(v))
w.WriteHeader(http.StatusNoContent)

接下来我们看看kvstore模块的Propose方法,看看提案是如何构造和处理的。

在Propose方法中,我们首先使用gob对要写入的键值对进行编码,然后将编码后的内容传递给proposeC,proposeC是负责将kvstore模块构建的proposal传输到raft模块的通道。

// kvstore.go
func (s *kvstore) Propose(k string, v string) {
    var buf strings.Builder
    if err := gob.NewEncoder(&buf).Encode(kv{k, v}); err != nil {
        log.Fatal(err)
    }
    s.proposeC 



由kvstore构造并传递给proposeC的proposal由raft模块中的serveChannels方法接收和处理。

在确认proposeC没有被关闭后,raft模块使用raft算法库提供的Propose方法将proposal提交给raft算法库进行处理。

// raft.go
select {
    case prop, ok := 



提案提交后,遵循raft算法流程。提案最终将转发到领导节点(如果当前节点不是领导节点,并且您允许追随者转发提案,由 DisableProposalForwarding 配置控制)。 Leader 会将提案作为日志条目添加到其 raft 日志中,并与其他 follower 节点同步。被视为已提交后,将应用到状态机并将结果返回给用户。

但是,由于etcd raft库本身不处理节点之间的通信、追加到raft日志、应用到状态机等,所以raft库只准备这些操作所需的数据。实际操作必须由我们来执行。

因此,我们需要从raft库接收这些数据,并根据其类型进行相应的处理。 Ready方法返回一个只读通道,通过该通道我们可以接收需要处理的数据。

需要注意的是,接收到的数据包括多个字段,例如要应用的快照、要附加到raft日志的日志条目、要通过网络传输的消息等。

继续我们的写请求示例(Leader节点),收到相应数据后,我们需要持久保存快照、HardState和Entries,以处理服务器崩溃引起的问题(例如,一个follower为多个候选人投票)。 HardState 和 Entries 共同构成了本文中提到的所有服务器上的持久状态。持久保存它们后,我们可以应用快照并追加到 raft 日志中。

由于我们当前是leader节点,raft库会返回MsgApp类型的消息给我们(对应论文中的AppendEntries RPC)。我们需要将这些消息发送到跟随者节点。这里,我们使用etcd提供的rafthttp进行节点通信,并使用Send方法将消息发送给follower节点。

// raft.go
case rd := 



接下来,我们使用publishEntries方法将提交的raft日志条目应用到状态机。如前所述,在 raftexample 中,kvstore 模块充当状态机。在publishEntries方法中,我们将需要应用到状态机的日志条目传递给commitC。与之前的proposeC类似,commitC负责将raft模块认为已提交的日志条目传输到kvstore模块,以应用到状态机。

// raft.go
rc.commitC 



在kvstore模块的readCommits方法中,从commitC读取的消息被gob解码以检索原始键值对,然后将其存储在kvstore模块内的map结构中。

// kvstore.go
for commit := range commitC {
    ...
    for _, data := range commit.data {
        var dataKv kv
        dec := gob.NewDecoder(bytes.NewBufferString(data))
        if err := dec.Decode(&dataKv); err != nil {
            log.Fatalf("raftexample: could not decode message (%v)", err)
        }
        s.mu.Lock()
        s.kvStore[dataKv.Key] = dataKv.Val
        s.mu.Unlock()
    }
    close(commit.applyDoneC)
}

回到raft模块,我们使用Advance方法通知raft库我们已经处理完从Ready通道读取的数据,准备处理下一批数据。

之前,在leader节点上,我们使用Send方法向follower节点发送MsgApp类型的消息。 follower节点的rafthttp监听相应的端口,接收请求并返回响应。无论是follower节点收到的请求,还是leader节点收到的响应,都会通过Step方法提交到raft库处理。

raftNode实现了rafthttp中的Raft接口,调用Raft接口的Process方法来处理接收到的请求内容(如MsgApp消息)。

// raft.go
func (rc *raftNode) Process(ctx context.Context, m raftpb.Message) error {
    return rc.node.Step(ctx, m)
}

上面描述了raftexample中一个写请求的完整处理流程。

概括

本文的内容到此结束。通过概述raftexample的结构以及详细说明一个写请求的处理流程,希望能够帮助您更好地理解如何使用etcd raft库构建自己的分布式KV存储服务。

如果有任何错误或问题,请随时评论或直接给我留言。谢谢。

参考

  • https://github.com/etcd-io/etcd/tree/main/contrib/raftexample

  • https://github.com/etcd-io/raft

  • https://raft.github.io/raft.pdf

版本聲明 本文轉載於:https://dev.to/justlorain/how-to-build-your-own-distributed-kv-storage-system-using-the-etcd-raft-library-2j69?1如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • 如何使用Python的記錄模塊實現自定義處理?
    如何使用Python的記錄模塊實現自定義處理?
    使用Python的Loggging Module 確保正確處理和登錄對於疑慮和維護的穩定性至關重要Python應用程序。儘管手動捕獲和記錄異常是一種可行的方法,但它可能乏味且容易出錯。 解決此問題,Python允許您覆蓋默認的異常處理機制,並將其重定向為登錄模塊。這提供了一種方便而係統的方法來捕獲...
    程式設計 發佈於2025-02-06
  • 如何使用char_length()在mySQL中按字符串長度對數據進行排序?
    如何使用char_length()在mySQL中按字符串長度對數據進行排序?
    [2使用內置的char_length()function。 char_length()和length() 此查詢將從指定的表中檢索所有行,並基於上升順序對它們進行排序指定列的字符長度。帶有更長字符串的行將出現在結果的底部。
    程式設計 發佈於2025-02-06
  • 如何使用FormData()處理多個文件上傳?
    如何使用FormData()處理多個文件上傳?
    )處理多個文件輸入時,通常需要處理多個文件上傳時,通常是必要的。可以將fd.append("fileToUpload[]", files[x]);方法用於此目的,允許您在單個請求中發送多個文件。 初始嘗試 在JavaScript中,一種常見方法是:); 但是,此代碼僅處理第...
    程式設計 發佈於2025-02-06
  • HTML格式標籤
    HTML格式標籤
    HTML 格式化元素 **HTML Formatting is a process of formatting text for better look and feel. HTML provides us ability to format text without us...
    程式設計 發佈於2025-02-06
  • 如何在Java列表中有效計算元素的發生?
    如何在Java列表中有效計算元素的發生?
    計數列表中的元素出現在列表 中,在java編程中,列舉列表中列舉元素出現的任務來自列表。為此,收集框架提供了全面的工具套件。 在這種情況下,Batocurrences變量將保持值3,代表動物列表中的“ BAT”出現的數量。 &&& [此方法是簡單的,可以得出準確的結果,使其成為計算列表中元素出現的...
    程式設計 發佈於2025-02-06
  • \“(1)vs.(;;):編譯器優化是否消除了性能差異?\”
    \“(1)vs.(;;):編譯器優化是否消除了性能差異?\”
    使用(1)而不是(;;)會導致無限循環的性能差異? 現代編譯器,(1)和(;;)之間沒有性能差異。 是如何實現這些循環的技術分析在編譯器中: perl: S-> 7 8 unstack v-> 4 -e語法ok 在GCC中,兩者都循環到相同的彙編代碼中,如下所示:。 globl t_時 ...
    程式設計 發佈於2025-02-06
  • C#中靜態變量的功率和局限性是什麼?
    C#中靜態變量的功率和局限性是什麼?
    [2 [2 靜態變量是C#的基本功能,在面向對象的編程中起著重要作用。 與實例變量不同,它們獨立於任何特定對象,維護在類的所有實例中共享的單個值。 [2 幾個關鍵好處使靜態變量有價值: 數據共享:靜態變量為在多個類實例之間共享數據提供了方便的機制。 這對於管理全局常數,應用程序設置或跟踪共享狀...
    程式設計 發佈於2025-02-06
  • 為什麼MySQL返回錯誤2014:“當其他未封閉的查詢處於活動狀態時無法執行查詢”?
    為什麼MySQL返回錯誤2014:“當其他未封閉的查詢處於活動狀態時無法執行查詢”?
    的原因2014:無法執行查詢,而其他未封閉的查詢是活動的在執行無封閉的查詢並試圖執行另一個查詢之前從中撤回所有行時首先,MySQL返回錯誤“無法執行查詢,而其他未封閉的查詢處於活動狀態。” 仿真準備的語句 有幾種解決此錯誤的方法: 使用buffered Queries: 關閉光標:使用colle...
    程式設計 發佈於2025-02-06
  • 如何從PHP中的源URL中檢索重定向URL?
    如何從PHP中的源URL中檢索重定向URL?
    從php /S/2e34796f/l/0l0sliberoquotidiano0bit0cnews0c12735670ci0esaggi0eper0ele0er0er0eriforme0ecostituzionaliiechiactuiaieiechiaccherano0eee0eee0ee...
    程式設計 發佈於2025-02-06
  • 混合蛋白如何在沒有繼承的情況下提供可擴展的類功能?
    混合蛋白如何在沒有繼承的情況下提供可擴展的類功能?
    引入mixins:Intuitive class Extension無繼承概念在擴展類別的功能中起著至關重要的作用,而無需依賴傳統的繼承。 Mixins通常稱為“抽象子類”,為一個共同的挑戰提供了一種優雅的解決方案:結合正交概念,同時保持代碼模塊化和組合性。 理解了對Mixins 在軟件工程中,我...
    程式設計 發佈於2025-02-06
  • 對象擬合:IE和Edge中的封面失敗,如何修復?
    對象擬合:IE和Edge中的封面失敗,如何修復?
    解決此問題,我們採用了一個巧妙的CSS解決方案來解決問題:高度:100%; 高度:auto ; 寬度:100%; //對於水平塊 ,使用絕對定位將圖像定位在中心,以object-fit:object-fit :cover in IE和edge消除了問題。現在,圖像將按比例擴展,保持所需的效果而不...
    程式設計 發佈於2025-02-06
  • 可以在純CS中將多個粘性元素彼此堆疊在一起嗎?
    可以在純CS中將多個粘性元素彼此堆疊在一起嗎?
    </main> <section> ,但无法使其正常工作,如您所见。任何洞察力都将不胜感激! display:grid; { position:sticky; top:1em; z-index:1 1 ; { { { pos...
    程式設計 發佈於2025-02-06
  • 如何在XAMPP上創建虛擬主機?
    如何在XAMPP上創建虛擬主機?
    [2 。更新hosts文件 127.0.0.1 localhost 127.0.0.1 [主機域名] 2。配置虛擬host ” Servername [主機域名] 3。 XAMPP \ apache \ apache \ conf \ conf \ httpd.conf中的uncomme...
    程式設計 發佈於2025-02-06
  • 在沒有密碼提示的情況下,如何在Ubuntu上安裝MySQL?
    在沒有密碼提示的情況下,如何在Ubuntu上安裝MySQL?
    在ubuntu 使用debconf-set-selections sudo debconf-set-selections
    程式設計 發佈於2025-02-06
  • 如何使用組在MySQL中旋轉數據?
    如何使用組在MySQL中旋轉數據?
    在關係數據庫中使用mysql組使用mysql組來調整查詢結果。在這裡,我們面對一個共同的挑戰:使用組的組將數據從基於行的基於列的基於列的轉換。通過子句以及條件匯總函數,例如總和或情況。讓我們考慮以下查詢: select d.data_timestamp, sum(data_id = 1 tata...
    程式設計 發佈於2025-02-06

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3