」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 程式設計 > MySQL 中的資料庫分片:綜合指南

MySQL 中的資料庫分片:綜合指南

發佈於2024-11-06
瀏覽:931

Database Sharding in MySQL: A Comprehensive Guide

随着数据库变得越来越大、越来越复杂,有效地控制性能和扩展就出现了。数据库分片是用于克服这些障碍的一种方法。称为“分片”的数据库分区将大型数据库划分为更小、更易于管理的段(称为“分片”)。通过将每个分片分布在多个服务器上(每个服务器保存总数据的一小部分),可以提高可扩展性和吞吐量。

在本文中,我们将探讨什么是分片、为什么它很重要以及如何在 MySQL 中实现分片。我们还将讨论这种方法的好处和潜在挑战,以及实际示例。

什么是数据库分片?

数据库分片是一种用于跨多个数据库或服务器水平分区数据的策略。分片不是将所有记录存储在一个庞大的数据库中,而是将数据集分割成几个较小的部分(分片),每个部分包含数据的子集。每个分片作为独立的数据库运行,但协同工作以提供对整个数据集的访问。

例如,假设您有一个用户数据库。您可以通过按地理区域拆分用户来对数据库进行分片,而不是将所有用户数据存储在单个数据库中。这样,来自北美的用户可以存储在一个分片上,来自欧洲的用户可以存储在另一个分片上。

为什么需要分片

分片在以下情况下变得必要:

↳ 数据量增长:随着数据库大小的增长,可能会出现查询缓慢和加载时间增加等性能问题。分片有助于分解大型数据集,减少任何单个服务器上的负载。

↳ 可扩展性:传统的垂直扩展(升级到更强大的硬件)有其局限性。通过分片进行水平扩展(添加更多服务器)可以让您在多个数据库之间分配负载,从而更轻松地处理大规模应用程序。

↳ 故障隔离:如果一个分片出现故障,它只会影响部分数据,从而使恢复速度更快并最大限度地减少总体停机时间。
提高性能:通过分片,查询仅命中数据子集,而不是搜索大量表,从而缩短查询响应时间。

分片策略

有多种方法可以对数据库进行分片,您选择的策略将取决于您的具体用例。两种最常见的分片策略是基于范围的分片和基于哈希的分片。

1.基于范围的分片

在基于范围的分片中,数据根据特定标准(例如数值或时间戳)划分为范围。例如,如果您要存储用户数据,您可以根据用户 ID 对数据进行分片,每个分片包含 ID 在特定范围内的用户。

-- Example of range-based sharding:
-- Shard 1 (User IDs 1-1000)
-- Shard 2 (User IDs 1001-2000)

-- Query for Shard 1
SELECT * FROM users WHERE user_id BETWEEN 1 AND 1000;

基于范围的分片实现起来很简单,但如果某些范围的记录明显多于其他范围,则可能会导致数据分布不均匀。

2.基于哈希的分片

基于哈希的分片涉及应用哈希函数来确定记录应放置在哪个分片中。此方法可确保数据在分片之间的分布更加均匀。

-- Example of hash-based sharding:
-- Use a modulo operation to determine which shard to query.

SELECT * FROM users WHERE MOD(user_id, 3) = 1;  -- For shard 1
SELECT * FROM users WHERE MOD(user_id, 3) = 2;  -- For shard 2

基于哈希的分片可防止数据偏向特定分片,但检索范围查询(例如,特定年龄范围内的用户)可能更具挑战性。

如何在MySQL中实现分片

虽然MySQL没有内置分片功能,但您可以通过以下方式手动实现分片:

↳ 设计您的分片策略:确定如何在分片之间分割数据。您可以根据用户 ID、地理位置或任何其他相关标准进行分片。

↳ 设置多个 MySQL 实例:每个分片将存储在单独的 MySQL 实例或服务器上。安装并配置所需数量的 MySQL 服务器,每个服务器处理一个特定的分片。

↳ 数据分布:根据您选择的分片策略在分片之间分布数据。例如,如果使用基于范围的分片,请编写一个脚本将记录迁移到适当的分片。

↳ 应用程序中的分片逻辑:在应用程序中实现分片逻辑。这涉及根据分片键(例如用户 ID)确定要查询的分片。您可以使用中间件或数据库代理层(例如 ProxySQL)将查询路由到正确的分片。

// Example in Node.js to handle sharding logic
import mysql from 'mysql2/promise';

// Shard connections
const shards = [
  mysql.createConnection({ host: 'shard1.db.com', user: 'root', database: 'db1' }),
  mysql.createConnection({ host: 'shard2.db.com', user: 'root', database: 'db2' }),
];

// Function to get shard by user ID (Range-based sharding)
function getShardByUserId(userId: number) {
  if (userId 



分片的挑战

虽然分片提供了许多好处,但它也带来了复杂性。以下是需要考虑的一些挑战:

↳ 复杂性增加:分片增加了应用程序逻辑的复杂性,因为您需要管理多个数据库并适当地路由查询。

↳ 跨分片查询:跨多个分片的查询可能很难实现,并且可能需要额外的协调,从而导致性能下降。

↳ 重新平衡数据:如果数据在分片之间增长不均匀,您可能需要重新平衡分片,这可能是一个耗时的过程。

MySQL 分片最佳实践

选择有效的分片键:您的分片键应确保数据在分片之间均匀分布,以避免热点。选择不太可能造成分布不平衡的键(例如,避免在高度活跃的系统中将时间戳用作分片键)。

↳ 监控和调整分片:持续监控分片是否存在性能问题。如果特定分片变得太大,请考虑重新分片或调整分片键分布。

↳ 自动重新平衡:实现当分​​片过载时自动重新平衡数据的机制。 Vitess 等工具可以帮助管理基于 MySQL 的系统的重新平衡。

↳ 备份和恢复:确保每个分片都单独备份,并且您有适当的恢复策略,以防特定分片上的数据丢失。

结论

在 MySQL 中,分片是处理大型数据集、优化速度和扩展大型数据库的有用技术。尽管它增加了另一层复杂性,但经过深思熟虑的计划与适当的方法相结合可以产生可扩展且高度优化的数据库架构。您可以通过使用本文中的建议以及基于范围或基于哈希的分片算法来使用满足您的应用程序要求的分片解决方案。

版本聲明 本文轉載於:https://dev.to/wallacefreitas/database-sharding-in-mysql-a-comprehensive-guide-2hag?1如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • 哪一種方法計算資料庫行數較快:PDO::rowCount 或 COUNT(*)?
    哪一種方法計算資料庫行數較快:PDO::rowCount 或 COUNT(*)?
    PDO::rowCount 與COUNT(*) 效能在資料庫查詢中計算行數時,選擇使用PDO:: rowCount 和COUNT(*) 會顯著影響效能。 PDO::rowCountPDO::rowCount 傳回受最後一個 SQL 語句影響的行數。但是,對於 SELECT 語句,某些資料庫可能會傳回...
    程式設計 發佈於2024-11-06
  • PART# 使用 HTTP 進行大型資料集的高效能檔案傳輸系統
    PART# 使用 HTTP 進行大型資料集的高效能檔案傳輸系統
    让我们分解提供的HTML、PHP、JavaScript和CSS代码对于分块文件上传仪表板部分。 HTML 代码: 结构概述: Bootstrap for Layout:代码使用 Bootstrap 4.5.2 创建一个包含两个主要部分的响应式布局: 分块上传部分:用于...
    程式設計 發佈於2024-11-06
  • 比較:Lithe 與其他 PHP 框架
    比較:Lithe 與其他 PHP 框架
    如果您正在為下一個專案探索 PHP 框架,很自然會遇到 Laravel、Symfony 和 Slim 等選項。但是,是什麼讓 Lithe 與這些更強大、更知名的框架區分開來呢?以下是一些突出 Lithe 如何脫穎而出的注意事項。 1. 輕量級與性能 Lithe 的設計重點在於輕量級...
    程式設計 發佈於2024-11-06
  • 程式設計風格指南:編寫簡潔程式碼的實用指南
    程式設計風格指南:編寫簡潔程式碼的實用指南
    在过去的五年里,我一直在不断尝试提高我的编码技能,其中之一就是学习和遵循最推荐的编码风格。 本指南旨在帮助您编写一致且优雅的代码,并包含一些提高代码可读性和可维护性的建议。它的灵感来自于社区中最受接受的流行指南,但进行了一些修改以更适合我的喜好。 值得一提的是,我是一名全栈 JavaScript 开...
    程式設計 發佈於2024-11-06
  • 檢查類型是否滿足 Go 中的接口
    檢查類型是否滿足 Go 中的接口
    在Go中,開發人員經常使用介面來定義預期的行為,使程式碼靈活且健壯。但是如何確保類型真正實現接口,尤其是在大型程式碼庫中? Go 提供了一種簡單有效的方法來在編譯時驗證這一點,防止執行時間錯誤的風險並使您的程式碼更加可靠和可讀。 您可能看過類似的文法 var _ InterfaceName = ...
    程式設計 發佈於2024-11-06
  • 掌握 JavaScript 中的 &#this&# 關鍵字
    掌握 JavaScript 中的 &#this&# 關鍵字
    JavaScript 中的 this 關鍵字如果不理解的話可能會非常棘手。這是即使是經驗豐富的開發人員也很難輕鬆掌握的事情之一,但一旦你掌握了,它可以為你節省大量時間。 在本文中,我們將了解它是什麼、它在不同情況下如何運作以及使用它時不應陷入的常見錯誤。 在 JavaScript...
    程式設計 發佈於2024-11-06
  • PHP 中的使用者瀏覽器偵測可靠嗎?
    PHP 中的使用者瀏覽器偵測可靠嗎?
    使用 PHP 進行可靠的用戶瀏覽器檢測確定用戶的瀏覽器對於定制 Web 體驗至關重要。 PHP 提供了兩種可能的方法: $_SERVER['HTTP_USER_AGENT'] 和 get_browser() 函數。 $_SERVER['HTTP_USER_AGENT'...
    程式設計 發佈於2024-11-06
  • 增強您的 Web 動畫:像專業人士一樣最佳化 requestAnimationFrame
    增強您的 Web 動畫:像專業人士一樣最佳化 requestAnimationFrame
    流畅且高性能的动画在现代 Web 应用程序中至关重要。然而,管理不当可能会使浏览器的主线程过载,导致性能不佳和动画卡顿。 requestAnimationFrame (rAF) 是一种浏览器 API,旨在将动画与显示器的刷新率同步,从而确保与 setTimeout 等替代方案相比更流畅的运动。但有效...
    程式設計 發佈於2024-11-06
  • 為什麼MySQL伺服器在60秒內就消失了?
    為什麼MySQL伺服器在60秒內就消失了?
    MySQL 伺服器已消失- 恰好在60 秒內在此場景中,之前成功運行的MySQL 查詢現在遇到了60 秒後逾時,顯示錯誤「MySQL 伺服器已消失」。即使調整了 wait_timeout 變量,問題仍然存在。 分析:超時正好發生在 60 秒,這表明是設置而不是資源限制是原因。直接從 MySQL 客戶...
    程式設計 發佈於2024-11-06
  • 為什麼帶有“display: block”和“width: auto”的按鈕無法拉伸以填充其容器?
    為什麼帶有“display: block”和“width: auto”的按鈕無法拉伸以填充其容器?
    了解具有“display: block”和“width: auto”的按鈕的行為當您設定“display: block”時一個按鈕,它會調整其佈局以佔據可用的整個寬度。但是,如果將其與“width: auto”結合使用,則按鈕會出現意外行為,並且無法拉伸以填充其容器。此行為源自於按鈕作為替換元素的基...
    程式設計 發佈於2024-11-06
  • 為 Bluesky Social 創作機器人
    為 Bluesky Social 創作機器人
    How the bot will work We will develop a bot for the social network Bluesky, we will use Golang for this, this bot will monitor some hashtags ...
    程式設計 發佈於2024-11-06
  • 為什麼 PHP 的浮點運算會產生意外的結果?
    為什麼 PHP 的浮點運算會產生意外的結果?
    PHP 中的浮點數計算精度:為什麼它很棘手以及如何克服它在PHP 中處理浮點數時,這一點至關重要了解其固有的準確性限制。如程式片段所示:echo("success");} else {echo("error");} 您可能會驚訝地發現,儘管值之間的差異小於0....
    程式設計 發佈於2024-11-06
  • Python中可以透過變數ID逆向取得物件嗎?
    Python中可以透過變數ID逆向取得物件嗎?
    從 Python 中的變數 ID 擷取物件參考Python 中的 id() 函數傳回物件的唯一識別。人們很容易想知道是否可以反轉此過程並從其 ID 取得物件。 具體來說,我們想要檢查取消引用變數的ID 是否會擷取原始物件:dereference(id(a)) == a瞭解引用的概念及其在Python...
    程式設計 發佈於2024-11-06
  • Go 的 Defer 關鍵字如何在函數執行順序中發揮作用?
    Go 的 Defer 關鍵字如何在函數執行順序中發揮作用?
    了解 Go 的 Defer 關鍵字的功能使用 Go 時,了解 defer 關鍵字的行為至關重要。此關鍵字允許開發人員推遲函數的執行,直到周圍的函數返回。但是,需要注意的是,函數的值和參數在執行 defer 語句時進行評估。 範例:評估 Defer Order為了說明這一點,請考慮以下內容代碼:pac...
    程式設計 發佈於2024-11-06
  • WordPress Gutenberg 全域狀態管理初學者指南
    WordPress Gutenberg 全域狀態管理初學者指南
    构建复杂的 WordPress 块编辑器 (Gutenberg) 应用程序时,有效管理状态变得至关重要。这就是 @wordpress/data 发挥作用的地方。它允许您跨 WordPress 应用程序中的不同块和组件管理和共享全局状态。 如果您不熟悉管理全局状态或使用@wordpress/data,...
    程式設計 發佈於2024-11-06

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3