淺談數據庫集群方案

發布時間：2020-02-28 18:37:33 來源：網絡閱讀：376 作者：ZeroOne01 欄目：MySQL數據庫

單點數據庫

數據庫往往是系統中的性能瓶頸，所以通常在系統設計中會引入各種各樣的緩存機制，以避免頻繁訪問數據庫。另外，數據庫由于其重要性，高可用要求也是避免不了的，因為一旦數據庫掛了基本上整個系統也就不能使用了。

而以上這些常見問題都是單點數據庫帶來的限制，為了解決這些問題，達到高性能、高可用的目的，我們就需要在系統架構設計中采用數據庫集群方案。

性能測試

既然單點數據庫存在性能問題，那么有沒有實際數據呢？下面我們就來對單點數據庫進行一個性能測試，看看其并發極限大概是多少。我這里使用了一臺2核2G的云服務，mysql版本為8.0.18。

mysql自帶了一個性能測試工具：mysqlslap，我們可以使用該工具進行測試，具體的測試參數如下：

[root@localhost ~]# mysqlslap -hlocalhost -uroot -pyour_password -P3306 --concurrency=500 --iterations=1 --auto-generate-sql --auto-generate-sql-load-type=mixed --auto-generate-sql-add-autoincrement --engine=innodb --number-of-queries=500

主要參數說明：

參數	說明
`--concurrency`	并發數量，即模擬的客戶端數量
`--iterations`	執行多少次該測試
`--auto-generate-sql`	使用系統自己生成的SQL腳本來測
`--auto-generate-sql-load-type`	要測試的是讀還是寫還是兩者混合的（取值：read, write, update, mixed）
`--auto-generate-sql-add-autoincrement`	將自增的列添加到自動生成的表中
`--engine`	要測試的存儲引擎
`--number-of-queries`	每個客戶端的訪問次數，該數值除以并發數量就是每個客戶端的訪問次數，在本例中：`500 / 500 = 1`

更多內容詳見官方文檔

這里我分別進行了不同量級的測試，在并發500、1000和5000個連接時，數據庫還可以正常處理，沒有太大問題：

# 500個并發連接
Benchmark
    Running for engine innodb
    Average number of seconds to run all queries: 0.391 seconds
    Minimum number of seconds to run all queries: 0.391 seconds
    Maximum number of seconds to run all queries: 0.391 seconds
    Number of clients running queries: 500
    Average number of queries per client: 1

# 1000個并發連接
Benchmark
    Running for engine innodb
    Average number of seconds to run all queries: 0.802 seconds
    Minimum number of seconds to run all queries: 0.802 seconds
    Maximum number of seconds to run all queries: 0.802 seconds
    Number of clients running queries: 1000
    Average number of queries per client: 1

# 5000個并發連接
Benchmark
    Running for engine innodb
    Average number of seconds to run all queries: 3.884 seconds
    Minimum number of seconds to run all queries: 3.884 seconds
    Maximum number of seconds to run all queries: 3.884 seconds
    Number of clients running queries: 5000
    Average number of queries per client: 1

但在測試1w個并發連接時，數據庫就開始報無法連接的錯誤了：
淺談數據庫集群方案

由該測試案例可知，普通的單節點數據庫性能瓶頸大概在1w個并發連接左右。當然這里的測試結果與機器的硬件差異有關，只是提供一個參考。

PXC集群方案

上一小節介紹了單點數據庫存在的問題，以及進行了一個簡單的性能測試。為了應對這些問題，我們需要將單點數據庫向集群轉變。

目前存在許多的數據庫集群方案，而這些方案中也沒有哪個好那個壞，只有適合的才是好的。本小節則介紹一下主流的方案之一：PXC集群方案，其架構圖大致如下：
淺談數據庫集群方案

PXC集群最大的特點就是數據讀寫的強一致性，在圖中的任意一個節點寫入數據，其他的節點就一定能讀到這個數據。不會出現A節點成功寫入，而讀B節點時讀取不到數據。該特性使得PXC集群適合存儲高價值重要數據，因為類似于訂單、錢有關的數據基本都有強一致性的要求

上圖只是PXC集群最基礎的架構，所以還有優化的余地。我們都知道mysql的單表數據處理的性能極限在2千萬左右，當數據達到這個量級時，mysql的處理性能就會很低下了。而上圖中每個PXC節點都會進行數據的同步，所以當每個節點的數據量級都達到2千萬時，整個集群的性能就會降低。

這時就需要增加多一個集群，并且這兩個集群之間的數據是不進行同步的。為了讓不同的集群存儲不同的數據，就得引入Mycat這種數據庫中間件將數據進行切分，讓數據可以在不同的集群上進行讀寫，分散存儲壓力。在這個場景下，一個集群稱為一個數據分片。如圖：
淺談數據庫集群方案

PXC集群工作原理

我們知道數據庫數據的一致性和持久性是通過事務來保證的，而PXC集群的強一致性也是采用了事務，只不過這個事務是分布式事務。

客戶端在寫入數據完成后，同樣需要提交一個事務，在事務內節點之間會進行數據的同步復制。該事務會作用到集群內的所有節點上，保證所有節點要么全寫入成功，要么全寫入失敗。這里用一個時序圖表達一下大致流程：
淺談數據庫集群方案

搭建PXC集群需要注意的事項：

PXC集群中的節點并不是越多越好，節點多并不能提高性能。相反，節點多意味著同步數據所需的耗時就越多，反而會降低性能。通常來講，一個PXC集群最好是不超過15個節點。若需要更多的節點時，應當搭建一個新的集群，然后用中間件來做分片。
PXC集群的性能不取決于配置最好的那個節點，而是取決于配置最差的那個節點，這和電腦硬件是類似的。所以我們應當盡量保證PXC集群內的節點配置都趨于一致，避免某個節點配置太差而拖慢了集群的整體性能。

PXC簡介

說了那么多，我們還沒介紹PXC是個啥玩意呢。PXC是Percona XtraDB Cluster的縮寫，PXC是基于mysql自帶的Galera集群技術，將不同的mysql實例連接起來，實現的多主集群。在PXC集群中每個mysql節點都是可讀可寫的，也就是主從概念中的主節點，不存在只讀的節點。
淺談數據庫集群方案

PXC可以集群任何mysql的衍生版本，例如MariaDB和Percona Server。由于Percona Server的性能最接近于mysql企業版，性能相對于標準版的mysql有顯著的提升，并且對mysql基本兼容。所以在搭建PXC集群時，通常建議基于Percona Server進行搭建。

Replication集群方案

PXC集群的數據強一致性是以犧牲性能為代價的，因為客戶端需要等待所有的節點寫入數據。而與之相反的一種集群方案就是本小節要介紹的Replication集群。該方案不犧牲性能，但不具有數據強一致性，正可謂魚和熊掌不可兼得。
淺談數據庫集群方案

所謂讀寫非強一致的意思就是在A節點成功寫入數據，并提交了事務。但在B節點上進行讀取時，可能會讀取不到寫入的數據。

因為這里提交的事務只是該節點的本地事務，只能保證數據成功寫入了該節點，而不保證數據成功寫入整個集群內的節點。當該節點與其他節點進行數據同步時，可能會由于種種原因沒有成功同步數據，從而導致在其他節點上讀不到該數據。

所以該集群方案就不適合保存高價值的數據，但對于非高價值的數據，又對讀寫性能要求高的，就適合采用該集群方案。例如，用戶行為日志、操作日志及商品描述等這類非重要的數據。

同樣的，上圖只是Replication集群最基礎的架構，也需要在數據量達到一定規模時采用Mycat對數據進行分片處理。如圖：
淺談數據庫集群方案

實際上，在大型的系統架構中，往往不是單獨采用某一種特定的集群方案，而是多種方案進行結合。例如，PXC集群和Replication集群就可以結合使用，讓PXC集群存儲高價值數據，Replication集群存儲低價值數據。然后采用Mycat等數據庫中間件來完成集群之間的數據分片及管理，如圖：
淺談數據庫集群方案

總結

PXC集群采用同步復制，事務在所有的集群節點要么同時提交，要么不提交，能夠保證集群中的數據強一致性。但性能相對較低，客戶端需等待所有節點同步復制完成
Replication集群采用異步復制，無法保證數據的強一致性。性能相對較高，客戶端只需要等待目標節點的本地事務提交成功即可，而不需要等待所有節點成功復制完數據
PXC和Replication集群都只實現了數據的同步，沒有數據切分功能。當數據量大時，需要引入Mycat等數據庫中間件來做數據的切分及管理
PXC和Replication集群方案并不排他，且各有優劣，可以結合一起使用，以達到取長補短的效果。高價值數據存儲至PXC集群，低價值數據存儲至Replication集群

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

淺談數據庫集群方案

單點數據庫

性能測試

PXC集群方案

PXC集群工作原理

PXC簡介

Replication集群方案

總結

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

淺談數據庫集群方案

單點數據庫

性能測試

PXC集群方案

PXC集群工作原理

PXC簡介

Replication集群方案

總結

猜你喜歡

最新資訊

相關推薦

相關標簽