中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

淺談數據庫集群方案

發布時間:2020-02-28 18:37:33 來源:網絡 閱讀:376 作者:ZeroOne01 欄目:MySQL數據庫

單點數據庫

數據庫往往是系統中的性能瓶頸,所以通常在系統設計中會引入各種各樣的緩存機制,以避免頻繁訪問數據庫。另外,數據庫由于其重要性,高可用要求也是避免不了的,因為一旦數據庫掛了基本上整個系統也就不能使用了。

而以上這些常見問題都是單點數據庫帶來的限制,為了解決這些問題,達到高性能、高可用的目的,我們就需要在系統架構設計中采用數據庫集群方案。

性能測試

既然單點數據庫存在性能問題,那么有沒有實際數據呢?下面我們就來對單點數據庫進行一個性能測試,看看其并發極限大概是多少。我這里使用了一臺2核2G的云服務,mysql版本為8.0.18。

mysql自帶了一個性能測試工具:mysqlslap,我們可以使用該工具進行測試,具體的測試參數如下:

[root@localhost ~]# mysqlslap -hlocalhost -uroot -pyour_password -P3306 --concurrency=500 --iterations=1 --auto-generate-sql --auto-generate-sql-load-type=mixed --auto-generate-sql-add-autoincrement --engine=innodb --number-of-queries=500

主要參數說明:

參數 說明
--concurrency 并發數量,即模擬的客戶端數量
--iterations 執行多少次該測試
--auto-generate-sql 使用系統自己生成的SQL腳本來測
--auto-generate-sql-load-type 要測試的是讀還是寫還是兩者混合的(取值:read, write, update, mixed)
--auto-generate-sql-add-autoincrement 將自增的列添加到自動生成的表中
--engine 要測試的存儲引擎
--number-of-queries 每個客戶端的訪問次數,該數值除以并發數量就是每個客戶端的訪問次數,在本例中:500 / 500 = 1
  • 更多內容詳見官方文檔

這里我分別進行了不同量級的測試,在并發500、1000和5000個連接時,數據庫還可以正常處理,沒有太大問題:

# 500個并發連接
Benchmark
    Running for engine innodb
    Average number of seconds to run all queries: 0.391 seconds
    Minimum number of seconds to run all queries: 0.391 seconds
    Maximum number of seconds to run all queries: 0.391 seconds
    Number of clients running queries: 500
    Average number of queries per client: 1

# 1000個并發連接
Benchmark
    Running for engine innodb
    Average number of seconds to run all queries: 0.802 seconds
    Minimum number of seconds to run all queries: 0.802 seconds
    Maximum number of seconds to run all queries: 0.802 seconds
    Number of clients running queries: 1000
    Average number of queries per client: 1

# 5000個并發連接
Benchmark
    Running for engine innodb
    Average number of seconds to run all queries: 3.884 seconds
    Minimum number of seconds to run all queries: 3.884 seconds
    Maximum number of seconds to run all queries: 3.884 seconds
    Number of clients running queries: 5000
    Average number of queries per client: 1

但在測試1w個并發連接時,數據庫就開始報無法連接的錯誤了:
淺談數據庫集群方案

由該測試案例可知,普通的單節點數據庫性能瓶頸大概在1w個并發連接左右。當然這里的測試結果與機器的硬件差異有關,只是提供一個參考。


PXC集群方案

上一小節介紹了單點數據庫存在的問題,以及進行了一個簡單的性能測試。為了應對這些問題,我們需要將單點數據庫向集群轉變。

目前存在許多的數據庫集群方案,而這些方案中也沒有哪個好那個壞,只有適合的才是好的。本小節則介紹一下主流的方案之一:PXC集群方案,其架構圖大致如下:
淺談數據庫集群方案

  • PXC集群最大的特點就是數據讀寫的強一致性,在圖中的任意一個節點寫入數據,其他的節點就一定能讀到這個數據。不會出現A節點成功寫入,而讀B節點時讀取不到數據。該特性使得PXC集群適合存儲高價值重要數據,因為類似于訂單、錢有關的數據基本都有強一致性的要求

上圖只是PXC集群最基礎的架構,所以還有優化的余地。我們都知道mysql的單表數據處理的性能極限在2千萬左右,當數據達到這個量級時,mysql的處理性能就會很低下了。而上圖中每個PXC節點都會進行數據的同步,所以當每個節點的數據量級都達到2千萬時,整個集群的性能就會降低。

這時就需要增加多一個集群,并且這兩個集群之間的數據是不進行同步的。為了讓不同的集群存儲不同的數據,就得引入Mycat這種數據庫中間件將數據進行切分,讓數據可以在不同的集群上進行讀寫,分散存儲壓力。在這個場景下,一個集群稱為一個數據分片。如圖:
淺談數據庫集群方案

PXC集群工作原理

我們知道數據庫數據的一致性和持久性是通過事務來保證的,而PXC集群的強一致性也是采用了事務,只不過這個事務是分布式事務。

客戶端在寫入數據完成后,同樣需要提交一個事務,在事務內節點之間會進行數據的同步復制。該事務會作用到集群內的所有節點上,保證所有節點要么全寫入成功,要么全寫入失敗。這里用一個時序圖表達一下大致流程:
淺談數據庫集群方案

搭建PXC集群需要注意的事項:

  • PXC集群中的節點并不是越多越好,節點多并不能提高性能。相反,節點多意味著同步數據所需的耗時就越多,反而會降低性能。通常來講,一個PXC集群最好是不超過15個節點。若需要更多的節點時,應當搭建一個新的集群,然后用中間件來做分片。
  • PXC集群的性能不取決于配置最好的那個節點,而是取決于配置最差的那個節點,這和電腦硬件是類似的。所以我們應當盡量保證PXC集群內的節點配置都趨于一致,避免某個節點配置太差而拖慢了集群的整體性能。
PXC簡介

說了那么多,我們還沒介紹PXC是個啥玩意呢。PXC是Percona XtraDB Cluster的縮寫,PXC是基于mysql自帶的Galera集群技術,將不同的mysql實例連接起來,實現的多主集群。在PXC集群中每個mysql節點都是可讀可寫的,也就是主從概念中的主節點,不存在只讀的節點。
淺談數據庫集群方案

PXC可以集群任何mysql的衍生版本,例如MariaDB和Percona Server。由于Percona Server的性能最接近于mysql企業版,性能相對于標準版的mysql有顯著的提升,并且對mysql基本兼容。所以在搭建PXC集群時,通常建議基于Percona Server進行搭建。


Replication集群方案

PXC集群的數據強一致性是以犧牲性能為代價的,因為客戶端需要等待所有的節點寫入數據。而與之相反的一種集群方案就是本小節要介紹的Replication集群。該方案不犧牲性能,但不具有數據強一致性,正可謂魚和熊掌不可兼得。
淺談數據庫集群方案

所謂讀寫非強一致的意思就是在A節點成功寫入數據,并提交了事務。但在B節點上進行讀取時,可能會讀取不到寫入的數據。

因為這里提交的事務只是該節點的本地事務,只能保證數據成功寫入了該節點,而不保證數據成功寫入整個集群內的節點。當該節點與其他節點進行數據同步時,可能會由于種種原因沒有成功同步數據,從而導致在其他節點上讀不到該數據。

所以該集群方案就不適合保存高價值的數據,但對于非高價值的數據,又對讀寫性能要求高的,就適合采用該集群方案。例如,用戶行為日志、操作日志及商品描述等這類非重要的數據。

同樣的,上圖只是Replication集群最基礎的架構,也需要在數據量達到一定規模時采用Mycat對數據進行分片處理。如圖:
淺談數據庫集群方案

實際上,在大型的系統架構中,往往不是單獨采用某一種特定的集群方案,而是多種方案進行結合。例如,PXC集群和Replication集群就可以結合使用,讓PXC集群存儲高價值數據,Replication集群存儲低價值數據。然后采用Mycat等數據庫中間件來完成集群之間的數據分片及管理,如圖:
淺談數據庫集群方案


總結

  • PXC集群采用同步復制,事務在所有的集群節點要么同時提交,要么不提交,能夠保證集群中的數據強一致性。但性能相對較低,客戶端需等待所有節點同步復制完成
  • Replication集群采用異步復制,無法保證數據的強一致性。性能相對較高,客戶端只需要等待目標節點的本地事務提交成功即可,而不需要等待所有節點成功復制完數據
  • PXC和Replication集群都只實現了數據的同步,沒有數據切分功能。當數據量大時,需要引入Mycat等數據庫中間件來做數據的切分及管理
  • PXC和Replication集群方案并不排他,且各有優劣,可以結合一起使用,以達到取長補短的效果。高價值數據存儲至PXC集群,低價值數據存儲至Replication集群
向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

房山区| 马山县| 和顺县| 二手房| 页游| 东丰县| 景泰县| 广宗县| 鄂伦春自治旗| 双牌县| 政和县| 西青区| 稻城县| 胶南市| 兰坪| 遂川县| 独山县| 射阳县| 敦煌市| 肥城市| 阿克陶县| 庆安县| 仙桃市| 同德县| 广河县| 汽车| 陵川县| 莫力| 东乌| 建水县| 武威市| 攀枝花市| 贵港市| 江北区| 犍为县| 沂水县| 武宣县| 昔阳县| 开江县| 霍邱县| 两当县|