中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

mysql的binlog怎么用

發布時間:2022-01-06 14:53:36 來源:億速云 閱讀:169 作者:iii 欄目:大數據

這篇文章主要介紹“mysql的binlog怎么用”,在日常操作中,相信很多人在mysql的binlog怎么用問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”mysql的binlog怎么用”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!

Mysql主從

既然我們可以模仿Mysql的主從復制來完成我們的需求,那么我們需要先了解一下mysql主從的原理,如下圖所示:mysql的binlog怎么用

?Stpe 1: 作為master的mysql需要在每個事務更新數據完成之前,將該操作記錄串行地寫入到binlog文件中,存儲在本地磁盤中。

?Step 2: 在我們的salve服務器中開啟一個I/O Thread,它會不斷的從binlog中讀取如果讀取。如果進度已經跟上了master,就進入睡眠狀態并等待master產生新的事件。所有讀取的數據都會寫到Relay log(中繼日志)中。?Step 3:SQL Thread會讀取中繼日志,并順序執行該日志中的SQL事件,從而與主數據庫中的數據保持一致。

在主從復制中過程中,其中最為重要的就是binlog,從庫會根據binlog的信息從而來復制出一份主庫的數據。

如果我們能在業務代碼中拿到binlog,通過binlog的數據,復制到redis或者es中,那我們就完全不用擔心數據的一致性的問題了。

binlog

binlog(Binary Log)顧名思義就是Mysql中二進制的日志,記錄了Mysql對數據庫執行更改的所有操作。binlog也是server層產生的日志和我們的存儲引擎沒有關系,不論你使用哪種存儲引擎,都可以使用我們的binlog。

binlog格式

在binlog中有三種格式,分別是:StatementRowMixed三種,可以通過show variables like 'binlog_format'進行查看當前數據庫的binlog格式,如下圖所示就是一個Row格式的binlog:mysql的binlog怎么用

Statement

Statement也就是語句類型,他會記錄每一條修改數據的Sql到binlog中。

?優點:空間占比是最小的,不會記錄沒有修改的字段。相比其他模式減少了很多的日志亮,提高I/O性能。?缺點:異構系統不方便使用,比如redis緩存復制的時候,很難模擬mysql的從操作,需要數據重查一次。并且slave也會有問題,比如使用一些UUID函數,slave重放的時候并不能保證兩邊是一致的。我們可以查看下Statement的日志內容到底是什么?我們這里可以輸入命令:show master status;查看我們當前master正在使用的binlog,如下圖:

mysql的binlog怎么用

然后再使用命令show binlog events in 'mysql-bin.000003', 查看這個日志中的內容是什么:mysql的binlog怎么用我們可以發現我們所有的操作都會在一個完整的事務中進行,如果事務沒有提交是不會出現在我們的binlog當中的,這個大家可以下來進行實驗一下,我們在數據庫中的更新原始sql都會被完全的記錄下來。

Row

Row模式和Statement不同,他會記錄每一行被修改后的所有的數據:

?優點:異構系統也能比較方便的同步數據,并且不會出現UUID函數的那種問題,無論什么情況都能被復制。?缺點:數據量比較多,比如update語句,他還會記錄更新前的每一個字段和更新后的每一個字段。造成日志量比較大,對I/O有一定的影響。

同樣的我們也查看一下其中的內容:mysql的binlog怎么用

show binlog events in 'mysql-bin.000004'命令中,我們發現在事務中是查看不了我們具體的數據的,這個時候就需要我們工具幫忙了mysqlbinlog,他也在mysql的bin目錄下我們直接調用就好了,輸入命令/usr/local/mysql/bin/mysqlbinlog --base64-output=decode-rows -v mysql-bin.000004,我們可以看見:mysql的binlog怎么用

這里展示的是一個update語句,他不僅顯示了原始值,也展示了修改后的值。

這里要注意的是binlog_row_image用于決定row是否會記錄原始值,默認是FULL代表會記錄,也就是我們上面的這種情況,還有個參數是minimal,代表只記錄更新后的值。

Mixed

在mixed模式下,MySQL默認仍然采用statement格式進行記錄,但是一旦它判斷可能會有數據不一致的情況(UUID函數)發生,則會采用row格式來記錄。

我們目前默認使用的是Row模式,在Row模式下可以比較方便的將數據異構,其實Row模式對I/O影響在業務當中來說感知并不是特別明顯。

Canal

當我們知道binlog是什么之后,我們就需要怎么去使用這個binlog。binlog的同步工具常見的有:databus,canal,maxwell,阿里云dts等等,在這里我們就不比較他們各自的優劣點了,重點去介紹canal。

canal(github地址:https://github.com/alibaba/canal),譯意為水道/管道/溝渠,主要用途是基于 MySQL 數據庫增量日志解析,提供增量數據訂閱和消費

早期阿里巴巴因為杭州和美國雙機房部署,存在跨機房同步的業務需求,實現方式主要是基于業務 trigger 獲取增量變更。從 2010 年開始,業務逐步嘗試數據庫日志解析獲取增量變更進行同步,由此衍生出了大量的數據庫增量訂閱和消費業務。后面在阿里云中逐漸演化稱DTS項目。

mysql的binlog怎么用

canal大體原理也是模仿mysql的slave,從master上不斷的去拉取binlog,然后將binlog可以投放到不同的地方,比如我們常見的消息隊列:kafka,rocketmq等等。當然在阿里云的付費dts上面也是可以直接同步到redis,es或者其他的一些存儲介質當中。

canal的簡單使用可以查看quickStart:https://github.com/alibaba/canal/wiki/QuickStart ,這里不做過多的介紹。接下來主要是更多的介紹canal的整體架構,以及實現的原理等等。

Canal整體架構

mysql的binlog怎么用

CanalServer:一個Jvm就可以理解成一個CanalServer,如果是集群模式的Canal的話 那么就會有多個CanalServer。

CanalInstance: 可以理解為一個作業為一個Instance,比如有一個把A庫的binlog同步到A消息隊列,B庫的binlog同步到B的消息隊列,那么這就是兩個不同的Instance,至于哪個Instance在哪個CanalServer上跑,需要看誰先在ZK搶占到臨時節點,如果分配得足夠均勻得話,可以在集群模式下緩解很多壓力。

CanalParser: 用于拉取mysql-binlog,并進行解析。

EventSink: 將解析的數據進行處理加工(過濾,合并等)。

CanalEventStore: 這個有點類似slave中的relay log,用于將日志進行中繼存儲,但是在canal中目前只支持了在內存中存儲,目前不支持落盤存儲。

CanalParser,EventSink,CanalEventStore這三個都是屬于Canal中非常重要的組件,他們之間的關系如下:mysql的binlog怎么用

CanalParser產生數據讓EventSink進行加工,加工后的數據會存儲在CanalEventStore中,然后MQ從CanalEventStore中不斷的拉取最新數據,然后投遞到MQ。

CanalParser

我們來講講在CanalParser中Canal是如何偽裝成slave去拉數據的,在AbstractEventParser.java這個類中有如下步驟:

?Step1: 構建一個數據庫鏈接,并且生成一個slaveId,用于標示自己slave的身份。?Step2: 獲取數據庫的元信息,比如binlogFormat,binRowImage等等。?Step3: 通過show variables like 'server_id' 命令,獲取我們需要監聽binlog服務的serverId。

mysql的binlog怎么用

?Step4: 獲取這一次需要消費的位置,如果有存儲上一次的就從上一次中獲取,如果沒有的話需要通過show master status命令中獲取到的最新的Position進行消費。

mysql的binlog怎么用

?Step5: 進行dump操作,模擬slave發送注冊slave請求,以及dump binlog請求,然后用一個死循環不斷的從binlog中拉取數據:

mysql的binlog怎么用

?Step6: 將獲取到的二進制數據,根據mysql binlog協議轉換成logEntry,方便后續處理。

EventSink

EventSink會將上面獲取到的logEntry來進行加工:

?過濾:

?過濾空的事務?過濾心跳?自定義過濾

?記錄,這里使用了Prometheus,來進行數據的統計上報。?合并,現在有很多分庫分表的業務需要,他們的數據來源都是從不同的Parser中來的,但是最后都需要匯總到同一個EventStore中。在這個場景需要注意的我們可以需要注意的是會做時間歸并控制,也就是盡量讓每個分庫的數據匯總后都是遞增的方式提交,避免出現某個分庫的數據比其他的領先或者落后很多。

EventStore

我們先看看EventStore中提供的接口:mysql的binlog怎么用可以看見EventStore其實就是一個簡單的存儲,在canal中提供了MemoryEventStoreWithBuffer,在內存中進行中轉的數據,其中的原理是通過RingBuffer(無鎖,高性能隊列)實現的,有關于RingBuffer的信息可以參考我之前的文章你應該知道的Disruptor,在3.1中有對RingBuffer進行詳細講解。

然后CanalMq通過EventStore不斷的獲取數據,來進行數據發送。

mysql的binlog怎么用

到此,關于“mysql的binlog怎么用”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

龙江县| 荆门市| 那坡县| 皋兰县| 乐业县| 三河市| 陵水| 虞城县| 盖州市| 会理县| 龙游县| 百色市| 濉溪县| 康马县| 塘沽区| 马鞍山市| 保山市| 玛沁县| 甘洛县| 德江县| 会泽县| 禹城市| 长泰县| 大田县| 兴海县| 彝良县| 玉门市| 万盛区| 兴义市| 双城市| 中阳县| 琼结县| 松滋市| 赤城县| 灵山县| 马鞍山市| 株洲县| 和田市| 南木林县| 麟游县| 八宿县|