深入淺出講解MySQL的并行復(fù)制

2024-07-25 19:08:44

字體：大中小

來源：轉(zhuǎn)載

供稿：網(wǎng)友

一、并行復(fù)制的背景

首先，為什么會(huì)有并行復(fù)制這個(gè)概念呢？

1. DBA都應(yīng)該知道，MySQL的復(fù)制是基于binlog的。

2. MySQL復(fù)制包括兩部分，IO線程和 SQL線程。

3. IO線程主要是用于拉取接收Master傳遞過來的binlog，并將其寫入到relay log

4. SQL線程主要負(fù)責(zé)解析relay log，并應(yīng)用到slave中

5. 不管怎么說，IO和SQL線程都是單線程的，然后master卻是多線程的，所以難免會(huì)有延遲，為了解決這個(gè)問題，多線程應(yīng)運(yùn)而生了。

6. IO多線程？

6.1 IO沒必要多線程，因?yàn)镮O線程并不是瓶頸啊

7. SQL多線程？

7.1 沒錯(cuò)，目前最新的5.6，5.7，8.0 都是在SQL線程上實(shí)現(xiàn)了多線程，來提升slave的并發(fā)度

接下來，我們就來一窺MySQL在并行復(fù)制上的努力和成果吧

二、重點(diǎn)

是否能夠并行，關(guān)鍵在于多事務(wù)之間是否有鎖沖突，這是關(guān)鍵。下面的并行復(fù)制原理就是在看如何讓避免鎖沖突

三、MySQL5.6 基于schema的并行復(fù)制

slave-parallel-type=DATABASE(不同庫的事務(wù)，沒有鎖沖突)

之前說過，并行復(fù)制的目的就是要讓slave盡可能的多線程跑起來，當(dāng)然基于庫級別的多線程也是一種方式(不同庫的事務(wù)，沒有鎖沖突)

先說說優(yōu)點(diǎn)：實(shí)現(xiàn)相對來說簡單，對用戶來說使用起來也簡單
再說說缺點(diǎn)：由于是基于庫的，那么并行的粒度非常粗，現(xiàn)在很多公司的架構(gòu)是一庫一實(shí)例，針對這樣的架構(gòu)，5.6的并行復(fù)制無能為力。當(dāng)然還有就是主從事務(wù)的先后順序，對于5.6也是個(gè)大問題

話不多說，來張圖好了

MySQL,并行復(fù)制

四、MySQL5.7 基于group commit的并行復(fù)制

slave-parallel-type=LOGICAL_CLOCK : Commit-Parent-Based模式(同一組的事務(wù)[last-commit相同]，沒有鎖沖突. 同一組，肯定沒有沖突，否則沒辦法成為同一組)
slave-parallel-type=LOGICAL_CLOCK : Lock-Based模式(即便不是同一組的事務(wù)，只要事務(wù)之間沒有鎖沖突[prepare階段]，就可以并發(fā)。不在同一組，只要N個(gè)事務(wù)prepare階段可以重疊，說明沒有鎖沖突)

group commit，之前的文章有詳細(xì)描述，這里不多解釋。MySQL5.7在組提交的時(shí)候，還為每一組的事務(wù)打上了標(biāo)記，現(xiàn)在想想就是為了方便進(jìn)行MTS吧。

我們先看一組binlog

last_committed=0 sequence_number=1last_committed=1 sequence_number=2last_committed=2 sequence_number=3last_committed=3 sequence_number=4last_committed=4 sequence_number=5last_committed=4 sequence_number=6last_committed=4 sequence_number=7last_committed=6 sequence_number=8last_committed=6 sequence_number=9last_committed=9 sequence_number=10

4.1 Commit-Parent-Based模式

MySQL,并行復(fù)制

4.2 Lock-Based模式

MySQL,并行復(fù)制

五、MySQL8.0 基于write-set的并行復(fù)制

基于主鍵的沖突檢測(binlog_transaction_depandency_tracking = COMMIT_ORDERE|WRITESET|WRITESET_SESSION, 修改的row的主鍵或非空唯一鍵沒有沖突，即可并行)
5.7.22 也支持了 write-set 機(jī)制

事務(wù)依賴關(guān)系：binlog_transaction_depandency_tracking = COMMIT_ORDERE|WRITESET|WRITESET_SESSION

COMMIT_ORDERE: 繼續(xù)基于組提交方式
WRITESET: 基于寫集合決定事務(wù)依賴
WRITESET_SESSION: 基于寫集合，但是同一個(gè)session中的事務(wù)不會(huì)有相同的last_committed

事務(wù)檢測算法：transaction_write_set_extraction = OFF| XXHASH64 | MURMUR32

MySQL會(huì)有一個(gè)變量來存儲(chǔ)已經(jīng)提交的事務(wù)HASH值，所有已經(jīng)提交的事務(wù)所修改的主鍵（或唯一鍵）的值經(jīng)過hash后都會(huì)與那個(gè)變量的集合進(jìn)行對比，來判斷改行是否與其沖突，并以此來確定依賴關(guān)系

這里說的變量，可以通過這個(gè)設(shè)置大小： binlog_transaction_dependency_history_size

這樣的粒度，就到了 row級別了，此時(shí)并行的粒度更加精細(xì)，并行的速度會(huì)更快，某些情況下，說slave的并行度超越master也不為過(master是單線程的寫，slave也可以并行回放)

六、如何讓slave的并行復(fù)制和master的事務(wù)執(zhí)行的順序一致呢

5.7.19 之后，可以通過設(shè)置 slave_preserve_commit_order = 1

官方解釋：

For multithreaded slaves, enabling this variable ensures that transactions are externalized on the slave in the same order as they appear in the slave's relay log.
Setting this variable has no effect on slaves for which multithreading is not enabled.
All replication threads (for all replication channels if you are using multiple replication channels) must be stopped before changing this variable.
--log-bin and --log-slave-updates must be enabled on the slave.
In addition --slave-parallel-type must be set to LOGICAL_CLOCK.
Once a multithreaded slave has been started, transactions can begin to execute in parallel.
With slave_preserve_commit_order enabled, the executing thread waits until all previous transactions are committed before committing.
While the slave thread is waiting for other workers to commit their transactions it reports its status as Waiting for preceding transaction to commit.

大致實(shí)現(xiàn)原理就是：excecution階段可以并行執(zhí)行，binlog flush的時(shí)候，按順序進(jìn)行。引擎層提交的時(shí)候，根據(jù)binlog_order_commit也是排隊(duì)順序完成

換句話說，如果設(shè)置了這個(gè)參數(shù)，master是怎么并行的，slave就怎么辦并行

總結(jié)

以上就是這篇文章的全部內(nèi)容了，希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，如果有疑問大家可以留言交流，謝謝大家對VeVb武林網(wǎng)的支持。

注：相關(guān)教程知識閱讀請移步到MYSQL教程頻道。

上一篇：MacBook下python3.7安裝教程

下一篇：Mysql下自動(dòng)刪除指定時(shí)間以前的記錄的操作方法