您好,登錄后才能下訂單哦!
簡書地址:
http://www.jianshu.com/p/fc836446cde0
本節也是一個重頭戲,后面的故障案例也和本節有關。本節將詳細介紹Gtid模塊的初始化,以及什么時候讀取了我們前文提及的兩個Gtid持久化介質:
此外也會描述他們的讀取方式。
同時分析這個步驟我也將在重點步驟分為兩種情況來分別討論:
因為這兩種使我們通常設置的方式,下面簡稱主庫和從庫。
首先初始化Gtid 幾個Global 內存空間包括 Gtid_state\Sid_map\gtid_table_persistor
這個調用由mysqld.cc調入gtid_server_init()。
if (init_server_components()) unireg_abort(MYSQLD_ABORT_EXIT);
其中init_server_components()會初始化很多模塊Gtid只是其中很小的一個,Innodb就在這里初始化。
gtid_server_init()函數片段如下:
(!(global_sid_lock= new Checkable_rwlock( #ifdef HAVE_PSI_INTERFACE key_rwlock_global_sid_lock #endif )) || !(gtid_mode_lock= new Checkable_rwlock( #ifdef HAVE_PSI_INTERFACE key_rwlock_gtid_mode_lock #endif )) || !(global_sid_map= new Sid_map(global_sid_lock)) || //new一個內存Sid_map內存空間出來 !(gtid_state= new Gtid_state(global_sid_lock, global_sid_map))||//new一個內存Gtid_state內存空間出來 !(gtid_table_persistor= new Gtid_table_persistor()));//new一個內存Gtid_table_persistor內存空間出來
這個初始化過程在前文提到了,無非就是通過my.cnf獲得server_uuid,如果沒有則重新生成,具體可以參考一下前文這里不再過多描述。
if (init_server_auto_options()) { sql_print_error("Initialization of the server's UUID failed because it could" " not be read from the auto.cnf file. If this is a new" " server, the initialization failed because it was not" " possible to generate a new UUID."); unireg_abort(MYSQLD_ABORT_EXIT); }
global_sid_lock->rdlock(); int gtid_ret= gtid_state->init();//將server_uuid對應的sid(Uuid)和sidno加入到 Sid_map中。 global_sid_lock->unlock(); if (gtid_ret) unireg_abort(MYSQLD_ABORT_EXIT);
其實本步驟也是完成了sidno的加入Sid_map中,有興趣的可以參考int Gtid_state::init()函數邏輯非常簡單。
這一步開始讀取我們的第一個Gtid持久化介質mysql.gtid_executed表,其最終調用為Gtid_table_persistor::fetch_gtids(Gtid_set *gtid_set)其原理為一行一行的讀取mysql.gtid_executed表的內容加入到Gtid_state.executed_gtids中,我們來看源碼:
// Initialize executed_gtids from mysql.gtid_executed table. if (gtid_state->read_gtid_executed_from_table() == -1) unireg_abort(1);
Gtid_state::read_gtid_executed_from_table只是一層簡單的封裝如下:
int Gtid_state::read_gtid_executed_from_table() { return gtid_table_persistor->fetch_gtids(&executed_gtids); }
接下來看看Gtid_table_persistor::fetch_gtids(Gtid_set *gtid_set)函數邏輯片段
if ((err= table->file->ha_rnd_init(true))) { ret= -1; goto end; } while(!(err= table->file->ha_rnd_next(table->record[0]))) //開始一行一行讀取數據 { /* Store the gtid into the gtid_set */ /** @todo: - take only global_sid_lock->rdlock(), and take gtid_state->sid_lock for each iteration. - Add wrapper around Gtid_set::add_gno_interval and call that instead. */ global_sid_lock->wrlock(); if (gtid_set->add_gtid_text(encode_gtid_text(table).c_str()) != //此處將讀取到的一行Gtid區間加入到Gtid_state.executed_gtids中。 RETURN_STATUS_OK) { global_sid_lock->unlock(); break; } global_sid_lock->unlock(); }
完成本步驟過后Gtid_state.executed_gtids將設置,主庫和從庫的設置不同
本步驟是一個非關鍵步驟但是定義了一些中間變量而且定義了4個指針來分別獲得Gtid_state四個內存變量的地址,方便操作。
if (opt_bin_log) //如果binlog開啟 { /* Initialize GLOBAL.GTID_EXECUTED and GLOBAL.GTID_PURGED from gtid_executed table and binlog files during server startup. */ Gtid_set *executed_gtids= const_cast<Gtid_set *>(gtid_state->get_executed_gtids());//獲得Gtid_state.executed_gtids的指針 Gtid_set *lost_gtids= const_cast<Gtid_set *>(gtid_state->get_lost_gtids());//獲得gtid_state.get_lost_gtids的指針 Gtid_set *gtids_only_in_table= const_cast<Gtid_set *>(gtid_state->get_gtids_only_in_table());//獲得gtid_state.get_lost_gtids的指針 Gtid_set *previous_gtids_logged= const_cast<Gtid_set *>(gtid_state->get_previous_gtids_logged());//獲得gtid_state.previous_gtids_logged的指針 Gtid_set purged_gtids_from_binlog(global_sid_map, global_sid_lock);//定義臨時變量用于存儲從binlog中掃描到已經丟棄的Gtid事物。 Gtid_set gtids_in_binlog(global_sid_map, global_sid_lock);//定義中間變量binlog中包含的所有Gtid事物包括丟棄的。 Gtid_set gtids_in_binlog_not_in_table(global_sid_map, global_sid_lock);//定義中間變量沒有存放在表中而在binlog中存在過的Gtid事物, //顯然主庫包含這樣一個集合,因為主庫的gtids_in_binlog>gtids_only_in_table,而從庫同樣也不包含這樣一個集合因為從庫的全部Gtid事物都在表中。
本步驟將會讀取我們提及的第二個Gtid持久化介質binlog,其讀取方式為先反向讀取獲得 gtids_in_binlog然后正向讀取獲得 purged_gtids_from_binlog,并且這里正向讀取purged_gtids_from_binlog將會受到binlog_gtid_simple_recovery參數的影響。同時我們前文所描述5.7 中Previous gtid Event會在沒有開啟Gtid的binlog也包含這個event,將在這部體現出它的價值。
if (mysql_bin_log.init_gtid_sets(>ids_in_binlog, &purged_gtids_from_binlog, opt_master_verify_checksum, true/*true=need lock*/, NULL/*trx_parser*/, NULL/*gtid_partial_trx*/, true/*is_server_starting*/))
我們發現他實際上就是調用bool MYSQL_BIN_LOG::init_gtid_sets()函數我們繼續看這個函數重要代碼片段:
list<string> filename_list; //定義一個string list來存儲文件名 LOG_INFO linfo; int error; list<string>::iterator it;//定義一個list的正向迭代器 list<string>::reverse_iterator rit;//定義一個list的反向迭代器 for (error= find_log_pos(&linfo, NULL, false/*need_lock_index=false*/); !error; //這部分實際上就是將文件名全部加入到這個list中 error= find_next_log(&linfo, false/*need_lock_index=false*/)) { DBUG_PRINT("info", ("read log filename '%s'", linfo.log_file_name)); filename_list.push_back(string(linfo.log_file_name)); } if (error != LOG_INFO_EOF) { DBUG_PRINT("error", ("Error reading %s index", is_relay_log ? "relaylog" : "binlog")); goto end; } if (all_gtids != NULL) //數據庫啟動初始化的情況下all_gtids不會為NULL,但是如果是做purge binary logs命令等刪除binlog log all_gtid會傳入NULL { rit= filename_list.rbegin(); //反向迭代器指向list尾部 bool can_stop_reading= false; reached_first_file= (rit == filename_list.rend());//如果只有一個binlog則為true while (!can_stop_reading && !reached_first_file) //開始反向循環掃描來獲得gtids_in_binlog(all_gtids)集合 { const char *filename= rit->c_str(); //獲取文件名 rit++; reached_first_file= (rit == filename_list.rend());//如果達到第一個文件則為true表示掃描完成 switch (read_gtids_from_binlog(filename, all_gtids, reached_first_file ? lost_gtids : NULL, NULL/* first_gtid */, sid_map, verify_checksum, is_relay_log)) //通過函數read_gtids_from_binlog讀取這個binlog文件 { case ERROR: { error= 1; goto end; } case GOT_GTIDS: //如果掃描本binlog有PREVIOUS GTID EVENT和GTID EVENT 則break 跳出循環且設置can_stop_reading= true { can_stop_reading= true; break; } case GOT_PREVIOUS_GTIDS://如果掃描本binlog只有PREVIOUS GTID EVENT 則進入邏輯判斷 { if (!is_relay_log)//我們只考慮binlog 不會是relaylog 那么 break 跳出循環且設置can_stop_reading= true, //注意這里并不受到binlog_gtid_simple_recovery參數的影響,我們知道5.7.5過后每一個binlog都 //包含了PREVIOUS GTID EVENT實際上即使沒有開啟GTID這里也會跳出循環,則只是掃描了最后一個binlog 文件 can_stop_reading= true; break; } case NO_GTIDS: //如果沒有找到PREVIOUS GTID EVENT和GTID EVENT 則做如下邏輯,實際上5.7過后不可能出現這種問題,因為必然包含了PREVIOUS GTID EVENT //即便是沒有開啟GTID,所以反向查找一定會在掃描最后一個文件后跳出循環 { if (binlog_gtid_simple_recovery && is_server_starting && !is_relay_log) //這里受到了binlog_gtid_simple_recovery參數的影響,但是我們知道這個分支是不會執行的。除非這個數據庫是升級的并且沒有開啟Gtid { DBUG_ASSERT(all_gtids->is_empty());//斷言all_gtids還是沒有找到 DBUG_ASSERT(lost_gtids->is_empty());//斷言lost_gtids還是沒有找到 goto end;//結束掃描,從這里我們發現如果mysql是升級而來的一定要注意這個問題,設置binlog_gtid_simple_recovery可能拿不到正確的GTID,對于升級 //最好使用master-slave 進行升級,可以規避這個風險。 } /*FALLTHROUGH*/ } case TRUNCATED: { break; } } } //中間還有一部分處理relaylog的占時沒有去研究接下來就是正向查找獲得purged_gtids_from_binlog(lost_gtids) if (lost_gtids != NULL && !reached_first_file)//如果前面的掃描沒有掃描完全部的binlog,這實際在5.7中是肯定的。 { for (it= filename_list.begin(); it != filename_list.end(); it++)//進行正向查找 { /* We should pass a first_gtid to read_gtids_from_binlog when binlog_gtid_simple_recovery is disabled, or else it will return right after reading the PREVIOUS_GTIDS event to avoid stall on reading the whole binary log. */ Gtid first_gtid= {0, 0}; const char *filename= it->c_str();//獲得文件名指針 switch (read_gtids_from_binlog(filename, NULL, lost_gtids, binlog_gtid_simple_recovery ? NULL : &first_gtid, sid_map, verify_checksum, is_relay_log)) { case ERROR: { error= 1; /*FALLTHROUGH*/ } case GOT_GTIDS: //如果掃描本binlog有PREVIOUS GTID EVENT和GTID EVENT 則跳出循環直達end { goto end; } case NO_GTIDS: //這里如果binlog不包含GTID EVENT和PREVIOUS GTID EVENT其處理邏輯一致 case GOT_PREVIOUS_GTIDS: { if (binlog_gtid_simple_recovery) //這里受到了binlog_gtid_simple_recovery。如果設置為ON,實際上在5.7過后 goto end; //PREVIOUS GTID EVENT是一定命中的,可以得到正確的結果,但是如果是5.6升級而來 /*FALLTHROUGH*/ //則binlog不包含PREVIOUS GTID EVENT則purged_gtids_from_binlog(lost_gtids)獲取為空 //如果在5.7中關閉了GTID,這種情況這里雖然PREVIOUS GTID EVENT命中但是任然 //不會跳出循環goto end,繼續下一個文件掃描。 } case TRUNCATED: { break; } } }
到這里我們分析了反向查找和正向查找,我們代碼注釋上也說明了binlog_gtid_simple_recovery作用,因為有了PREVIOUS GTID EVENT的支持,5.7.6過后這個參數默認都是設置為true,如果在Gtid關閉的情況下設置binlog_gtid_simple_recovery為flase可能需要掃描大量的binlog才會確定purged_gtids_from_binlog這個集合,這可能出現在兩個地方:
這里也是我后文描述的第二個案例出現的原因。
正常情況下到這里我們的gtids_in_binlog和purged_gtids_from_binlog已經獲取:
如第四步描述主庫通過讀取mysql.gtid_executed表獲得的Gtid_state.executed_gtids并不是最新的,所以整理需要修正,代碼如下:
if (!gtids_in_binlog.is_empty() && //如果gtids_in_binlog不為空,從庫為空不走這個邏輯了,這里主要是主庫對Gtid_state.executed_gtids的修正 !gtids_in_binlog.is_subset(executed_gtids)) //并且executed_gtids是gtids_in_binlog的子集 { gtids_in_binlog_not_in_table.add_gtid_set(>ids_in_binlog); if (!executed_gtids->is_empty()) gtids_in_binlog_not_in_table.remove_gtid_set(executed_gtids); //將不在表中的GTID及gtids_in_binlog-executed_gtids 加入到gtids_in_binlog_not_in_table if (gtid_state->save(>ids_in_binlog_not_in_table) == -1)//這里將gtids_in_binlog_not_in_table這個Gtid集合存儲到mysql.gtid_executed表中完成修正 { global_sid_lock->unlock(); unireg_abort(MYSQLD_ABORT_EXIT); } executed_gtids->add_gtid_set(>ids_in_binlog_not_in_table);//最后在executed_gtids中加入這個gtids_in_binlog_not_in_table,這個完成executed_gtids就是最新的Gtid_set了,完成了Gtid_state.executed_gtids的修正 }
這一步完全是主庫才會觸發的邏輯:
到這里Gtid_state.executed_gtids也就是我們的gtid_executed變量初始化已經完成mysql.gtid_executed表已經修正。
由于上一步已經獲得了完整的的Gtid_state.executed_gtids 集合,這里獲得Gtid_state.gtids_only_in_table只需要簡單的gtids_only_in_table= executed_gtids - gtids_in_binlog相減即可。
/* gtids_only_in_table= executed_gtids - gtids_in_binlog */ if (gtids_only_in_table->add_gtid_set(executed_gtids) != //這里將executed_gtids加入到gtids_only_in_table RETURN_STATUS_OK) { global_sid_lock->unlock(); unireg_abort(MYSQLD_ABORT_EXIT); } gtids_only_in_table->remove_gtid_set(>ids_in_binlog); //這里將去掉gtids_in_binlog
這一步主庫和從庫如下:
這一步開始獲取Gtid_state.lost_gtids也就是我們的gtid_purged變量,這里只需要簡單的用Gtid_state.gtids_only_in_table + purged_gtids_from_binlog;即可,他們都已經獲取
/* lost_gtids = executed_gtids - (gtids_in_binlog - purged_gtids_from_binlog) = gtids_only_in_table + purged_gtids_from_binlog; */ if (lost_gtids->add_gtid_set(gtids_only_in_table) != RETURN_STATUS_OK || //將gtids_only_in_table這個集合加入lost_gtids lost_gtids->add_gtid_set(&purged_gtids_from_binlog) != //將purged_gtids_from_binlog加入到這個集合 RETURN_STATUS_OK) { global_sid_lock->unlock(); unireg_abort(MYSQLD_ABORT_EXIT); }
這一步主庫和從庫如下:
到這里gtid_purged變量和gtid_executed變量以及mysql.gtid_executed表都已經初始化完成。
這個值沒有變量能夠看到,它代表是直到上一個binlog所包含的全部的binlog Gtid。
/* Prepare previous_gtids_logged for next binlog */ if (previous_gtids_logged->add_gtid_set(>ids_in_binlog) !=//很明顯將掃描到的gtids_in_binlog的這個集合加入即可。 RETURN_STATUS_OK) { global_sid_lock->unlock(); unireg_abort(MYSQLD_ABORT_EXIT); }
很明顯因為啟動的時候binlog會切換所以簡單的將掃描到gtids_in_binlog加入到集合即可。
這一步主庫和從庫如下:
通過讀取mysql.gtid_executed和binlog,然后經過一系列的運算后,我們的Gtid模塊初始化完成。4個內存變量和mysql.gtid_executed都得到了初始化,總結如下:
注意本節第五步包含了binlog文件的讀取方法以及binlog_gtid_simple_recovery參數的作用
學習完本節至少能夠學習到:
作者微信:
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。