MVCC原理探究及びMySQLソースコード実現分析
55683 ワード
MVCC原理探究及びMySQLソースコード実現分析
データベースのマルチバージョン読み込みシーン
MVCC実現原理
DB_経由ROLL_PT遡及データ履歴バージョンの検索
read viewで行レコードが表示されるか否かを判断する
MVCCはどんな問題を解決しましたか.
MySQLコード解析
InnoDB非表示フィールドソース分析
InnoDB判定トランザクション可視性ソース分析
MVCC原理探究及びMySQLソースコード実現分析
データベースのマルチバージョン読み込みシーン
session 1
session 2
select a from test; return a = 10
start transaction;
update test set a = 20;
start transaction;
select a from test; return ?
commit;
select a from test; return ?
上記のデータベースの日常的な操作の例を見てみましょう. session 1は記録を修正し、提出しなかった.それと同時に、session 2はこのレコードをクエリーし、このときにレコードを返すのはいくらですか? セッション1がコミットされた後、セッション2がクエリーされたのはいくらですか?
MySQLは複数の独立性レベルをサポートしているため、この問題はsession 2のトランザクション独立性レベルを見る必要があります.状況は次のとおりです.独立性レベルがREAD-UNCOMMITTEDの場合:session 1 commit前後session 2を見てもわかるのは修正後の結果a=20 独立性レベルがREAD-COMMITTEDの場合:session 1 commitの前に表示されたものはa=10であり、commitの後に表示されたものはa=20 である独立性レベルがREPEATABLE-READ、SERIALIZABLEの場合:session 1 commit前後session 2を見てもわかるのは修正後の結果a=10 独立性レベルにかかわらず、データベース内のACIDを捨てて、InnoDBのデータはすべてB-treeに格納されていることがよく知られています.修正されたデータは実際のB-treeリーフノードに格納されるかどうか、session 2はどのようにして検索した結果を10にしますか.20列ではありません.
MVCC実現原理
これらの現象はデータベースでよく見られますが、データベースがどのように実現されているのか、深く研究している人は多くありません.実は原理はとても簡単で、データベースはUNDOとMVCCを通じて実現しました.
DB_経由ROLL_PT遡及データ履歴バージョンの検索まずInnoDB各行データにDB_が1つあるROLL_PTのロールバックポインタは、その行の修正前の前の履歴バージョンを指す新しいデータが挿入された場合、記録上の対応するロールバックセグメントポインタはNULL である.
レコードを更新すると、元のレコードはundoテーブルスペースに入れられ、DB_を通過します.ROLL_PTはこの記録を指す.session 2クエリが返す未修正データはこのundoから返される.MySQLは、レコード上のロールバック・セグメント・ポインタおよびトランザクションIDに基づいてレコードが表示されているかどうかを判断し、表示されていない場合はDB_ROLL_PTは遡及検索を継続する.
read viewで行レコードが表示されるか否かを判断する
具体的な判断の流れは以下の通りである. RR独立性レベルでは、各トランザクションが開始されると、現在のシステム内のすべてのアクティブなトランザクションが1つのリストにコピーされます(read view) RC独立性レベルでは、各文が開始されると、現在のシステム内のすべてのアクティブなトランザクションが1つのリストにコピーされ、次の論理に従ってトランザクションの可視性が判断されます.
MVCCはどんな問題を解決しましたか. MVCCにより、データベースの読み取りによってデータがロックされず、selectによってロックされず、データベースの同時処理能力が向上する MVCCを利用して、データベースはRC、RRなどの独立性レベルを実現することができ、ユーザーは現在のデータの前の1つまたは前のいくつかの履歴バージョンを表示することができる.ACIDにおけるI-アイソレーションが保証されている.
MySQLコード解析
前にMVCCとは何か、そしてそれがどのような問題を解決したのかを紹介した.次に、MySQLのソースコードで、この論理をどのように実現しているのかを見てみましょう.
InnoDB非表示フィールドソース分析
InnoDBテーブルにはmysqlのデフォルトで追加された3つの非表示フィールドが格納されます.コードから次のように表示できます.
データベースのマルチバージョン読み込みシーン
MVCC実現原理
DB_経由ROLL_PT遡及データ履歴バージョンの検索
read viewで行レコードが表示されるか否かを判断する
MVCCはどんな問題を解決しましたか.
MySQLコード解析
InnoDB非表示フィールドソース分析
InnoDB判定トランザクション可視性ソース分析
MVCC原理探究及びMySQLソースコード実現分析
データベースのマルチバージョン読み込みシーン
session 1
session 2
select a from test; return a = 10
start transaction;
update test set a = 20;
start transaction;
select a from test; return ?
commit;
select a from test; return ?
上記のデータベースの日常的な操作の例を見てみましょう.
MySQLは複数の独立性レベルをサポートしているため、この問題はsession 2のトランザクション独立性レベルを見る必要があります.状況は次のとおりです.
MVCC実現原理
これらの現象はデータベースでよく見られますが、データベースがどのように実現されているのか、深く研究している人は多くありません.実は原理はとても簡単で、データベースはUNDOとMVCCを通じて実現しました.
DB_経由ROLL_PT遡及データ履歴バージョンの検索
レコードを更新すると、元のレコードはundoテーブルスペースに入れられ、DB_を通過します.ROLL_PTはこの記録を指す.session 2クエリが返す未修正データはこのundoから返される.MySQLは、レコード上のロールバック・セグメント・ポインタおよびトランザクションIDに基づいてレコードが表示されているかどうかを判断し、表示されていない場合はDB_ROLL_PTは遡及検索を継続する.
read viewで行レコードが表示されるか否かを判断する
具体的な判断の流れは以下の通りである.
MVCCはどんな問題を解決しましたか.
MySQLコード解析
前にMVCCとは何か、そしてそれがどのような問題を解決したのかを紹介した.次に、MySQLのソースコードで、この論理をどのように実現しているのかを見てみましょう.
InnoDB非表示フィールドソース分析
InnoDBテーブルにはmysqlのデフォルトで追加された3つの非表示フィールドが格納されます.コードから次のように表示できます.
dict_table_add_system_columns(
/*==========================*/
dict_table_t* table, /*!< in/out: table */
mem_heap_t* heap) /*!< in: temporary heap */
{
ut_ad(table);
ut_ad(table->n_def == (table->n_cols - table->get_n_sys_cols()));
ut_ad(table->magic_n == DICT_TABLE_MAGIC_N);
ut_ad(!table->cached);
/* NOTE: the system columns MUST be added in the following order
(so that they can be indexed by the numerical value of DATA_ROW_ID,
etc.) and as the last columns of the table memory object.
The clustered index will not always physically contain all system
columns.
Intrinsic table don't need DB_ROLL_PTR as UNDO logging is turned off
for these tables. */
dict_mem_table_add_col(table, heap, "DB_ROW_ID", DATA_SYS,
DATA_ROW_ID | DATA_NOT_NULL,
DATA_ROW_ID_LEN);
#if (DATA_ITT_N_SYS_COLS != 2)
#error "DATA_ITT_N_SYS_COLS != 2"
#endif
#if DATA_ROW_ID != 0
#error "DATA_ROW_ID != 0"
#endif
dict_mem_table_add_col(table, heap, "DB_TRX_ID", DATA_SYS,
DATA_TRX_ID | DATA_NOT_NULL,
DATA_TRX_ID_LEN);
#if DATA_TRX_ID != 1
#error "DATA_TRX_ID != 1"
#endif
if (!table->is_intrinsic()) {
dict_mem_table_add_col(table, heap, "DB_ROLL_PTR", DATA_SYS,
DATA_ROLL_PTR | DATA_NOT_NULL,
DATA_ROLL_PTR_LEN);
#if DATA_ROLL_PTR != 2
#error "DATA_ROLL_PTR != 2"
#endif
/* This check reminds that if a new system column is added to
the program, it should be dealt with here */
#if DATA_N_SYS_COLS != 3
#error "DATA_N_SYS_COLS != 3"
#endif
}
}
- DB_ROW_ID: MySQL 6 row id
- DB_TRX_ID: ID
- DB_ROLL_PTR:
InnoDB
mysql ID , ID 。
,
dhy@10.16.70.190:3306 12:25:47 [dhy]>select * from dhytest;
+------+
| id |
+------+
| 10 |
+------+
1 row in set (7.99 sec)
:
dhy@10.10.80.199:3306 15:28:24 [dhy]>update dhytest set id = 20;
Query OK, 3 rows affected (40.71 sec)
Rows matched: 3 Changed: 3 Warnings: 0
dhy@10.16.70.190:3306 12:38:33 [dhy]>select * from dhytest;
mysql ,
ReadView,Read View , Read View ID ID
/** The read should not see any transaction with trx id >= this
value. In other words, this is the "high water mark". */
trx_id_t m_low_limit_id;
/** The read should see all trx ids which are strictly
smaller (
low water mark". */
trx_id_t m_up_limit_id;
/** trx id of creating transaction, set to TRX_ID_MAX for free
views. */
trx_id_t m_creator_trx_id;
, :
row_search_mvcc->lock_clust_rec_cons_read_sees
bool
lock_clust_rec_cons_read_sees(
/*==========================*/
const rec_t* rec, /*!< in: user record which should be read or
passed over by a read cursor */
dict_index_t* index, /*!< in: clustered index */
const ulint* offsets,/*!< in: rec_get_offsets(rec, index) */
ReadView* view) /*!< in: consistent read view */
{
ut_ad(index->is_clustered());
ut_ad(page_rec_is_user_rec(rec));
ut_ad(rec_offs_validate(rec, index, offsets));
/* Temp-tables are not shared across connections and multiple
transactions from different connections cannot simultaneously
operate on same temp-table and so read of temp-table is
always consistent read. */
//
if (srv_read_only_mode || index->table->is_temporary()) {
ut_ad(view == 0 || index->table->is_temporary());
return(true);
}
/* NOTE that we call this function while holding the search
system latch. */
trx_id_t trx_id = row_get_rec_trx_id(rec, index, offsets); // TRX_ID , 。 TRX_ID
return(view->changes_visible(trx_id, index->table->name)); //
}
。
bool changes_visible(
trx_id_t id,
const table_name_t& name) const
MY_ATTRIBUTE((warn_unused_result))
{
ut_ad(id > 0);
// ID Read View , 。 select
if (id < m_up_limit_id || id == m_creator_trx_id) {
return(true);
}
check_trx_id_sanity(id, name);
// Read View , ,
if (id >= m_low_limit_id) {
return(false);
} else if (m_ids.empty()) {
return(true);
}
const ids_t::value_type* p = m_ids.data();
return(!std::binary_search(p, p + m_ids.size(), id)); // Read View , Read View , Read View
}
row_vers_build_for_consistent_read UNDO , 。
, :
- READ-COMMITTED
Read View,- REPEATABLE-READ
Read View , Read View , 。:
《 -2016PG - .pdf》