SS2PLを採用しているSamehadaDBでのPhantom Read抑止ロジックの検討

現在のConcurrent Control（CC）実装 • レコード（タプル）粒度でのLock ◦ ロックマネージャはレコード ID（＝DBファイル内のロケーション情報）で Lockを管理 ▪ {テーブル、スキーマ、レコードのデータ
}に関する情報は知らない • Strong Stricted 2-Phase Locking（SS2PL）プロトコルによるCC ◦ WLockもRLockもCommitもしくはAbort時まで保持 ◦ no-wait（Lock獲得に失敗したtxnはAbort） ◦ UpgradableなReader-Writer Lockを用いたLock機構 ▪ RLockは共有ロック（同一タプルの RLockを複数のtxnが持てる） ▪ WLockの獲得はRLockもしくはWLockを持っているtxnが自分以外にいたら獲得失敗 ▪ Upgrade（RLock->WLock）はRLockを持っているtxnが自分以外にいたら獲得失敗 • 更新系操作（Update, Delete, Insert）はCommitを待たずしてメモリ上のデータへ反映 ◦ txnの終了がCommitであればメモリ上のデータへの更新はそのまま。 commitでtxnが終了した旨のログをログバッファに appendして、メモリ上のログデータを Flushし、持っていたLockを全て解放 ◦ (略）がAbortであれば、（略）をロールバック。 Abortでtxnが終了した旨のログをログバッファに appendして、（以降略）

課題 • 一部のAnomalyが発生し得ることを除いて・・・Serializableである認識 ◦ （少なくとも） Phantom Read が起こり得る • （Indexを用いたレンジスキャンに限らず）
Pahtom Readの発生を抑止したい

抑止のためのロジック修正案1（ダメだった） • 冒頭の実装をベースに Optimistic Concurrency Control（OCC）的な発想を取り入れ、以下のように CCを行えばPhantom Readは抑止されるか？
◦ 1. スキャンを行う処理は以下のように変更する ▪ 1-1. 各txnは自身が行ったスキャンの概要を個々に記憶 • ex) テーブルAの全レコード、テーブルBのカラムB{1}の範囲 100-500、etc ▪ 1-2. 同一のテーブルに対して再度スキャンを行う際は、読み取ったレコードが過去のスキャンにおいても存在しなければならなかったはずのレコードでないかのチェックも行う。検出したらAbort • （効率的に行う工夫を考える必要はありそう・・・） ◦ 2.txnがCommitに至った際に既存の処理の前に以下の処理を追加 ▪ 記憶しているスキャンを全て再実施し過去の read結果から変化があるかチェックする（OCC的な発想） • 自身が過去に読んだレコードは RLockを持っているはずなので、そうでないレコードにぶつかったら、Abort処理に切り替える • （主にはInsertを検出することになるはず。 DeleteについてはRLockを持っているので発生しない。Updateでレンジスキャンの範囲に入ってきたものも上のチェック方法で検出可能なはず）

抑止のためのロジック修正案 1(改) - ポイントクエリへの考慮を追加 • 冒頭の実装をベースに Optimistic Concurrency Control（OCC）的な発想を取り入れ、以下のように CC
を行えばPhantom Readは抑止されるか？ ◦ 1. Readを行う際に以下の処理を加える ▪ 1-1. 各txnは自身が行ったReadの概要を個々に記憶 • ex) テーブルAの全レコード、テーブルBのカラムB{1}の範囲 100-500、etc ▪ 1-2. 同一のテーブルに対して再度Readを行う際は、読み取ったレコードで、その時点でRLockもWRock も持っていたわけではないものがあった際に、過去のスキャンにおいても存在しなければならなかったはずのレコードでないかのチェックも行う。検出したらAbort • （効率的に行うためのデータ構造やアルゴリズムを考える必要はありそう・・・） ◦ 2.txnがCommitに至った際に既存の処理の前に以下の処理を追加 ▪ 記憶しているスキャンを全て再実施し過去のRead結果から変化があるかチェックする • 自身が過去に読んだレコードもしくは追加・更新したレコードはRLockもしくはWLockを持っているはずなので、そうでないレコードにぶつかったら、Abort処理に切り替える ◦ 主にはInsertを検出することになるはず。DeleteについてはRLockを持っているので発生しない。Updateでレンジスキャンの範囲に入ってきたものも上のチェック方法で検出可能 ◦ 同一テーブルへの複数回のスキャンが存在しなければチェックのコストは低いはず ◦ txnが行ったポイントクエリについてはRLockを保持しているはずでありDeleteもUpdateも行われ得ず、他のReadとの不整合は1-2で確認済みであるためここではチェック不要。従って1-2でポイントクエリの情報は記憶していない（しない

抑止のためのロジック修正案 1(改2) - コミット前のチェックは不要では？ • 冒頭の実装をベースに以下のように CCを行えばPhantom Readは抑止されるか？ ◦ Readを行う際に以下の処理を加える
▪ ① 各txnは自身が行ったReadの概要を個々に記憶 • ex) テーブルAの全レコード、テーブルBのカラムB{1}の範囲 100-500、etc ▪ ② 同一のテーブルに対して再度Readを行う際は、読み取ったレコードで、その時点で RLockもWRockも持っていたわけではないものがあった際に、過去のスキャンにおいても存在しなければならなかったはずのレコードでないかのチェックも行う。検出したら Abort • txnが行ったポイントクエリについては RLockを保持しているはずでありDeleteも Updateも行われ得ない。従ってチェック対象はスキャンに限定することが可能であり、①でポイントクエリの情報は記憶していない（しない） • （効率的に行うためのデータ構造やアルゴリズムを考える必要はありそう・・・） ◦ （修正案1（改）の2において検出したい Phantom Readとなる可能性のあるエントリは、同案の 1-2のチェックで検出されているはずでは、というところで 2を取り除いたのが本案）

抑止のためのロジック修正案2（多分こっちはいける） • 前述の実装をベースに Optimistic Concurrency Control（OCC）的な発想を取り入れ、以下のように CCを行えばPhantom Readは抑止されるか？ ◦
1. スキャンを行う処理はほぼそのままであるが、以下の処理を追加する ▪ 1. 各txnは自身が行ったスキャンで読んだレコードのアップデートカウンタをスキャンごとに記憶しておく • （各レコードのアップデートカウンタを管理する永続化不要のレコード IDをキーとする連想配列をロックマネージャに持たせればよい？） ◦ 2.txnがCommitに至った際に既存の処理の前に以下の処理を追加 ▪ 記憶しているスキャンを全て再実施し過去の read結果から変化があるかチェックする（OCC的な発想） • 自身が過去にレコードを読んだ際のアップデートカウンタとリスキャンで得たそれに差異があればNGとしてAbortの処理に切り替えるポイントクエリの考慮漏れ以前のレベルでダメだった

SS2PLを採用しているSamehadaDBでのPhantom Read抑止ロジックの検討

SS2PLを採用しているSamehadaDBでのPhantom Read抑止ロジックの検討

Ryo Kanbayashi

More Decks by Ryo Kanbayashi

Featured

Transcript

現在のConcurrent Control（CC）実装 • レコード（タプル）粒度でのLock ◦ ロックマネージャはレコード ID（＝DBファイル内のロケーション情報）で Lockを管理 ▪ {テーブル、スキーマ、レコードのデータ

課題 • 一部のAnomalyが発生し得ることを除いて・・・Serializableである認識 ◦ （少なくとも） Phantom Read が起こり得る • （Indexを用いたレンジスキャンに限らず）

抑止のためのロジック修正案1（ダメだった） • 冒頭の実装をベースに Optimistic Concurrency Control（OCC）的な発想を取り入れ、以下のように CCを行えばPhantom Readは抑止されるか？

抑止のためのロジック修正案 1(改) - ポイントクエリへの考慮を追加 • 冒頭の実装をベースに Optimistic Concurrency Control（OCC）的な発想を取り入れ、以下のように CC

抑止のためのロジック修正案 1(改2) - コミット前のチェックは不要では？ • 冒頭の実装をベースに以下のように CCを行えばPhantom Readは抑止されるか？ ◦ Readを行う際に以下の処理を加える

抑止のためのロジック修正案2（多分こっちはいける） • 前述の実装をベースに Optimistic Concurrency Control（OCC）的な発想を取り入れ、以下のように CCを行えばPhantom Readは抑止されるか？ ◦

SS2PLを採用しているSamehadaDBでのPhantom Read抑止ロジックの検討

SS2PLを採用しているSamehadaDBでのPhantom Read抑止ロジックの検討

Ryo Kanbayashi

More Decks by Ryo Kanbayashi

Featured

Transcript

現在のConcurrent Control（CC）実装 • レコード（タプル）粒度でのLock ◦ ロックマネージャはレコード ID（＝DBファイル内のロケーション情報）で Lockを管理 ▪ {テーブル、スキーマ、レコードのデータ

課題 • 一部のAnomalyが発生し得ることを除いて・・・Serializableである認識 ◦ （少なくとも） Phantom Read が起こり得る • （Indexを用いたレンジスキャンに限らず）

抑止のためのロジック修正案1（ダメだった ） • 冒頭の実装をベースに Optimistic Concurrency Control（OCC）的な発想を取り入れ、以 下のように CCを行えばPhantom Readは抑止されるか？

抑止のためのロジック修正案 1(改) - ポイントクエリへの考慮を追加 • 冒頭の実装をベースに Optimistic Concurrency Control（OCC）的な発想を取り入れ、以下のように CC

抑止のためのロジック修正案 1(改2) - コミット前のチェックは不要では？ • 冒頭の実装をベースに以下のように CCを行えばPhantom Readは抑止されるか？ ◦ Readを行う際に以下の処理を加える

抑止のためのロジック修正案2（多分こっちはいける） • 前述の実装をベースに Optimistic Concurrency Control（OCC）的な発想を取り入 れ、以下のように CCを行えばPhantom Readは抑止されるか？ ◦

抑止のためのロジック修正案1（ダメだった） • 冒頭の実装をベースに Optimistic Concurrency Control（OCC）的な発想を取り入れ、以下のように CCを行えばPhantom Readは抑止されるか？

抑止のためのロジック修正案2（多分こっちはいける） • 前述の実装をベースに Optimistic Concurrency Control（OCC）的な発想を取り入れ、以下のように CCを行えばPhantom Readは抑止されるか？ ◦