データベースと応用システム：障害回復

(c)長岡技術科学大学電気系 1 データベースと応用システム障害回復山本和英長岡技術科学大学電気系

(c)長岡技術科学大学電気系 2 障害の種類と復旧 • トランザクション障害 – データの不備、デッドロック、資源不足、通信障害等 – ロールバックしてやり直し
• システム障害 – ソフトウェアや（データ部以外の）ハードウェアのトラブル – ＤＢの一貫性が保証されるまでロールバック – ＋コミットしたトランザクションはロールフォワード • メディア（媒体）障害 – データベースの損傷 – バックアップを使って復活

(c)長岡技術科学大学電気系 3 障害を回復する機能 • ログファイル – すべての操作の履歴記録 • チェックポイント
– メモリとディスクの内容を一致させるタイミング • バックアップ

(c)長岡技術科学大学電気系 4 ログファイル

(c)長岡技術科学大学電気系 5 ログファイル(log file) • トランザクションが行った更新などの操作履歴は、障害に備えてログファイルに記録される – ジャーナルファイル(journal
file)とも呼ぶ • 後退復帰と前進復帰の両者に備える – 更新前ログと更新後ログがある • データベースとログファイルは別のディスクに書き込む – データベース本体よりも信頼性の高い装置に保存、あるいはログを二重化する

(c)長岡技術科学大学電気系 6 ログに書きこむ情報 • トランザクション開始・終了ログ • データ挿入 – 更新後データログ
• データ削除 – 更新前データログ • データ更新 – 更新前・更新後データログ • コミット・ロールバックログ

(c)長岡技術科学大学電気系 7 WALプロトコル (Write Ahead Logging) • データベースの更新よりもログファイルへの記録を先にする手順
– トランザクション障害が発生してもいいように • 更新処理手順 1.ログファイルへbegin transactionレコードを記録 2.ログファイルへ更新前レコードの記録 3.ログファイルへ更新後レコードの記録 4.データベースの更新 5.commitレコードを記録 6.end transactionレコードを記録

(c)長岡技術科学大学電気系 8 ロールバックとロールフォワードロールバック（後退復帰, undo） • トランザクション中で実行したすべての更新を取り消して、障害回復を行うことロールフォワード（前進復帰,
redo） • （バックアップ復旧などの際に）コミット済のトランザクションを再実行すること

(c)長岡技術科学大学電気系 9 障害と処理の関係 • トランザクション障害 – ロールバックしてトランザクション開始時に戻す • システム障害
– コミットされていればロールフォワード – コミットされていなければロールバック • メディア障害 – 交換やバックアップ復元したあとロールフォワード

(c)長岡技術科学大学電気系 10 チェックポイント

(c)長岡技術科学大学電気系 11 チェックポイント • データベースの内容は常にディスクに読み書きしている訳ではなく、一部はメモリ上で更新している。 • よって、メモリとディスクの内容は一致しているとは限らない。
• DBMSはあるタイミングでチェックポイントを設定してメモリ上の内容を書き込んでいる。 – 一定時間ごと – 一定のトランザクション実行数ごと – 一定のログ量ごと

(c)長岡技術科学大学電気系 12 チェックポイントと回復処理の関係 • チェックポイント前にコミット – 回復処理は不要 • チェックポイント後にコミットし、障害発生前
– チェックポイント後の操作をロールフォワード • チェックポイント前に開始し、障害時も実行中 – ロールバック • チェックポイント後に開始し、障害時も実行中 – ロールバック

(c)長岡技術科学大学電気系 13 チェックポイントシステム障害データベースへの書き出しが完了
データベースへの書き出しが完了かどうか不明チェックポイント時刻

(c)長岡技術科学大学電気系 14 チェックポイントシステム障害すべて書き出されており、障害時に対処不要時刻

(c)長岡技術科学大学電気系 15 チェックポイントシステム障害チェックポイント後のみ前進復帰時刻

(c)長岡技術科学大学電気系 16 チェックポイントシステム障害すべての更新を前進復帰時刻

(c)長岡技術科学大学電気系 17 時刻チェックポイントシステム障害まだコミットされていないので全更新を後退復帰

(c)長岡技術科学大学電気系 18 時刻チェックポイントシステム障害まだコミットされていないので全更新を後退復帰

(c)長岡技術科学大学電気系 19 バックアップ

(c)長岡技術科学大学電気系 20 バックアップ • ある時点でのデータベースのコピーを磁気テープなどに保存すること • システムの障害復旧の他、操作ミスなどに対処することが目的
• バックアップ間隔の長さに比例して、ログファイルからの復旧処理時間が長くなる。

(c)長岡技術科学大学電気系 21 バックアップの種類 • フルバックアップ • 差分バックアップ：フルバックアップからの差分のみ保存 • 増分バックアップ：前回の増分バックアップからの差分の
み保存 • 通常はフルバックアップを定期的（例：週１回）に行い、さらに細かく差分・増分バックアップを行う（例：毎日）という使い分けをする。 • 差分バックアップはバックアップ時間は短く、復旧時間は長くなる。増分バックアップはさらにこの傾向が顕著。

(c)長岡技術科学大学電気系 22 メディア障害からの回復バックアップしてあることが大前提１．装置の交換２．バックアップ状態の復元３．ログファイルを使ってコミットされたすべてのトランザクションを前進復帰

(c)長岡技術科学大学電気系 23 ＲＡＩＤ

(c)長岡技術科学大学電気系 24 ＲＡＩＤ • Redundant Array of Inexpensive Disks
• データを複数のHDDに冗長に記録する仕組み • 1987年UCB(University of California, Berkeley)のDavid A. Pattersonらの論文 • 当初は RAID1～RAID5で、その後 RAID0とRAID6が追加された

(c)長岡技術科学大学電気系 25 ＲＡＩＤ０（ストライピング） • 複数のディスクを見かけ上連結させて、ひとつのディスクに見せる • ディスク容量の効率的な利用が可能 •
複数ディスクのどれかが故障するとすべて損失 – 信頼性の向上には無関係

(c)長岡技術科学大学電気系 26 ＲＡＩＤ１（ミラーイング） • ディスクの二重化 • どちらかのディスクが故障してもデータは保持される。

(c)長岡技術科学大学電気系 27 ＲＡＩＤ５ • RAID0と同様にデータを複数のディスクに分散して書き込むが、この際に（今データを書いたディスクとは別の）ディスクにパリティ（誤り訂正符号）も書き込む。 – パリティを書き込むディスクは毎回変える
• これによって、例えば４ディスクで３ディスク分の容量を書き込みできる。 • どれか１ディスクが故障してもデータは保持される – ２ディスク以上が故障したら終わり • ディスクが分散されているので、読み込み速度は速い – パリティを計算するため書き込み速度は比較的遅い

(c)長岡技術科学大学電気系 28 その他のＲＡＩＤ • ＲＡＩＤ２、３、４、６ – 定義されているが、実用上はあまり使われない • ＲＡＩＤ１０
(ＲＡＩＤ１＋０) – ＲＡＩＤ１と０の組み合わせ。最低４ディスク必要 • ＲＡＩＤ５０ (ＲＡＩＤ５＋０) – ＲＡＩＤ５と０の組み合わせ。最低６ディスク必要

(c)長岡技術科学大学電気系 29 ＲＡＩＤ関連技術ホットスワップ(hot swap) • システムを停止させることなく（＝通電したままで）ディスクを交換することができる処理・技術 –
自動でアクセス停止して電気信号を切り離す等ホットスペア(hot spare)／ホットスタンバイ • ディスクの故障に備えて、予備のディスクを通電状態で待機させておく技術 • 故障した機器は自動で切り離し、予備のディスクの動作を自動で開始する

データベースと応用システム：障害回復

データベースと応用システム：障害回復

自然言語処理研究室

More Decks by 自然言語処理研究室

Other Decks in Education

Featured

Transcript

(c)長岡技術科学大学電気系 1 データベースと応用システム障害回復山本和英長岡技術科学大学電気系

(c)長岡技術科学大学電気系 2 障害の種類と復旧 • トランザクション障害 – データの不備、デッドロック、資源不足、通信障害等 – ロールバックしてやり直し

(c)長岡技術科学大学電気系 3 障害を回復する機能 • ログファイル – すべての操作の履歴記録 • チェックポイント

(c)長岡技術科学大学電気系 4 ログファイル

(c)長岡技術科学大学電気系 5 ログファイル(log file) • トランザクションが行った更新などの操作履歴は、障害に備えてログファイルに記録される – ジャーナルファイル(journal

(c)長岡技術科学大学電気系 6 ログに書きこむ情報 • トランザクション開始・終了ログ • データ挿入 – 更新後データログ

(c)長岡技術科学大学電気系 7 WALプロトコル (Write Ahead Logging) • データベースの更新よりもログファイルへの記録を先にする手順

(c)長岡技術科学大学電気系 8 ロールバックとロールフォワードロールバック（後退復帰, undo） • トランザクション中で実行したすべての更新を取り消して、障害回復を行うことロールフォワード（前進復帰,

(c)長岡技術科学大学電気系 9 障害と処理の関係 • トランザクション障害 – ロールバックしてトランザクション開始時に戻す • システム障害

(c)長岡技術科学大学電気系 10 チェックポイント

(c)長岡技術科学大学電気系 11 チェックポイント • データベースの内容は常にディスクに読み書きしている訳ではなく、一部はメモリ上で更新している。 • よって、メモリとディスクの内容は一致しているとは限らない。

(c)長岡技術科学大学電気系 12 チェックポイントと回復処理の関係 • チェックポイント前にコミット – 回復処理は不要 • チェックポイント後にコミットし、障害発生前

(c)長岡技術科学大学電気系 13 チェックポイントシステム障害データベースへの書き出しが完了

(c)長岡技術科学大学電気系 14 チェックポイントシステム障害すべて書き出されており、障害時に対処不要時刻

(c)長岡技術科学大学電気系 15 チェックポイントシステム障害チェックポイント後のみ前進復帰時刻

(c)長岡技術科学大学電気系 16 チェックポイントシステム障害すべての更新を前進復帰時刻

(c)長岡技術科学大学電気系 17 時刻チェックポイントシステム障害まだコミットされていないので全更新を後退復帰

(c)長岡技術科学大学電気系 18 時刻チェックポイントシステム障害まだコミットされていないので全更新を後退復帰

(c)長岡技術科学大学電気系 19 バックアップ

(c)長岡技術科学大学電気系 20 バックアップ • ある時点でのデータベースのコピーを磁気テープなどに保存すること • システムの障害復旧の他、操作ミスなどに対処することが目的

(c)長岡技術科学大学電気系 21 バックアップの種類 • フルバックアップ • 差分バックアップ：フルバックアップからの差分のみ保存 • 増分バックアップ：前回の増分バックアップからの差分の

(c)長岡技術科学大学電気系 22 メディア障害からの回復バックアップしてあることが大前提１．装置の交換２．バックアップ状態の復元３．ログファイルを使ってコミットされたすべてのトランザクションを前進復帰

(c)長岡技術科学大学電気系 23 ＲＡＩＤ

(c)長岡技術科学大学電気系 24 ＲＡＩＤ • Redundant Array of Inexpensive Disks

(c)長岡技術科学大学電気系 25 ＲＡＩＤ０（ストライピング） • 複数のディスクを見かけ上連結させて、ひとつのディスクに見せる • ディスク容量の効率的な利用が可能 •

(c)長岡技術科学大学電気系 26 ＲＡＩＤ１（ミラーイング） • ディスクの二重化 • どちらかのディスクが故障してもデータは保持される。

(c)長岡技術科学大学電気系 28 その他のＲＡＩＤ • ＲＡＩＤ２、３、４、６ – 定義されているが、実用上はあまり使われない • ＲＡＩＤ１０

(c)長岡技術科学大学電気系 29 ＲＡＩＤ関連技術ホットスワップ(hot swap) • システムを停止させることなく（＝通電したままで）ディスクを交換することができる処理・技術 –