Oracle Database 入門 - Oracle Real Application Clusters【アーキテクチャ詳説編】

Oracle Real Application Clusters アーキテクチャ詳説編日本オラクル株式会社クラウドエンジニアリング統括オラクルデジタル本部第一クラウドアーキテクト部小畑
晶

1. Oracle Real Application Clusters概要 2. Oracle RACとシングル・データベースとの違い 3. Oracle
Grid Infrastructure概要 4. 接続ロード・バランシングと接続フェイルオーバー 5. まとめ Agenda Copyright © 2024, Oracle and/or its affiliates 2

1. Oracle Real Application Clusters概要 • Oracle Real Application Clusters(Oracle
RAC)とは • Oracle RACの特徴 • Oracle RACの代表的な構成 2. Oracle RACとシングル・データベースとの違い 3. Oracle Grid Infrastructure概要 4. 接続ロード・バランシングと接続フェイルオーバー 5. まとめ Agenda Copyright © 2024, Oracle and/or its affiliates 3

【シングル構成】 • 障害時にサービスが停止する構成 • 予備サーバにOracleソフトウェアをインストールし、再構築する必要がある【高可用性構成: HA構成】 • 障害時に切り替える待機サーバをあ
らかじめ用意 • 現用系と待機系を用意するため、待機サーバ・リソースは遊休資産となる構成例: • サードパーティ製Clusterwareとの連携 • CLUSTERPRO X (NEC) • LifeKeeper (サイオステクノロジー) • Windows Server Failover Cluster+ Oracle Fail Safe (19c 非推奨) 【Oracle RAC】 • 複数のサーバのリソースを活用した Active-Activeのクラスタ構成 • 高い性能と高い可用性を唯一両立 Oracle Databaseにおける一般的なデータベース構成例 Copyright © 2024, Oracle and/or its affiliates 4 Active Active Standby Active Active 本日の内容

Oracle Real Application Clustersとは • システム障害によるダウンタイムを最小に抑え、データ保護と連続的なサービス環境を実現する Oracle Databaseのクラスタ技術特徴 •
高可用性：Active-Activeのクラスタ構成により、障害時にも継続してサービスを提供可能 • 高拡張性：サーバの追加によって容易にスケールアウトが可能 Oracle Real Application Clusters (Oracle RAC) とは Copyright © 2024, Oracle and/or its affiliates 5 共有ストレージ障害によるサーバ停止があっても、サービスは停止しない 1つのデータベースに複数のサーバから同時にアクセスできる処理量の増加に合わせ、容易に拡張可能

高可用性の実現（HA構成との比較） HA(Active-Standby）構成障害時にストレージ接続の切り替えやデータベースの再起動が必要 RAC(Active-Active）構成全てのサーバが稼働しているためすぐに別のサーバで処理を引き継ぐことが可能 Oracle RACの特徴（１） Copyright
© 2024, Oracle and/or its affiliates 6 共有ストレージ共有ストレージストレージ接続の切り替え稼働数分〜十数分本番機バックアップ機待機データベース再起動稼働稼働稼働全てのサーバのリソースを有効活用高速なフェイルオーバー数秒〜数十秒 ※フェイルオーバー: 稼動中のシステムやサーバに障害が発生した際に、自動的に待機システムに切り替える仕組み

高拡張性の実現（HA構成との比較） HA(Active-Standby）構成ハードウェアの処理能力が限界になった場合、ハードウェアをリプレイスしなければならない RAC(Active-Active）構成それまでのサーバを交換せずに追加することで処理能力をより安価に向上可能 Oracle RACの特徴（２） Copyright
© 2024, Oracle and/or its affiliates 7 共有ストレージ共有ストレージ稼働待機稼働稼働稼働サーバを追加することで処理能力を向上コスト増大安価にスケールアウト稼働サーバごとリプレイス

Oracle RACの代表的な構成 Copyright © 2024, Oracle and/or its affiliates 8
共有ストレージデータ・ベース・サーバデータベース・クライアントパブリック・ネットワークデータベース・クライアントとの通信インターコネクト・ネットワーク Computeノード間通信ストレージ・ネットワーク全Computeノードが全ストレージと通信 S/W Oracle データベース関連ファイル Oracleデータベース関連ファイル REDOログファイル UNDO ファイルデータファイル制御ファイル SPFILE アーカイブ REDOログファイルインスタンスごとに用意 Oracle ソフトウェア • Oracle Database • Oracle Grid Infrastructure • Oracle Clusterware • Oracle ASM DNSサーバ（SCANのIPアドレス解決で使用 ※後述） OS

参考）Oracle Exadata すべてのデータベース・ワークロードのための最高のプラットフォーム • 単一ベンダーによるサポート • データベースに特化した設計 • ハードウェアとソフトウェアの
密なインテグレーション • ストレージへの革新的なアプローチ • Real Application Clustersにより、DBサーバを並列稼働させ、高可用性と高拡張性を実現 • Automatic Storage Managementにより、ストレージ・サーバを並列稼働させ、高いI/O性能と高可用性・高拡張性を実現 • さらに、Exadata System Softwareが処理の一部をオフロードし、大量データの高速処理を実現 9 Copyright © 2024, Oracle and/or its affiliates 驚異的なパフォーマンス、優れた運用効率、最高の可用性とセキュリティ、クラウド対応スケールアウト可能なインテリジェント・ストレージスケールアウト可能なデータベース・サーバ最速の内部ネットワーク DBサーバを並列稼働ストレージを並列稼働オンプレミスにもクラウドにも理想的

1. Oracle Real Application Clusters概要 2. Oracle RACとシングル・データベースとの違い • アプリケーションはシングル・データベースと同じものを利用（透過性）
• Oracle RACならではの拡張性 • Oracle RACのデータアクセス • Cache Fusion • Oracle RACのインスタンス・リカバリ 3. Oracle Grid Infrastructure概要 4. 接続ロード・バランシングと接続フェイルオーバー 5. まとめ Agenda Copyright © 2024, Oracle and/or its affiliates 10

Oracleクライアントから見た挙動がシングル・インスタンスと同じすべてのOracleインスタンスから同じデータをアクセス • ストレージを共有しており、1つのOracleインスタンスからすべてのデータにアクセス可能 • Oracle RAC独自のデータ構造はなく、シングル・データベースと同じトランザクション分離レベルの挙動が同じ
• 複数のセッションがノード内/ノード間で同じデータにアクセスしたときの挙動が同じ • 複数ノード間でのキャッシュの一貫性を全自動で維持 (Cache Fusion) アプリケーションはシングル・データベースと同じものを利用（透過性） Copyright © 2024, Oracle and/or its affiliates 11 Oracleクライアント Oracle インスタンス2 Oracle インスタンス1 Oracle インスタンス3 Oracle インスタンス4 シングル・インスタンスで開発したアプリケーションがそのまま動作する

トランザクション系も分析系も同じアーキテクチャで対応トランザクション系 • 多数のセッションからの同時並行リクエスト • より多くの同時リクエストを処理集計/分析系 • 1つのSQL処理を並列化 •
より高い並列度で1つのSQLを処理 Oracle RACならではの拡張性 Copyright © 2024, Oracle and/or its affiliates 12 Oracleクライアント Oracle インスタンス2 Oracle インスタンス1 Oracle インスタンス3 Oracle インスタンス4 Oracleクライアント Oracle インスタンス2 Oracle インスタンス1 Oracle インスタンス3 Oracle インスタンス4 QC PX PX PX PX PX PX PX PX QC: Query Coordinator PX: Parallel Execution Server

シングルインスタンスと同じように低速なストレージアクセスを減らすという考え方で動作キャッシュ・ヒットした場合 • キャッシュのデータを使用キャッシュ・ミスした場合 • シングルインスタンスの場合 • ストレージから読み込む •
RACの場合 • ストレージから読み込む • （存在すれば）他ノードのキャッシュから受け取る Oracle RACのデータアクセス Copyright © 2024, Oracle and/or its affiliates 13 共有ストレージ SGA Buffer Cache サーバプロセス SGA Buffer Cache SQL発行

共有ロックのブロックは複数ノードにコピー可能 • Shared モードのデータブロックは複数ノードにコピーを持つことができる • 複数ノードで並列に読み出すことができる更新するには、ブロックの排他ロックが必要 • eXclusive
モードのデータブロックは1つのノードしかもつことができない • 他のノードがキャッシュしていたデータブロックは Null モードに変換される参考）データベース・ブロックのロック・モード Copyright © 2024, Oracle and/or its affiliates 14 共有ストレージ SGA Buffer Cache SGA Buffer Cache S S SELECT SELECT 共有ストレージ SGA Buffer Cache SGA Buffer Cache X N UPDATE/DELETE/INSERT SELECT X→N S→N

Global Resource Directory を使ってキャッシュ状態とデータ・ブロックのロック状態を管理 Global Resource Directory (GRD) • リソース保持ノードとロック状態が記録されるDirectory
• クラスタの全てのノードのメインメモリ上に分散配置 • あるデータ・ブロックのロックの状態に責任をもつGRDは、クラスタのノードのうち1つのみで、リソース・マスタと呼ぶ Global Cache Service (GCS): • バッファ・キャッシュ上のブロックを管理 Global Enqueue Service (GES): • ブロック以外の対象(エンキュー等)を管理 Cache Fusion Copyright © 2024, Oracle and/or its affiliates 15 共有ストレージ SGA Buffer Cache SGA Buffer Cache SGA Buffer Cache GRD GRD GRD サーバプロセス SQL発行に格納されているデータを処理したいのリソース・マスタ共有ストレージへのアクセスが早い場合はストレージから読み込む

インスタンス障害 • インスタンス(メモリー＋プロセス)上の情報が失われる障害 Oracle RAC構成時: • 障害が発生したインスタンスを再起動しなくてもよい • 正常ノードが障害ノードのREDOログを読み込んでリカバリ実施 •
リカバリを実施するインスタンスはIRエンキューを取得 • Global Resource Directoryの再構成 Oracle RACのインスタンス・リカバリ Copyright © 2024, Oracle and/or its affiliates 16 原因: 停電などによるハードウェア障害、プロセス障害などにより、データベースが異常終了問題: メモリー上の変更がファイルに反映されていない可能性解決法: Single構成時: データベースの再起動 (インスタンス・リカバリ) データベース・バッファ・キャッシュ REDOログ・バッファ制御ファイルデータ・ファイル REDOログ・ファイル A A 変更履歴 A→B B 変更前データ A A→B SMON B 消失 SGA Buffer Cache SGA Buffer Cache SGA Buffer Cache GRD GRD GRD 共有ストレージインスタンス１インスタンス1用 REDO UNDO 消失インスタンス2 インスタンス3 インスタンス2用 REDO UNDO インスタンス3用 REDO UNDO データ領域再構成

可用性レベル（アプリケーションからのデータアクセスの制限度合い）障害発生からアプリケーションが待たされる時間と範囲 Oracle RACのインスタンス・リカバリ（２） Copyright © 2024, Oracle and/or its
affiliates 17 時間可用性レベル高低障害 ①インスタンス障害発生 ②GRD 再構成 ③1回目のREDO読み込みリカバリ対象のブロックを特定（読み込みのみ） ④2回目のREDO読み込みリカバリ対象のブロックに対するリカバリ処理 ⑤ロールバックアプリケーションからのアクセス待機リカバリ対象が確定すると、リカバリ対象外にアクセスするアプリケーションは通常通りアクセス可能リカバリが進むにつれ、アクセス待機させられるデータの範囲が少なくなる ※ Recovery Buddy (12c R2〜)により、「③1回目のREDO読み込み」の短縮をおこなう「アプリケーションからのアクセス待機」時間は 19cでは11g R2に比べ 1/6 に短縮 ②、③は並列処理

Grid Infrastructure概要 • Oracle RAC利用時のソフトウェア構成 • Oracle Automatic Storage Management(Oracle ASM) • Oracle Clusterware • Oracle Clusterwareのコンポーネント 4. 接続ロード・バランシングと接続フェイルオーバー 5. まとめ Agenda Copyright © 2024, Oracle and/or its affiliates 18

Oracle Database Oracle Grid Infrastructure (GI) Oracle Grid Infrastructure /
Oracle Database Oracle Grid Infrastructure • エンタープライズ・グリッド・アーキテクチャ用のインフラストラクチャを提供するソフトウェア • Oracle Clusterware および Oracle Automatic Storage Management (Oracle ASM)が含まれます【補足】バージョンの組合せ • Grid InfrastructureとOracle Databaseのバージョンの組合せについては、Oracle Supportの提供する以下のドキュメントをご確認ください • Oracle Clusterware (CRS/GI) - ASM - Database Version Compatibility (Doc ID 337737.1) Oracle RAC利用時のソフトウェア構成 Copyright © 2024, Oracle and/or its affiliates 19 共有ストレージ Grid ホーム DB ホーム Oracle Clusterware Oracle ASM リスナー Oracle Database ※リスナーはGIのものを利用

スタック構成イメージ図高性能、高可用性、管理容易性を提供するデータベースとして理想的なストレージ管理機能 Oracle Databaseのストレージ仮想化機能 • Oracle Databaseに対するボリューム・マネージャ兼ファイルシステム • シングルまたはクラスタ環境ともに利用可能
• ASMによるファイルシステム機能も提供 • Oracle Automatic Storage Management Cluster File System (Oracle ACFS) I/O性能を最大限引き出しつつ、ストレージ管理工数を大幅削減 • すべてのストレージ・デバイスにまたがったディスクの仮想化とストライピングを自動で行い、アクセスを均一化 • ストレージ・デバイスの増減にあわせた自動リバランス（本セミナーではFlex ASMの説明は省略） Database ASM OS Storage Oracle Automatic Storage Management (Oracle ASM) Copyright © 2024, Oracle and/or its affiliates 20 dbf dbf dbf dbf dbf dbf ・・・ idx idx redo tbl tbl tbl Tablespace ・・・・・・ device device device device ・・・ LU LU LU LU ・・・ RAID Group ・・・ Disk Group 詳細: • データベースに最適なストレージ構成の極意 (Oracle Database Technology Night 2016年9月)

ASMディスク・グループ ASMインスタンス • ASMディスク・グループを管理するメモリとプロセス群 • Oracle インスタンスと同じテクノロジーに基づいており、 Oracle RACと同様クラスタ化できる ASMディスク・グループ
• Oracleインスタンスからみえる仮想化ストレージ・プール障害グループ • データのミラー化コピーを配置するためのもの ASMディスク • ASMディスクを構成する個々のディスク • 通常は物理ディスクをそのまま使用 ASMメタデータ • ASMがディスク・グループの制御に使用する情報 • ディスク・グループに属しているディスク • ディスク・グループで使用可能な領域のサイズ • ディスク・グループのデータファイルのデータ・エクステントの場所 Oracle Automatic Storage Management (Oracle ASM) Copyright © 2024, Oracle and/or its affiliates 21 データベースインスタンス ASM インスタンス障害グループ A 障害グループ B ASMファイル(データファイルなど) ASMメタデータ ASMメタデータデータ ASM ディスクミラー化コピー

Oracle RACの実行に必要なインフラストラクチャを提供 Oracle Clusterware の技術スタック 1. Cluster Ready Services技術スタック •
Cluster Ready Services (CRS) CRSリソースの管理・監視 • Cluster Synchronization Services (CSS) クラスタのメンバーシップ管理・監視 2. Oracle高可用性サービス技術スタック • Oracle High Availability Services (OHAS) Clusterwareプロセスの管理・監視 Oracle Clusterwareの2種類のファイル • OCR: Oracle Cluster Registry • クラスタの構成情報の保持 • OLR: Oracle Local Registry • クラスタ内の各ノードに存在し、特定のノードごとにOracle Clusterwareの構成情報を管理。OHASで利用される • Voting Disk • 共有ストレージ上のハートビート通信経路 Oracle Clusterware Copyright © 2024, Oracle and/or its affiliates 22 共有ストレージ Voting Disk OCR CSS CRS CSS CSS CRS CRS Listener Oracle Listener Oracle Listener Oracle CRSリソース例 OLR OLR OLR OHAS OHAS OHAS ※OCRとVoting Diskは Oracle ASMに配置 (スタンドアロン・クラスタのインストールでは共有ファイル・システムへ格納可能) Oracle ASMで標準、または高い冗長性のディスク・グループを使用することで複数のVoting Diskが確実に構成されるまた、OCRは最大５つの場所に配置できる Oracle Clusterware プロセス Oracle Clusterware を監視 VIP VIP VIP

Cluster Synchronization Services (CSS) クラスタ・メンバーシップの管理 • ハートビートをおこない他ノードの生存確認 • ハートビートが途絶えると、障害ノードを切り離す •
ハートビートが一定時間途切れるとCSSが障害として検知 • もっともメンバーシップが多いグループでクラスタを再構成 Oracle Clusterwareのコンポーネント Copyright © 2024, Oracle and/or its affiliates 23 共有ストレージ Voting Disk CSS CSS CSS 共有ストレージ Voting Disk CSS CSS CSS クラスタ再構成ノード切り離し ※1 ※2 ※1: タイムアウト値はmisscount(秒)に依存 ※2: タイムアウト値はdisktimeout(秒)などに依存

Instant Failure Detection ※ • ExadataはCSS間ハートビートと並行して短時間でのノード障害検出機能がある(約2秒) • 通常、サーバ障害の検出では長いタイムアウトを設定し、誤検知によるクラスタからのサーバ除外を回避
• ハートビートへの応答が遅い原因が、 CPUが高負荷状態なのか、サーバ障害によるものなのかをすぐに区別するのは難しいため • Exadataは迅速なサーバ障害確定にRDMAを利用 • RDMAはH/Wを使用するためS/Wが遅くてもリモートのポートは応答を返す • 4つのRDMA読み取りが、送信元/ターゲットポートのすべての組み合わせで疑わしいサーバに送信 • 4つの読み取りすべてが失敗した場合、サーバはクラスタから削除【補足】 • RoCE: RDMA over Converged Ethernet • Ethernet上でInfiniBand RDMAソフトウェアを実行するためのプロトコル • Open Consortiumにより規定 • RDMA: リモート・ダイレクト・メモリ・アクセス • 1台のコンピューターがOSやCPUの関与なしにリモート・コンピューターからデータにアクセスする機能 • RDMAアクセスの場合、ネットワーク・カードは、余分なコピーやバッファリングなしでメモリーを直接読み取り/書き込みすることができるため、待ち時間が非常に短くなる • RDMAはInfiniBandとともにExadataに導入され、Exadataの高性能アーキテクチャの基本的な部分参考）Exadata RoCE Instant Failure Detection (Fast Node Death Detection) Copyright © 2024, Oracle and/or its affiliates 24 RDMA NIC Port #1 NIC Port #2 NIC Port #1 NIC Port #2 詳細: Exadata X8Mの紹介：OLTPとアナリティクスの両方の点で共有ストレージのすべての利点を備えたインメモリ・パフォーマンス ※ Exadata System Software 19.3以降のExadata X8Mと統合 Grid Infrastructure 12.1.0.2 BP7以降

Cluster Ready Services (CRS) / Event Manager (EVM) およびOracle Notification
Service (ONS) Cluster Ready Services (CRS) • CRSリソースの起動、停止、監視 • 障害を検知すると、リソースの再起動又はフェイルオーバーを試行 • CRSリソースの構成及びステータスはOracle Cluster Registry(OCR)に記録 Event Manager (EVM)および Oracle Notification Service (ONS) • EVMはアプリケーションに対するイベントの発行をおこなう • ONSはイベント通知のためのサービス • Fast Application Notification (FAN) で利用 ※ 後述 Oracle Clusterwareのコンポーネント Copyright © 2024, Oracle and/or its affiliates 25 共有ストレージ OCR CRS CRS CRS Listener Oracle Listener Oracle Listener Oracle VIP VIP VIP クラスタ再構成 VIP 共有ストレージ OCR CRS CRS CRS クラスタ再構成 EVM EVM EVM ONS ONS ONS インスタンス・ダウン検知 Oracleクライアントへ通知リソースが再起動できない場合はフェイルオーバー

障害箇所障害内容 Oracleクライアント・セッションへの影響障害からの復旧の動き障害からの復旧の流れ (図のボックスの長さはあくまでもイメージです) Oracle Database
致命的でないバックグラウンド・プロセス障害影響せず Oracleインスタンスにより当該バックグラウンド・プロセスの再起動ー致命的なバックグラウンド・プロセス障害一時的にアクセス不可正常ノード上の Oracleインスタンスによるインスタンス・リカバリ実施 Grid Infrastructure CRS障害影響せず CRS再起動ー CSS障害一時的にアクセス不可当該ノードはOS再起動他の正常ノードによるクラスタ再構成。 (以下と同様の流れ) ハードウェア障害電源断など一時的にアクセス不可他の正常ノードによるクラスタ再構成障害からの復旧の流れ Copyright © 2024, Oracle and/or its affiliates 26 障害検出 CSS再構成 GRD再構成 CRSリソース(VIPなど)のフェイルオーバー 1回目REDO読み込み 2回目REDO読み込み(リカバリ処理) 時間障害通常利用一部は処理待ちアプリケーションは処理待ち時間障害通常利用一部は処理待ち処理待 ※Exadataの場合、ノード障害時の排除時間は２秒 (Instant Failure Detectionによる)

Oracle Restart • シングル・インスタンス環境におけるOracle Databaseの可用性を向上させるために利用 • シングル・インスタンス環境でOracle ASMを利用する場合においても利用
• Oracle Clusterwareのサブセット。Oracle Clusterwareからクラスタ構成の管理を省略したもの • ハードウェア障害やソフトウェア障害が発生した後やデータベース・ホスト・コンピュータが再起動した場合に常に、様々な Oracleコンポーネントを自動的に再起動できる参考）Oracle Restart Copyright © 2024, Oracle and/or its affiliates 27 Oracle Database Oracle Grid Infrastructure (GI) Grid ホーム DB ホーム Oracle Restart Oracle ASM Oracle Database

Grid Infrastructure概要 4. 接続ロード・バランシングと接続フェイルオーバー • Single Client Access Name(SCAN) • 接続先の決定 • 接続時ロード・バランシング（Oracle Client機能） • サーバ側接続ロード・バランシング • 接続時フェイルオーバー（Oracle Client機能） • 確立済みコネクションの異常切断への対応（Application Continuity） • コネクション・プール利用時のロード・バランシングとフェイルオーバー • Demo 5. まとめ Agenda Copyright © 2024, Oracle and/or its affiliates 28 詳細: • Oracle Databaseのネットワーク接続 (Oracle Database Technology Night #52)

SCANおよびSCANの構成 Single Client Access Name (SCAN) • クラスタ内で実行中のOracle Databaseにアクセスする際の単一の名前（11g
R2〜） • SCAN導入前と比べ、クライアントおよびサーバの接続設定の手間や複雑さを排除 • ロードバランシングやフェイルオーバー機能の設定 • ノード追加 / 削除時の設定変更 • SCAN導入前の tnsnames.ora ファイルの記述例 • ノード上のVIPを直接指定。ノード追加、削除時に修正が必要 SCANの構成 • DNSにSCAN名に対応する3個のIPアドレス (SCAN VIP)を登録 • SCANの名前解決で3個の内のいずれかのアドレスが戻される (DNSラウンド・ロビンに依存) • SCAN導入後の tnsnames.ora ファイルの記述例 Single Client Access Name (SCAN) Copyright © 2024, Oracle and/or its affiliates 29 (DESCRIPTION = (LOAD_BALANCE=ON)(FAILOVER=ON) (ADDRESS=(PROTOCOL=TCP)(HOST=vip1)(PORT = port)) (ADDRESS=(PROTOCOL=TCP)(HOST=vip2)(PORT = port)) (ADDRESS=(PROTOCOL=TCP)(HOST=vip3)(PORT = port)) (CONNECT_DATA=(SERVICE_NAME=SERVICE_A))) (DESCRIPTION = (LOAD_BALANCE=ON)(FAILOVER=ON) (ADDRESS=(PROTOCOL=TCP)(HOST=scanhost)(PORT = port)) (CONNECT_DATA=(SERVICE_NAME=SERVICE_A))) DNSサーバ scanhost scanvip1 scanvip2 scanvip3 (DESCRIPTION = (LOAD_BALANCE=ON)(FAILOVER=ON) (ADDRESS=(PROTOCOL=TCP)(HOST=scanvip1)(PORT = port)) (ADDRESS=(PROTOCOL=TCP)(HOST=scanvip2)(PORT = port)) (ADDRESS=(PROTOCOL=TCP)(HOST=scanvip3)(PORT = port)) (CONNECT_DATA=(SERVICE_NAME=SERVICE_A))) もしくは

SCAN VIPとSCANリスナーはクラスタを構成するいずれかのノード上で稼働 • SCAN VIPとSCANリスナーが実行されているノードで障害が発生すると別のノードへフェイルオーバー • SCANリスナーはクライアントからの接続リクエストを、ローカル・リスナーにリダイレクト • サーバ側接続ロード・バランシング（後述）
CRSリソースとしてのSCAN VIPおよびSCANリスナー Copyright © 2024, Oracle and/or its affiliates 30 tnslsnr Oracle インスタンス1 vip1 tnslsnr Oracle インスタンス2 vip2 tnslsnr Oracle インスタンス3 vip3 tnslsnr Oracle インスタンス4 vip4 tnslsnr1 (scan) scanvip1 tnslsnr2 (scan) scanvip2 tnslsnr3 (scan) scanvip3 SERVICE_A ノード障害時にはフェイルオーバー

接続時ロード・バランシング（Oracle Client機能）接続時ロード・バランシング • Client-side Connect-Time Load Balancing • Oracle
Listenerを(ランダムに)選択 • 実際に接続先が決まるのはサーバ側接続ロード・バランシングによる接続先の決定（１） Copyright © 2024, Oracle and/or its affiliates 31 tnslsnr Oracle インスタンス1 vip1 tnslsnr Oracle インスタンス2 vip2 tnslsnr Oracle インスタンス3 vip3 tnslsnr Oracle インスタンス4 vip4 tnslsnr1 (scan) scanvip1 tnslsnr2 (scan) scanvip2 tnslsnr3 (scan) scanvip3 SERVICE_A Oracle Client (DESCRIPTION = (LOAD_BALANCE=ON)(FAILOVER=ON) (ADDRESS=(PROTOCOL=TCP)(HOST=scanvip1)(PORT = port)) (ADDRESS=(PROTOCOL=TCP)(HOST=scanvip2)(PORT = port)) (ADDRESS=(PROTOCOL=TCP)(HOST=scanvip3)(PORT = port)) (CONNECT_DATA=(SERVICE_NAME=SERVICE_A)) ) tnsnames.ora ファイル

サーバ側接続ロード・バランシング • SCANリスナーはどのサービスをどのOracleインスタンスが担当しているかを認識している • サービスがアクティブになっているOracleインスタンスに接続リクエストをリダイレクトして負荷分散する • ロード・バランシング・アドバイザ接続先の決定（２）
Copyright © 2024, Oracle and/or its affiliates 32 tnslsnr Oracle インスタンス1 vip1 tnslsnr Oracle インスタンス2 vip2 tnslsnr Oracle インスタンス3 vip3 tnslsnr Oracle インスタンス4 vip4 tnslsnr1 (scan) scanvip1 tnslsnr2 (scan) scanvip2 tnslsnr3 (scan) scanvip3 SERVICE_A Oracle Client ①接続リクエスト発行 ②リダイレクト tnslsnr (scan) SERVICE_A Oracle インスタンス1 Oracle インスタンス2 Oracle インスタンス3 Oracle インスタンス4 SERVICE_Aの接続先候補

接続時フェイルオーバー (Connect-Time Failover: CTF) • 障害ノードを避けて正常ノードと接続 • LOAD_BALANCE=OFF の場合、上から接続試行 •
SCANリスナーは可用性のために複数存在接続時フェイルオーバー（Oracle Client機能） Copyright © 2024, Oracle and/or its affiliates 33 tnslsnr Oracle インスタンス1 vip1 tnslsnr Oracle インスタンス2 vip2 tnslsnr Oracle インスタンス3 vip3 tnslsnr Oracle インスタンス4 vip4 tnslsnr1 (scan) scanvip1 tnslsnr2 (scan) scanvip2 tnslsnr3 (scan) scanvip3 SERVICE_A Oracle Client (DESCRIPTION = (LOAD_BALANCE=ON)(FAILOVER=ON) (ADDRESS=(PROTOCOL=TCP)(HOST=scanvip1)(PORT = port)) (ADDRESS=(PROTOCOL=TCP)(HOST=scanvip2)(PORT = port)) (ADDRESS=(PROTOCOL=TCP)(HOST=scanvip3)(PORT = port)) (CONNECT_DATA=(SERVICE_NAME=SERVICE_A)) ) tnsnames.ora ファイル

アプリケーション・コンティニュイティ / Application Continuity • アプリケーション・コンティニュイティ対応接続ドライバは Oracleサーバに発行した処理を記憶 • Oracle接続ドライバがセッション切断を検出すると自動再接続
• COMMIT時の障害はトランザクション・ガードでトランザクションの状態を確認してCOMMIT完了していなければトランザクションを自動再実行 • Oracle接続ドライバがセッション切断を検出すると (1) 再接続 (2) トランザクション状態の確認 (3) トランザクション再実行まで自動で行う。 • アプリケーションから見るとエラーを検出せずにトランザクションが完了確立済みコネクションの異常切断への対応 Copyright © 2024, Oracle and/or its affiliates 34 Oracle Client Oracle インスタンス1 サーバプロセス LGWR Oracle インスタンス2 サーバプロセス LGWR Oracle 接続ドライバー DML 1 DML 2 COMMIT : DML 1 DML 2 COMMIT : 再接続アプリケーション DML 1 DML 2 DML 1 DML 2 COMMIT : トランザクション状態を管理する内部表 ⇒トランザクション・ガード機能で用意コミット無しトランザクション・ガード機能でコミット有無を確認コミット無し REDOログに書込み

アプリケーション・コンティニュイティ対応クライアントとリクエスト境界リクエスト境界 • アプリケーション・コンティニュイティが想定するコード: 1. Oracle製コネクション・プールからコネクション取得 2. DML発行 3. 最後に1回だけCOMMIT
4. コネクション・プールに返却確立済みコネクションの異常切断への対応（２） Copyright © 2024, Oracle and/or its affiliates 35 【主な対応クライアント】 ... 後述のFAN対応クライアントのサブセット • Oracle JDBC Thin • Replay Driverを利用 • Oracle Universal Connection Pool (UCP) • Oracle WebLogic Server • Oracle Tuxedo for non-XA datasources • Oracle Call Interface (OCI) Session Pool • SQL*Plus • ODP.Net Unmanaged Provider • Managed DriverとCore Driverは未対応 ⇒ 23cより対応 • UCPを使ったサードパーティ製Java Application Server • Tomcatなど詳細はOracle Supportの提供する以下のドキュメントをご確認ください • Client Validation Matrix for Application Continuity (Doc ID 2511448.1) ConnectionPool ConnectionPool getConnection() close() DML 1 DML n COMMIT リクエスト境界

アプリケーション・コンティニュイティの考慮点とアプリケーション・コンティニュイティがカバーできる領域【考慮点】 • 可変オブジェクト(SYSDATEなど) • 副作用のあるプロシージャの扱い(UTL_MAILなど) • 自律トランザクション(Autonomous Transaction) •
アプリケーション・コンティニュイティで再実行できないケース (バッチ処理に多い複数回コミットなど) • 詳細はOracle Database Tech Night ＃39を参照「アプリケーション・コンティニュイティセッション異常切断時の更新トランザクション自動再実行」 • 資料 • YouTube • マニュアル記述もご確認ください。 • アプリケーション・コンティニュイティに関する制限および他の考慮事項アプリケーション・コンティニュイティがカバーできる領域: • コネクション・プールを使用した(オンライン・トランザクション処理系)アプリケーション 1. コネクション・プールから論理コネクションを取得 2. 最後に1回COMMIT 3. コネクション・プールに論理コネクションを返却アプリケーション・コンティニュイティではカバーできない領域: • 分散トランザクション • データベース・リンク、XA • コネクション・プールを使用せずに直結している (バッチ処理系)アプリケーション • リプレイ境界内で複数回COMMITを発行する • 非トランザクション系ツール • RMAN/Data Pump/SQL*Loader ... 確立済みコネクションの異常切断への対応（３） Copyright © 2024, Oracle and/or its affiliates 36

高速アプリケーション通知 (Fast Application Notification: FAN) Fast Application Notification (FAN) •
Oracle Clusterwareからクライアントにイベント通知 • Runtime Load Balancing (RLB)イベント • UP/DOWNイベントランタイム接続ロード・バランス • (Runtime Connection Load Balance: RCLB) • サーバ側で最適な負荷配分を算出して通知 • プールされたコネクションから負荷配分を考慮してSQLを実行するインスタンスを決める高速接続フェイルオーバー • (Fast Connection Failover: FCF) • サービスの起動および停止、ノード停止イベントの通知 • ノード障害時にクライアントは停止したノードとのコネクションを TCPタイムアウトを待たずに切断できるコネクション・プール利用時のロード・バランシングとフェイルオーバー Copyright © 2024, Oracle and/or its affiliates 37 共有ストレージ OCR CRS CRS CRS クラスタ再構成 EVM EVM EVM ONS ONS ONS インスタンス・ダウン検知 Oracle クライアントへ通知 Oracle Client Connection Pool 無効な接続の開放必要に応じて接続追加

特定ノードのサービスを停止させる場合のセッション・ドレイン 1. 特定ノードでsrvctl stop instance発行 2. 物理コネクションのドレインを行い、インスタンス停止 FANによるOracleインスタンスの計画停止（FCFの活用） Copyright ©
2024, Oracle and/or its affiliates 38 例）srvctl stop instance -node ノード名 -drain_timeout 60 –stopoption TRANSACTIONAL -failover –force Oracle インスタンス1 Oracle インスタンス2 SERVICE_A FANイベント ※ Connection Pool Clusterware Clusterware Oracle Client ①サービス停止 ②DOWN 通知 Oracle インスタンス1 Oracle インスタンス2 SERVICE_A Connection Pool Clusterware Clusterware Oracle Client ③インスタンス1との物理コネクションはプールに返却されたら切断 SERVICE_A ④新規の物理コネクションはインスタンス2に接続 ⑤drain_timeout まで待機 ⑥stopoption 設定に基づいて、インスタンスを shutdown ※異常時のDOWNイベントとは区別される

オンライン業務を止めないために Oracle RACとコネクション・プール Copyright © 2024, Oracle and/or its affiliates
39 Oracle インスタンス1 Oracle インスタンス2 SERVICE_A FAN イベント Connection Pool Clusterware Clusterware Oracle Client 停止起動計画停止 (ローリング・パッチ適用など) コマンドによるOracleインスタンスの停止/起動 • トランザクション中のOracleインスタンスを安全に停止させる ⇒ FAN - 高速接続フェイルオーバー(FCF) FAN イベント Oracleインスタンス/サービス起動 • 新規受付可能なインスタンスへの新たな接続リクエスト ⇒ FAN - 高速接続フェイルオーバー(FCF) ⇒ FAN -ランタイム接続ロード・バランス(RCLB) 計画外停止 (DBサーバ側のクラッシュ) • クライアント側が切断されたことに気付かずにハング状態になることを避ける ⇒ FAN - 高速接続フェイルオーバー(FCF) • 切断された接続のトランザクションのエラーを救う ⇒ アプリケーション・コンティニュイティ(AC)

Demo –アプリケーションコンティニュイティ- Copyright © 2024, Oracle and/or its affiliates
40 内容 SQL実行中にノード障害を起こして、アプリケーションコンティニュイティの機能を試す・ノード障害時の自動再接続・トランザクションの自動再実行 (今回はOracle接続ドライバ: SQL*Plusを使用) 構成 Before After dbase_testテーブル接続ノード(CDB) Before After dbase1 dbase2 障害発生させて切り替える INSERT時に障害発生 Oracle Client ※ORA-41412のエラーが出るのでv$instanceはselectできない

Demo –アプリケーションコンティニュイティ- Copyright © 2024, Oracle and/or its affiliates
41 再接続アプリケーション Oracle接続ドライバ (SQL*Plus) SQL 1 SQL 2 SQL n COMMIT SQL 1 SQL 2 SQL n COMMIT Oracleサーバ SQL 1 SQL 2 SQL n COMMIT SQL 1 SQL 2 Oracleクライアント Oracleサーバ ③ノード障害を発生 # kill -9 プロセス(pmon) ②INSERT文を発行 SQL 1> INSERT INTO dbase_test VALUES(2,'BBB’); SQL 2> INSERT INTO dbase_test VALUES(3,'CCC'); Demoの流れ ①dbase_testテーブル、接続ノードを表示 ②INSERT文を発行 ③ノード障害を発生アプリケーションコンティニュイティが作用 ④再度、接続ノードを表示自動再接続の確認 ⑤dbase_testテーブルを表示トランザクションの自動再実行を確認事前確認 ①dbase_testテーブル、接続ノードを表示事後確認 ④再度、接続ノードを表示 ⑤dbase_testテーブルを表示

▪ Oracle Real Application Clustersの概要 ▪ Oracle RACとシングルデータベースとの違い • データアクセスの方法
▪ Oracle Grid Infrastructureの概要 • Oracle ASMとOracle Clusterware • 障害回復の流れ ▪ 接続ロードバランスと接続フェイルオーバー • SCANを使った接続 • Demo -アプリケーションコンティニュイティ- まとめ Copyright © 2024, Oracle and/or its affiliates 43

Oracle Database 入門 - Oracle Real Application Cl...

Oracle Database 入門 - Oracle Real Application Clusters【アーキテクチャ詳説編】

oracle4engineer PRO

More Decks by oracle4engineer

Other Decks in Technology

Featured

Transcript

Oracle Real Application Clusters アーキテクチャ詳説編日本オラクル株式会社クラウドエンジニアリング統括オラクルデジタル本部第一クラウドアーキテクト部小畑

1. Oracle Real Application Clusters概要 2. Oracle RACとシングル・データベースとの違い 3. Oracle

1. Oracle Real Application Clusters概要 • Oracle Real Application Clusters(Oracle

【シングル構成】 • 障害時にサービスが停止する構成 • 予備サーバにOracleソフトウェアをインストールし、再構築する必要がある【高可用性構成: HA構成】 • 障害時に切り替える待機サーバをあ

Oracle Real Application Clustersとは • システム障害によるダウンタイムを最小に抑え、データ保護と連続的なサービス環境を実現する Oracle Databaseのクラスタ技術特徴 •

Oracle RACの代表的な構成 Copyright © 2024, Oracle and/or its affiliates 8

参考）Oracle Exadata すべてのデータベース・ワークロードのための最高のプラットフォーム • 単一ベンダーによるサポート • データベースに特化した設計 • ハードウェアとソフトウェアの

1. Oracle Real Application Clusters概要 2. Oracle RACとシングル・データベースとの違い • アプリケーションはシングル・データベースと同じものを利用（透過性）

トランザクション系も分析系も同じアーキテクチャで対応トランザクション系 • 多数のセッションからの同時並行リクエスト • より多くの同時リクエストを処理集計/分析系 • 1つのSQL処理を並列化 •

Global Resource Directory を使ってキャッシュ状態とデータ・ブロックのロック状態を管理 Global Resource Directory (GRD) • リソース保持ノードとロック状態が記録されるDirectory

インスタンス障害 • インスタンス(メモリー＋プロセス)上の情報が失われる障害 Oracle RAC構成時: • 障害が発生したインスタンスを再起動しなくてもよい • 正常ノードが障害ノードのREDOログを読み込んでリカバリ実施 •

可用性レベル（アプリケーションからのデータアクセスの制限度合い）障害発生からアプリケーションが待たされる時間と範囲 Oracle RACのインスタンス・リカバリ（２） Copyright © 2024, Oracle and/or its

1. Oracle Real Application Clusters概要 2. Oracle RACとシングル・データベースとの違い 3. Oracle

Oracle Database Oracle Grid Infrastructure (GI) Oracle Grid Infrastructure /

ASMディスク・グループ ASMインスタンス • ASMディスク・グループを管理するメモリとプロセス群 • Oracle インスタンスと同じテクノロジーに基づいており、 Oracle RACと同様クラスタ化できる ASMディスク・グループ

Oracle RACの実行に必要なインフラストラクチャを提供 Oracle Clusterware の技術スタック 1. Cluster Ready Services技術スタック •

Cluster Synchronization Services (CSS) クラスタ・メンバーシップの管理 • ハートビートをおこない他ノードの生存確認 • ハートビートが途絶えると、障害ノードを切り離す •

Instant Failure Detection ※ • ExadataはCSS間ハートビートと並行して短時間でのノード障害検出機能がある(約2秒) • 通常、サーバ障害の検出では長いタイムアウトを設定し、誤検知によるクラスタからのサーバ除外を回避

Cluster Ready Services (CRS) / Event Manager (EVM) およびOracle Notification

障害箇所障害内容 Oracleクライアント・セッションへの影響障害からの復旧の動き障害からの復旧の流れ (図のボックスの長さはあくまでもイメージです) Oracle Database

Oracle Restart • シングル・インスタンス環境におけるOracle Databaseの可用性を向上させるために利用 • シングル・インスタンス環境でOracle ASMを利用する場合においても利用

1. Oracle Real Application Clusters概要 2. Oracle RACとシングル・データベースとの違い 3. Oracle

SCANおよびSCANの構成 Single Client Access Name (SCAN) • クラスタ内で実行中のOracle Databaseにアクセスする際の単一の名前（11g

接続時ロード・バランシング（Oracle Client機能）接続時ロード・バランシング • Client-side Connect-Time Load Balancing • Oracle

接続時フェイルオーバー (Connect-Time Failover: CTF) • 障害ノードを避けて正常ノードと接続 • LOAD_BALANCE=OFF の場合、上から接続試行 •

アプリケーション・コンティニュイティ / Application Continuity • アプリケーション・コンティニュイティ対応接続ドライバは Oracleサーバに発行した処理を記憶 • Oracle接続ドライバがセッション切断を検出すると自動再接続

高速アプリケーション通知 (Fast Application Notification: FAN) Fast Application Notification (FAN) •

特定ノードのサービスを停止させる場合のセッション・ドレイン 1. 特定ノードでsrvctl stop instance発行 2. 物理コネクションのドレインを行い、インスタンス停止 FANによるOracleインスタンスの計画停止（FCFの活用） Copyright ©

オンライン業務を止めないために Oracle RACとコネクション・プール Copyright © 2024, Oracle and/or its affiliates

Demo –アプリケーションコンティニュイティ- Copyright © 2024, Oracle and/or its affiliates

Demo –アプリケーションコンティニュイティ- Copyright © 2024, Oracle and/or its affiliates

1. Oracle Real Application Clusters概要 2. Oracle RACとシングル・データベースとの違い 3. Oracle

▪ Oracle Real Application Clustersの概要 ▪ Oracle RACとシングルデータベースとの違い • データアクセスの方法