Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Exadata Database Machine: Maximum Availability Architecture (MAA) Platinum 層特化版

Exadata Database Machine: Maximum Availability Architecture (MAA) Platinum 層特化版

oracle4engineer

February 15, 2021
Tweet

More Decks by oracle4engineer

Other Decks in Technology

Transcript

  1. 停⽌のマトリックス 計画外停止 RTO / RPO* リカバリ可能なノードまたはインスタンス障害 数分 ** 災害: データ破損およびサイト障害

    数時間から数日 RPO は最後のバックアップ以降、また は ZDLRA によりほぼ 0(ゼロ) 計画メンテナンス ソフトウェア/ハードウェア更新 数分 ** データベースのメジャー・アップグレード 数分~1時間 シングル・ インスタンス データベース プライマリ可⽤性ドメイン セカンダリ可⽤性ドメイン ローカル・ バックアップ レプリケートされた バックアップ 開発、テスト、本番 – データバックアップを伴う シングル・インスタンスまたはマルチテナント・デ ータベース • Clusterware による再起動が可 能なシングル・インスタンス • RMANによる⾼度なバックアップ/リ ストア • オプションの ZDLRA を利⽤す ることで永久的増分バックアップ の取得、およびほぼゼロのRPO • ASM によるストレージの冗⻑化と データバリデーションの実施 • PDB 機能を持つマルチテナント・ データベース / リソース管理 • オンライン・メンテナンス • データ破損に対する保護 • フラッシュバック・テクノロジー BRONZE * RPO=0(明⽰的に指定されていない場合) ** Exadata システムには RAC が含まれますが、Oracle Clusterware で稼働するシングル・イ ンスタンス・データベースを備えた Bronze Exadata 構成には、コスト削減のための最⼤限の統 合密度が提供されます Copyright © 2020, Oracle and/or its affiliates, 4
  2. 本番環境/部⾨環境 SILVER Bronze に加えて以下を利⽤ • Real Application Clustering (RAC) •

    Application Continuity 計画外停止 RTO/RPO* リカバリ可能なノードまたはインスタンス障害 ゼロ** 災害: 破損およびサイト障害 RTO 数時間~数日 RPO 最後のバックアップ以降、または ZDLRによりほぼ 0(ゼロ) 計画メンテナンス ソフトウェア/ハードウェア更新 ゼロ** データベースのメジャー・アップグレード 数分~1時間 Outage Matrix RAC データベース プライマリ可⽤性ドメイン セカンダリ可⽤性ドメイン ローカル・ バックアップ レプリケートされた バックアップ MAA OTN内のチェックリスト https://www.oracle.com/technetwork/database/options/ clustering/applicationcontinuity/adb- continuousavailability-5169724.pdf ⽇本語 https://www.oracle.com/technetwork/jp/database/optio ns/clustering/applicationcontinuity/maa- continuousavailability-5169724-ja.pdf * RPO=0(明⽰的に指定されていない場合) ** ゼロを達成するには、アプリケーション・チェックリストの適⽤が必要です Copyright © 2020, Oracle and/or its affiliates, 5
  3. アプリケーションは停⽌中にエラーを認識しない • アプリケーション・コンティニュイティとOracle Real Application Clustersを使⽤ • 障害発⽣時にセッションの情報を透過的に追 跡および記録 •

    アプリケーションを変更せずに機能するよう、 データベースの内部にビルトイン • 計画外停⽌時にセッション状態を再構成し、 処理中のトランザクションを再実⾏ • 計画メンテナンス時は、TACを使⽤して1つ以 上のノードからセッションをドレインすることにより、 計画メンテナンスを実施可能 • アプリケーション変更に適応: 将来を⾒据えた保護 透過的アプリケーション・コンティニュイティ(TAC) リクエスト エラー/タイムアウトが隠される 透過的アプリ ケーション・ コンティニュイ ティ Copyright © 2020, Oracle and/or its affiliates, 6
  4. 計画メンテナンス Copyright © 2020, Oracle and/or its affiliates, 7 3

    1 4 6 5 計画メンテナンス(停⽌なし)︓ 1. データベース・サービスが再配置されるか停⽌する 2. サービスが別のRACインスタンス上で開始する 3. サービスに接続されているセッションがドレインされる 4. 新しいセッションが別のインスタンス上のサービスに接 続する 5. データベース・リクエストの結果がユーザーに返される 6. メンテナンス作業を最初のノードで開始可能になる (ローリング) 2 RAC Cluster
  5. 計画外停⽌、影響なし Copyright © 2020, Oracle and/or its affiliates, 8 Primary

    Active Data Guard Standby 1 2 3 データベースの停止または中断: 1. データベース・リクエストが停止またはタイムアウトによっ て中断される 2. セッションがRACクラスタ(またはスタンバイ)に再接続し、 3. データベース・リクエストが自動的に再実行される 4. データベース・リクエストの結果がユーザーに返される 4 2 3
  6. 1. Oracle Clusterware Serviceを使⽤(デフォルトのサービスは使⽤しない) 2. 推奨されている接続⽂字列を使⽤ 3. 接続プールに対してFANを構成 4. サービスをドレイン

    5. アプリケーション・コンティニュイティまたは透過的アプリケーション・コンティニュイティを使⽤ アプリケーションの停⽌時間ゼロ達成のためのチェックリスト 1) MAAホワイト・ペーパー: MAAソリューションの継続的サービスのためのアプリケーション・チェックリスト 2) RHPhelper を使⽤して、計画メンテナンス中のExadataの停⽌時間を最⼩化( Using RHPhelper to Minimize Downtime During Planned Maintenance on Exadata MOS 2385790.1) 3) フリートパッチ適⽤およびプロビジョニングとメンテナンスによるMAAプラクティスを運⽤に組み込む Copyright © 2020, Oracle and/or its affiliates, 9
  7. 停⽌のマトリックス 計画外停止 RTO/RPO* リカバリ可能なノードまたはインスタンス障害 数秒 災害: 破損およびサイト障害 数秒 RPO:ゼロまたは数秒 計画メンテナンス

    ソフトウェア/ハードウェア更新 0(ゼロ) データベースのメジャー・アップグレード 数秒 プライマリ・リージョン セカンダリ・リージョン ローカル・ バックアップ リモート・ スタンバイ プライマリ ローカル・ スタンバイ ローカル・ バックアップ AD2 AD1 ミッション・クリティカル Silver に加えて以下を利⽤ • Active Data Guard • 包括的なデータ保護 MAAアーキテクチャ: • AD(Availability Domain) また はリージョン全体で少なくとも1つの スタンバイデータベースが必要 • データセンター(またはAD)内のプライマリ を、別のデータセンター内のスタンバイ データベースにレプリケート • Active Data Fast-Start Failover(FSFO) • プライマリ環境とスタンバイ環境両⽅での ローカル・バックアップ GOLD DG FSFO RPO=0(明⽰的に指定されていない場合) ** ゼロを達成するには、アプリケーション・チェックリストの適⽤が必要です Copyright © 2020, Oracle and/or its affiliates, 10
  8. Active Data Guard の概要 プライマリデータベース 読取り/書込みでオープン スタンバイデータベース 読取り専⽤でオープン いかなる距離でもデータ損失ゼロ ⾃動ブロック修復機能

    読取り専⽤ワークロード、またはほぼ 読取りのワークロードをスタンバイ・ データベースにオフロード • データ損失ゼロの同期レプリケーション • データベースのローリング・アップグレードによる、計 画メンテナンスの停⽌時間の短縮 • ⾃動フェイルオーバーによる⾼可⽤性 DMLのリダイレクト RACに対する マルチインスタンス REDO Apply (インメモリをサポート) Copyright © 2020, Oracle and/or its affiliates, 11
  9. Primary Database Far Sync Instance Active Standby Database • Oracleの制御ファイルとログ・ファイル

    • データベース・ファイルなし • メディア・リカバリなし • 転送圧縮や暗号化のオフロード • データ損失ゼロのフェイルオーバー・ター ゲット • データベースを読取り専⽤でオープン • Oracleの継続的な検証 • ⼿動または⾃動のフェイルオーバー SYNC 距離の制限あり ASYNC 距離の制限なし WAN経由でのREDO圧縮 いかなる距離でもデータ損失ゼロの保護 Active Data Guard Far Sync • 本番コピー Copyright © 2020, Oracle and/or its affiliates, 12
  10. Gold に加えて以下を利⽤ • Oracle GoldenGate アクティ ブ/アクティブ・レプリケーション • シャーディングおよびエディションベースの再定 義機能(オプション)

    MAA Architecture: • それぞれの GoldenGate “プライマリ”レプリカ をExadata、RAC および Active Data Guard によって保護 • データセンター(またはAD)内のプライマリをリ モート・データセンター(またはAD)内の別のプ ライマリにレプリケート • Oracle GG およびエディション・ベースの 再定義により、アプリケーション・アップグ レードの停⽌時間ゼロを実現 • シャーディングにより、スケーラビリティと障害 の分離を実現 • 両⽅のサイトでのローカル・バックアップ • GG レプリカへのカスタム・フェイルオーバー により停⽌時間ゼロを実現 ⾮常にクリティカル PLATINUM プライマリ・リージョン セカンダリ・リージョン ローカル・ バックアップ ローカル・ バックアップ AD2 AD1 GG レプリケーション AD1 AD2 スタンバイ スタンバイ プライマリ プライマリ 停⽌のマトリックス 計画外停止 RTO/RPO* リカバリ可能なノードまたはインスタンス障害 ゼロ** 破損およびサイト障害などの災害 ゼロ*** 計画メンテナンス もっとも一般的なソフトウェア/ハードウェア更新 ゼロ** データベースのメジャー・アップグレード、アプリケーションの アップグレード ゼロ*** RPO=0(明⽰的に指定されていない場合) ** ゼロを達成するには、アプリケーション・チェックリストの適⽤が必要です *** アプリケーション・フェイルオーバーは GG レプリカへのカスタム・フェイルオーバー Copyright © 2020, Oracle and/or its affiliates, 13
  11. • ディザスタ・リカバリ・フェイルオーバー⽤に最⼩で2リージョン • リージョンはローカライズされた地理的エリア • US⻄海岸 – プライマリの例 • US東海岸

    – セカンダリの例 • 各リージョンには最⼩で2つの可⽤性ドメイン(AD)が必要 • 可⽤性ドメインの特徴 • ADは互いに分離、フォルト・トレラント • ADは電⼒、冷却、ADネットワークなどのインフラストラクチャを 共有しない • 1つのADの障害が他のADに影響しない • リージョン内のADは同じ地理的エリア内で⾼速ネットワーク経 由で接続 データセンターのアーキテクチャと要件 Copyright © 2020, Oracle and/or its affiliates, 14 AD1 AD2 プライマリ・リージョン – US⻄海岸 AD1 AD2 セカンダリ・リージョン – US東海岸 待機時間1ミリ秒未満 の⾼速ネットワーク
  12. Platinumリファレンス・アーキテクチャ Copyright © 2020, Oracle and/or its affiliates, 15 ProdA

    STBYA ProdB AD1 AD2 AD2 AD1 STBYB Primary Region 1 – West US Secondary Region – East US データ損失ゼロのSync転送 データ損失ゼロのSync転送 Active Data Guard Fast-Start Failover, Oracle GoldenGate Replication Read アプリケーション層 Read/Write Read アプリケーション層 Read/Write
  13. リファレンス・アーキテクチャ – アプリ停⽌時間ゼロ、データ損失ゼロ (災害シナリオ︓データセンター全体の損失) Copyright © 2020, Oracle and/or its

    affiliates, 16 ProdA ProdA ProdB AD1 AD2 AD2 AD1 STBYB オプションとしてクライアントの ProdBへのフェイルオーバー Data Guardの⾃動フェイルオー バーレプリカの同期によって最終 的にデータ損失ゼロを達成 Primary Region 1 – West US Secondary Region – East US Active Data Guard Fast-Start Failover, Oracle GoldenGate Replication Read/Write アプリケーション層 Read アプリケーション層 Read/Write ProdBレプリカによって アプリとDBの停⽌時間ゼロ Read/Write
  14. ProdA STBYA ProdB AD1 AD2 AD2 AD1 STBYB 障害が発⽣したシステムを再開す る

    Data Guardがスイッチオーバー して元の状態に戻る Primary Region 1 – West US Secondary Region – East US リファレンス・アーキテクチャ – スイッチバック ProdAがプライマリに戻り、STBYA+がスタンバイに戻る Copyright © 2020, Oracle and/or its affiliates, 17 Active Data Guard Fast-Start Failover, Oracle GoldenGate Replication Read アプリケーション層 Read/Write Read アプリケーション層 Read/Write
  15. リファレンス・アーキテクチャ – アップグレード・シナリオ Copyright © 2020, Oracle and/or its affiliates,

    18 ProdA STBYA ProdB AD1 AD2 AD2 AD1 STBYB V1 V1 V1 V1 Primary Region 1 – West US Secondary Region – East US Read アプリケーション層 Read/Write Active Data Guard Fast-Start Failover, Oracle GoldenGate Replication データ損失ゼロのSync転送 データ損失ゼロのSync転送 Read アプリケーション層 Read/Write
  16. アップグレード・シナリオ ステップ1︓スタンバイのアップグレード Copyright © 2020 Oracle and/or its affiliates. 19

    ProdA STBYA ProdB AD1 AD2 AD2 AD1 LSTBYB V1 V1 V1 V2 Primary Region 1 – West US Secondary Region – East US Read アプリケーション層 Read/Write Active Data Guard Fast-Start Failover, Oracle GoldenGate Replication データ損失ゼロのSync転送 データ損失ゼロのSync転送 アプリケーション層 Read/Write ロジカルスタンバイ への変換と アップグレード 同期と検証
  17. ProdA STBYA StbyB AD1 AD2 AD2 AD1 PRODB V1 V2

    V1 V2 Primary Region 1 – West US Secondary Region – East US Read アプリケーション層 Read/Write Active Data Guard Fast-Start Failover, Oracle GoldenGate Replication データ損失ゼロのSync転送 データ損失ゼロのSync転送 アプリケーション層 Read/Write Prod Bへの スイッチオーバー Read V2にアップグレードした Oracle Home から起動 スタンバイとして設定 再同期 アップグレード・シナリオ ステップ2︓スイッチオーバーとV1、V2の共存 Copyright © 2020 Oracle and/or its affiliates. 20
  18. 最終的な判断ポイント • 利点 1. 停⽌時間ゼロ、データ損失ゼロ 2. V1とV2を同時に評価 3. V1とV2間のGoldenGateレプリケーションによって容易なスイッチオーバーとフォールバックが可能 •

    V2を検証し許容可能と判断されたら、次に以下を実施︓ • オプション 1: 同時にV1のプライマリとスタンバイをアップグレード(シンプルな⽅法) • オプション 2: V1 のスタンバイを最初にアップグレード、しばらく利⽤して検証を実施し、最終的にスイッチオーバ ーしてV1をアップグレード(より保護的な⽅法) オプション2の⽅法は以下のスライドで説明しています アップグレードにおけるPlatinum 構成の優れた点 Copyright © 2020, Oracle and/or its affiliates, 21
  19. ProdA STBYA StbyB AD1 AD2 AD2 AD1 PRODB V1 V2

    V2 V2 Primary Region 1 – West US Secondary Region – East US アプリケーション層 Read/Write Active Data Guard Fast-Start Failover, Oracle GoldenGate Replication データ損失ゼロのSync転送 データ損失ゼロのSync転送 アプリケーション層 Read/Write ロジカルスタンバイへの 変換とアップグレード 同期と検証 Read アップグレード・シナリオ ステップ3︓スタンバイのアップグレード Copyright © 2020, Oracle and/or its affiliates, 22
  20. STBYA PRODA StbyB AD1 AD2 AD2 AD1 PRODB V2 V2

    V2 V2 Primary Region 1 – West US Secondary Region – East US Active Data Guard Fast-Start Failover, Oracle GoldenGate Replication データ損失ゼロのSync転送 データ損失ゼロのSync転送 アプリケーション層 Read/Write Read 新しいProdAに スイッチオーバー V2にアップグレードした ORACLE Homeから起動 スタンバイの再設定 再同期 アプリケーション層 Read/Wri te Read アップグレード・シナリオ ステップ3︓スイッチオーバーしてすべてをV2のバージョンへ Copyright © 2020, Oracle and/or its affiliates, 23
  21. Exadataを使⽤する場合の Platinum MAA構成での計画外停⽌ Copyright © 2020, Oracle and/or its affiliates,

    24 計画外停⽌ データベース停⽌時 間(RTO) アプリケーショ ン への影響 データ損失(RPO) おもな実現⼿段 Exadataクラスタの ネットワーク・ファブリッ ク またはストレージ の障害 0(ゼロ) 0(ゼロ)またはほぼ0 (ゼロ) 0(ゼロ) Exadata ASMディスク・グループの⾼冗⻑性構成 RACインスタンス またはノードの障害 0(ゼロ) 1桁秒 0(ゼロ) Exadata、RAC MAAチェックリストを適⽤したアプリケー ション・コンティニュイティ データ破損 0(ゼロ) 0(ゼロ)または 障害の分離 0(ゼロ)または 論理的影響の分 離 Active Data Guard MOS 1302539.1 フラッシュバック・テクノロジー ZDLRA データベース、クラス タ、またはサイトの障 害を含む災害 GoldenGate レプリ カを利⽤できるため0 (ゼロ) 0(ゼロ)またはほぼ 0(ゼロ) Global Data Services の 場合は1桁秒 最終的には0(ゼロ) GoldenGate Data Guard Fast-Start Failover カスタムのアプリ・フェイルオーバー、 ないしは、Global Data Services or Site Guard
  22. Exadataを使⽤する場合の Platinum MAA構成での計画停⽌ Copyright © 2020, Oracle and/or its affiliates,

    25 計画メンテナンス データベース停⽌時間 (RTO) アプリケーションへの影響 おもな実現⼿段 Exadata インフラストラ クチャSWまたはHWの更 新 0(ゼロ) 0(ゼロ)またはほぼ0(ゼ ロ) Exadataプラットフォーム ASMディスク・グループの⾼冗⻑性構成 データベースとGrid Infrastructureのソフ トウェア更新 0(ゼロ) 0(ゼロ) RAC Application Continuity Continuous Availability Application Continuity for the Oracle Database データベースのアップグ レードまたは⾮ローリング 更新 0(ゼロ) 0(ゼロ)またはほぼ0(ゼ ロ) GoldenGate カスタムのアプリケーション・フェイルオーバーまたは Global Data Services