Upgrade to Pro — share decks privately, control downloads, hide ads and more …

OCIモニタリング機能概要

 OCIモニタリング機能概要

OCIの技術説明資料 モニタリング・サービスの概要資料です。

デモを含めた動画URL
https://videohub.oracle.com/media/Oracle+Cloud+Infrastructure+%E6%8A%80%E8%A1%93%E3%82%BB%E3%83%9F%E3%83%8A%E3%83%BC+-+%E3%83%A2%E3%83%8B%E3%82%BF%E3%83%AA%E3%83%B3%E3%82%B0%E6%A6%82%E8%A6%81/1_yr1g0397

2020/09/07 初版をアップロード
2021/03/24 フォーマットの最新化/補足追加

Transcript

  1. Oracle Cloud Infrastructure モニタリング機能概要 OCI Monitoring Level 100 Oracle Cloud

    Infrastructure 技術資料 2021年3月
  2. Safe harbor statement 以下の事項は、弊社の一般的な製品の方向性に関する概要を説明するものです。また、 情報提供を唯一の目的とするものであり、いかなる契約にも組み込むことはできません。以 下の事項は、マテリアルやコード、機能を提供することを確約するものではないため、購買 決定を行う際の判断材料になさらないで下さい。 オラクル製品に関して記載されている機能の開発、リリース、時期及び価格については、弊 社の裁量により決定され、変更される可能性があります。 Copyright

    © 2021, Oracle and/or its affiliates 2
  3. • Out of the box でサービスやリソースの性能や状態のメトリックを取得する • コンピュート・インスタンス、VNIC、ブロック・ボリューム、ロードバランサーなど • 事前定義済のビジュアライゼーション・ダッシュボードの提供

    • カスタム・メトリックも定義可能 • メトリックに対してアラームを作成することも可能 • アラームは通知サービスと連携して、指定した条件のトリガーに メトリックが合致した場合に通知 モニタリング / Monitoring Copyright © 2021, Oracle and/or its affiliates 3 Monitoring OCI サービス METRICS ALARMS Notifications CPU: 80 CPU: 90 CPU: 40 CPU: 50 Customer Applications, Services, Resources OCIコンソール Customer Monitoring Tool Monitoring
  4. • 通知サービスとは • マネージドのメッセージングサービス • モニタリング・アラームなどのメッセージを大規模なサブスクリプション・ エンドポイントにプッシュ • セキュアで低レイテンシー、耐久性に優れたメッセージ配信 •

    通知先から確認応答がされない(通知が上手く行かない)場合、 サブスクリプションの再試行期間中(最大120分)、指数バックオフを 含む再試行を行う • サブスクリプションのタイプ(2021年3月現在) • Email • ファンクション • HTTPS (Custom URL) • PagerDuty • Slack • SMS 通知 / Notifications Copyright © 2021, Oracle and/or its affiliates 4 Notifications イベント・サービス × 通知サービス の連携 イベント・サービスでリソースの変化を検知して通知
  5. 通知サービス×モニタリング の連携 Copyright © 2021, Oracle and/or its affiliates 5

    Virtual Machine Load Balancer Block Storage … リソースのメトリック値をモニタリングし、設定したルールに応じて 検知されたアラームを、通知サービスで指定された宛先へ通知する • モニタリング/アラーム定義 • モニタリング対象の メトリック を選択 • アラームを起動する トリガー・ルール を設定 • 通知先となるサービスの選択(通知サービスの トピック) • 通知 • 通知内容に応じた トピック の定義 • トピックの配信先となる サブスクリプション の作成 例)VMインスタンスのCPU使用率が80%超過した場合、 - 通知サービスと連携し、Eメールにて通知 - 通知サービスと連携し、ファンクションズを呼出し、 VMインスタンスのシェイプを変更
  6. モニタリングのメリット Copyright © 2021, Oracle and/or its affiliates 7 モニタリングのメリット

    OCIの各サービスをまたがった 一貫性のある実装 • OCIサービスの各リソースの状態確認やアプリケーション性 能の最適化、異常への対応などをリアルタイムに実行可 能 カスタムのサービスや アプリケーションのメトリック • アプリケーションでカスタムメトリックを生成し、それらを一元 的に視覚化してモニタリングしたりアラーム生成することが 可能 安定したメトリックエンジン • リアルタイムに複数のメトリック・ストリームやディメンションに またがって柔軟な計算や複雑なクエリーを実行することが 可能 シンプルかつ予測可能な 価格体系 • 広い無償範囲をベースにし、追加コストの少ないシンプル な価格体系
  7. モニタリングのアーキテクチャー Copyright © 2021, Oracle and/or its affiliates 8 メトリック

    • 各リソースのヘルス状態、キャパシティ、性能についての 一連のメトリックデータ • OCIの各サービスで事前定義されたメトリックと、カスタム メトリックの定義が可能 アラーム • メトリックがあらかじめ設定したトリガーにマッチした際に、 Notificationサービスと連携してユーザーに通知を行う 機能 • 繰り返し設定可能。OK状態に戻った際にも通知。 OCI サービス メトリック アラーム Notifications CPU: 80 CPU: 90 CPU: 40 CPU: 50 Customer Applications, Services, Resources OCIコンソール Customer Monitoring Tool Monitoring CPU: 85 CPU: 45 集計データ 生データポイント トリガー・ルール
  8. メトリックとは • 各リソースのヘルス状態、キャパシティ、性能についての測定値 • ネームスペース:メトリックを生成するリソース、サービス、アプリケーションの識別子 • 例) 「CpuUtilization」メトリックは「oci_computeagent」ネームスペースをソースとしたメトリックをリストする • ディメンション:メトリックデータをフィルターしたりグルーピングする修飾語句

    • 例) 「availabilityDomain = “VeBZ:PHX-AD-1”」 → 特定の可用性ドメインのみを対象に絞り込む • メタデータ:メトリック定義内の参考情報 • 例) 「unit(bytes)」 ← oci_computeagent の metricDiskBytesReadの補足情報 メトリック・ストリーム • メトリックの集計済みデータのセット • ストリームは特定のリソース固有もしくはコンパートメント内の全リソースにまたがって集計することも可能 メトリック Copyright © 2021, Oracle and/or its affiliates 9
  9. モニタリング・メトリックを生成できる 主なOCIサービス • https://docs.oracle.com/en-us/iaas/Content/Monitoring/Concepts/monitoringoverview.htm#SupportedServices 最新情報と各サービス・メトリックの詳細はリンク先のマニュアルを参照のこと メトリックを生成できるサービス Copyright © 2021, Oracle

    and/or its affiliates 10 • イベント • 電子メール配信サービス • ファイル・ストレージ • ファンクション • ヘルス・チェック • ロード・バランサー • MySQLデータベース • ネットワーク - vNIC - FastConnect - VPN - サービス・ゲートウェイ • APIゲートウェイ • ビッグ・データ • ブロック・ストレージ • コンピュート - コンピュート・インスタンス - Infrastructure Health • OKE • データ・カタログ • データ統合 • データベース • デジタル・アシスタント • DNS • NoSQLデータベース • 通知 • オブジェクト・ストレージ • OS管理 • ストリーミング • ボールト • WAF
  10. メトリックの例:コンピュート・インスタンス関連のメトリック Copyright © 2021, Oracle and/or its affiliates 11 インスタンス

    NIC ブート・ボリューム ブロック・ボリューム コンピュートのメトリックはインスタンス上で測 定され、関連リソースにまたがって集計される ネームスペース:oci_computeagent VNICメトリック ネームスペース: oci_vcn ブート/ブロック・ボリュームの メトリック・ネームスペース: oci_blockstore メトリック・ ネームスペース リソースOCID どこで測定されるか oci_computeagent インスタンスの OCID インスタンス上。 このネームスペースのメトリックはインスタンス上の すべての関連リソースにまたがって集計される。 (例: DiskBytesRead はインスタンスにア タッチされた全ボリュームにまたがって集計される。 NetworkBytesIn はインスタンスにアタッチされ たすべてのVNICにまたがって集計される) oci_blockstore ブート/ブロック・ ボリュームの OCID ブロック・ボリュームサービスによって測定される。 各ブート/ブロックボリュームごとのメトリック oci_vcn VNICのOCID ネットワーク・サービスによって測定される。各 VNICごとのメトリック
  11. oci_compute_infrastructure_health メトリック • コンピュートのVMインスタンスやベアメタル・インスタンスの正常 性を監視するメトリック • インスタンス・ヘルス (up/down) ステータス •

    VMやベア・メタルインスタンスが起動状態の際に、 使用可能(up)か 使用不可(down)か を監視 • Upの場合0、downの場合1 • インスタンスが停止(stop)状態の場合は0 • インスタンス・メンテナンス・ステータス • VMインスタンスのリブート・メンテナンスがスケジュールされて いない場合は0、スケジュールされている場合は1 • ディメンションとして、メンテナンス・ウィンドウのスタート時間や 推奨アクション(再起動)が存在 • ベアメタル・インフラストラクチャー・ヘルス・ステータス • ベアメタル・インスタンスのCPUやメモリなどのハードウェア・コ ンポーネントの状態監視 メトリックの例:インフラストラクチャ・ヘルス・メトリック Copyright © 2021, Oracle and/or its affiliates 12 起動中のインスタンスの詳細ページからも確認可能
  12. https://docs.oracle.com/ja-jp/iaas/Content/Monitoring/Reference/mql.htm Monitoring Query Language(MQL)で集計データの取得、評価が可能。 • メトリック・クエリー構文: メトリック・クエリー Copyright © 2021,

    Oracle and/or its affiliates 13 metric[interval]{dimensionname=“dimensionvalue”}.groupingfunction.statistic metric[interval]{dimensionname=“dimensionvalue”}.groupingfunction.statistic operator value • アラーム・クエリー構文: メトリック メトリック・ネームスペースごとに定められた使用可能なメトリックを設定.(例:CPU使用率 ”CpuUtilization” ) 間隔 生データ・ポイントを集約するための時間枠. 1m(1分)/5m(5分)/1h(1時間)/1d(1日) 等から設定. ディメンション 問合せの軸(フィルタ)を設定.(例:リソース名 resourceDisplayName=“instanceA”) グループ化関数 groupBy() にて、問合せ結果をグループ(ディメンションまたはリソース・グループ)別に集計. または、grouping() にて、すべての問合せ結果を集計. 統計 指定された期間のメトリックに対する統計方法を指定. max()/mean()/avg()/sum() …など. 比較操作 演算子(>, >=, ==, !=, in(), not in() …など) および それに対する数値、または absent() を設定.
  13. メトリック・クエリー • 1分間隔での最大CPU使用率 • 単一リソースに対する、1分間隔での最大CPU使用率 • 単一コンパートメント内の全ての1分間隔でのread IOPSの最大値 アラーム・クエリー •

    単一リソースに対する、1分間隔でのCPU使用率メトリックが存在しない場合(死活監視) • 単一リソースに対する、1分間隔での最大CPU使用率が 90を超える場合 • 単一リソースに対する、1時間間隔での平均バケットサイズが 約1MBを超える場合 メトリック・クエリーの例 Copyright © 2021, Oracle and/or its affiliates 14 CpuUtilization[1m].max() IopsRead[1m]{compartmentId="ocid1.compartment.oc1.phx..exampleuniqueID"}.grouping().max() CpuUtilization[1m]{resourceId="ocid1.instance.oc1.phx.exampleuniqueID"}.max() CpuUtilization[1m]{resourceDisplayName = “instanceA"}.absent() CpuUtilization[1m]{resourceId = "ocid1.instance.oc1.phx.exampleuniqueID"}.max() > 90 StoredBytes[1h]{resourceDisplayName = “objectstorgeA"}.mean() > 1000000
  14. メトリック・クエリー および アラーム・クエリー いずれも、問合せエディタを用いてGUIベースで作成することも可能 問合せエディタを使用したクエリーの作成 Copyright © 2021, Oracle and/or

    its affiliates 15
  15. • アラーム機能は、Notificationサービスで定義された通知先に対してアラーム・メッセージをパブリッシュする機能 • アラーム評価にMQLを利用可能。アラーム・クエリーは、メトリック、スタティスティック、インターバル、トリガールール (thresholdもしくはabsence)が必要 • アラームのステータス • OK [

    ]:アラームが発生していない(=アラーム・クエリーで設定された条件に一致していない)状態 • FIRING [ ]:アラームが起動中(=アラーム・クエリーで設定された条件に一致している)状態 • アラームは以下の設定を行うことが可能 - 繰り返し通知・間隔の設定: アラームが起動状態になっている間、指定した間隔で通知を再送信します。通知のノイズを削減できます。 - アラームの抑制: 指定された期間中、一時的にアラーム・クエリーによる評価と通知を停止します。 問題の調査中にアラームが起動することを避けられます。問題の解消後、抑制の設定を削除することで、再度評価が開始されます。 - アラームの有効化・無効化: アラームは任意のタイミングで有効化・無効化できます。アラームが有効化されるまで評価は行われません。 アラームとは Copyright © 2021, Oracle and/or its affiliates 16
  16. https://docs.oracle.com/en-us/iaas/Content/Monitoring/Concepts/monitoringoverview.htm • アラームから通知されるメッセージには、以下のようなパラメータ・値が含まれる(Eメールの例) メッセージの例 Copyright © 2021, Oracle and/or its

    affiliates 17 { "dedupeKey": "exampleuniqueID", "title": "High CPU Utilization", "body": "Follow runbook at http://example.com/runbooks", "type": "REPEAT", "severity": "CRITICAL", "timestampEpochMillis": 1542406320000, "timestamp": "2018-11-16T22:12:00Z", "alarmMetaData": [ { "id": "ocid1.alarm.oc1.iad.exampleuniqueID", "status": "FIRING", "severity": "CRITICAL", "query": "CpuUtilization[1m].mean()>0", "totalMetricsFiring": 2, "dimensions": [ { "instancePoolId": "Default", "resourceDisplayName": "myinstance1", "faultDomain": "FAULT-DOMAIN-1", "resourceId": "ocid1.instance.oc1.iad.exampleuniqueID", "imageId": "ocid1.image.oc1.iad.exampleuniqueID", "availabilityDomain": "szYB:US-ASHBURN-AD-1", "shape": "VM.Standard2.1", "region": "us-ashburn-1" }, { "instancePoolId": "Default", "resourceDisplayName": "myinstance2", "faultDomain": "FAULT-DOMAIN-3", "resourceId": "ocid1.instance.oc1.iad.exampleuniqueID", "imageId": "ocid1.image.oc1.iad.exampleuniqueID", "availabilityDomain": "szYB:US-ASHBURN-AD-1", "shape": "VM.Standard2.1", "region": "us-ashburn-1" } ] } ], "version": 1.1 }
  17. サービス・メトリック • コンパートメント内のすべてのリソースに対する特定のメトリックを 表示。フィルタリングやディメンションを利用可能 メトリック・エクスプローラー • 特定のメトリックの詳細を表示したり、同時に複数メトリック表示 も可能。複雑なクエリーに対してはMQLインターフェースを利用 可能 アラーム定義

    • メトリックをもとにアラームを作成し、OCI Notificationサービス を経由して通知を生成 アラーム・ステータス • 構成済みのアラームのステータスを参照 OCIコンソールからの利用方法 Copyright © 2021, Oracle and/or its affiliates 18
  18. サービス・メトリック メニュー Copyright © 2021, Oracle and/or its affiliates 19

  19. メトリック・エクスプローラー Copyright © 2021, Oracle and/or its affiliates 20

  20. アラームのステータス Copyright © 2021, Oracle and/or its affiliates 21

  21. アラーム定義 Copyright © 2021, Oracle and/or its affiliates 22

  22. サービス制限のデフォルト • 必要に応じて引き上げ申請可能 ストレージ保持期間 ※ 90日以上に保存が必要な場合、API/CLI等を経由して別途ストレージへ要退避 リミット Copyright © 2021,

    Oracle and/or its affiliates 23 保持期間 メトリック定義 14日間 アラーム履歴のエントリー 90日間 サービス制限 アラーム 50 メトリック数 無制限
  23. Oracle Cloud Infrastructure Monitoring – Ingestion Oracle Cloud Infrastructure Monitoring

    – Retrieval モニタリング 価格 Copyright © 2021, Oracle and/or its affiliates 24 Product Pay as You Go Annual Flex Metric First 500 Million Datapoints Free Free Million Datapoints Over 500 Million Datapoints $0.0025 $0.0025 Million Datapoints 最新状況は下記URLをご参照ください。 • https://www.oracle.com/devops/monitoring/ Product Pay as You Go Annual Flex Metric First 1 Billion Datapoints Free Free Million Datapoints Over 1 Billion Datapoints $0.0015 $0.0015 Million Datapoints
  24. モニタリング 課金について Copyright © 2021, Oracle and/or its affiliates 25

    FAQ https://www.oracle.com/jp/devops/monitoring/faq/ Ingestion: “カスタム・メトリック”のデータポイント(※1)にのみ課金され る。OCIの各サービスが提供するメトリックは含まれない。 Retrieval: アナライズされたデータポイント(※2)を取得する際に課金 される。コンソールのメトリック・エクスプローラーなどでグラ フ表示やリロードした際にカウントされる。 ※1) データ・ポイント • メトリックストリーム内でのタイムスタンプ付きの単一の値 ※2) 分析されたデータ・ポイント • メトリック取得クエリー実行時のメトリックストリームごとの 1分あたりのデータポイント • 1分間に複数のデータポイントがある場合は要約された値 になる。 OCI サービス Metric Alerm Notifications CPU: 80 CPU: 90 CPU: 40 CPU: 50 Customer Applications, Services, Resources OCIコンソール Customer Monitoring Tool Monitoring CPU: 85 CPU: 45 集計データ 生データポイント トリガー・ルール Monitoring - Retrieval Monitoring - Ingestion
  25. 日本語マニュアル – モニタリング • https://docs.oracle.com/ja-jp/iaas/Content/Monitoring/Concepts/monitoringoverview.htm 日本語マニュアル – 通知 • https://docs.oracle.com/ja-jp/iaas/Content/Notification/Concepts/notificationoverview.htm

    チュートリアル – モニタリング機能でOCIのリソースを監視する • https://oracle-japan.github.io/ocitutorials/intermediates/monitoring-resources/ モニタリング 関連の技術情報 Copyright © 2021, Oracle and/or its affiliates 26
  26. Oracle Cloud Infrastructure マニュアル (日本語 / 英語) • https://docs.cloud.oracle.com/iaas/api/ -

    APIリファレンス • https://docs.cloud.oracle.com/ja-jp/iaas/Content/General/Reference/aqswhitepapers.htm - テクニカル・ホワイト・ペーパー • https://docs.oracle.com/en-us/iaas/releasenotes/ - リリースノート • https://docs.cloud.oracle.com/ja-jp/iaas/Content/knownissues.htm - 既知の問題(Known Issues) • https://docs.cloud.oracle.com/ja-jp/iaas/Content/General/Reference/graphicsfordiagrams.htm - OCIアイコン・ダイアグラム集(PPT、SVG、Visio用) ※ 日本語版は翻訳のタイムラグのため情報が古い場合があります。最新情報は英語版をご確認ください Oracle Cloud Infrastructure マニュアル・ドキュメント Copyright © 2021, Oracle and/or its affiliates 27
  27. Oracle Cloud Infrastructure 活用資料集 • https://oracle-japan.github.io/ocidocs/ チュートリアル - Oracle Cloud

    Infrastructureを使ってみよう • https://oracle-japan.github.io/ocitutorials/ Oracle Cloud ウェビナーシリーズ • https://www.oracle.com/goto/ocws-jp Oracle 主催 セミナー、ハンズオン・ワークショップ • https://www.oracle.com/search/events/_/N-2bu/ Oracle Cloud Infrastructure – General Forum (英語) • https://cloudcustomerconnect.oracle.com/resources/9c8fa8f96f/summary Oracle Cloud Infrastructure トレーニング・技術フォーラム Copyright © 2021, Oracle and/or its affiliates 28
  28. Thank you Copyright © 2021, Oracle and/or its affiliates 29

  29. None
  30. Our mission is to help people see data in new

    ways, discover insights, unlock endless possibilities.