Upgrade to Pro — share decks privately, control downloads, hide ads and more …

OCIモニタリング機能概要

 OCIモニタリング機能概要

OCIの技術説明資料 モニタリング・サービスの概要資料です。

デモを含めた動画URL
https://videohub.oracle.com/media/Oracle+Cloud+Infrastructure+%E6%8A%80%E8%A1%93%E3%82%BB%E3%83%9F%E3%83%8A%E3%83%BC+-+%E3%83%A2%E3%83%8B%E3%82%BF%E3%83%AA%E3%83%B3%E3%82%B0%E6%A6%82%E8%A6%81/1_yr1g0397

2020/09/07 初版をアップロード
2021/03/24 フォーマットの最新化/補足追加
2021/10/07 通知サービスのフレンドリー・フォーマットを追記
2021/11/25 誤記修正
2022/3/30 Notificationの価格スライド追加

More Decks by Oracle Cloud Infrastructure ソリューション・エンジニア

Other Decks in Technology

Transcript

  1. • Out of the box でサービスやリソースの性能や状態のメトリックを取得する • コンピュート・インスタンス、VNIC、ブロック・ボリューム、ロードバランサーなど • 事前定義済のビジュアライゼーション・ダッシュボードの提供

    • カスタム・メトリックも定義可能 • メトリックに対してアラームを作成することも可能 • アラームは通知サービスもしくはストリーミング・サービスと連携して、 指定した条件のトリガーにメトリックが合致した場合に通知 モニタリング / Monitoring Copyright © 2022, Oracle and/or its affiliates 3 Monitoring OCI サービス メトリック アラーム Notifications CPU: 80 CPU: 90 CPU: 40 CPU: 50 Customer Applications, Services, Resources OCIコンソール Customer Monitoring Tool Monitorin g CPU: 85 CPU: 45 集計データ 生データポイン ト トリガー・ルール Streaming
  2. • 通知サービスとは • マネージドのメッセージングサービス • モニタリング・アラームなどのメッセージを大規模なサブスクリプション・ エンドポイントにプッシュ • セキュアで低レイテンシー、耐久性に優れたメッセージ配信 •

    通知先から確認応答がされない(通知が上手く行かない)場合、 サブスクリプションの再試行期間中(最大120分)、指数バックオフを 含む再試行を行う • サブスクリプションのタイプ(2022年11月現在) • Email • ファンクション • HTTPS (Custom URL) • PagerDuty • Slack • SMS 通知 / Notifications Copyright © 2022, Oracle and/or its affiliates 4 Notifications イベント・サービス × 通知サービス の連携 イベント・サービスでリソースの変化を検知して通知
  3. 通知サービス×モニタリング の連携 Copyright © 2022, Oracle and/or its affiliates 5

    リソースのメトリック値をモニタリングし、設定したルールに応じて 検知されたアラームを、通知サービスで指定された宛先へ通知する 1. 通知サービスの設定 • 通知内容に応じた トピック の定義 • トピックの配信先となる サブスクリプション の作成 2. モニタリング/アラーム定義 • モニタリング対象の メトリック を選択 • アラームを起動する トリガー・ルール を設定 • 通知先となるサービスの選択(通知サービスの トピック) 例)VMインスタンスのCPU使用率が80%超過した場合、 - 通知サービスと連携し、Eメールにて通知 - 通知サービスと連携し、ファンクションズを呼出し、 VMインスタンスのシェイプを変更 metric-1 metric-2 metric-3 metric-n configured destination resource-1 resource-2 resource-3 resource-n Virtual Machine Load Balancer Block Storage …
  4. 通知サービスと他のサービスの連携 Copyright © 2022, Oracle and/or its affiliates 6 イベントから通知への連携

    モニタリングから通知への連携 ファンクションとの連携例:モニタリングでVMインスタンスのメモリ使用率があらかじめ設定した閾値を超えたら通知 を行うようアラームを設定。通知先としてファンクションを呼び出し、自動的にVMインスタンスのシェイプ変更を行う。 resize shape
  5. モニタリングのメリット Copyright © 2022, Oracle and/or its affiliates 8 モニタリングのメリット

    OCIの各サービスをまたがった 一貫性のある実装 • OCIサービスの各リソースの状態確認やアプリケーション性 能の最適化、異常への対応などをリアルタイムに実行可 能 カスタムのサービスや アプリケーションのメトリック • アプリケーションでカスタムメトリックを生成し、それらを一元 的に視覚化してモニタリングしたりアラーム生成することが 可能 安定したメトリックエンジン • リアルタイムに複数のメトリック・ストリームやディメンションに またがって柔軟な計算や複雑なクエリーを実行することが 可能 シンプルかつ予測可能な 価格体系 • 広い無償範囲をベースにし、追加コストの少ないシンプル な価格体系
  6. モニタリングのアーキテクチャー Copyright © 2022, Oracle and/or its affiliates 9 メトリック

    • 各リソースのヘルス状態、キャパシティ、性能についての 一連のメトリックデータ • OCIの各サービスで事前定義されたメトリックと、カスタム メトリックの定義が可能 アラーム • メトリックがあらかじめ設定したトリガーにマッチした際に、 Notificationサービスもしくはストリーミング・サービスと連 携して通知 • 繰り返し設定可能。OK状態に戻った際にも通知。 OCI サービス メトリック アラーム Notifications CPU: 80 CPU: 90 CPU: 40 CPU: 50 Customer Applications, Services, Resources OCIコンソール Customer Monitoring Tool Monitoring CPU: 85 CPU: 45 集計データ 生データポイント トリガー・ルール Streaming
  7. メトリックとは • 各リソースのヘルス状態、キャパシティ、性能についての測定値 • ネームスペース:メトリックを生成するリソース、サービス、アプリケーションの識別子 • 例) 「CpuUtilization」メトリックは「oci_computeagent」ネームスペースをソースとしたメトリックをリストする • ディメンション:メトリックデータをフィルターしたりグルーピングする修飾語句

    • 例) 「availabilityDomain = “VeBZ:PHX-AD-1”」 → 特定の可用性ドメインのみを対象に絞り込む • メタデータ:メトリック定義内の参考情報 • 例) 「unit(bytes)」 ← oci_computeagent の metricDiskBytesReadの補足情報 メトリック・ストリーム • メトリックの集計済みデータのセット • ストリームは特定のリソース固有もしくはコンパートメント内の全リソースにまたがって集計することも可能 メトリック Copyright © 2022, Oracle and/or its affiliates 10
  8. メトリック Copyright © 2022, Oracle and/or its affiliates 11 メトリック:

    各リソースのヘルス状態、キャパシティ、 性能についての測定値 メタデータ: メトリック定義内の参考情報 例)「unit(bytes)」← oci_computeagent のmetricDiskBytesReadの補足情報 ディメンション: メトリックデータをフィルターしたりグルーピングする 修飾語句 例)「availabilityDomain = “VeBZ:PHX-AD-1”」 →特定の可用性ドメインのみを対象に絞り込む ネームスペース: メトリックを生成するリソース、 サービス、アプリケーションの 識別子 例)「CpuUtilization」メトリッ ク は 「 oci_computeagent 」 ネームスペースをソースとしたメト リックをリスト メトリック・ストリーム: メトリックの集計済みデータの セット - ストリームは特定のリソース 固有もしくはコンパートメント 内の全リソースにまたがって 集計することも可能 参照:https://docs.oracle.com/ja-jp/iaas/Content/Monitoring/Concepts/monitoringoverview.htm#concepts
  9. モニタリング・メトリックを生成できる 主なOCIサービス • https://docs.oracle.com/en-us/iaas/Content/Monitoring/Concepts/monitoringoverview.htm#SupportedServices 最新情報と各サービス・メトリックの詳細はリンク先のマニュアルを参照のこと メトリックを生成できるサービス Copyright © 2022, Oracle

    and/or its affiliates 12 • データ統合 • データ・サイエンス • データ転送 - ディスクベースのデータ・インポート - アプライアンスベースのデータ・イン ポート - データ・エクスポート • データベース • データベース移行 • DevOps • デジタル・アシスタント • DNS • イベント • 電子メール配信サービス • ファイル・ストレージ • ファンクション • APIゲートウェイ • Application Performance Monitoring • 要塞 • ビッグ・データ • ブロック・ストレージ • ブロックチェーン・プラットフォーム • コンピュート - コンピュート・インスタンス - インスタンス・プールのメトリック - インフラストラクチャ・ヘルス・メト リック - インスタンス・プールのメトリック • OKE • データ・カタログ • データ・フロー • GoldenGate • ヘルス・チェック • 統合 • ロード・バランサー • MySQLデータベース • ネットワーク • vNIC • FastConnect • VPN • サービス・ゲートウェイ • NoSQLデータベース • 通知 • ネットワーク・ファイアウォール • オブジェクト・ストレージ • オペレーション・インサイト • Oracle APEX Application Development • OS管理 • プロセス自動化 • Service Connector Hub • サービス・メッシュ • スタック・モニタリング • ストリーミング • ボールト • 脆弱性スキャン • WAF
  10. メトリックの例:コンピュート・インスタンス関連のメトリック Copyright © 2022, Oracle and/or its affiliates 13 インスタンス

    NIC ブート・ボリューム ブロック・ボリューム コンピュートのメトリックはインスタンス上で測 定され、関連リソースにまたがって集計される ネームスペース:oci_computeagent VNICメトリック ネームスペース: oci_vcn ブート/ブロック・ボリュームの メトリック・ネームスペース: oci_blockstore メトリック・ ネームスペース リソースOCID どこで測定されるか oci_computeagent インスタンスの OCID インスタンス上。 このネームスペースのメトリックはインスタンス上の すべての関連リソースにまたがって集計される。 (例: DiskBytesRead はインスタンスにア タッチされた全ボリュームにまたがって集計される。 NetworkBytesIn はインスタンスにアタッチされ たすべてのVNICにまたがって集計される) oci_blockstore ブート/ブロック・ ボリュームの OCID ブロック・ボリュームサービスによって測定される。 各ブート/ブロックボリュームごとのメトリック oci_vcn VNICのOCID ネットワーク・サービスによって測定される。各 VNICごとのメトリック
  11. oci_compute_infrastructure_health メトリック • コンピュートのVMインスタンスやベアメタル・インスタンスの正常 性を監視するメトリック • インスタンス・ヘルス (up/down) ステータス •

    VMやベア・メタルインスタンスが起動状態の際に、 使用可能(up)か 使用不可(down)か を監視 • Upの場合0、downの場合1 • インスタンスが停止(stop)状態の場合は0 • インスタンス・メンテナンス・ステータス • VMインスタンスのリブート・メンテナンスがスケジュールされて いない場合は0、スケジュールされている場合は1 • ディメンションとして、メンテナンス・ウィンドウのスタート時間や 推奨アクション(再起動)が存在 • ベアメタル・インフラストラクチャー・ヘルス・ステータス • ベアメタル・インスタンスのCPUやメモリなどのハードウェア・コ ンポーネントの状態監視 メトリックの例:インフラストラクチャ・ヘルス・メトリック Copyright © 2022, Oracle and/or its affiliates 14 起動中のインスタンスの詳細ページからも確認可能
  12. カスタム・メトリックの公開 Copyright © 2022, Oracle and/or its affiliates 15 ユーザー独自のメトリックを定義し、Monitoringに自身で追加して監視することが可能

    - REST API, SDK, CLI等で作成したカスタム・メトリック値を定期的にMonitoringにPost (最小頻度: 1秒、最小集計間隔: 1分) <略> #OCIへの接続情報 . for proc in psutil.process_iter(): try: if "vmstat" in proc.exe(): existvalue = 1 except psutil.AccessDenied: pass dt_now = datetime.datetime.now(timezone('UTC’)) . <略> #OCIテナンシ情報 post_metric_data_response = monitoring_client.post_metric_data( post_metric_data_details=oci.monitoring.models.PostMetricDataDetails( metric_data=[ oci.monitoring.models.MetricDataDetails( namespace="osprocess", compartment_id="ocid1.compartment.oc1..aaaaaaaa6itxxxxxxxxxxx", name="process001", dimensions={ 'serverid': 'testsrv001’}, datapoints=[ oci.monitoring.models.Datapoint( timestamp=datetime.datetime.strftime( dt_now,"%Y-%m-%dT%H:%M:%S.%fZ"), value=existvalue)] )] ... ) Python SDKを使用したサンプルコード 稼働するプロセスやサービス を OS コ マ ン ド で 取 り 出 し メトリック値とする Monitoringを実施する コンパートメント名や、 作成するメトリック名、 ディメンションなどを指定
  13. https://docs.oracle.com/ja-jp/iaas/Content/Monitoring/Reference/mql.htm Monitoring Query Language(MQL)で集計データの取得、評価が可能。 • メトリック・クエリー構文: メトリック・クエリー Copyright © 2022,

    Oracle and/or its affiliates 16 metric[interval]{dimensionname=“dimensionvalue”}.groupingfunction.statistic metric[interval]{dimensionname=“dimensionvalue”}.groupingfunction.statistic operator value • アラーム・クエリー構文: メトリック メトリック・ネームスペースごとに定められた使用可能なメトリックを設定.(例:CPU使用率 ”CpuUtilization” ) 間隔 生データ・ポイントを集約するための時間枠. 1m(1分)/5m(5分)/1h(1時間)/1d(1日) 等から設定. ディメンション 問合せの軸(フィルタ)を設定.(例:リソース名 resourceDisplayName=“instanceA”) グループ化関数 groupBy() にて、問合せ結果をグループ(ディメンションまたはリソース・グループ)別に集計. または、grouping() にて、すべての問合せ結果を集計. 統計 指定された期間のメトリックに対する統計方法を指定. max()/mean()/avg()/sum() …など. 比較操作 演算子(>, >=, ==, !=, in(), not in() …など) および それに対する数値、または absent() を設定.
  14. メトリック・クエリー • 1分間隔での最大CPU使用率 • 単一リソースに対する、1分間隔での最大CPU使用率 • 単一コンパートメント内の全ての1分間隔でのread IOPSの最大値 アラーム・クエリー •

    単一リソースに対する、1分間隔でのCPU使用率メトリックが存在しない場合(死活監視) • 単一リソースに対する、1分間隔での最大CPU使用率が 90を超える場合 • 単一リソースに対する、1時間間隔での平均バケットサイズが 約1MBを超える場合 メトリック・クエリーの例 Copyright © 2022, Oracle and/or its affiliates 17 CpuUtilization[1m].max() IopsRead[1m]{compartmentId="ocid1.compartment.oc1.phx..exampleuniqueID"}.grouping().max() CpuUtilization[1m]{resourceId="ocid1.instance.oc1.phx.exampleuniqueID"}.max() CpuUtilization[1m]{resourceDisplayName = “instanceA"}.absent() CpuUtilization[1m]{resourceId = "ocid1.instance.oc1.phx.exampleuniqueID"}.max() > 90 StoredBytes[1h]{resourceDisplayName = “objectstorgeA"}.mean() > 1000000
  15. • アラーム機能は、Notificationサービスもしくはストリーミング・サービスで定義された通知先に対してアラーム・メッセージをパ ブリッシュする機能 • アラーム評価にMQLを利用可能。アラーム・クエリーは、メトリック、スタティスティック、インターバル、トリガールール (thresholdもしくはabsence)が必要 • アラームのステータス • OK

    [ ]:アラームが発生していない(=アラーム・クエリーで設定された条件に一致していない)状態 • FIRING [ ]:アラームが起動中(=アラーム・クエリーで設定された条件に一致している)状態 • アラームは以下の設定を行うことが可能 - 繰り返し通知・間隔の設定: アラームが起動状態になっている間、指定した間隔で通知を再送信します。通知のノイズを削減できます。 - アラームの抑制: 指定された期間中、一時的にアラーム・クエリーによる評価と通知を停止します。 問題の調査中にアラームが起動することを避けられます。問題の解消後、抑制の設定を削除することで、再度評価が開始されます。 - アラームの有効化・無効化: アラームは任意のタイミングで有効化・無効化できます。アラームが有効化されるまで評価は行われません。 アラームとは Copyright © 2022, Oracle and/or its affiliates 19
  16. https://docs.oracle.com/en-us/iaas/Content/Monitoring/Concepts/monitoringoverview.htm • アラームから通知されるメッセージには、以下のようなパラメータ・値が含まれる(Eメールの例) メッセージの例 Copyright © 2022, Oracle and/or its

    affiliates 21 { "dedupeKey": "exampleuniqueID", "title": "High CPU Utilization", "body": "Follow runbook at http://example.com/runbooks", "type": "REPEAT", "severity": "CRITICAL", "timestampEpochMillis": 1542406320000, "timestamp": "2018-11-16T22:12:00Z", "alarmMetaData": [ { "id": "ocid1.alarm.oc1.iad.exampleuniqueID", "status": "FIRING", "severity": "CRITICAL", "query": "CpuUtilization[1m].mean()>0", "totalMetricsFiring": 2, "dimensions": [ { "instancePoolId": "Default", "resourceDisplayName": "myinstance1", "faultDomain": "FAULT-DOMAIN-1", "resourceId": "ocid1.instance.oc1.iad.exampleuniqueID", "imageId": "ocid1.image.oc1.iad.exampleuniqueID", "availabilityDomain": "szYB:US-ASHBURN-AD-1", "shape": "VM.Standard2.1", "region": "us-ashburn-1" }, { "instancePoolId": "Default", "resourceDisplayName": "myinstance2", "faultDomain": "FAULT-DOMAIN-3", "resourceId": "ocid1.instance.oc1.iad.exampleuniqueID", "imageId": "ocid1.image.oc1.iad.exampleuniqueID", "availabilityDomain": "szYB:US-ASHBURN-AD-1", "shape": "VM.Standard2.1", "region": "us-ashburn-1" } ] } ], "version": 1.1 }
  17. サービス・メトリック • コンパートメント内のすべてのリソースに対する特定のメトリックを 表示。フィルタリングやディメンションを利用可能 メトリック・エクスプローラー • 特定のメトリックの詳細を表示したり、同時に複数メトリック表示 も可能。複雑なクエリーに対してはMQLインターフェースを利用 可能 アラーム定義

    • メトリックをもとにアラームを作成し、OCI Notificationサービス もしくはストリーミング・サービスを経由して通知 アラーム・ステータス • 構成済みのアラームのステータスを参照 OCIコンソールからの利用方法 Copyright © 2022, Oracle and/or its affiliates 23
  18. サービス制限のデフォルト • 必要に応じて引き上げ申請可能 ストレージ保持期間 ※ 90日以上に保存が必要な場合、API/CLI等を経由して別途ストレージへ要退避 アラーム・メッセージの制限 リミット Copyright ©

    2022, Oracle and/or its affiliates 28 保持期間 メトリック定義 14日間 アラーム履歴のエントリー 90日間 サービス制限 アラーム 50 メトリック数 無制限 アラームの宛先 配送 評価ごとの最大アラーム・メッセージ数 トピック(通知) 少なくとも1回 60 stream (ストリーミング) 少なくとも1回 200,000
  19. Oracle Cloud Infrastructure Monitoring – Ingestion Oracle Cloud Infrastructure Monitoring

    – Retrieval モニタリング 価格 Copyright © 2022, Oracle and/or its affiliates 29 Product Price Metric First 500 Million Datapoints Free Million Datapoints Over 500 Million Datapoints $0.0025 Million Datapoints 最新状況は下記URLをご参照ください。 • https://www.oracle.com/devops/monitoring/ Product Price Metric First 1 Billion Datapoints Free Million Datapoints Over 1 Billion Datapoints $0.0015 Million Datapoints
  20. モニタリング 課金について Copyright © 2022, Oracle and/or its affiliates 30

    FAQ https://www.oracle.com/jp/devops/monitoring/faq/ Ingestion: “カスタム・メトリック”のデータポイント(※1)にのみ課金され る。OCIの各サービスが提供するメトリックは含まれない。 Retrieval: アナライズされたデータポイント(※2)を取得する際に課金 される。コンソールのメトリック・エクスプローラーなどでグラ フ表示やリロードした際にカウントされる。 ※1) データ・ポイント • メトリックストリーム内でのタイムスタンプ付きの単一の値 ※2) 分析されたデータ・ポイント • メトリック取得クエリー実行時のメトリックストリームごとの 1分あたりのデータポイント • 1分間に複数のデータポイントがある場合は要約された値 になる。 OCI サービス Metric Alerm Notifications CPU: 80 CPU: 90 CPU: 40 CPU: 50 Customer Applications, Services, Resources OCIコンソール Customer Monitoring Tool Monitoring CPU: 85 CPU: 45 集計データ 生データポイント トリガー・ルール Monitoring - Ingestion Monitoring - Retrieval Streaming
  21. Oracle Cloud Infrastructure Notifications - HTTPS Delivery Oracle Cloud Infrastructure

    Notifications - Email Delivery Oracle Cloud Infrastructure Notifications - SMS Delivery 通知(Notification) 価格 Copyright © 2022, Oracle and/or its affiliates 31 Product Price Metric First 1 Million Delivery Operations Per Month Free Million Delivery Operations Over 1 Million Delivery Operations Per Month $0.60 Million Delivery Operations 最新状況は下記URLをご参照ください。 • https://www.oracle.com/devops/notifications/ Product Price Metric First 1,000 Emails Sent Per Month Free 1,000 Emails Sent Over 1,000 Emails Sent Per Month $0.02 1,000 Emails Sent Product Price Metric First 100 SMS Messages Sent Per Month Free 1 SMS Message Sent Country Zone 5: Over 100 SMS Messages Sent Per Month $0.24 1 SMS Message Sent *JapanはCountry Zone 5に含まれる
  22. 日本語マニュアル – モニタリング • https://docs.oracle.com/ja-jp/iaas/Content/Monitoring/Concepts/monitoringoverview.htm 日本語マニュアル – 通知 • https://docs.oracle.com/ja-jp/iaas/Content/Notification/Concepts/notificationoverview.htm

    チュートリアル – モニタリング機能でOCIのリソースを監視する • https://oracle-japan.github.io/ocitutorials/intermediates/monitoring-resources/ モニタリング 関連の技術情報 Copyright © 2022, Oracle and/or its affiliates 32
  23. Oracle Cloud Infrastructure マニュアル (日本語 / 英語) • https://docs.cloud.oracle.com/iaas/api/ -

    APIリファレンス • https://docs.cloud.oracle.com/ja-jp/iaas/Content/General/Reference/aqswhitepapers.htm - テクニカル・ホワイト・ペーパー • https://docs.oracle.com/en-us/iaas/releasenotes/ - リリースノート • https://docs.cloud.oracle.com/ja-jp/iaas/Content/knownissues.htm - 既知の問題(Known Issues) • https://docs.cloud.oracle.com/ja-jp/iaas/Content/General/Reference/graphicsfordiagrams.htm - OCIアイコン・ダイアグラム集(PPT、SVG、Visio用) ※ 日本語版は翻訳のタイムラグのため情報が古い場合があります。最新情報は英語版をご確認ください Oracle Cloud Infrastructure マニュアル・ドキュメント Copyright © 2022, Oracle and/or its affiliates 33
  24. Oracle Cloud Infrastructure 活用資料集 • https://oracle-japan.github.io/ocidocs/ チュートリアル - Oracle Cloud

    Infrastructureを使ってみよう • https://oracle-japan.github.io/ocitutorials/ Oracle Cloud ウェビナーシリーズ • https://www.oracle.com/goto/ocws-jp Oracle 主催 セミナー、ハンズオン・ワークショップ • https://www.oracle.com/search/events/_/N-2bu/ Oracle Cloud Infrastructure – General Forum (英語) • https://cloudcustomerconnect.oracle.com/resources/9c8fa8f96f/summary Oracle Cloud Infrastructure トレーニング・技術フォーラム Copyright © 2022, Oracle and/or its affiliates 34
  25. Our mission is to help people see data in new

    ways, discover insights, unlock endless possibilities.