Upgrade to Pro — share decks privately, control downloads, hide ads and more …

APMって何? 【IBM Observability by Instana】

APMって何? 【IBM Observability by Instana】

6/28 2022に実施したTech Dojoで使用した資料の一部更新バージョンです。
https://ibm-developer.connpass.com/event/252174/

***
本Dojoでは、#APM #Instana #監視というタグに興味がある方向けに、APM入門的な内容をご紹介します。

- Observability?可観測性?
- APMと可観測性って違うの?
- エンドユーザモニタリングに興味がある
- サーバーの運用監視が大変...
コンテナ環境の監視って今までとなにか変わるの?

Junki Sagawa

August 10, 2022
Tweet

More Decks by Junki Sagawa

Other Decks in Technology

Transcript

  1. @2022 IBM Corporation
    IBM Cloud

    View full-size slide

  2. 自己紹介
    2
    佐川 洵貴 (Junki Sagawa)
    ⽇本IBM
    カスタマー・サクセス・マネージャー
    座右の銘
    「起きてるときは、ITのことかそれ意外しか考えない。」

    View full-size slide

  3. 本日の内容
    3
    • APMとは?
    • IBM Observability by Instanaのご紹介

    View full-size slide

  4. Application Performance Management
    Application Performance Management
    (Monitoring)
    A P M

    View full-size slide

  5. Application Performance Management
    従来の監視
    • システムを構成するハードウェア・ソフトウェアが
    正常に稼動しているかに注目
    1. サーバやストレージ・ネットワーク機器、ハードウェアの状態を監視
    – CPU・メモリ・ディスクの使用率・使用量は正常?
    2. OSやソフトウェアの状態を監視
    – プロセスが起動している?
    – エラー起きていない?

    View full-size slide

  6. Application Performance Management
    従来の監視
    • 異常を検知することはできるが、
    故障や停止を伴わない性能低下の検知は苦手
    • アプリケーションの応答時間が遅い
    • たまにエラー画面が表示されている

    View full-size slide

  7. Application Performance Management
    従来の監視
    レスポンスが 遅いといわれて初めて気づく
    • → 原因はインフラ? アプリ?
    • → 「基盤運用チーム、原因調査して!」
    • → 「CPUもメモリも正常です」
    • →「 むむ、そうか。アプリチーム、原因調査して!」
    • → 「ログを見てきます」
    • → 「とくに変なエラーは出てないですねえ。」

    View full-size slide

  8. Application Performance Management
    APM
    • システムやアプリケーションが、利用者に
    どういった 品質でサービスを提供しているのか?
    • アプリケーションの動作、インフラの依存関係、
    ユーザー、アプリケーションのライフサイクル全体
    にわたるKPIの監視を可能にするソフトウエア

    View full-size slide

  9. Application Performance Management
    APM
    • どのくらいの利⽤者がシステムにアクセスしているのか?
    • 利⽤者はシステムを快適に利⽤できているのか?
    • システムのパフォーマンスが悪化した場合、
    どの処理がボトルネックとなっているのか?

    View full-size slide

  10. 複雑な時代…
    • コンテナ
    • マルチクラウド
    • マイクロサービス
    • DevOps
    • etc..
    Application Performance Management
    Node
    フロント
    Java
    Python
    DBサーバー
    認証 SaaS
    Kubernetes / OpenShift
    (Container Orchestration)

    View full-size slide

  11. Observe + ability : 可観測性
    複雑化する環境においても、
    起きていることを把握するだけでなく、
    なぜ起きたかの原因まで把握できること

    View full-size slide

  12. Observability
    • インフラモニタリング
    • アプリモニタリング
    • APM
    • アラート
    • トレース…
    • ⾊々な機能を持っていること

    View full-size slide

  13. APM (次世代)
    13
    Observabilityを実現するツール
    • システム監視 + APM
    • ⾃動化
    • 原因分析
    • 依存関係
    例えば。。。
    IBM Observability by
    Instana APM

    View full-size slide

  14. @2022 IBM Corporation
    IBM Cloud
    従来の基盤監視だけでは 間に合わない世界が来ている
    従来型の監視基盤
    ü 個別導⼊とセットアップ
    - 監視対象に応じて導⼊
    - 監視対象の設計と設定が必要
    ü 得られる情報が少ない
    - OSレベルの情報のみ
    - 5秒-30秒の平均値の値
    - アプリケーションの挙動が掴めず
    改善につなげられない
    ü オンプレミスとクラウド 別管理
    - ユーザーの体験を理解できない
    - クラウドでツールが別れていて
    情報を追えない
    新世代 可観測性基盤
    ü ゼロ構成と⾃動監視、環境変化にも⾃動追随
    - 監視対象を検知し⾃動構成
    - 監視対象に対する専⾨知識を反映済み
    ü ⾼精細データでシステムを可視化
    - 全要求トレース+1秒単位メトリック
    - 基盤からアプリまで多様に渡り可視化
    - AIと機械学習で 問題を⾃動検知
    - 関連コンポーネントの情報も整理して提⽰
    ü オンプレミスと各種クラウドも統合して監視
    - WebUIから基幹システムの呼出しまで
    - 挙動を理解しユーザー体験改善につなげる
    14
    問題が「おきている」ことが分かる 問題が「なぜ起きているか」分かる
    可観測性を強化
    よりクリアな視界を
    数百〜数千のコンテナ
    動的に変化する基盤
    多様な技術の利⽤
    多岐にわたる提供サービス
    問題判別の複雑化
    サービスにフォーカスしたSRE運⽤
    複数クラスタでのサービス提供
    基幹システムとの連携
    エンドユーザー体験の可視化

    View full-size slide

  15. @2022 IBM Corporation
    IBM Cloud
    サービスのパフォーマンスの可視化 コンテキストの可視化
    IBM Observability with Instana
    システムが提供する様々なデータを解析することで、
    システムの振る舞いを可視化し、不透明なシステムを透明なシステムに変えるAPMソリューションです
    Ø概要
    • 業界を超えて400以上のお客様(製造、⼩売、通信、⾦融など)が利⽤
    • システムの振る舞いを理解し、再起動や再デプロイなしにあらゆる種類のパフォーマンスや問題の分析を⾏います
    • アプリケーション、サービス、テクノロジーのコンポーネント単位でゴールデンシグナルの値を取得し、グラフィカルに提⽰します
    障害の原因分析のサポート

    View full-size slide

  16. @2022 IBM Corporation
    IBM Cloud
    サービスのパフォーマンスの可視化
    n アプリケーションの表⽰
    –サービスとエンドポイントは⾃動的に検出され、動的グラフ(スタック/依存関係)に保存される
    –ゴールデンシグナル: 要求数、応答性能、エラー率 と ヘルス状態を視覚的に表⽰
    1ホスト1エージェ
    ントで自動構成、環
    境の変化に自動追随
    すべての要求をトレース、
    1秒単位のメトリクス、す
    べての構成変更を記録

    View full-size slide

  17. @2022 IBM Corporation
    IBM Cloud
    コンテキストの可視化
    n 依存性マップ
    –データのフローの表⽰
    –カーソルを合わせると
    詳細とメトリックの表⽰
    –特定のメトリックによる
    アイコンの拡⼤表⽰
    –イベントの発⽣状況の
    カラー表⽰
    カーソルを合わ
    せた時にポップ
    アップ表⽰
    特定のメトリックによ
    るアイコンの拡⼤表⽰
    例)Calls(アクセス)が
    多い箇所を拡⼤表⽰

    View full-size slide

  18. @2022 IBM Corporation
    IBM Cloud
    障害の原因分析のサポート
    n エラーからブレイクダウンして詳細を確認
    –呼び出し順序を視覚的に表⽰
    –詳細画⾯ではステータスコードやStack Trace、関連するエラーログ、インフラ情報などを表⽰
    処理ごとに自動的に
    エラー情報と
    StackTraceを提示
    Call毎のレイテン
    シーを提示

    View full-size slide