Upgrade to Pro — share decks privately, control downloads, hide ads and more …

APMって何? 【IBM Observability by Instana】

APMって何? 【IBM Observability by Instana】

6/28 2022に実施したTech Dojoで使用した資料の一部更新バージョンです。
https://ibm-developer.connpass.com/event/252174/

***
本Dojoでは、#APM #Instana #監視というタグに興味がある方向けに、APM入門的な内容をご紹介します。

- Observability?可観測性?
- APMと可観測性って違うの?
- エンドユーザモニタリングに興味がある
- サーバーの運用監視が大変...
コンテナ環境の監視って今までとなにか変わるの?

Junki Sagawa

August 10, 2022
Tweet

More Decks by Junki Sagawa

Other Decks in Technology

Transcript

  1. Application Performance Management 従来の監視 • システムを構成するハードウェア・ソフトウェアが 正常に稼動しているかに注目 1. サーバやストレージ・ネットワーク機器、ハードウェアの状態を監視 –

    CPU・メモリ・ディスクの使用率・使用量は正常? 2. OSやソフトウェアの状態を監視 – プロセスが起動している? – エラー起きていない?
  2. Application Performance Management 従来の監視 レスポンスが 遅いといわれて初めて気づく • → 原因はインフラ? アプリ?

    • → 「基盤運用チーム、原因調査して!」 • → 「CPUもメモリも正常です」 • →「 むむ、そうか。アプリチーム、原因調査して!」 • → 「ログを見てきます」 • → 「とくに変なエラーは出てないですねえ。」
  3. 複雑な時代… • コンテナ • マルチクラウド • マイクロサービス • DevOps •

    etc.. Application Performance Management Node フロント Java Python DBサーバー 認証 SaaS Kubernetes / OpenShift (Container Orchestration)
  4. APM (次世代) 13 Observabilityを実現するツール • システム監視 + APM • ⾃動化

    • 原因分析 • 依存関係 例えば。。。 IBM Observability by Instana APM
  5. @2022 IBM Corporation IBM Cloud 従来の基盤監視だけでは 間に合わない世界が来ている 従来型の監視基盤 ü 個別導⼊とセットアップ

    - 監視対象に応じて導⼊ - 監視対象の設計と設定が必要 ü 得られる情報が少ない - OSレベルの情報のみ - 5秒-30秒の平均値の値 - アプリケーションの挙動が掴めず 改善につなげられない ü オンプレミスとクラウド 別管理 - ユーザーの体験を理解できない - クラウドでツールが別れていて 情報を追えない 新世代 可観測性基盤 ü ゼロ構成と⾃動監視、環境変化にも⾃動追随 - 監視対象を検知し⾃動構成 - 監視対象に対する専⾨知識を反映済み ü ⾼精細データでシステムを可視化 - 全要求トレース+1秒単位メトリック - 基盤からアプリまで多様に渡り可視化 - AIと機械学習で 問題を⾃動検知 - 関連コンポーネントの情報も整理して提⽰ ü オンプレミスと各種クラウドも統合して監視 - WebUIから基幹システムの呼出しまで - 挙動を理解しユーザー体験改善につなげる 14 問題が「おきている」ことが分かる 問題が「なぜ起きているか」分かる 可観測性を強化 よりクリアな視界を 数百〜数千のコンテナ 動的に変化する基盤 多様な技術の利⽤ 多岐にわたる提供サービス 問題判別の複雑化 サービスにフォーカスしたSRE運⽤ 複数クラスタでのサービス提供 基幹システムとの連携 エンドユーザー体験の可視化
  6. @2022 IBM Corporation IBM Cloud サービスのパフォーマンスの可視化 コンテキストの可視化 IBM Observability with

    Instana システムが提供する様々なデータを解析することで、 システムの振る舞いを可視化し、不透明なシステムを透明なシステムに変えるAPMソリューションです Ø概要 • 業界を超えて400以上のお客様(製造、⼩売、通信、⾦融など)が利⽤ • システムの振る舞いを理解し、再起動や再デプロイなしにあらゆる種類のパフォーマンスや問題の分析を⾏います • アプリケーション、サービス、テクノロジーのコンポーネント単位でゴールデンシグナルの値を取得し、グラフィカルに提⽰します 障害の原因分析のサポート
  7. @2022 IBM Corporation IBM Cloud サービスのパフォーマンスの可視化 n アプリケーションの表⽰ –サービスとエンドポイントは⾃動的に検出され、動的グラフ(スタック/依存関係)に保存される –ゴールデンシグナル:

    要求数、応答性能、エラー率 と ヘルス状態を視覚的に表⽰ 1ホスト1エージェ ントで自動構成、環 境の変化に自動追随 すべての要求をトレース、 1秒単位のメトリクス、す べての構成変更を記録
  8. @2022 IBM Corporation IBM Cloud コンテキストの可視化 n 依存性マップ –データのフローの表⽰ –カーソルを合わせると

    詳細とメトリックの表⽰ –特定のメトリックによる アイコンの拡⼤表⽰ –イベントの発⽣状況の カラー表⽰ カーソルを合わ せた時にポップ アップ表⽰ 特定のメトリックによ るアイコンの拡⼤表⽰ 例)Calls(アクセス)が 多い箇所を拡⼤表⽰
  9. @2022 IBM Corporation IBM Cloud 障害の原因分析のサポート n エラーからブレイクダウンして詳細を確認 –呼び出し順序を視覚的に表⽰ –詳細画⾯ではステータスコードやStack

    Trace、関連するエラーログ、インフラ情報などを表⽰ 処理ごとに自動的に エラー情報と StackTraceを提示 Call毎のレイテン シーを提示