$30 off During Our Annual Pro Sale. View Details »

Oracle Database Technology Night #56 データベースエンジニアに向けたOracle Management Cloud 入門・活用方法

Oracle Database Technology Night #56 データベースエンジニアに向けたOracle Management Cloud 入門・活用方法

Oracle Database Technology Night #56 データベースエンジニアに向けたOracle Management Cloud 入門・活用方法 前半

oracle4engineer
PRO

July 25, 2022
Tweet

More Decks by oracle4engineer

Other Decks in Technology

Transcript

  1. データベースエンジニアに向けた Oracle Management Cloud 入門・活用方法 イントロダクション: OCIの運用監視サービス概要 日本オラクル株式会社

  2. 1. マルチクラウド、ハイブリッド環境が本格的に導入される一方、システム運用がより煩雑化 2. 従来のインフラスタック毎や、クラウドネイティブの新たなテクノロジー毎などに個別最適化されたツールを複数利用、非効率 3. 開発者と管理者の連携不足により、DevOpsなシステム開発を阻害 IT運用管理における昨今の課題 オンプレミス オンプレミス クラウド

    管理者 開発者 情報が共有されず、サイロ化 クラウド 多種多様な開発言語や開発環境が存在し、それ毎 の毎に専用のツールを利用 オンプレミス、マルチクラウド環境が存在する一方、管 理ツールはそれぞれで専用のツールを利用 データがサイロ化されているため、システム問題の検出 と解決が困難 フルスタックでの可視性に乏しく、トラブルシューティング に複数のツールを利用 管理ツールの相互運用性がないため、分析のための インテグレーションコストが増大 Copyright © 2022, Oracle and/or its affiliates 2
  3. 機械学習分析によりIT運用作業者の意思決定を支援 Oracle Management Cloud Copyright © 2022, Oracle and/or its

    affiliates 3 • 統合プラットフォーム ログ分析からエンドユーザー性能監視までを4 サービスで提供 - Application Performance Monitoring - Infrastructure Monitoring - Log Analytics - IT Analytics • 高度な分析をお手軽に 必要な設定がプリセットされているため膨大な 運用データを機械学習を利用した分析がすぐ に利用可能 他社クラウド メトリック情報 ログファイル Oracle Management Cloud オンプレミス環境 クラウド環境 Oracle Cloud アラート通知 状態確認 運用担当者 事象解析 をアップロード 1. お客様のIT資産のメトリック情報やログファイルを Oracle Management Cloud へ送信 2. 送信されたIT運用データを Oracle Management Cloud 上で分析 3. 条件に応じてユーザーにアラート通知、Oracle Management Cloudで 状態確認と事象解析を実行 IT運用作業者のアクションを より迅速かつ正確に
  4. クラウドの利点を活かし、人力勝負の運用監視から脱却 Oracle Management Cloud の特徴 定義済み監視テンプレートを使用し 人依存による運用からの脱却 運用者の知見をもとに行っていた作業を機械 学習が実装されたツールを使用することでより 高度な分析を可能にします

    IT運用高度化に必要な要素を 統合プラットフォームとして提供 ログ分析、アプリケーション監視、メトリック監視・ 分析を統合し各サービスを 横断的に利用した高度なIT運用管理を 実現します IT運用SaaS 本番環境にアクセスせず分析 トラブルが発生したのに分析データに アクセスできませんか? Oracle Cloudにアクセスし、いつでもあなた のアプリケーションの様子を 確認することができます Copyright © 2022, Oracle and/or its affiliates 4
  5. マシンラーニング(統計的分析機能)の活用 Oracle Management Cloud の特徴 異常値(アノマリー)検知 過去のデータを基に「通常時の値の 範囲」を算出し、そこから外れたもの (anomaly)を異常として検知 (レスポンス時間等)

    パターン認識と相関分析 似たようなログエントリを自動集計 することで例外的なログを素早く発見 出現パターンが似ているログを自動検知して 関連性を素早く発見 トレンド&フォーキャスト 過去のデータを基にトレンドを発見し、将来 の値を予測 (リソース使用量等) Copyright © 2022, Oracle and/or its affiliates 5
  6. Oracle Management Cloudの主要機能 Copyright © 2022, Oracle and/or its affiliates

    6
  7. ~アプリケーション・パフォーマンスをエンド・ツー・エンドで”見える化” 実際のエンドユーザー体感性能を可視化 すべてのページ(Ajax含)に対するパフォーマ ンスを分析可能 セッションの時系列のアクセス情報を表示 リソース使用量には表面化しないパフォーマ ンス上の問題を、ユーザーの観点で 監視・検出・分析 ベースラインと傾向判断による異常値 (アノマリー)を検知・アラート通知

    Application Performance Monitoring サーバ処理状況の可視化 ユーザー体験の可視化 APM Agent <html>…</html> <script> APMスクリプト </script> ブラウザ・パフォーマンス データ エンドユーザー 体感性能を記録 APサーバー アプリケーションのHTMLに APMスクリプトが自動的に挿入される Application Performance Monitoring Cloud Service Copyright © 2022, Oracle and/or its affiliates 7
  8. ユーザエクスペリエンスを向上 パフォーマンス低下のボトルネック早期分析 Before(現行) ・ユーザ使用時の実レスポンス時間は確認できない ・関連する処理の洗い出しから必要になり工数が必要 ・多数サーバ構成では該当処理の実行サーバを特定する だけでも時間とアプリケーションの知識が必要 After(OMC利用) 利用者から「遅い」とのクレームにより調査開始 ➡ボトルネック特定のため、設計書・各種ログから分析作業を実施

    ある画面のパフォーマンス低下発生 設計書から関連処理の洗い出し 関連ログの収集 ボトルネック特定分析 ・各ユーザの実際の体感性能を確認可能 ・ドリルダウンによりアプリケーション知識、サーバ構成 を意識しなくても原因追及が可能 特定ページのアクセス一覧 特定ユーザセッションのタイムライン 各ユーザセッション情報へドリルダウン ページのアクセス一覧から、パフォーマンス劣化の連絡があった セッションを特定し、実データもとにボトルネックを分析 Copyright © 2022, Oracle and/or its affiliates 8
  9. ~柔軟・包括的なインフラ監視フレームワーク Infrastructure Monitoring 他社クラウド メトリック情報 をアップロード Infrastructure Monitoring Cloud Service

    オンプレミス環境 クラウド環境 Oracle Cloud エージェント 経由 エージェント or REST API 経由 アラート通知 状態確認 保守担当者 事象解析 包括的な監視フレームワーク • オンプレミスやIaaS上のターゲット監視 • クラウドサービスの監視 • 監視対象の拡張 • しきい値設定とアラート通知 パフォーマンス異常の自動検知 • ベースラインを自動的に算出し「通常」の動きを決定 • アノマリー=範囲を超えたメトリック値 Host (OS) Oracle Database / MySQL Microsoft SQL Server Apache Tomcat Oracle WebLogic Server Docker Engine / Container Switch Etc. 事前定義済みの監視ターゲットと監視項目 • ヘテロジニアス環境に対応 • ターゲットタイプごとに事前定義済み監視項目を提供 Copyright © 2022, Oracle and/or its affiliates 9
  10. クラウド活用した高速なシステムリリースを実現 運用稼働情報の集計・分析の自動化 Copyright © 2022, Oracle and/or its affiliates 10

    Before(現行) ・経験者による作業が必要 ・集計処理やレポート作成の工数が必要 ・リアルタイム性に欠ける After(OMC利用) システムリリース時に必要なインフラリソースを算出するために 一定期間の運用稼働情報の手動集計が必要 ・メトリック監視のデータで分析用グラフを自動生成 ・システムに最適なリソース量を機械学習で算出 ・運用者のリソース見積分析をスピードアップ メトリック監視で取得したデータを基に将来の予測値を算出 キャパシティ計画を支援 2016-02-29 19:23:42,317 [[ACTIVE] ExecuteThread: '6' for queue: 'weblogic.kernel.Default (self-tuning)'] ERROR console.ConsolePerfCollecto r logp.251 - Session Expired while processing page with viewId null,so tracing for the page is not recorded. ConsolePerfTraceDatais... 2016-03-11 17:10:08,130 [EMUI_17_10_08_/console/ database/instance/orarep/s qlmonitor/list] ERROR reports.ReportXmlBean logp.251 - getReportXML SQLException: ORA-31011: XML解析に失敗しました ORA-19213: 行 1 LPX-00118: Warning: エン ティティ “amp;inst_id=1&amp”が未 定義です ... 2016-02-29 19:23:42,317 [[ACTIVE] ExecuteThread: '6' for queue: 'weblogic.kernel.Default (self-tuning)'] ERROR console.ConsolePerfCollecto r logp.251 - Session Expired while processing page with viewId null,so tracing for the page is not recorded. ConsolePerfTraceDatais... 2016-03-11 17:10:08,130 [EMUI_17_10_08_/console/ database/instance/orarep/s qlmonitor/list] ERROR reports.ReportXmlBean logp.251 - getReportXML SQLException: ORA-31011: XML解析に失敗しました ORA-19213: 行 1 LPX-00118: Warning: エン ティティ “amp;inst_id=1&amp”が未 定義です ... ・・・
  11. 機械学習を適用して、パターンや外れ値を発見しシステムの異常を特定 Logging Analyticsは、システムのログを収集・分析し、脅威や新しい知見を検出します。検知された内容は、ビジュア ライズされた管理画面より詳細を確認することが可能です。 Log Analytics ✓ Agentによるログ自動収集とログ分析可能 ✓ GUIベースでインタラクティブにログ分析

    ✓ すべてのログを横断した検索&可視化が可能 ✓ 機械学習を活用した大量ログの高速分析 ✓ OCIサービスとシームレスな統合 Copyright © 2022, Oracle and/or its affiliates 11
  12. エラーの原因特定と影響範囲の効率的な分析 多数のログを横断した高速な原因究明 Before(現行) After(OMC利用) ・分析をする前の関連ログの収集、整形にかなりの 工数が必要 ・大量のログから該当箇所の特定にも時間を要する サーバ処理でエラー発生 ➡エラーの原因調査とユーザーへの影響範囲を調査 サーバ処理でエラーが発生

    個別ログによるエラー箇所特定、原因・影響範囲調査 インフラログ調査 DBログ調査 アプリログ調査 関連ログの相関分析・調査 ・エラー発生個所/時間帯、各処理関連性を迅速に把握 ・該当処理の関連ログ分析までシームレスに実施可能 ・大量ログから見るべき箇所を自動的に抽出 どの処理でエラーが発生して いるのかを特定 各処理の流れ・依存関係を確認 詳細画面へドリルダウン 関連ログ(OS、DB、アプリ)の分析 エラー発生時間帯の ログ分析画面へ遷移 関連ログの出力傾向や Anomaly出力を自動検知 Copyright © 2022, Oracle and/or its affiliates 12
  13. 2体系の提供形態 • オンプレミスから様々なクラウド基盤のサーバーやソフトウェアを 幅広く監視する統合運用監視サービス • PaaSとして提供され、監視エージェントを対象サーバーにイン ストールする • OS、データベース、ミドルウェア、コンテナ、ネットワーク機器な ど様々なシステム・リソースを統合監視

    • OCIに組み込まれた運用管理サービス • OCIの機能として提供され、監視エージェントはコンピュートに ビルドインされている (※機能によっては別途エージェントイン ストールが必要) • OCIサービスの監視は、細かい情報が取得可能 • Database Managementは新たな機能として提供 参考: Oracle Cloud Management Platform の2つのサービス Oracle Management Cloud (PaaS版) Oracle Cloud Observability and Management Platform (IaaS版) Copyright © 2022, Oracle and/or its affiliates 13
  14. DBCS, ExaCSでスムーズに利用開始できるDB管理サービス オンプレミスやクラウド上にあるOracle Databaseの稼働状況を 一元的に管理する統合ビュー CPU、メモリ、I/O、表領域などのリソース使用率 SQLジョブの実行管理 AWRエクスプローラによるリアルタイム解析やレポーティング 詳細なパフォーマンス分析 -

    リアルタイムSQLモニタリング - ASH分析、実行計画、ブロッキングセッション検出 対応バージョン:Oracle Database 11.2.0.4以上 (SEの場合は一部機能制限あり) 対象データベース: DBCS(VM, BareMetal)、ExaCS、外部データベース(オンプレミス、他社クラウド 含むパブリック接続可能なOracle Database) 参考: Observability and Management / Database Management Copyright © 2022, Oracle and/or its affiliates 14
  15. None