$30 off During Our Annual Pro Sale. View Details »

20251126_AIOps を始めよう on ガバメントクラウド

Avatar for Yozo Suzuki Yozo Suzuki
November 26, 2025

20251126_AIOps を始めよう on ガバメントクラウド

2025/11/26に開催されたガバメントクラウドワークショップでガバメントクラウドで始める
AIOps について話しました。

Avatar for Yozo Suzuki

Yozo Suzuki

November 26, 2025
Tweet

More Decks by Yozo Suzuki

Other Decks in Technology

Transcript

  1. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. AIOpsを始めよう on ガバメントクラウド Yozo Suzuki アマゾン ウェブ サービス ジャパン 合同会社 パブリックセクター 技術統括本部 ソリューションアーキテクト
  2. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. ⾃⼰紹介 鈴⽊ 陽三 アマゾンウェブサービスジャパン プロトタイピング ソリューションアーキテクト 公共領域のお客様をご⽀援 好きなサービス • AWS Cloud Development Kit (CDK) • AWS IAM Identity Center
  3. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 1. AIOps が解決する課題 2. ガバメントクラウドで始めるために 3. 本番導⼊に向けて 3 アジェンダ
  4. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. AIOps が解決する課題 4
  5. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 5 運⽤において、こんなお悩みないでしょうか︖ サーバーのCPUやメモリは正常だが、 アプリのどの処理が重いのか分からない 毎日数百件のアラートが来るが、 本当に重要なものがどれか分からない 障害発生時にログやメトリクスの分析に 時間が多く取られてしまい、復旧に時間がかかる リソースの最適化をしてみたが、 本当に最適化どうかの判断が難しい コスト削減できるかどうか判断つかない 20年前のシステムを改修しているが、 技術仕様書が不完全で理解に時間がかかる
  6. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 6 AIOps の主なユースケース • これまで⼈が分析や確認をしていたタスクに対し、省⼒化・効率化が⾒込める • また、⼈依存になりやすいタスクの均質化も狙える APM • メトリクス 分析 根本原因分析 • メトリクスの 相関分析 • アラートの解 説・影響確認 • ログやトレー スの時系列分 析 異常検出 • 運用データ からの 異常パターン 学習 • セキュリティ 異常の解説・ 影響確認 クラウドの 自動化・最適化 • 需要予測と スケーリング • コストの分析 アプリケーション 開発サポート • コード生成・ 最適化 • コードの レビューや 解説
  7. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 7 AIOps とは IT 運⽤のための AI (AIOps) は、⼈⼯知能 (AI) テクノロジーを使⽤して IT インフラストラクチャを維 持するプロセスです。パフォーマンスモニタリング、ワークロードスケジューリング、データバック アップなどの重要な運⽤タスクを⾃動化します。AIOps テクノロジーは、最新の機械学習 (ML)、⾃ 然⾔語処理 (NLP)、およびその他の⾼度な AI ⼿法を使⽤して、IT の運⽤効率を向上させます。さま ざまなソースからデータを収集して分析することで、積極的でパーソナライズされたリアルタイムの インサイトを IT 運⽤にもたらします。 出典: AIOps とは何ですか? (https://aws.amazon.com/jp/what-is/aiops/)
  8. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 8 AIOps の前提 AIOps テクノロジーは、最新の機械学習 (ML)、⾃然⾔語処理 (NLP)、およびその他 の⾼度な AI ⼿法を使⽤して、IT の運⽤効率を向上させます。さまざまなソースから データを収集して分析することで、積極的でパーソナライズされたリアルタイムの インサイトを IT 運⽤にもたらします。 AIOps を⾏うためには、データが収集可能な状態であることが求められます 求められるデータの例︓ • テレメトリデータ(ログ・メトリクス・トレース) • コスト(クラウドのサービスごとの利⽤料、など) • イベントデータ(アラート、セキュリティイシュー、ヘルスイベント、など) • ソースコード(アプリケーションだけでなく、IaCもあるとベター)
  9. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 9 AIOps はクラウドで始めやすい︖ • デフォルトで、データを取得済みであることが多く、データをAPI経由で取得で きるため、AI が活⽤しやすい • イベントデータ、コストはもちろん、テレメトリデータもデフォルトで設定済み なことが多い(トレースなど、オプショナルな項⽬はありますが) AWS Cost & Usage Report AWS Cost Explorer AWS CloudTrail AWS Security Hub AWS Health Dashboard イベントデータ コスト テレメトリデータ AWS Distro for OpenTelemetry Amazon CloudWatch
  10. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 10 AIOps はクラウドで始めやすい︖ • デフォルトで、データを取得済みであることが多く、データをAPI経由で取得で きるため、AI が活⽤しやすい • イベントデータ、コストはもちろん、テレメトリデータもデフォルトで設定済み なことが多い(トレースなど、オプショナルな項⽬はありますが) AWS Cost & Usage Report AWS Cost Explorer AWS CloudTrail AWS Security Hub AWS Health Dashboard イベントデータ コスト テレメトリデータ AWS Distro for OpenTelemetry Amazon CloudWatch ガバメントクラウドは ベースラインが整備されているため、より始めやすい
  11. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 11 AIOps をさらに活⽤するために コンテキスト強化のために、 “オブザーバビリティ(デフォルト以外のログなど)”や ”IaC” が求められる AWS Distro for OpenTelemetry Amazon CloudWatch AWS CloudFormation AWS Cloud Development Kit (AWS CDK) 3rd Party IaC ツール (Terraformなど) オブザーバビリティ Infrastructure as Code (IaC) テレメトリデータが整備されている と AI は推論しやすくなる AI がコードを参照し、原因分析可能になる 開発エージェントと組み合わせて、修正までカバーできる Observability 成熟度モデル (https://aws-observability.github.io/observability-best-practices/ja/guides/observability-maturity-model/)
  12. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 12 AIOps をさらに活⽤するために コンテキスト強化のために、 “オブザーバビリティ(デフォルト以外のログなど)”や ”IaC” が求められる AWS Distro for OpenTelemetry Amazon CloudWatch AWS CloudFormation AWS Cloud Development Kit (AWS CDK) 3rd Party IaC ツール (Terraformなど) オブザーバビリティ Infrastructure as Code (IaC) テレメトリデータが整備されている と AI は推論しやすくなる AI がコードを参照し、原因分析可能になる 開発エージェントと組み合わせて、修正までカバーできる Observability 成熟度モデル (https://aws-observability.github.io/observability-best-practices/ja/guides/observability-maturity-model/) GCAS ガイドでも、モダン化の⽂脈で これらの重要性は述べられています AIOps でも活⽤できると⼀⽯⼆⿃です
  13. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. ガバメントクラウドで始めるために 13
  14. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 利⽤リージョンの制限 AWS Marketplace は原則利⽤ 不可 AWS Organizations を介した 機能の制限 14 AIOps をする上で、気にすべきガバメントクラウドの仕様 原則、国内(東京・⼤阪)の 2リージョンしか利⽤できな い Claude などの 3rd Party モデルを利⽤するためには、 Marketplace の利⽤が必要 Amazon Nova シリーズや Amazon Titan であれば利⽤可 能だが、クロスリージョン推 論が APAC だと利⽤できない Security Hub CSPM といった Organizations 単位でデータを 集約するような機能は利⽤で きず、個別に複数アカウント のデータを集約する必要があ る Amazon Bedrock の利⽤に影響がある仕様 ※モデル利⽤やクロスリージョン推論に影響あり データ参照時に影響がある仕様 ※シングルアカウントなら影響なし
  15. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 15 ガバメントクラウドにおける 3rd party モデル の利⽤⽅法 • 株式会社⼤崎コンピュータエンヂニアリング様の事例では、 ⾃社アカウントの Bedrock へ接続し、3rd party モデルを利⽤しています 引⽤元:【寄稿】生成 AI 活用によるガバメントクラウド環境運用管理補助業務の効率化 (https://aws.amazon.com/jp/blogs/news/gov-cloud-ops-with-genai/)
  16. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 16 マルチアカウント構成におけるデータ参照 • クロスアカウントオブザーバビリティのような機能が提供されているリソースは 問題ありませんが、そうでないケースは、⼯夫が必要になります • 例1︓コスト情報や Trail ログを Athena でクエリできる環境の整備 - 個々のアカウントの CUR 2.0 を S3 へ集約し、Athena でクエリ可能にする - 例えば、CID の以下の⻘⾊の部分だけ採⽤する、など 引⽤元︓Deployment in Global Regions (https://docs.aws.amazon.com/guidance/latest/cloud-intelligence-dashboards/deployment-in-global-regions.html)
  17. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 17 マルチアカウント構成におけるデータ参照 • クロスアカウントオブザーバビリティのような機能が提供されているリソースは 問題ありませんが、そうでないケースは、⼯夫が必要になります • 例2︓クロスアカウントアクセスして情報を取得するエージェントを作る - 各アカウントにクロスアカウントロールを作成し、 エージェントが⼀時認証情報を取得した上で、リソース情報を取得します - Bedrock の利⽤を運⽤監視アカウントに限定できます(ガバクラと相性◯) AIOps エージェントや⼦エージェントが ⾃社アカウントの Bedrock を利⽤する場合、 運⽤監視アカウントだけ接続すれば良い
  18. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. CloudWatch Investigations※1 Amazon Q Developer※2 ⾃作エージェント(Strands) 18 AIOps エージェントの候補⼀例 CloudWatch に組み込ま れた運⽤調査機能。テレ メトリデータを参照し、 マルチアカウントでも分 析可能 MCP Client として動作す るため、AWS Core MCP Server と組み合わせ、 運⽤タスクを実施可能 (VS Code + Cline などでも可) Strands SDK などを利⽤ し、独⾃のAIOps エー ジェントを開発する ⾃由度は⼀番⾼い 導⼊が容易だが対応タスクが限定的 対応範囲は広いが実装/設定が必要 ※1. 2025/11/26現在、⽇本語未対応かつ、海外でクロスリージョン推論される。また、全てのAWSサービスにはアクセスできない https://docs.aws.amazon.com/ja_jp/AmazonCloudWatch/latest/monitoring/Investigations-Security.html#cross-region-inference ※2. 2025/11/26現在(⼀部)コンテンツが海外リージョンに保存される https://docs.aws.amazon.com/ja_jp/amazonq/latest/qdeveloper-ug/data-storage.html
  19. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. CloudWatch Investigations※1 Amazon Q Developer※2 ⾃作エージェント(Strands) 19 AIOps エージェントの候補⼀例 CloudWatch に組み込ま れた運⽤調査機能。テレ メトリデータを参照し、 マルチアカウントでも分 析可能 MCP Client として動作す るため、AWS Core MCP Server と組み合わせ、 運⽤タスクを実施可能 (VS Code + Cline などでも可) Strands SDK などを利⽤ し、独⾃のAIOps エー ジェントを開発する ⾃由度は⼀番⾼い 導⼊が容易だが対応タスクが限定的 対応範囲は広いが実装/設定が必要 ※1. 2025/11/26現在、⽇本語未対応かつ、海外でクロスリージョン推論される。また、全てのAWSサービスにはアクセスできない https://docs.aws.amazon.com/ja_jp/AmazonCloudWatch/latest/monitoring/Investigations-Security.html#cross-region-inference ※2. 2025/11/26現在(⼀部)コンテンツが海外リージョンに保存される https://docs.aws.amazon.com/ja_jp/amazonq/latest/qdeveloper-ug/data-storage.html 注釈の通り、ガバメントクラウドでは利⽤にハードルがある 実質これになる。。が、 今みなさんが感じた ハードルを超えたい。。︕
  20. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 20 Strands SDK と MCP Server で作る AIOps エージェント • Strands SDK を⽤いて AWS Core MCP Server を連携させると、 約150⾏の Python コードで AWS で活⽤できる AIOps エージェントが書けます - AWS が提供する MCP Server は API 実⾏、コスト情報取得、ドキュメント検索、 といった情報取得やリソース操作が可能です > https://awslabs.github.io/mcp/ - 本エージェントはシンプルですが、障害分析やコスト分析、リソース分析など、 様々なタスクをお試しいただけます - Python 実⾏環境と AWS の認証情報があれば、動きます (ローカル、踏み台、etc) • まずは簡易的に始めてみて、どんなことができるのか、悩みを解決できそうか、 をお試しいただくと良いと思います
  21. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 21 構成例︓シングルアカウント版 エージェントの実⾏環境は、⽤途に依存します 例︓ - お試しなら、ローカル - 踏み台で利⽤するなら、EC2 or コンテナ - どこからでも呼び出したいなら、AgentCore など
  22. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 22 構成例︓マルチアカウント版 エージェントの⽤途に応じて 前述の情報取得の仕組みを追加します
  23. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 23 デモ|現在稼働しているECSサービスはこの1週間正常に稼働していましたか︖ メトリクスを確認し、リソースを最適化する必要があるか教えてください。
  24. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. コードサンプル 1/2 from strands import Agent from strands.agent.conversation_manager import NullConversationManager from strands_tools import current_time from mcp import stdio_client, StdioServerParameters from strands.tools.mcp import MCPClient aws_profile = "your_profile" aws_region = "us-east-1" stdio_mcp_client = MCPClient(lambda: stdio_client( StdioServerParameters( command="uvx", args=["awslabs.core-mcp-server"], env={ "AWS_REGION": aws_region, "AWS_API_MCP_PROFILE_NAME": aws_profile, # for aws-api-server tool "AWS_PROFILE": aws_profile, "aws-foundation": "true", "sql-db-specialist": "true", "solutions-architect": "true", "security-identity": "true", "monitoring-observability": "true", "finops": "true", "MCP_LOG_LEVEL": "ERROR", "FASTMCP_LOG_LEVEL": "ERROR", }, ) )) def main(): """ メインの実⾏ループ """ print("=" * 60) print("AIOps Buddy へようこそ") print("=" * 60) print("MCPサーバーを起動中...") print("(初回起動時は時間がかかる場合があります)") print("-" * 60) try: # Create an agent with tools from the community-driven strands-tools package # as well as our custom letter_counter tool with stdio_mcp_client: aws_mcp_tools = stdio_mcp_client.list_tools_sync() conversation_manager = NullConversationManager() agent = Agent( tools=[aws_mcp_tools, current_time], conversation_manager=conversation_manager, system_prompt=""" あなたは、ログ分析やパフォーマンス分析、および異常検知を専⾨とするAIOpsエージェントです。 ユーザーは、⽇々の運⽤に関する質問や問題を提⽰します。 さらに、ユーザはシステムログやテレメトリデータ、コストデータなどを提供しますので、これらのデータを分析し、ユーザーからの質問や問題を解決してください。 ※あくまでサンプル実装なので、⼗分な検証・レビューをお願いします MCP Serverの設定 Agent の設定
  25. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. コードサンプル 2/2 役割︓ - テレメトリデータの分析と異常検知 - アラートに対する分析と対応策の提案 - 根本原因の診断と障害対応⽀援 - システムパフォーマンスの最適化提案 - データベースパフォーマンス分析と最適化 - SQL クエリの分析と改善提案 - データベース容量計画とスケーリング⽀援 - セキュリティインシデントの調査⽀援 - AWS コスト分析と削減提案 - リソース使⽤量の最適化 利⽤可能な専⾨ツール︓ 【AWS Foundation】 - aws-knowledge-server: AWS知識ベースとベストプラクティス - aws-api-server: AWS API操作とリソース管理 【SQL Database Specialist】 - postgres-server: PostgreSQL データベース管理 - mysql-server: MySQL データベース管理 - aurora-dsql-server: Aurora DSQL データベース管理 - redshift-server: Amazon Redshift データウェアハウス管理 【Solutions Architect】 - diagram-server: アーキテクチャ図の作成と管理 - pricing-server: AWS料⾦計算とコスト⾒積もり - cost-explorer-server: コスト分析とレポート - syntheticdata-server: 合成データ⽣成 - aws-knowledge-server: AWS知識ベースとベストプラクティス 【Security & Identity】 - iam-server: IAM ポリシーとロール管理 - support-server: AWS サポートケース管理 - well-architected-security-server: セキュリティベストプラクティス 【Monitoring & Observability】 - cloudwatch-server: CloudWatch メトリクス、ログ、アラーム管理 - cloudwatch-appsignals-server: アプリケーションシグナル監視 - prometheus-server: Prometheus メトリクス管理 - cloudtrail-server: AWS API コール監査ログ 【FinOps】 - cost-explorer-server: コスト分析とレポート - pricing-server: AWS料⾦計算とコスト⾒積もり - cloudwatch-server: リソース使⽤量監視 - billing-cost-management-server: 請求とコスト管理 """ ) print("MCPサーバー起動完了!") print("質問を⼊⼒してください") print("終了するには 'quit', 'exit', または '終了' と⼊⼒してください") print("-" * 60) while True: try: # ユーザーからの⼊⼒を受け取る message = input("¥n質問: ").strip() # 終了条件のチェック if message.lower() in ['quit', 'exit', '終了', 'q']: print("¥nシステムを終了します。") break # 空の⼊⼒をスキップ if not message: print("質問を⼊⼒してください。") continue # エージェントに質問を処理させる print("¥n" + "=" * 60) print("処理中...") print("=" * 60) agent(message) print("¥n" + "-" * 60) print("処理完了") print("-" * 60) except KeyboardInterrupt: print("¥n¥nシステムを終了します。") break except Exception as e: print(f"¥nエラーが発⽣しました: {e}") print("もう⼀度お試しください。") except Exception as e: print(f"¥nMCPサーバーの起動に失敗しました: {e}") print("以下を確認してください:") print("1. AWS認証情報が正しく設定されているか") print("2. インターネット接続が正常か") print(f"3. {aws_profile} プロファイルが存在するか") print("¥nAWS CLIで以下のコマンドを実⾏して確認してください:") print("aws configure list-profiles") print(f"aws sts get-caller-identity --profile {aws_profile}") if __name__ == "__main__": main() ※あくまでサンプル実装なので、⼗分な検証・レビューをお願いします 対話 インタフェース プロンプト
  26. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 本番導⼊に向けて 26
  27. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 27 本番導⼊に向けて • まずは⼀つのタスクから - ⼀度に全てのタスクに適⽤すると、効果検証もしづらくなります まずは⽬標を定め、効果が出るのか、精度はどうか、⼩さく始めましょう • 運⽤作業フローも⾒直しが必要 - レビュータイミングやエージェントのトリガーの⾃動化などによって、 AIOps エージェントを適切に利⽤し、より作業負荷を軽減することが可能です • エージェントも最適化が必要 - タスクが曖昧だったり、ツールが余分に設定されていたりすると、使うツール を間違えてしまうことがあり、コストが余分にかかってしまいます - そこで、エージェントを個別に切り出したり、ツール(MCP Server)を必要な 分だけ設定するなど、最適化が重要になります
  28. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 28 終わりに • AIOps は煩雑かつ時間のかかる運⽤タスクを効率化するアプローチです • まずは簡単に始められ、かつ効果の⾼そうなタスクから試し、 運⽤コストを下げ、より価値創出に時間を掛けられるようにしましょう
  29. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Thank you! © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved.