$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20251126_AIOps を始めよう on ガバメントクラウド
Search
Yozo Suzuki
November 26, 2025
Technology
0
36
20251126_AIOps を始めよう on ガバメントクラウド
2025/11/26に開催されたガバメントクラウドワークショップでガバメントクラウドで始める
AIOps について話しました。
Yozo Suzuki
November 26, 2025
Tweet
Share
More Decks by Yozo Suzuki
See All by Yozo Suzuki
持続可能なクラウドガバナンス運用 - スモールステップと生成AIで始める運用効率化
suzukyz
1
290
運用イベント対応への生成AIの活用 with Failure Analysis Assistant
suzukyz
0
490
Other Decks in Technology
See All in Technology
Contract One Engineering Unit 紹介資料
sansan33
PRO
0
9.8k
mablでリグレッションテストをデイリー実行するまで #mablExperience
bengo4com
0
450
Kill the Vibe?Architecture in the age of AI
stoth
1
150
TypeScript×CASLでつくるSaaSの認可 / Authz with CASL
saka2jp
2
170
Data Hubグループ 紹介資料
sansan33
PRO
0
2.3k
Digital omtanke på Internetdagarna 2025
axbom
PRO
0
160
Capture Checking / Separation Checking 入門
tanishiking
0
110
Google Stitch 大型アップデートが実現するアイデアとコードの完全なる融合
nekoailab
0
100
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
970
AI 時代のデータ戦略
na0
8
2.9k
タグ付きユニオン型を便利に使うテクニックとその注意点
uhyo
1
390
プラットフォームエンジニアリングとは何であり、なぜプラットフォームエンジニアリングなのか
doublemarket
1
510
Featured
See All Featured
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.3k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
VelocityConf: Rendering Performance Case Studies
addyosmani
333
24k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
Art, The Web, and Tiny UX
lynnandtonic
303
21k
How to train your dragon (web standard)
notwaldorf
97
6.4k
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.1k
Testing 201, or: Great Expectations
jmmastey
46
7.8k
The Invisible Side of Design
smashingmag
302
51k
Unsuck your backbone
ammeep
671
58k
Transcript
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. AIOpsを始めよう on ガバメントクラウド Yozo Suzuki アマゾン ウェブ サービス ジャパン 合同会社 パブリックセクター 技術統括本部 ソリューションアーキテクト
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. ⾃⼰紹介 鈴⽊ 陽三 アマゾンウェブサービスジャパン プロトタイピング ソリューションアーキテクト 公共領域のお客様をご⽀援 好きなサービス • AWS Cloud Development Kit (CDK) • AWS IAM Identity Center
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 1. AIOps が解決する課題 2. ガバメントクラウドで始めるために 3. 本番導⼊に向けて 3 アジェンダ
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. AIOps が解決する課題 4
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 5 運⽤において、こんなお悩みないでしょうか︖ サーバーのCPUやメモリは正常だが、 アプリのどの処理が重いのか分からない 毎日数百件のアラートが来るが、 本当に重要なものがどれか分からない 障害発生時にログやメトリクスの分析に 時間が多く取られてしまい、復旧に時間がかかる リソースの最適化をしてみたが、 本当に最適化どうかの判断が難しい コスト削減できるかどうか判断つかない 20年前のシステムを改修しているが、 技術仕様書が不完全で理解に時間がかかる
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 6 AIOps の主なユースケース • これまで⼈が分析や確認をしていたタスクに対し、省⼒化・効率化が⾒込める • また、⼈依存になりやすいタスクの均質化も狙える APM • メトリクス 分析 根本原因分析 • メトリクスの 相関分析 • アラートの解 説・影響確認 • ログやトレー スの時系列分 析 異常検出 • 運用データ からの 異常パターン 学習 • セキュリティ 異常の解説・ 影響確認 クラウドの 自動化・最適化 • 需要予測と スケーリング • コストの分析 アプリケーション 開発サポート • コード生成・ 最適化 • コードの レビューや 解説
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 7 AIOps とは IT 運⽤のための AI (AIOps) は、⼈⼯知能 (AI) テクノロジーを使⽤して IT インフラストラクチャを維 持するプロセスです。パフォーマンスモニタリング、ワークロードスケジューリング、データバック アップなどの重要な運⽤タスクを⾃動化します。AIOps テクノロジーは、最新の機械学習 (ML)、⾃ 然⾔語処理 (NLP)、およびその他の⾼度な AI ⼿法を使⽤して、IT の運⽤効率を向上させます。さま ざまなソースからデータを収集して分析することで、積極的でパーソナライズされたリアルタイムの インサイトを IT 運⽤にもたらします。 出典: AIOps とは何ですか? (https://aws.amazon.com/jp/what-is/aiops/)
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 8 AIOps の前提 AIOps テクノロジーは、最新の機械学習 (ML)、⾃然⾔語処理 (NLP)、およびその他 の⾼度な AI ⼿法を使⽤して、IT の運⽤効率を向上させます。さまざまなソースから データを収集して分析することで、積極的でパーソナライズされたリアルタイムの インサイトを IT 運⽤にもたらします。 AIOps を⾏うためには、データが収集可能な状態であることが求められます 求められるデータの例︓ • テレメトリデータ(ログ・メトリクス・トレース) • コスト(クラウドのサービスごとの利⽤料、など) • イベントデータ(アラート、セキュリティイシュー、ヘルスイベント、など) • ソースコード(アプリケーションだけでなく、IaCもあるとベター)
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 9 AIOps はクラウドで始めやすい︖ • デフォルトで、データを取得済みであることが多く、データをAPI経由で取得で きるため、AI が活⽤しやすい • イベントデータ、コストはもちろん、テレメトリデータもデフォルトで設定済み なことが多い(トレースなど、オプショナルな項⽬はありますが) AWS Cost & Usage Report AWS Cost Explorer AWS CloudTrail AWS Security Hub AWS Health Dashboard イベントデータ コスト テレメトリデータ AWS Distro for OpenTelemetry Amazon CloudWatch
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 10 AIOps はクラウドで始めやすい︖ • デフォルトで、データを取得済みであることが多く、データをAPI経由で取得で きるため、AI が活⽤しやすい • イベントデータ、コストはもちろん、テレメトリデータもデフォルトで設定済み なことが多い(トレースなど、オプショナルな項⽬はありますが) AWS Cost & Usage Report AWS Cost Explorer AWS CloudTrail AWS Security Hub AWS Health Dashboard イベントデータ コスト テレメトリデータ AWS Distro for OpenTelemetry Amazon CloudWatch ガバメントクラウドは ベースラインが整備されているため、より始めやすい
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 11 AIOps をさらに活⽤するために コンテキスト強化のために、 “オブザーバビリティ(デフォルト以外のログなど)”や ”IaC” が求められる AWS Distro for OpenTelemetry Amazon CloudWatch AWS CloudFormation AWS Cloud Development Kit (AWS CDK) 3rd Party IaC ツール (Terraformなど) オブザーバビリティ Infrastructure as Code (IaC) テレメトリデータが整備されている と AI は推論しやすくなる AI がコードを参照し、原因分析可能になる 開発エージェントと組み合わせて、修正までカバーできる Observability 成熟度モデル (https://aws-observability.github.io/observability-best-practices/ja/guides/observability-maturity-model/)
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 12 AIOps をさらに活⽤するために コンテキスト強化のために、 “オブザーバビリティ(デフォルト以外のログなど)”や ”IaC” が求められる AWS Distro for OpenTelemetry Amazon CloudWatch AWS CloudFormation AWS Cloud Development Kit (AWS CDK) 3rd Party IaC ツール (Terraformなど) オブザーバビリティ Infrastructure as Code (IaC) テレメトリデータが整備されている と AI は推論しやすくなる AI がコードを参照し、原因分析可能になる 開発エージェントと組み合わせて、修正までカバーできる Observability 成熟度モデル (https://aws-observability.github.io/observability-best-practices/ja/guides/observability-maturity-model/) GCAS ガイドでも、モダン化の⽂脈で これらの重要性は述べられています AIOps でも活⽤できると⼀⽯⼆⿃です
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. ガバメントクラウドで始めるために 13
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 利⽤リージョンの制限 AWS Marketplace は原則利⽤ 不可 AWS Organizations を介した 機能の制限 14 AIOps をする上で、気にすべきガバメントクラウドの仕様 原則、国内(東京・⼤阪)の 2リージョンしか利⽤できな い Claude などの 3rd Party モデルを利⽤するためには、 Marketplace の利⽤が必要 Amazon Nova シリーズや Amazon Titan であれば利⽤可 能だが、クロスリージョン推 論が APAC だと利⽤できない Security Hub CSPM といった Organizations 単位でデータを 集約するような機能は利⽤で きず、個別に複数アカウント のデータを集約する必要があ る Amazon Bedrock の利⽤に影響がある仕様 ※モデル利⽤やクロスリージョン推論に影響あり データ参照時に影響がある仕様 ※シングルアカウントなら影響なし
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 15 ガバメントクラウドにおける 3rd party モデル の利⽤⽅法 • 株式会社⼤崎コンピュータエンヂニアリング様の事例では、 ⾃社アカウントの Bedrock へ接続し、3rd party モデルを利⽤しています 引⽤元:【寄稿】生成 AI 活用によるガバメントクラウド環境運用管理補助業務の効率化 (https://aws.amazon.com/jp/blogs/news/gov-cloud-ops-with-genai/)
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 16 マルチアカウント構成におけるデータ参照 • クロスアカウントオブザーバビリティのような機能が提供されているリソースは 問題ありませんが、そうでないケースは、⼯夫が必要になります • 例1︓コスト情報や Trail ログを Athena でクエリできる環境の整備 - 個々のアカウントの CUR 2.0 を S3 へ集約し、Athena でクエリ可能にする - 例えば、CID の以下の⻘⾊の部分だけ採⽤する、など 引⽤元︓Deployment in Global Regions (https://docs.aws.amazon.com/guidance/latest/cloud-intelligence-dashboards/deployment-in-global-regions.html)
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 17 マルチアカウント構成におけるデータ参照 • クロスアカウントオブザーバビリティのような機能が提供されているリソースは 問題ありませんが、そうでないケースは、⼯夫が必要になります • 例2︓クロスアカウントアクセスして情報を取得するエージェントを作る - 各アカウントにクロスアカウントロールを作成し、 エージェントが⼀時認証情報を取得した上で、リソース情報を取得します - Bedrock の利⽤を運⽤監視アカウントに限定できます(ガバクラと相性◯) AIOps エージェントや⼦エージェントが ⾃社アカウントの Bedrock を利⽤する場合、 運⽤監視アカウントだけ接続すれば良い
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. CloudWatch Investigations※1 Amazon Q Developer※2 ⾃作エージェント(Strands) 18 AIOps エージェントの候補⼀例 CloudWatch に組み込ま れた運⽤調査機能。テレ メトリデータを参照し、 マルチアカウントでも分 析可能 MCP Client として動作す るため、AWS Core MCP Server と組み合わせ、 運⽤タスクを実施可能 (VS Code + Cline などでも可) Strands SDK などを利⽤ し、独⾃のAIOps エー ジェントを開発する ⾃由度は⼀番⾼い 導⼊が容易だが対応タスクが限定的 対応範囲は広いが実装/設定が必要 ※1. 2025/11/26現在、⽇本語未対応かつ、海外でクロスリージョン推論される。また、全てのAWSサービスにはアクセスできない https://docs.aws.amazon.com/ja_jp/AmazonCloudWatch/latest/monitoring/Investigations-Security.html#cross-region-inference ※2. 2025/11/26現在(⼀部)コンテンツが海外リージョンに保存される https://docs.aws.amazon.com/ja_jp/amazonq/latest/qdeveloper-ug/data-storage.html
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. CloudWatch Investigations※1 Amazon Q Developer※2 ⾃作エージェント(Strands) 19 AIOps エージェントの候補⼀例 CloudWatch に組み込ま れた運⽤調査機能。テレ メトリデータを参照し、 マルチアカウントでも分 析可能 MCP Client として動作す るため、AWS Core MCP Server と組み合わせ、 運⽤タスクを実施可能 (VS Code + Cline などでも可) Strands SDK などを利⽤ し、独⾃のAIOps エー ジェントを開発する ⾃由度は⼀番⾼い 導⼊が容易だが対応タスクが限定的 対応範囲は広いが実装/設定が必要 ※1. 2025/11/26現在、⽇本語未対応かつ、海外でクロスリージョン推論される。また、全てのAWSサービスにはアクセスできない https://docs.aws.amazon.com/ja_jp/AmazonCloudWatch/latest/monitoring/Investigations-Security.html#cross-region-inference ※2. 2025/11/26現在(⼀部)コンテンツが海外リージョンに保存される https://docs.aws.amazon.com/ja_jp/amazonq/latest/qdeveloper-ug/data-storage.html 注釈の通り、ガバメントクラウドでは利⽤にハードルがある 実質これになる。。が、 今みなさんが感じた ハードルを超えたい。。︕
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 20 Strands SDK と MCP Server で作る AIOps エージェント • Strands SDK を⽤いて AWS Core MCP Server を連携させると、 約150⾏の Python コードで AWS で活⽤できる AIOps エージェントが書けます - AWS が提供する MCP Server は API 実⾏、コスト情報取得、ドキュメント検索、 といった情報取得やリソース操作が可能です > https://awslabs.github.io/mcp/ - 本エージェントはシンプルですが、障害分析やコスト分析、リソース分析など、 様々なタスクをお試しいただけます - Python 実⾏環境と AWS の認証情報があれば、動きます (ローカル、踏み台、etc) • まずは簡易的に始めてみて、どんなことができるのか、悩みを解決できそうか、 をお試しいただくと良いと思います
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 21 構成例︓シングルアカウント版 エージェントの実⾏環境は、⽤途に依存します 例︓ - お試しなら、ローカル - 踏み台で利⽤するなら、EC2 or コンテナ - どこからでも呼び出したいなら、AgentCore など
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 22 構成例︓マルチアカウント版 エージェントの⽤途に応じて 前述の情報取得の仕組みを追加します
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 23 デモ|現在稼働しているECSサービスはこの1週間正常に稼働していましたか︖ メトリクスを確認し、リソースを最適化する必要があるか教えてください。
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. コードサンプル 1/2 from strands import Agent from strands.agent.conversation_manager import NullConversationManager from strands_tools import current_time from mcp import stdio_client, StdioServerParameters from strands.tools.mcp import MCPClient aws_profile = "your_profile" aws_region = "us-east-1" stdio_mcp_client = MCPClient(lambda: stdio_client( StdioServerParameters( command="uvx", args=["awslabs.core-mcp-server"], env={ "AWS_REGION": aws_region, "AWS_API_MCP_PROFILE_NAME": aws_profile, # for aws-api-server tool "AWS_PROFILE": aws_profile, "aws-foundation": "true", "sql-db-specialist": "true", "solutions-architect": "true", "security-identity": "true", "monitoring-observability": "true", "finops": "true", "MCP_LOG_LEVEL": "ERROR", "FASTMCP_LOG_LEVEL": "ERROR", }, ) )) def main(): """ メインの実⾏ループ """ print("=" * 60) print("AIOps Buddy へようこそ") print("=" * 60) print("MCPサーバーを起動中...") print("(初回起動時は時間がかかる場合があります)") print("-" * 60) try: # Create an agent with tools from the community-driven strands-tools package # as well as our custom letter_counter tool with stdio_mcp_client: aws_mcp_tools = stdio_mcp_client.list_tools_sync() conversation_manager = NullConversationManager() agent = Agent( tools=[aws_mcp_tools, current_time], conversation_manager=conversation_manager, system_prompt=""" あなたは、ログ分析やパフォーマンス分析、および異常検知を専⾨とするAIOpsエージェントです。 ユーザーは、⽇々の運⽤に関する質問や問題を提⽰します。 さらに、ユーザはシステムログやテレメトリデータ、コストデータなどを提供しますので、これらのデータを分析し、ユーザーからの質問や問題を解決してください。 ※あくまでサンプル実装なので、⼗分な検証・レビューをお願いします MCP Serverの設定 Agent の設定
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. コードサンプル 2/2 役割︓ - テレメトリデータの分析と異常検知 - アラートに対する分析と対応策の提案 - 根本原因の診断と障害対応⽀援 - システムパフォーマンスの最適化提案 - データベースパフォーマンス分析と最適化 - SQL クエリの分析と改善提案 - データベース容量計画とスケーリング⽀援 - セキュリティインシデントの調査⽀援 - AWS コスト分析と削減提案 - リソース使⽤量の最適化 利⽤可能な専⾨ツール︓ 【AWS Foundation】 - aws-knowledge-server: AWS知識ベースとベストプラクティス - aws-api-server: AWS API操作とリソース管理 【SQL Database Specialist】 - postgres-server: PostgreSQL データベース管理 - mysql-server: MySQL データベース管理 - aurora-dsql-server: Aurora DSQL データベース管理 - redshift-server: Amazon Redshift データウェアハウス管理 【Solutions Architect】 - diagram-server: アーキテクチャ図の作成と管理 - pricing-server: AWS料⾦計算とコスト⾒積もり - cost-explorer-server: コスト分析とレポート - syntheticdata-server: 合成データ⽣成 - aws-knowledge-server: AWS知識ベースとベストプラクティス 【Security & Identity】 - iam-server: IAM ポリシーとロール管理 - support-server: AWS サポートケース管理 - well-architected-security-server: セキュリティベストプラクティス 【Monitoring & Observability】 - cloudwatch-server: CloudWatch メトリクス、ログ、アラーム管理 - cloudwatch-appsignals-server: アプリケーションシグナル監視 - prometheus-server: Prometheus メトリクス管理 - cloudtrail-server: AWS API コール監査ログ 【FinOps】 - cost-explorer-server: コスト分析とレポート - pricing-server: AWS料⾦計算とコスト⾒積もり - cloudwatch-server: リソース使⽤量監視 - billing-cost-management-server: 請求とコスト管理 """ ) print("MCPサーバー起動完了!") print("質問を⼊⼒してください") print("終了するには 'quit', 'exit', または '終了' と⼊⼒してください") print("-" * 60) while True: try: # ユーザーからの⼊⼒を受け取る message = input("¥n質問: ").strip() # 終了条件のチェック if message.lower() in ['quit', 'exit', '終了', 'q']: print("¥nシステムを終了します。") break # 空の⼊⼒をスキップ if not message: print("質問を⼊⼒してください。") continue # エージェントに質問を処理させる print("¥n" + "=" * 60) print("処理中...") print("=" * 60) agent(message) print("¥n" + "-" * 60) print("処理完了") print("-" * 60) except KeyboardInterrupt: print("¥n¥nシステムを終了します。") break except Exception as e: print(f"¥nエラーが発⽣しました: {e}") print("もう⼀度お試しください。") except Exception as e: print(f"¥nMCPサーバーの起動に失敗しました: {e}") print("以下を確認してください:") print("1. AWS認証情報が正しく設定されているか") print("2. インターネット接続が正常か") print(f"3. {aws_profile} プロファイルが存在するか") print("¥nAWS CLIで以下のコマンドを実⾏して確認してください:") print("aws configure list-profiles") print(f"aws sts get-caller-identity --profile {aws_profile}") if __name__ == "__main__": main() ※あくまでサンプル実装なので、⼗分な検証・レビューをお願いします 対話 インタフェース プロンプト
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 本番導⼊に向けて 26
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 27 本番導⼊に向けて • まずは⼀つのタスクから - ⼀度に全てのタスクに適⽤すると、効果検証もしづらくなります まずは⽬標を定め、効果が出るのか、精度はどうか、⼩さく始めましょう • 運⽤作業フローも⾒直しが必要 - レビュータイミングやエージェントのトリガーの⾃動化などによって、 AIOps エージェントを適切に利⽤し、より作業負荷を軽減することが可能です • エージェントも最適化が必要 - タスクが曖昧だったり、ツールが余分に設定されていたりすると、使うツール を間違えてしまうことがあり、コストが余分にかかってしまいます - そこで、エージェントを個別に切り出したり、ツール(MCP Server)を必要な 分だけ設定するなど、最適化が重要になります
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 28 終わりに • AIOps は煩雑かつ時間のかかる運⽤タスクを効率化するアプローチです • まずは簡単に始められ、かつ効果の⾼そうなタスクから試し、 運⽤コストを下げ、より価値創出に時間を掛けられるようにしましょう
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. Thank you! © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved.