Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
マイクロサービスのためのシステム運用を一瞬でラクにするオブザーバビリティ事例
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
o11yfes
October 05, 2023
Technology
610
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
マイクロサービスのためのシステム運用を一瞬でラクにするオブザーバビリティ事例
o11yfes
October 05, 2023
More Decks by o11yfes
See All by o11yfes
⽣成 AI で進化する AWS オブザーバビリティ
o11yfes2023
0
370
X-Ray SDKとDaemonのサポート終了と移⾏ガイド
o11yfes2023
0
530
AWS オブザーバビリティサービスアップデート
o11yfes2023
0
320
クロスアカウント/クロスリージョンのオブザーバビリティ
o11yfes2023
0
250
サーバレス、コンテナ、データベース特化型機能をご紹介。CloudWatch をもっと使いこなそう!
o11yfes2023
0
540
Amazon CloudWatch を使って NW 監視を行うには
o11yfes2023
0
950
CloudWatch 大好きなSAが語る CloudWatch キホンのキ
o11yfes2023
0
620
Amazon CloudWatchで始める エンドユーザー体験のモニタリング
o11yfes2023
0
600
Observabilityジャーニーを実現するためのAWSサービス:CloudWatch編
o11yfes2023
0
820
Other Decks in Technology
See All in Technology
人材育成分科会.pdf
_awache
4
300
AIのReact習熟度を測る
uhyo
2
660
「勝手に広まる」人気 AI エージェントを爆速で作ろう!(AWS Summit Japan 2026講演資料)
minorun365
PRO
10
2.1k
小さく始める AI 活用推進 ― 日経電子版 Web チームの事例/nikkei-tech-talk47
nikkei_engineer_recruiting
0
310
【NRUG vol.18】KubernetesにおけるNew Relicデータ取得量削減の考え方
nrug_member
0
170
手塩にかけりゃいいってもんじゃない
ming_ayami
0
610
iOS アプリの「これって不具合ですか?」を AI に調べてもらう
miichan
0
110
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
3k
Kiro Ambassador を目指す話
k_adachi_01
0
110
Chainlitで作るお手軽チャットUI
ynt0485
0
280
[チョークトーク資料]AWS DevOps Agent を使いこなす / AWS Dev Ops Agent Chalk Talk AWS Summit Japan 2026
kinunori
3
630
AI-DLCを “そのまま導入しなかった”話 ~組織に合わせてアジャストした 私たちの実践共有~
hiroramos4
PRO
1
250
Featured
See All Featured
RailsConf 2023
tenderlove
30
1.5k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
AI: The stuff that nobody shows you
jnunemaker
PRO
8
720
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
2k
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
200
Optimizing for Happiness
mojombo
378
71k
BBQ
matthewcrist
89
10k
Abbi's Birthday
coloredviolet
2
8.1k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
430
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
62
54k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.8k
Transcript
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. マイクロサービスのための システム運用を一瞬でラクにする オブザーバビリティ事例 発表者 NTTドコモ 第一プロダクトデザイン部 マーケティングイノベーション・カスタマーサクセス担当 森 晴菜 川嵜 哲生 -0-
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. アジェンダ -1- サービス紹介 システム構成 (Observabilityが無いとやっていけない) システム運用をラクにするための工夫 実例紹介① ~ AWSとSaaSの棲み分けポイント ~ 実例紹介② ~ カスタムメトリクスでラクラクObservability ~ まとめ
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. サービス紹介 2 PM 1 スーパー販促プログラム(スパ販) ①お店で「dポイント」や 「d払い」で支払う・貯める ②d払い・dポイントを使ったことのあるお店から お得な情報が届く リピーター d払い・dポイント どちらの利用もOK! d払い・dポイントクラブアプリ内にお店専用のメッセージBOXができる dポイントやd払いでお買い物をしてくれたお客様と、 友達追加無しで直接コミュニケーションが可能になるサービス また行こう!
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. -3- 他 システム 他 システム レコメンド システム クーポン メッセージ 配信システム 他 システム 他 システム 決済 システム アプリ 各種データ参照 Json ①加盟店情報 ②クーポン情報 加盟店からのクーポンや メッセージを配信 他 システム 認証 システム システム構成 このシステムを新規構築 AWS Cloud 他クラウド 他システム
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. -4- 他 システム 他 システム レコメンド システム クーポン メッセージ 配信システム 他 システム 他 システム 決済 システム アプリ 各種データ参照 Json ①加盟店情報 ②クーポン情報 加盟店からのクーポンや メッセージを配信 他 システム 認証 システム システム構成 このシステムを新規構築 AWS Cloud 他クラウド 他システム 障害が起こりそうなポイントを想像してみてください・・・
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. -5- 他 システム 他 システム 他 システム クーポン メッセージ 配信システム 他 システム 他 システム 他 システム ドコモアプリ 各種データ参照 Json ①加盟店情報 ②クーポン情報 加盟店からのクーポンや メッセージを配信 他 システム 他 システム システム構成 このシステムを新規構築 AWS Cloud 他クラウド 他システム 障害が起こりそうなポイントを想像してみてください・・・ d サービスやシステムのマイクロ化が進み、 構成がとにかく複雑 ↓ どこで何が起こっているのか? Observabilityが無いとやっていけない
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. -6- システム運用をラクにするための工夫 ~ SaaSダッシュボード連携でシステム状況可視化 ~
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. システム運用をラクにするための工夫 7 リソースのグラフ化 ログ出力項目を分けて検索・ソート サービスマップ自動作成 AWS X-Ray Amazon CloudWatch Logs カスタムメトリクスを通して値を可視化 Amazon CloudWatch等AWSサービスの監視項目をSaaSにより集約 サービスを集約し、 共通のルールで可視化 ログ追跡のしやすさにより 問い合わせの稼働減を期待
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. システム運用をラクにするための工夫 8 APM(パフォーマンス分析・監視) ログイン等、複雑な条件の外形・サービス監視 どこの処理で時間がかかっているか 一目でわかる 監視ツールを作成しなくてよい アラート形式を統一できる AWS X-Ray Amazon ECS Slackへの障害アラート Amazon CloudWatch等AWSサービスの監視項目をSaaSにより集約
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. システム運用をラクにするための工夫 9 サービスの状況がひとめで分かるダッシュボード例 →3時間で作成! ラクラク!
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. システム運用をラクにするための工夫 10 ユーザがリクエストするAPI・画面は 正常は応答できているか Queueの処理は 正常に進んでいるか コンテナ・ DB等 サーバ状況は正常か 閾値超過で状況をSlackに通知し ダッシュボードへ誘導(即時の状況把握を徹底) サービスの状況がひとめで分かるダッシュボード例 ラクラク!
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. システム運用をラクにするための工夫 11 DynamoDBの状態は正常か 連携先外部システムは 正常にリクエストできているか ユーザ処理のECSタスク数は どこまで増減しているか Amazon CloudWatch システム状況がひとめで分かるダッシュボード例
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. 12 Logs AWS Cloud Amazon CloudWatch S3 Log Forwarder S3やCloudWatchLogsに出力した ログをDatadogに連携 ログ種別、ユーザID、URL、 出力文字等様々な検索が可能 ユーザIDやAPI名、ステータスコード を表示、フィルタ可能 システム運用をラクにするための工夫 エラーが発生した場合は ログ詳細をSlackに通知 ユーザ行動を追うためのログ可視化例 log ラクラク!
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. 13 AWS Cloud X-Ray・Agentから トレースをDatadogに連携 レイテンシやURL等 様々な検索が可能 URL毎のレイテンシやステータス が一目で追える システム運用をラクにするための工夫 リクエストの処理内訳 を可視化 AWS X-Ray APMでアプリケーションの「それぞれの処理のパフォーマンス」を可視化 ラクラク!
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. 14 API・画面の外形監視 システム運用をラクにするための工夫 APIの不正応答でSlack通知、 まず何をするべきかを誘導 ユーザへ提供しているAPIや画面を外形監視して不正な応答をしていれば通知へ ラクラク!
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. 15 Q.全部SaaSに集約しているけどSaaSだけ見ているの? システム運用をラクにするための工夫 A.平常時はその通りですが、 トラブル時にこんなことがありました・・・
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. -16- 実例紹介① ~ AWS CloudWatchとSaaSの棲み分けポイント ~
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. 実例紹介① ~ AWSとSaaSの棲み分けポイント ~ 17 休日に外形監視でアラートが発生 →APIが遅くなり数回に1回エラーを返す状態 Datadogのダッシュボードを色々見たけど 異常がすぐに見つからない… APIのレイテンシが悪化している SaaSにダッシュボードを集約すると便利だが、こんなこともあるので要注意!
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. 実例紹介① ~ AWSとSaaSの棲み分けポイント ~ 18 DynamoDBのモニタリングは 色々な事象でお世話になりました 困ってDynamoDBの管理コンソールから CloudWatch Contributor Insights・CloudWatchメトリクス を見ると、読み取り調整されたリクエストが表示されている →アカウントデフォルトのクォータ値で制限されていた! すぐにAWSソリューションズアーキテクトさんに連絡して サポートケースからQuotaの引き上げを依頼 →すばやく対応していただき、連絡から30分以内に引き上げ 異常は解消。 Point! AWSのメトリクスがDatadogにまだ反映されていなかった(30分後には反映) SaaSにダッシュボードを集約すると便利だが、こんなこともあるので要注意!
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. 実例紹介① ~ AWSとSaaSの棲み分けポイント ~ 19 SaaSは便利だが、すべてのメトリクスが リアルタイムに反映されない。 ダッシュボード化は担当者任せなのでメトリクスに漏れも発生 AWSでは各サービスのコンソールに 「異常が発生した際に見ておきたい」ダッシュボードが存在 Amazon Aurora Amazon DynamoDB このサービスたちも! ラクラク!
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. -20- 実例紹介② ~ カスタムメトリクスでラクラク可視化 ~
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. 21 AWS Cloud 他クラウド 他システム Amazon CloudWatchのカスタムメトリクス を使えば簡単に可視化できる! 実例紹介② ~カスタムメトリクスでラクラク可視化 ~ Amazon CloudWatchカスタムメトリクスを使って、メトリクス以外の要素を可視化 例) ・AWS連携している他クラウドの状況 ・DBの値 import boto3 cloudwatch = boto3.client('cloudwatch') … PutMetricData = cloudwatch.put_metric_data( Namespace='string', MetricData=[ { 'MetricName': 'string', 'Dimensions': [ { 'Name': 'string', 'Value': 'string' }, ], 'Timestamp': datetime(2015, 1, 1), 'Value': 123.0, 'Unit': "Count", … }, … ラクラク!
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. AWS Cloud CloudWatchカスタムメトリクスでラクラク可視化 22 キュー数のチェック Pub/Sub キュー数確認 タスク数の変更 CloudWatch アラーム Auto Scaling ・・・ Application AutoScaling CloudWatch カスタムメトリクス AWS連携している他クラウドの状況 ・他クラウドのキュー滞留数をCloudWatchのカスタムメトリクスに記録 → キュー処理をAutoScaling化してECSタスクを増減可能に ラクラク!
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. AWS Cloud CloudWatchカスタムメトリクスでラクラク可視化 23 Pub/Sub キュー数確認 CloudWatch カスタムメトリクス Amazon DynamoDB Amazon ElastiCache データベースの値やロジック値を CloudWatchカスタムメトリクスを通して可視化できる DBの値 ・DynamoDBやElastiCacheのテーブルに格納されている値をカスタムメトリクスへPush → CloudWatchカスタムメトリクスを通してDB値(例では待機人数)の増減状況を可視化 ラクラク!
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. まとめ -24- 複雑化するシステムのどこで何が起こっているのか知るためObservabilityは必須 AWSのサービスやSaaSを使うとシステム運用がラクになる。 AWSとSaaSの棲み分けを理解し、必要な場面で使い分けを AWS各サービスコンソールのダッシュボードを活用しよう AWS CloudWatchカスタムメトリクスは色々な値をラクラク可視化できる 運用をラクにする目的で Observabilityを使いこなそう
© 2008 NTT DOCOMO, INC. All rights reserved. © 2023
NTT DOCOMO,INC. All Rights Reserved. 25 ご清聴ありがとうございました。