Slide 1

Slide 1 text

もっと使いたい︕ Systems Manager 活⽤術︕ 2019.06.20 AWS Management Tools re:Cap powered by Ops JAWS ハッシュタグ︓ #AWSLoft #jawsug #opsjaws 1

Slide 2

Slide 2 text

2 ⾃⼰紹介 園部 治 • クラスメソッド株式会社 オペレーション部 2019年1⽉ Join • 好きなAWSサービス ・CloudWatch ・Systems Manager • OpsJAWS 運営 Professional series Coming soon ..?

Slide 3

Slide 3 text

3 アジェンダ 1. AWS Summit Tokyo 振り返り 2. Systems Manager 活⽤例

Slide 4

Slide 4 text

4 アジェンダ 1. AWS Summit Tokyo 振り返り 2. Systems Manager 活⽤例

Slide 5

Slide 5 text

5 24

Slide 6

Slide 6 text

6 数で⾒る タイトルに「運⽤」か「Ops」というキーワード の⼊ったセッション数(昨年は 10タイトル ) セッションのコマ割が 9 * 12 コマ / ⽇なので 毎回どこかで運⽤関連セッションが開催されていた。 ※ 注意 ※ あくまで机上の計算です。内容は把握していません。

Slide 7

Slide 7 text

※ Twitter 「#AWSSummit ツィート」から作成した WordCloud(素⼈⾃作) 7 数で⾒る(WordCloud)

Slide 8

Slide 8 text

8 DeepRacer︕︕

Slide 9

Slide 9 text

9 やっぱり注⽬コンテナ界隈

Slide 10

Slide 10 text

10 運⽤・管理も︕(監視も中位には)

Slide 11

Slide 11 text

11 ⼤阪は27⽇︕来年は…横浜(らしい)

Slide 12

Slide 12 text

12 ピックアップ・キーワード 「ガバナンスとアジリティの両⽴」 ( A1-01 AWSでの Operational Excellence 〜クラウドで回す監視と運⽤PDCA ) ( A1-04 AWS Systems Manager 徹底活⽤ ~エンタープライズのユースケースから~) 「ガードレール、Resiliency」 ( A1-06 クラウド運⽤管理の最前線 ~⽇⽶の最新状況から~ ) 「適応型モニタリング・改善」 ( A2-01 AWS で実現する攻めのシステムモニタリング ) ( C3-04 【初級】クラウド環境におけるモニタリングの重要性 )

Slide 13

Slide 13 text

13 今年も、、もちろん。

Slide 14

Slide 14 text

14 アジェンダ 1. AWS Summit Tokyo 振り返り 2. Systems Manager 活⽤例

Slide 15

Slide 15 text

15 重要な共有 Ø 推奨ポリシー変更 以前︓AmazonEC2RoleForSSM 今後︓AmazonSSMManagedInstanceCore l 公式ドキュメント︓ https://docs.aws.amazon.com/systems-manager/latest/userguide/systems- manager-release-history.html l 弊社ブログ︓ https://dev.classmethod.jp/cloud/aws/not-recommended-amazonec2roleforssm/

Slide 16

Slide 16 text

16 サービス⼀覧 Operations Management • CloudWatch Dashboard • OpsCenter • Resource Groups • Trusted Advisor & PHD Actions & Change • Automation • Maintenance Windows Shared Resources • Parameter Store • Documents Instances & Nodes • Compliance • Inventory • Managed Instances • Hybrid Activations • Session Manager • Run Command • State Manager • Patch Manager • Distributor

Slide 17

Slide 17 text

17 単体でもパワフル けど、、、AWS の良さはそれだけではない︕︕

Slide 18

Slide 18 text

18 Building Block

Slide 19

Slide 19 text

19 もっと使う Operations Management • CloudWatch Dashboard • OpsCenter • Resource Groups • Trusted Advisor & PHD Actions & Change • Automation • Maintenance Windows Shared Resources • Parameter Store • Documents Instances & Nodes • Compliance • Inventory • Managed Instances • Hybrid Activations • Session Manager • Run Command • State Manager • Patch Manager • Distributor

Slide 20

Slide 20 text

A1-04 AWS Systems Manager 徹底活⽤ ~エンタープライズのユースケースから~ 20 もっと使う l 他サービスとの連携 e.g. Config , License Manager , CloudWatch Events

Slide 21

Slide 21 text

21 OpsCenter

Slide 22

Slide 22 text

22 OpsCenter ?? ① 運⽤上の問題を表⽰、調査、解決を助ける ② 既存ワークフローのまま修復対応のハブ ③ Config, CloudTrail, CloudWatchEvents から情報集約 引⽤︓https://aws.amazon.com/jp/about-aws/whats-new/2019/06/introducing-aws-systems-manager-opscenter-to-enable-faster-issue-resolution/

Slide 23

Slide 23 text

23 OpsCenter ?? Ø 提供機能・情報(公式サイトから引⽤) • イベント、リソース、アカウントの詳細情報 • 類似した特徴を持つ過去の OpsItem • 関連する AWS Config の変更 • AWS CloudTrail のログ • Amazon CloudWatch アラーム • スタックの情報 • ログやメトリクスにアクセスできるその他のクイックリンク • ランブックのリストと推奨されるランブック • AWS のサービスから OpsCenter に渡されたその他の情報 Ø つまり... インシデント対応&管理サービス

Slide 24

Slide 24 text

24 仕組み AWS Systems Manager OpsCenter Automation Amazon CloudWatch Event (event-based) AWS Security Hub Amazon EC2 Amazon DynamoDB AWS Command Line Interface AWS Management Console ︓OpsItem 作成 ︓復旧アクション • ステータス管理 • リソース情報表⽰ • 復旧アクション • 簡易レポート • 類似検索(過去事例)

Slide 25

Slide 25 text

25 収集︓OpsItem 作成 OpsItem とは︖ • リソースにまたがる運⽤上の問題(公式サイト) • 管理するインシデントの(リソース)単位 設定⽅法 説明 CloudWatch Events ⾃動設定 Basic setup として Management Console から CloudWatch Events に⼀括 設定 • EC2 Instance State-change - Stopped or Terminated • EC2 SSM Maintenance Window Execution Failed/Timed Out • AWS Health - RDS Maintenance Scheduled CloudWatch Events ⼿導設定 CloudWatch Events で対象をイベントソースに指定し、ターゲットに SSM OpsItem を指定して設定 ⼿動設定 Management Console か API から サポートリソース ARN を指定して設定 https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter-related-resources-reference.html

Slide 26

Slide 26 text

26 表⽰︓簡易レポート Open&In progress や 過去情報の確認が可能 (もう少し情報が欲しい。。)

Slide 27

Slide 27 text

27 調査︓リソース情報表⽰ OpsItemは、ID(oi-*)が付与されリンク先では 詳細情報を確認できます。 < OpsItem 情報⼀覧 > • OpsItem details • Related resources • Runbooks • OpsItem tags • Similar OpsItems • Operational data • Ralated OpsItems • Resource description • Tags • Current CloudWatch alarms • Details from AWS Config • CloudTrail logs • CloudFormation stack resources

Slide 28

Slide 28 text

28 対応︓復旧アクション 各 OpsItem に対して RunBook(SSM Automation)が実⾏できます。 任意のAutomation を 実⾏することが可能です 関連するリソース情報が補完されます

Slide 29

Slide 29 text

29 記録︓データ登録と検索設定 OpsItem 詳細情報「Operational data」に 原因や対応内容を記録すれば、検索することも可能。 ※ 利⽤不可(予約)KEY : amazon、aws、amzn、ssm、/ amazon、/ aws、/ amzn、/ ssm

Slide 30

Slide 30 text

30 その他︓重複排除 ステータスが Open&In progess の場合は 同様のリソースでのOpsItem作成を⾏わない。 (対応中や検知までに、複数回発⽣した場合などには優しい)

Slide 31

Slide 31 text

31 まとめ Good Request • ナレッジ蓄積 • リソース状態の変化がトリガー • インターフェースの統⼀ • Runbooks(Automation)活⽤による ⼀次対応の品質向上 • 多様な利⽤シーン • 簡易レポートの拡充・連携 • OpsItem 作成の優しさ • RunBook 実⾏時のリソース情報の引 き渡し(run automation は OK) • Related や ステータス変更の⼀括操 作

Slide 32

Slide 32 text

32 余談までに

Slide 33

Slide 33 text

33