Upgrade to Pro — share decks privately, control downloads, hide ads and more …

新会社ネクストモードと監視運用保守の今

Fad0d157244126a95094c26f2857d164?s=47 jukiya330
November 13, 2020
600

 新会社ネクストモードと監視運用保守の今

Developers.IO Shocaseでの発表資料

Fad0d157244126a95094c26f2857d164?s=128

jukiya330

November 13, 2020
Tweet

Transcript

  1. 新会社ネクストモードと監視運用保守の今 クラウド環境の監視運用保守 2020/11/04 Nextmode, Inc. Jukiya Shimakawa

  2. 2 監視?運用?保守? 大変ですよね。

  3. 3 本日のターゲット - クラウドの監視は何をするべきなのか - 監視運用をお願いしたいけど何をしたらいいのか分からない - 自社システム運用に疲弊している - なんとなく不安なのでなんでも監視してしまう

    - アラート発生しても静観対象だ→ヨシッ!としてしまっている 事例と一緒に 監視運用保守の今をお伝えします
  4. 4 本日お話しすること - 監視する目的 - 機器の監視を目的とするのではなく、サービスが動いているかどうかを監視する - 新会社ネクストモードの運用代行サービスの紹介 - AWS環境のインフラをメインにお話しします

    - ネクストモードでの監視運用保守事例 - テレワーク環境の運用
  5. 5 自己紹介 名前:島川寿希也(Shimakawa Jukiya) 所属:ネクストモード インテグレーション事業部 好きなAWSサービス:Amazon ECS

  6. 6 ネクストモードについて AWS最強技術者集団クラスメソッド社と日本の通信を守ってきたNTT東日本。 2社が交わることで起きた化学反応が「ネクストモード」です。 お客様と一緒にクラウドによるデジタルイノベーションを追求し、カスタマーサクセスを 実現していきます。 AWS最強技術者集団 「APN Cousulting Partner

    of the Year 2018」を受賞 6年連続「AWSプレミアム コンサルティングパート ナー」に認定 光ネットワーク 2,000万回線 エリアカバー率99% インフラネットワークキャリア
  7. 7 とりあえずで監視してませんか?

  8. 8 監視する目的を改めて考える

  9. 9 監視する目的 - 監視をする目的 →サーバが動いているかどうか確認する ⚠️ →システム、サービスが動いているかどうか確認する ⭕ - リソースを監視する

    - CPUアラートが発生したとして何をする?まで考える必要があ る とりあえずで監視は 運用が辛くなるだけ
  10. 10 監視する目的 - 例えば・・・よくあるWebサーバを監視する場合 監視すべきはEC2ではなくALB

  11. 11 監視する目的 - よくあるWebサーバを監視 する場合 - エンドユーザーが直接参照する ALBのみを監視 - EC2はAutoScalingにより管理

    →運用負担を減らす
  12. 12 何が動いていなければダメなのか ビジネスを監視するという視点が大事

  13. 13 監視の種類

  14. 14 監視の種類 - 監視といっても色んな種類の監視がある - 死活監視 - データ活用のための収集 - システム状況確認のための分析

    →今取得しているそのデータは意味があるのかを考える必要がある
  15. 15 監視するべき項目は 日々の運用で変わっていく ↓ 定期的な見直しが必要

  16. 16 監視サーバについて

  17. 17 監視サーバについて - 監視サーバの監視を考える - ZabbixやNagios、muninなど →監視サーバの監視も運用負荷になりがち - 監視SaaSで運用負荷を減らすのも大事 -

    AWS CloudWatchやMackerel、Datadogなど
  18. 18 自動化できるところは自動化を

  19. 19 自動化 - サーバの自動再起動、プロセス再起動等はシステムで実現 →それでも復旧しないときに初めて人‍が対応する

  20. 20 監視ソリューションも含めて 現状の運用負荷を把握し 改善し続ける必要がある

  21. 21 とはいえ、自分たちでやるのはきつい。 アウトソーシングしたい。

  22. 22 新会社ネクストモードの運用代行サービスの紹介 ~運用アシスタント~

  23. 23 運用アシスタントとは ネクストモードが提供する 24時間365日の監視運用代行サービス (監視はMackerelを利用) 単純作業のために深夜起こされてしまう 日々発生しているオペレーション業務 →ネクストモードにお任せください お客様の現状の課題を汲み取り、運用を改善していきます。

  24. 運用アシスタントとは 24 お手軽な監視から運用保守作業のアウトソースまで。 NTT東日本と連携した安心・安全な保守運用を実現します エントリープラン スタンダードプラン クラウドサービスの監視・通知 を実現するリーズナブルな プラン 通知・監視に加え、お客様シス

    テムにあった措置を実現するプ ラン 【初期費用】 区分 単位 料金額(税抜) クラウド基本設定 アカウント 50,000円 サービス設定 サービスごと 10,000円 【月額費用】 単位 月額料金額(税抜) サービスごと 5,000円 監視・通知時間:24時間365日 お問い合わせ:全日9時~21時 【初期費用】 区分 単位 料金額(税抜) クラウド基本設定 アカウント 50,000円 サービス設定 サービスごと 10,000円 【月額費用】 単位 月額料金額(税抜) サービスごと 15,000円 監視・通知時間:24時間365日 お問い合わせ:24時間365日 アドバンストプラン 通知・監視、お客様システムに あった措置に加えて運用代行を 実現するプラン 【初期費用】 区分 単位 料金額(税抜) クラウド基本設定 アカウント 50,000円 サービス設定 サービスごと 10,000円 【月額費用】 単位 月額料金額(税抜) サービスごと 20,000円 監視・通知時間:24時間365日 お問い合わせ:24時間365日 オプション 柔軟なクラウド運用をお手伝い するオプションもご用意 ・クラウド・ガイドラインの提供 ・コスト削減(SavingsPlans等) ・システム改善提案 ・各種状況の定期レポーティング、 可視化 ・その他
  25. プラン比較 25 作業内容 作業概要 エントリー スタンダード アドバンスト 監視 ステータスチェック IaaSの死活監視を行う

    ◦ ◦ ◦ リソース監視 CPU/メモリ/ディスク使用率などを監視する ◦ ◦ ◦ プロセス監視 お客様と事前に合意したプロセスの死活を監視する ◦ ◦ ◦ ログ監視 お客様と事前に合意したログの文字列を監視する ◦ ◦ ◦ URL/ポート監視 お客様と事前の合意したポートとURLに対して、正しいレスポンスが返ってくるか監視する ◦ ◦ ◦ PaaS監視 PaaSサービスの監視を行う ◦ ◦ ◦ 受付 故障受付 お客様申告に基づき、故障箇所の切り分けを行う ◦ ◦ ◦ 通知 故障通知 アラームを受信後、お客様へ通知する ◦ ◦ ◦ 一次対 処 再起動 事前にお客様と合意したインスタンスを再起動する - ◦ ◦ 停止・起動 事前にお客様と合意が取れたインスタンスを停止後、起動する - ◦ ◦ 運用代 行 リタイアメント対応 クラウド事業者より仮想サーバEOL通知が届いた場合、お客様へ通知、日程調整後インスタンスの停 止・起動を行う - - ◦ 仮想サーバタイプ変更 お客様からの申し出に応じて、仮想サーバのスペックを変更する - - ◦ イメージバックアップ作成 お客様からの申し出に応じて、仮想サーバのイメージバックアップを行う - - ◦ ボリュームサイズ変更 お客様からの申し出に応じて、仮想ストレージの容量を変更する - - ◦ 起動・停止・再起動 お客様からの申し出に応じて、故障がなくても指定の仮想サーバを再起動もしくは停止・起動する - - ◦ OSセキュリティパッチ適用 お客様からの申し出に応じて、OSにセキュリティパッチを適用する - - ◦ ミドルウェアアップデート お客様からの申し出に応じて、ミドルウェアのアップデートを行う - - ◦ アクセス権変更(FS) お客様からの申し出に応じて、ファイルサーバのアクセス権変更を行う - - ◦ お客様追加・削除(FS/AD) お客様からの申し出に応じて、ファイルサーバ/ActiveDirectoryサーバのお客様追加・削除を行う - - ◦ ポリシー変更(AD/WSUS) お客様からの申し出に応じて、ActiveDirectoryサーバ/WSUSサーバのポリシー変更を行う - - ◦
  26. 26 ほかにも 運用代行でこんなことができます

  27. 27 こんなことができます。(AWS) AWSの運用代行の場合 - EC2 リタイアメント対応 イメージバックアップ ボリュームサイズ変更 サーバタイプの変更 OSセキュリティパッチ適用

    ミドルウェアのアップデート - RDS インスタンスタイプ変更 ストレージ容量変更 snapshotからの復元 - CLB/ALB/NLB サーバ証明書更新 各種設定項目の変更 ほかにも・・・ Lambda,LightSail,Elastic Beanstalk,StorageGateway,VMImport/Export,FSx forWindows/Aurora/ElastiCache/DynamoDB/RedShift/S3/CloudFormation /WAF/Route53/CloudFront/SES/SNS/SQS/CloudWatch/Cognito/Directory Service/WorkMail/ECS/Fargate/EFS IAM etc... お客様のご要望に応じて日々対応範囲拡充中です。 まずはお問い合わせください。
  28. 28 監視運用保守で 少しでもお困りのことがあれば ネクストモードにご連絡ください

  29. 29 監視運用保守の事例

  30. 30 前提 お客様の依頼をそのままお引き受けするのではなく、 現状をヒアリングした上で監視運用保守のプランをご提案してい ます。 →互いの運用負荷がなるべく少なくなるようにと考えています。

  31. 31 事例1 : 独立した大量のEC2サーバを改善

  32. 32 事例1 : AWS 独立した大量のEC2サーバを改善 - EC2 約100台の監視運用代行 - EC2は全て独立したWebサーバ

    - PublicIPを直接割り当て利用 - 深夜対応の毎日 - DoS攻撃などへの対応 - アーキテクチャ改善、システムアップデートに手が回らない
  33. 33 事例1 : AWS 独立した大量のEC2サーバを改善 最適なアーキテクチャのご提案 構築サポート

  34. 34 事例1 : AWS 独立した大量のEC2サーバを改善 - 100台を運用代行に乗せる前にまずは現状を改善 - AWS最適アーキテクチャを提案し、PoC環境の作成実施 -

    (別途コンサルティングのご契約) - そのPoC環境で動作確認を実施後に現環境を移行 - AutoScaling構成にすることで深夜対応を減らす - 自動スケーリング及び自動起動でEC2そのものの運用負荷を減らす - ALBを配置しWAFを利用することで攻撃を防ぐ →クラウドサービスを活用することで不必要な運用をなくす
  35. 35 事例1 : AWS 独立した大量のEC2サーバを改善 - DBがon EC2だったためRDSへの切り替えを提案 - セキュリティSaaS製品を活用しEC2の脆弱性及びウィルス対策を

    提案 - Future Vals → 脆弱性状況の把握、対応 - DeepSecurity → EC2そのもののセキュリティ強化
  36. 36 事例1 : AWS 独立した大量のEC2サーバを改善 改善前と改善後

  37. 37 事例1 : AWS 独立した大量のEC2サーバを改善 不必要な運用を減らした上で 運用アシスタントを活用

  38. 38 事例1 : AWS 独立した大量のEC2サーバを改善 - 想定されるオペレーションをまとめる - AutoScalingの起動テンプレートの変更(AMI変更) -

    AutoScalingの最大値、最小値の変更 - ALBの証明書更新作業 - WAFの設定変更作業 EC2 100台を監視、運用するのではなく サービスを絞った監視に切り替え
  39. 39 事例2 : 自動化で人的コストを削減

  40. 40 事例2 : 自動化で人的コストを削減 - 大量のURL外部監視とEC2の監視運用代行 - アラート発生時の復旧作業依頼 - プロセスの再起動及びEC2の再起動

  41. 41 事例2 : 自動化で人的コストを削減 単純作業は自動化で解決

  42. 42 事例2 : 自動化で人的コストを削減 - EC2の再起動 - オペレーションが決まっていた(ルールが出力ログから判別できた) → CloudWatch

    Logsの特定文字列からLambdaを起動し自動的に再起動を目指す
  43. 43 事例2 : 自動化で人的コストを削減 - プロセスの再起動 - オペレーションが決まっていた(ルールが出力ログから判別できた) → CloudWatch

    Agentでプロセスを監視→ルールに基づきプロセス再起動 Lambda SNS CloudWatch CloudWatch Agent
  44. 44 事例2 : 自動化で人的コストを削減 - 電話はAmazon Connectで自動通知

  45. 45 事例2 : 自動化で人的コストを削減 自動化することでコストを最小限に

  46. 46 テレワーク環境の運用

  47. 47 テレワーク環境の運用 VDIの利用需要が増えている↗️

  48. 48 テレワーク環境の運用 - VDI(仮想デスクトップ)の需要が増えている↗️ - AWS WorkSpaces - Azure Windows

    Virtual Desktop - etc... →導入はもちろん、その後のVDI運用が課題となっているケースが多い 環境の運用そのもの。スペックアップ対応など ユーザーの追加、削除 アプリケーションの追加、削除 グループポリシーの管理
  49. 49 テレワーク環境の運用 テレワークアシスタントの活用

  50. 「Amazon WorkSpaces」の初期設定・運用サポートを行うサービスです Amazon WorkSpaces パソコン端末 お客様事務所 画面転送 お客様システム 設定サービス メニュー

    概要 AWSクラウドの設定 クラウド環境の初期設定を行います VDIの新設 クラウド環境に仮想デスクトップを 作成します 運用サポートサービス メニュー 概要 監視・保守 仮想デスクトップを24時間365日監視し、 障害発生時は復旧措置を行います 問い合わせ対応 ユーザーからの障害申告やサービスに関 する 問い合わせの受付・対応を行います 運用代行 仮想デスクトップのスペック変更や、 アカウント情報管理等の運用を代行しま す 高度なスキルを要する 設定作業を 代行します 監視保守や問い合わせ 対応、 面倒なスペック変更作 業等を でサポートします 50 テレワークアシスタントとは(WorkSpaces)
  51. 51 まとめ - 監視運用保守は定期的な見直しを! - 日々の運用でお困りのことがあればネクストモードへ ご相談ください https://nextmode.co.jp/

  52. 52

  53. None