Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
約1万台のサーバー運用を行うMSPの舞台裏
Search
NobuakiKikuchi
April 22, 2021
Technology
0
490
約1万台のサーバー運用を行うMSPの舞台裏
「cloudpack」の裏側 〜MSPと運用自動化〜 /iret tech labo #8
https://irettechlabo.connpass.com/event/208423/
登壇資料
NobuakiKikuchi
April 22, 2021
Tweet
Share
More Decks by NobuakiKikuchi
See All by NobuakiKikuchi
ハッカー飯に New Relic を導入して実践した3つのこと
nobuakikikuchi
0
710
失敗を経験したあなたへ〜建設的なインシデントの振り返りを行うために実践するべきこと〜
nobuakikikuchi
0
690
エンジニアと気軽に繋がれるプラットフォーム「ハッカー飯」で行った セキュリティ・モニタリングに関する取り組みについて
nobuakikikuchi
0
820
Dockerをざっくり知る
nobuakikikuchi
0
720
Other Decks in Technology
See All in Technology
Oracle Cloud Infrastructureデータベース・クラウド:各バージョンのサポート期間
oracle4engineer
PRO
29
13k
安心してください、日本語使えますよ―Ubuntu日本語Remix提供休止に寄せて― 2024-11-17
nobutomurata
1
1k
[CV勉強会@関東 ECCV2024 読み会] オンラインマッピング x トラッキング MapTracker: Tracking with Strided Memory Fusion for Consistent Vector HD Mapping (Chen+, ECCV24)
abemii
0
230
個人でもIAM Identity Centerを使おう!(アクセス管理編)
ryder472
4
250
DynamoDB でスロットリングが発生したとき_大盛りver/when_throttling_occurs_in_dynamodb_long
emiki
1
480
開発生産性を上げながらビジネスも30倍成長させてきたチームの姿
kamina_zzz
2
1.7k
100 名超が参加した日経グループ横断の競技型 AWS 学習イベント「Nikkei Group AWS GameDay」の紹介/mediajaws202411
nikkei_engineer_recruiting
1
180
インフラとバックエンドとフロントエンドをくまなく調べて遅いアプリを早くした件
tubone24
1
440
オープンソースAIとは何か? --「オープンソースAIの定義 v1.0」詳細解説
shujisado
10
1.5k
『Firebase Dynamic Links終了に備える』 FlutterアプリでのAdjust導入とDeeplink最適化
techiro
0
210
rootlessコンテナのすゝめ - 研究室サーバーでもできる安全なコンテナ管理
kitsuya0828
3
390
CDCL による厳密解法を採用した MILP ソルバー
imai448
3
240
Featured
See All Featured
VelocityConf: Rendering Performance Case Studies
addyosmani
325
24k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
25
1.8k
Into the Great Unknown - MozCon
thekraken
32
1.5k
Product Roadmaps are Hard
iamctodd
PRO
49
11k
Music & Morning Musume
bryan
46
6.2k
What's in a price? How to price your products and services
michaelherold
243
12k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
126
18k
Raft: Consensus for Rubyists
vanstee
136
6.6k
Ruby is Unlike a Banana
tanoku
97
11k
Testing 201, or: Great Expectations
jmmastey
38
7.1k
Transcript
約1万台のサーバー運用を行う MSPの舞台裏 クラウドインテグレーション事業部 菊池 宣明
アジェンダ 2
インフラの運用や保守業務を行う上でアイレットMSPではどのような 工夫をしているのか本セッションでご紹介します アジェンダ MSPの概要 MSPの舞台裏 3
• 菊池 宣明 Nobuaki Kikuchi • アイレット株式会社 クラウドインテグレーション事業部 東京MSP運用セクション グループリーダー •
生命情報工学専攻出身 研究テーマ:蛋白質とアミノ酸組成の相関性について • 好きなAWSのサービス:AWSサポート about me 4
5 01 MSPの紹介および体制に関して MSPの概要
MSPとは? 6 Managed Service Provider インフラの運用や保守業務をお客様の 代わりにサービスとして提供する事業者
何故MSPが必要なのか? 7
何故MSPが必要なのか? 8 EC2
何故MSPが必要なのか? 9 EC2 AWSを使っているとはいえOS以上の管理は必要になる
何故MSPが必要なのか? 10
何故MSPが必要なのか? 11 アプリ OS/MW 基盤
何故MSPが必要なのか? 12 MSPがいることでアプリの開発のみに集中することが出来る アプリ OS/MW 基盤
MSPのミッション① 13 アンマネージドなサービスを…
MSPのミッション① 14 アンマネージドなサービスを… マネージドサービス のように提供する
マネージドサービスの場合 15
マネージドサービスの場合 16 Lambda RDS ELB
マネージドサービスの場合 17 Lambda RDS ELB 同時実行数の上限があ るため事前に緩和が必 要なケースもある AWSからハードウェアメン テナンスの連絡が届く事
がある 突発的なリクエストに備 えて暖機申請をしておく 必要がある
MSPのミッション② 18
マネージドサービスを適切に運用する MSPのミッション② 19
MSPのミッションを果たすためには自然災害等が発生したとしても… MSPの体制 20
MSPのミッションを果たすためには自然災害等が発生したとしても… 24時間365日 体制で業務が出来るようにしておく必要がある MSPの体制 21
MSPのミッションを果たすためには自然災害等が発生したとしても… 24時間365日 体制で業務が出来るようにしておく必要がある MSPの体制 22 2拠点体制 東京:虎ノ門ヒルズ 大阪:グランフロント
MSPに関するまとめ 23
• MSPとは ◦ インフラの運用や保守業務をお客様の代わりにサービスとして提供する事業者 MSPに関するまとめ 24
• MSPとは ◦ インフラの運用や保守業務をお客様の代わりにサービスとして提供する事業者 • MSPのミッション ◦ アンマネージドなサービスをマネージドサービスのように提供する ◦ マネージドサービスを適切に運用する
MSPに関するまとめ 25
• MSPとは ◦ インフラの運用や保守業務をお客様の代わりにサービスとして提供する事業者 • MSPのミッション ◦ アンマネージドなサービスをマネージドサービスのように提供する ◦ マネージドサービスを適切に運用する
MSPに関するまとめ 26
• MSPとは ◦ インフラの運用や保守業務をお客様の代わりにサービスとして提供する事業者 • MSPのミッション ◦ アンマネージドなサービスをマネージドサービスのように提供する ◦ マネージドサービスを適切に運用する
• MSPの体制 ◦ 自然災害等に備えて2拠点体制にしている MSPに関するまとめ 27
MSPの舞台裏 28 02 使用ツール等の紹介
29 アラート対応の流れ
30 アラート対応の流れ
31 アラート対応の流れ 監視 監視サービス
32 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲
33 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視
34 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視 プロジェクト管理サービス アラート対応方法の確認
35 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視 プロジェクト管理サービス アラート対応方法の確認
報告 お客様
36 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視 プロジェクト管理サービス アラート対応方法の確認
報告 お客様
◦ SaaS型の監視サービス ◦ インフラの監視だけでなくアプリケーションパフォーマンス監視(APM)も可能 監視サービスに関して 37
• 昔はNagiosやSnesuといった監視サービスを使用していた時期もあった ◦ 特徴として専用の監視サーバを構築する必要がある 監視サービスに関して 38 監視サーバ 監視対象 サーバーを管理する必要がある (メンテナンス対応、死活監視…etc)
• NewRelicのようなSaaS型の監視サービスの場合… 専用の監視サーバの構築が不要 監視サービスに関して 39 監視対象 監視対象のサーバーのことだけ考えれば良い
40 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視 プロジェクト管理サービス アラート対応方法の確認
報告 お客様
41 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視 プロジェクト管理サービス アラート対応方法の確認
報告 お客様
インシデント管理サービス 42 MSPは24時間365日体制でPagerDutyの画面を監視している
PagerDutyの使い方 43
PagerDutyの使い方 44
PagerDutyの使い方 45
アラート対応 46
アラート対応 47
アラート対応 48 自動起票される内容 MSP 対応内容
49 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視 プロジェクト管理サービス アラート対応方法の確認
報告 お客様
アラートの対応手順は全てwikiに記載 ▪wikiにするメリット • 書きやすい/読みやすい • バージョン管理しやすい
• 共有/権限の設定が簡単 Backlogについて 50
Backlogについて 51
Backlogについて 52 アラート内容が自動で起票される
Backlogについて 53 アラート内容が自動で起票される Backlog上でインシデントを報告
54 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視 プロジェクト管理サービス アラート対応方法の確認
報告 お客様
まとめ 55 03
• アイレットのMSPは24時間365日の有人監視を実施 • SaaS型のツールを用いることでアラート対応を効率化 • 自社でMSP事業を持つことで「血の通った運用」をお客様に提供 56 まとめ