Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
約1万台のサーバー運用を行うMSPの舞台裏
Search
NobuakiKikuchi
April 22, 2021
Technology
0
490
約1万台のサーバー運用を行うMSPの舞台裏
「cloudpack」の裏側 〜MSPと運用自動化〜 /iret tech labo #8
https://irettechlabo.connpass.com/event/208423/
登壇資料
NobuakiKikuchi
April 22, 2021
Tweet
Share
More Decks by NobuakiKikuchi
See All by NobuakiKikuchi
ハッカー飯に New Relic を導入して実践した3つのこと
nobuakikikuchi
0
720
失敗を経験したあなたへ〜建設的なインシデントの振り返りを行うために実践するべきこと〜
nobuakikikuchi
0
700
エンジニアと気軽に繋がれるプラットフォーム「ハッカー飯」で行った セキュリティ・モニタリングに関する取り組みについて
nobuakikikuchi
0
830
Dockerをざっくり知る
nobuakikikuchi
0
720
Other Decks in Technology
See All in Technology
ガバナンスを支える新サービス / New Services to Support Governance
sejima1105
0
490
Unlearn Product Development - Unleashed Edition
lemiorhan
PRO
2
140
[トレノケ雲の会 mod.13] 3回目のre:Inventで気づいたこと -CloudOperationsを添えて-
shintaro_fukatsu
0
110
怖くない!ゼロから始めるPHPソースコードコンパイル入門
colopl
0
190
多領域インシデントマネジメントへの挑戦:ハードウェアとソフトウェアの融合が生む課題/Challenge to multidisciplinary incident management: Issues created by the fusion of hardware and software
bitkey
PRO
2
130
「完全に理解したTalk」完全に理解した
segavvy
1
210
1等無人航空機操縦士一発試験 合格までの道のり ドローンミートアップ@大阪 2024/12/18
excdinc
0
190
Server-Side Engineer of LINE Sukimani
lycorp_recruit_jp
0
430
サーバーなしでWordPress運用、できますよ。
sogaoh
PRO
0
140
20241218_今年はSLI/SLOの導入を頑張ってました!
zepprix
0
210
ネットワーク可視化の世界
likr
7
5.1k
Wantedly での Datadog 活用事例
bgpat
2
860
Featured
See All Featured
The Art of Programming - Codeland 2020
erikaheidi
53
13k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
159
15k
Raft: Consensus for Rubyists
vanstee
137
6.7k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
6
470
How GitHub (no longer) Works
holman
311
140k
Fireside Chat
paigeccino
34
3.1k
Learning to Love Humans: Emotional Interface Design
aarron
274
40k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
365
25k
Rails Girls Zürich Keynote
gr2m
94
13k
We Have a Design System, Now What?
morganepeng
51
7.3k
Transcript
約1万台のサーバー運用を行う MSPの舞台裏 クラウドインテグレーション事業部 菊池 宣明
アジェンダ 2
インフラの運用や保守業務を行う上でアイレットMSPではどのような 工夫をしているのか本セッションでご紹介します アジェンダ MSPの概要 MSPの舞台裏 3
• 菊池 宣明 Nobuaki Kikuchi • アイレット株式会社 クラウドインテグレーション事業部 東京MSP運用セクション グループリーダー •
生命情報工学専攻出身 研究テーマ:蛋白質とアミノ酸組成の相関性について • 好きなAWSのサービス:AWSサポート about me 4
5 01 MSPの紹介および体制に関して MSPの概要
MSPとは? 6 Managed Service Provider インフラの運用や保守業務をお客様の 代わりにサービスとして提供する事業者
何故MSPが必要なのか? 7
何故MSPが必要なのか? 8 EC2
何故MSPが必要なのか? 9 EC2 AWSを使っているとはいえOS以上の管理は必要になる
何故MSPが必要なのか? 10
何故MSPが必要なのか? 11 アプリ OS/MW 基盤
何故MSPが必要なのか? 12 MSPがいることでアプリの開発のみに集中することが出来る アプリ OS/MW 基盤
MSPのミッション① 13 アンマネージドなサービスを…
MSPのミッション① 14 アンマネージドなサービスを… マネージドサービス のように提供する
マネージドサービスの場合 15
マネージドサービスの場合 16 Lambda RDS ELB
マネージドサービスの場合 17 Lambda RDS ELB 同時実行数の上限があ るため事前に緩和が必 要なケースもある AWSからハードウェアメン テナンスの連絡が届く事
がある 突発的なリクエストに備 えて暖機申請をしておく 必要がある
MSPのミッション② 18
マネージドサービスを適切に運用する MSPのミッション② 19
MSPのミッションを果たすためには自然災害等が発生したとしても… MSPの体制 20
MSPのミッションを果たすためには自然災害等が発生したとしても… 24時間365日 体制で業務が出来るようにしておく必要がある MSPの体制 21
MSPのミッションを果たすためには自然災害等が発生したとしても… 24時間365日 体制で業務が出来るようにしておく必要がある MSPの体制 22 2拠点体制 東京:虎ノ門ヒルズ 大阪:グランフロント
MSPに関するまとめ 23
• MSPとは ◦ インフラの運用や保守業務をお客様の代わりにサービスとして提供する事業者 MSPに関するまとめ 24
• MSPとは ◦ インフラの運用や保守業務をお客様の代わりにサービスとして提供する事業者 • MSPのミッション ◦ アンマネージドなサービスをマネージドサービスのように提供する ◦ マネージドサービスを適切に運用する
MSPに関するまとめ 25
• MSPとは ◦ インフラの運用や保守業務をお客様の代わりにサービスとして提供する事業者 • MSPのミッション ◦ アンマネージドなサービスをマネージドサービスのように提供する ◦ マネージドサービスを適切に運用する
MSPに関するまとめ 26
• MSPとは ◦ インフラの運用や保守業務をお客様の代わりにサービスとして提供する事業者 • MSPのミッション ◦ アンマネージドなサービスをマネージドサービスのように提供する ◦ マネージドサービスを適切に運用する
• MSPの体制 ◦ 自然災害等に備えて2拠点体制にしている MSPに関するまとめ 27
MSPの舞台裏 28 02 使用ツール等の紹介
29 アラート対応の流れ
30 アラート対応の流れ
31 アラート対応の流れ 監視 監視サービス
32 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲
33 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視
34 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視 プロジェクト管理サービス アラート対応方法の確認
35 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視 プロジェクト管理サービス アラート対応方法の確認
報告 お客様
36 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視 プロジェクト管理サービス アラート対応方法の確認
報告 お客様
◦ SaaS型の監視サービス ◦ インフラの監視だけでなくアプリケーションパフォーマンス監視(APM)も可能 監視サービスに関して 37
• 昔はNagiosやSnesuといった監視サービスを使用していた時期もあった ◦ 特徴として専用の監視サーバを構築する必要がある 監視サービスに関して 38 監視サーバ 監視対象 サーバーを管理する必要がある (メンテナンス対応、死活監視…etc)
• NewRelicのようなSaaS型の監視サービスの場合… 専用の監視サーバの構築が不要 監視サービスに関して 39 監視対象 監視対象のサーバーのことだけ考えれば良い
40 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視 プロジェクト管理サービス アラート対応方法の確認
報告 お客様
41 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視 プロジェクト管理サービス アラート対応方法の確認
報告 お客様
インシデント管理サービス 42 MSPは24時間365日体制でPagerDutyの画面を監視している
PagerDutyの使い方 43
PagerDutyの使い方 44
PagerDutyの使い方 45
アラート対応 46
アラート対応 47
アラート対応 48 自動起票される内容 MSP 対応内容
49 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視 プロジェクト管理サービス アラート対応方法の確認
報告 お客様
アラートの対応手順は全てwikiに記載 ▪wikiにするメリット • 書きやすい/読みやすい • バージョン管理しやすい
• 共有/権限の設定が簡単 Backlogについて 50
Backlogについて 51
Backlogについて 52 アラート内容が自動で起票される
Backlogについて 53 アラート内容が自動で起票される Backlog上でインシデントを報告
54 アラート対応の流れ 監視 監視サービス インシデント管理サービス アラート発砲 MSP 24365で監視 プロジェクト管理サービス アラート対応方法の確認
報告 お客様
まとめ 55 03
• アイレットのMSPは24時間365日の有人監視を実施 • SaaS型のツールを用いることでアラート対応を効率化 • 自社でMSP事業を持つことで「血の通った運用」をお客様に提供 56 まとめ