Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
障害対応から改善につなげる DevOpsへの取り組み方 / Troubleshooting ...
Search
mackerelio
November 11, 2020
Business
0
200
障害対応から改善につなげる DevOpsへの取り組み方 / Troubleshooting and Continuous improvement
「Jira / Confluence × Mackerel で実践! 運用しながら改善していくDevOpsのはじめかた」での発表資料です。
mackerelio
November 11, 2020
Tweet
Share
More Decks by mackerelio
See All by mackerelio
Mackerel CREのご紹介
mackerelio
0
46
Mackerelが取り組むオブザーバビリティ - Mackerel Tech Day
mackerelio
0
800
Mackerelの2023年ふりかえりと 今後のロードマップ
mackerelio
0
1k
Mackerel開発者が使ってほしいAWSインテグレーションの機能4選
mackerelio
0
82
Mackerelの現在と未来 2023 / Mackerel Drinkup #10
mackerelio
0
170
次世代Mackerelの アーキテクチャ / Mackerel Meetup #14 Next Generation Architecture
mackerelio
0
2.3k
Mackerelの現在と未来 2023 / Mackerel Meetup #14
mackerelio
0
2.2k
【講演資料】クラウド運用事業の成長を支援!MackerelではじめるMSP_20210427
mackerelio
0
140
オンラインセミナー資料「はじめてのMackerel 〜アラートの洪水から脱出! Mackerel流の通知活用法〜」20210303
mackerelio
0
100
Other Decks in Business
See All in Business
20250220_生成AIで実現する業務改革とは?活用事例とデモでご紹介!
suzakiyoshito
0
220
2022~2025年の成長戦略(アップデート)
junkiogawa
0
3k
RAKSUL会社紹介資料 / RAKSUL Introduction
raksulrecruiting
9
84k
アルファを作る人になる
nrryuya
0
120
20250219_一人データエンジニアだからこそ感じるアウトプットの重要性
1210yuichi0
0
310
ホットリンク会社紹介スライド / We are hiring
hottolink_pr
1
8.7k
CCBJIピッチブック
2024ccbji
0
260
AmbientNavi_紹介資料.pdf
ambientnavi0329
0
390
i3DESIGN_Culture_Book / We-are-hiring
i3design
0
34k
27.02.2025 El mercado cuartohorario de electricidad
neuroenergia
PRO
0
120
【詳細版】パーソルクロステクノロジー_グループソリューション統括本部_システムソリューション統括本部のご紹介 / Introduction_of_persol-xtech_gs_ssol_all
pxt_gs_ssol
0
2.4k
2ndPASS_リクルートガイド2024
akinodaichi
0
530
Featured
See All Featured
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3k
Rails Girls Zürich Keynote
gr2m
94
13k
Done Done
chrislema
182
16k
[RailsConf 2023] Rails as a piece of cake
palkan
53
5.3k
Building Better People: How to give real-time feedback that sticks.
wjessup
367
19k
Visualization
eitanlees
146
15k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
10
520
How GitHub (no longer) Works
holman
314
140k
Fontdeck: Realign not Redesign
paulrobertlloyd
83
5.4k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
40
2k
Large-scale JavaScript Application Architecture
addyosmani
511
110k
What's in a price? How to price your products and services
michaelherold
244
12k
Transcript
2020.11.11 株式会社はてな 渡辺 起 Jira / Confluence × Mackerel で実践! 運用しながら改善していくDevOpsのはじめかた
障害対応から改善につなげる DevOpsへの取り組み方
自己紹介 • 渡辺 起 (わたなべ たつる) ◦ id:wtatsuru @tatsuru • 略歴
◦ 2011年入社。インフラエンジニアとして入社 ◦ 基盤開発部門のマネージャー、責任者を経て ◦ 現在はMackerelプロダクトマネージャー • 得意・好き ◦ 計算機、ハードウェア ◦ 仕事ではAWSをよく使ってきた
内容 障害対応から改善につなげるDevOpsへの取り組み方 • Mackerelの紹介 • DevOpsとMackerelの取り組み • 障害対応から改善につなげる例 • まとめ
Mackerelの紹介
会社紹介 社名 株式会社はてな 所在地 (本社) 〒604-0835 京都府京都市中京区御池通間之町東入高宮町206 御池ビル9F (本店)
〒107-0062 東京都港区南青山6-5-55青山サンライトビル3F 設立 2001年7月 売上高 2,542 百万円(2020年7月現在) 従業員数 161人(2020年7月現在) 2016年に東証マザーズ市場に上場 5 提供サービス(抜粋)
6
Mackerelの紹介 • エンジニアをワクワクさせる直感的サーバー監視サービス • 簡単に始められる • 直感的ユーザー体験 • 便利で奥が深い機能
すぐにはじめられる • ガイドにしたがってコマンドを実行するだけ • 数分あれば十分 • エージェントが死活監視とメトリック取得を自動で開始 • メトリックは自動的にグラフで可視化 8
直感的なユーザー体験 9
アーキテクチャ 10 (SaaS) URL外形監視 Mackerelから 外部サービスの 外形監視が可能
マルチクラウド対応(クラウドインテグレーション) クラウド製品も可視化。サービス/ロール/ホストの 概念でわかりやすく監視できます。 AWS、Azure、Google Cloudなどのクラウドサービスか ら様々なメトリックやイベントを可視化。 複雑なサービス環境も全体を俯瞰してシンプルに 管理できます。 11
育てていく監視 • 動的な管理モデル。サーバーを自然に役割で管理 • 豊富な通知連携 • 充実したAPI • 運用の中で育てていく監視
日本語サポート・国内コミュニティ 課題解決の手段と場所を整えています 13 ▽ 豊富な日本語コンテンツ (ブログ・ヘルプ・FAQ) ▽ 公式イベントの継続開催 (Meetup・オンラインセミナー) ▽
ユーザーコミュニティ (Slackで活動中) https://mackerel-ug-slackin.herokuapp.com/
日本語サポート・国内コミュニティ サポートチームへのお問い合わせも可能です 14 ご不明点がありましたら ぜひ、サポートチームへ ご連絡ください!
Mackerelの紹介(再掲) • エンジニアをワクワクさせる直感的サーバー監視サービス • 簡単に始められる • 直感的ユーザー体験 • 便利で奥が深い機能
DevOpsとMackerelの取り組み
ビジネス環境の変化 • クラウドの登場、ビジネス上の要求 ◦ クラウドによりシステム調達が不要に。インフラ管理の敷居が下がった。 ◦ システムの売り切りモデルから SaaSなどリテンションモデルへ。 • 価値を素早く届けるための方法論の登場
◦ アジャイル ◦ SRE ◦ DevOps
DevOps • ビジネス価値の提供に向き合う ◦ 「開発」と「運用」という観点は対立構造を生む ◦ ともに同じ価値の提供に向き合う • コラボレーション文化。問題に対してチームで向き合う ◦
情報の透明性 ◦ 問題vs私達の観点
監視という観点から見たDevOps • チームでのスキル獲得の観点 ◦ インフラ運用や監視が専門家のものになってしまうと、チームでの改善に取り組めない ◦ チームのスキルにしていく必要がある。 • 情報の透明性という観点 ◦
見ている情報が異なると目線が揃わない ◦ 前提の相違、情報格差による権威勾配。対立が生まれる構造ができる ◦ 情報の透明性がコラボレーションを助ける • 監視の問題は改善のチャンス ◦ チームでの問題発見、システムの改善に取り組む
監視という観点から見たDevOps • 開発・運用という垣根をこえて、チームで運用 = 価値の提供に向き合っていく必要が ある 「監視とは役割ではなくスキルであり、チーム内の全員がある程度のレベルに至っておくべ き。」 『入門 監視』
2019年1月 日本語訳出版(1.2 アンチパターン2:役割としての監視 )より
Mackerelの紹介(再) • エンジニアをワクワクさせる直感的サーバー監視サービス • 簡単に始められる • 直感的ユーザー体験 • 便利で奥が深い機能
Mackerelの取り組み • 簡単に始められる ◦ 敷居を下げて、誰でも取り組むことができる。 • 直感的ユーザー体験 ◦ 誰でも同じ目線で向き合える。 •
便利で奥が深い機能 ◦ 改善に取り組む、監視を育てていく。
障害対応から改善につなげる例
障害対応から改善につなげる例 はてな社内の事例をもとに、実際の流れを追っていきます • 障害発生 • 対応 • 振り返り • 改善
• アラートの通知。チャットツールやメールなどへの通知 • グラフやエラー状況を見て状況を把握 障害発生 • slack(などチャット)へのアラート通知
対応 • 対応者が集まり、対応開始 • Confluenceなどのドキュメントツールに対応を 記録 • リアルタイムな情報共有、認識の齟齬をなくす ◦ 電話、ビデオチャットでのコミュニケーション
◦ 対応ドキュメントをアップデートしていく ◦ グラフ共有などで同じものを見る
振り返り、改善 • チームでの振り返り実施 • 前提を把握する ◦ 対応ドキュメントの記録 ◦ チャットツールでの時系列情報 ▪
何時に何をしたか ▪ どのグラフを見て ▪ どのような判断を行ったか • チームで問題に向き合い、改善策を考える ◦ 動き方、役割分担は適切だったか。 ◦ 対応精度向上。 ▪ 対応時間を短縮できるポイントは存在したか、 ▪ 予兆は検知できたのか、できるための改善はなにか ◦ チーム全体で課題に向き合う
障害対応から改善につなげる • slack(などチャット)へのアラート連携 • アラート通知をきっかけにコミュニケー ション。 • チームで共同で調査・対応し • 経緯をポストモーテムとしてオンラインド
キュメントなどに蓄積。 • 根本対策に取り組む。 経緯をポストモー テムに残す 根本対策に継続し て取り組む
まとめ 障害対応から改善につなげるDevOpsへの取り組み方 • Mackerelの紹介 • DevOpsとMackerelの取り組み • 障害対応から改善につなげる例 • まとめ
Mackerelをぜひお試しください mackerel.io から 「無料で試してみる」をクリック!