Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
障害対応から改善につなげる DevOpsへの取り組み方 / Troubleshooting ...
Search
mackerelio
November 11, 2020
Business
0
190
障害対応から改善につなげる DevOpsへの取り組み方 / Troubleshooting and Continuous improvement
「Jira / Confluence × Mackerel で実践! 運用しながら改善していくDevOpsのはじめかた」での発表資料です。
mackerelio
November 11, 2020
Tweet
Share
More Decks by mackerelio
See All by mackerelio
Mackerelが取り組むオブザーバビリティ - Mackerel Tech Day
mackerelio
0
660
Mackerelの2023年ふりかえりと 今後のロードマップ
mackerelio
0
990
Mackerel開発者が使ってほしいAWSインテグレーションの機能4選
mackerelio
0
65
Mackerelの現在と未来 2023 / Mackerel Drinkup #10
mackerelio
0
160
次世代Mackerelの アーキテクチャ / Mackerel Meetup #14 Next Generation Architecture
mackerelio
0
2.2k
Mackerelの現在と未来 2023 / Mackerel Meetup #14
mackerelio
0
2.2k
【講演資料】クラウド運用事業の成長を支援!MackerelではじめるMSP_20210427
mackerelio
0
140
オンラインセミナー資料「はじめてのMackerel 〜アラートの洪水から脱出! Mackerel流の通知活用法〜」20210303
mackerelio
0
100
はじめてのMackerel ~ クラウド監視入門編 ~ 20210225
mackerelio
0
74
Other Decks in Business
See All in Business
Works Human Intelligence
whisaiyo
1
80k
デジタルで創れ!未来の東京消防庁
tokyo_metropolitan_gov_digital_hr
1
330
重厚長大なものづくり企業におけるプロダクトマネジメントの挑戦と苦悩 / pmconf2024
tkchy
0
5.1k
WHITE CROSS inc. - Recruiting deck
yutanagahata
2
9k
(16枚)組織と集団の違いとは? 組織の「3要素」とは?
nyattx
PRO
3
2.1k
AWS の生成 AI 最前線 : 顧客起点のイノベーション
icoxfog417
PRO
0
1.2k
1LDK会社紹介資料
1ldkinc
1
740
Go See!で見つけるプロダクト開発の突破口とその実践法
ta0o_o0821
0
190
【エンジニア採用】BuySell Technologies会社説明資料
buyselltechnologies
2
55k
Ampersand Company Profile
cuebicventures
PRO
0
510
概要
_connect
0
760
re:Infrastructure_for the NextGen AI/ML and Beyond
ichichi
0
170
Featured
See All Featured
Testing 201, or: Great Expectations
jmmastey
41
7.1k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.9k
Keith and Marios Guide to Fast Websites
keithpitt
410
22k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
29
2k
GraphQLの誤解/rethinking-graphql
sonatard
67
10k
Building Adaptive Systems
keathley
38
2.3k
Agile that works and the tools we love
rasmusluckow
328
21k
BBQ
matthewcrist
85
9.4k
A Modern Web Designer's Workflow
chriscoyier
693
190k
The Power of CSS Pseudo Elements
geoffreycrofte
73
5.4k
Building Flexible Design Systems
yeseniaperezcruz
327
38k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
45
2.2k
Transcript
2020.11.11 株式会社はてな 渡辺 起 Jira / Confluence × Mackerel で実践! 運用しながら改善していくDevOpsのはじめかた
障害対応から改善につなげる DevOpsへの取り組み方
自己紹介 • 渡辺 起 (わたなべ たつる) ◦ id:wtatsuru @tatsuru • 略歴
◦ 2011年入社。インフラエンジニアとして入社 ◦ 基盤開発部門のマネージャー、責任者を経て ◦ 現在はMackerelプロダクトマネージャー • 得意・好き ◦ 計算機、ハードウェア ◦ 仕事ではAWSをよく使ってきた
内容 障害対応から改善につなげるDevOpsへの取り組み方 • Mackerelの紹介 • DevOpsとMackerelの取り組み • 障害対応から改善につなげる例 • まとめ
Mackerelの紹介
会社紹介 社名 株式会社はてな 所在地 (本社) 〒604-0835 京都府京都市中京区御池通間之町東入高宮町206 御池ビル9F (本店)
〒107-0062 東京都港区南青山6-5-55青山サンライトビル3F 設立 2001年7月 売上高 2,542 百万円(2020年7月現在) 従業員数 161人(2020年7月現在) 2016年に東証マザーズ市場に上場 5 提供サービス(抜粋)
6
Mackerelの紹介 • エンジニアをワクワクさせる直感的サーバー監視サービス • 簡単に始められる • 直感的ユーザー体験 • 便利で奥が深い機能
すぐにはじめられる • ガイドにしたがってコマンドを実行するだけ • 数分あれば十分 • エージェントが死活監視とメトリック取得を自動で開始 • メトリックは自動的にグラフで可視化 8
直感的なユーザー体験 9
アーキテクチャ 10 (SaaS) URL外形監視 Mackerelから 外部サービスの 外形監視が可能
マルチクラウド対応(クラウドインテグレーション) クラウド製品も可視化。サービス/ロール/ホストの 概念でわかりやすく監視できます。 AWS、Azure、Google Cloudなどのクラウドサービスか ら様々なメトリックやイベントを可視化。 複雑なサービス環境も全体を俯瞰してシンプルに 管理できます。 11
育てていく監視 • 動的な管理モデル。サーバーを自然に役割で管理 • 豊富な通知連携 • 充実したAPI • 運用の中で育てていく監視
日本語サポート・国内コミュニティ 課題解決の手段と場所を整えています 13 ▽ 豊富な日本語コンテンツ (ブログ・ヘルプ・FAQ) ▽ 公式イベントの継続開催 (Meetup・オンラインセミナー) ▽
ユーザーコミュニティ (Slackで活動中) https://mackerel-ug-slackin.herokuapp.com/
日本語サポート・国内コミュニティ サポートチームへのお問い合わせも可能です 14 ご不明点がありましたら ぜひ、サポートチームへ ご連絡ください!
Mackerelの紹介(再掲) • エンジニアをワクワクさせる直感的サーバー監視サービス • 簡単に始められる • 直感的ユーザー体験 • 便利で奥が深い機能
DevOpsとMackerelの取り組み
ビジネス環境の変化 • クラウドの登場、ビジネス上の要求 ◦ クラウドによりシステム調達が不要に。インフラ管理の敷居が下がった。 ◦ システムの売り切りモデルから SaaSなどリテンションモデルへ。 • 価値を素早く届けるための方法論の登場
◦ アジャイル ◦ SRE ◦ DevOps
DevOps • ビジネス価値の提供に向き合う ◦ 「開発」と「運用」という観点は対立構造を生む ◦ ともに同じ価値の提供に向き合う • コラボレーション文化。問題に対してチームで向き合う ◦
情報の透明性 ◦ 問題vs私達の観点
監視という観点から見たDevOps • チームでのスキル獲得の観点 ◦ インフラ運用や監視が専門家のものになってしまうと、チームでの改善に取り組めない ◦ チームのスキルにしていく必要がある。 • 情報の透明性という観点 ◦
見ている情報が異なると目線が揃わない ◦ 前提の相違、情報格差による権威勾配。対立が生まれる構造ができる ◦ 情報の透明性がコラボレーションを助ける • 監視の問題は改善のチャンス ◦ チームでの問題発見、システムの改善に取り組む
監視という観点から見たDevOps • 開発・運用という垣根をこえて、チームで運用 = 価値の提供に向き合っていく必要が ある 「監視とは役割ではなくスキルであり、チーム内の全員がある程度のレベルに至っておくべ き。」 『入門 監視』
2019年1月 日本語訳出版(1.2 アンチパターン2:役割としての監視 )より
Mackerelの紹介(再) • エンジニアをワクワクさせる直感的サーバー監視サービス • 簡単に始められる • 直感的ユーザー体験 • 便利で奥が深い機能
Mackerelの取り組み • 簡単に始められる ◦ 敷居を下げて、誰でも取り組むことができる。 • 直感的ユーザー体験 ◦ 誰でも同じ目線で向き合える。 •
便利で奥が深い機能 ◦ 改善に取り組む、監視を育てていく。
障害対応から改善につなげる例
障害対応から改善につなげる例 はてな社内の事例をもとに、実際の流れを追っていきます • 障害発生 • 対応 • 振り返り • 改善
• アラートの通知。チャットツールやメールなどへの通知 • グラフやエラー状況を見て状況を把握 障害発生 • slack(などチャット)へのアラート通知
対応 • 対応者が集まり、対応開始 • Confluenceなどのドキュメントツールに対応を 記録 • リアルタイムな情報共有、認識の齟齬をなくす ◦ 電話、ビデオチャットでのコミュニケーション
◦ 対応ドキュメントをアップデートしていく ◦ グラフ共有などで同じものを見る
振り返り、改善 • チームでの振り返り実施 • 前提を把握する ◦ 対応ドキュメントの記録 ◦ チャットツールでの時系列情報 ▪
何時に何をしたか ▪ どのグラフを見て ▪ どのような判断を行ったか • チームで問題に向き合い、改善策を考える ◦ 動き方、役割分担は適切だったか。 ◦ 対応精度向上。 ▪ 対応時間を短縮できるポイントは存在したか、 ▪ 予兆は検知できたのか、できるための改善はなにか ◦ チーム全体で課題に向き合う
障害対応から改善につなげる • slack(などチャット)へのアラート連携 • アラート通知をきっかけにコミュニケー ション。 • チームで共同で調査・対応し • 経緯をポストモーテムとしてオンラインド
キュメントなどに蓄積。 • 根本対策に取り組む。 経緯をポストモー テムに残す 根本対策に継続し て取り組む
まとめ 障害対応から改善につなげるDevOpsへの取り組み方 • Mackerelの紹介 • DevOpsとMackerelの取り組み • 障害対応から改善につなげる例 • まとめ
Mackerelをぜひお試しください mackerel.io から 「無料で試してみる」をクリック!