Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
障害対応から改善につなげる DevOpsへの取り組み方 / Troubleshooting ...
Search
mackerelio
November 11, 2020
Business
0
220
障害対応から改善につなげる DevOpsへの取り組み方 / Troubleshooting and Continuous improvement
「Jira / Confluence × Mackerel で実践! 運用しながら改善していくDevOpsのはじめかた」での発表資料です。
mackerelio
November 11, 2020
Tweet
Share
More Decks by mackerelio
See All by mackerelio
アプリケーションの中身が見える!Mackerel APMの全貌と展望 / Mackerel APMリリースパーティ
mackerelio
0
580
Mackerel CREのご紹介
mackerelio
0
85
Mackerelが取り組むオブザーバビリティ - Mackerel Tech Day
mackerelio
0
970
Mackerelの2023年ふりかえりと 今後のロードマップ
mackerelio
0
1.1k
Mackerel開発者が使ってほしいAWSインテグレーションの機能4選
mackerelio
0
120
Mackerelの現在と未来 2023 / Mackerel Drinkup #10
mackerelio
0
190
次世代Mackerelの アーキテクチャ / Mackerel Meetup #14 Next Generation Architecture
mackerelio
0
2.4k
Mackerelの現在と未来 2023 / Mackerel Meetup #14
mackerelio
0
2.3k
【講演資料】クラウド運用事業の成長を支援!MackerelではじめるMSP_20210427
mackerelio
0
150
Other Decks in Business
See All in Business
リーダーシップとマネジメントの違いとは?
baroqueworksdev
13
4k
【Progmat】Monthly-ST-Market-Report-2025-Jun.
progmat
0
110
20250613_CMC_2025_A3
hideki_ojima
0
440
CSRレポート2025_ギークス株式会社
geechs
PRO
0
520
【全ポジション共通】㈱エグゼクション/会社紹介資料
exe_recruit
1
1.3k
Platform Engineering done well: innovation, efficiency, market advantage - Matthew Skelton - ProductTank Auckland
matthewskelton
PRO
0
250
コーポレートストーリー(新規投資家様向け会社説明資料)
gatechnologies
1
13k
なぜConfluence Cloudだったのか?〜『運用効率と将来性』から見る最適解と、予期せぬ課題を乗り越えた移行のリアル~ / Why-we-choose-confluence-cloud
medley
0
170
構造化すれば怖くない 画像検索から始める木を見て森に入る勉強法
cuebic9bic
2
360
事業計画及び成長可能性に関する事項 2025年6月25日
cynd
0
240
tokyo_dbt_meetup_#14_意志ある羅針盤たれ<データサイド>
t_yamaguchi
3
500
Taiwan Product Conference 2025: Interoperate Integrate Iterate a 10 Year Pm Survival Kit for Traditional Sectors
dwchiang
0
140
Featured
See All Featured
Navigating Team Friction
lara
187
15k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
657
60k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Designing Experiences People Love
moore
142
24k
Producing Creativity
orderedlist
PRO
346
40k
The World Runs on Bad Software
bkeepers
PRO
69
11k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
46
9.6k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
15
1.5k
How to Think Like a Performance Engineer
csswizardry
24
1.7k
Building Applications with DynamoDB
mza
95
6.5k
[RailsConf 2023] Rails as a piece of cake
palkan
55
5.6k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
16
940
Transcript
2020.11.11 株式会社はてな 渡辺 起 Jira / Confluence × Mackerel で実践! 運用しながら改善していくDevOpsのはじめかた
障害対応から改善につなげる DevOpsへの取り組み方
自己紹介 • 渡辺 起 (わたなべ たつる) ◦ id:wtatsuru @tatsuru • 略歴
◦ 2011年入社。インフラエンジニアとして入社 ◦ 基盤開発部門のマネージャー、責任者を経て ◦ 現在はMackerelプロダクトマネージャー • 得意・好き ◦ 計算機、ハードウェア ◦ 仕事ではAWSをよく使ってきた
内容 障害対応から改善につなげるDevOpsへの取り組み方 • Mackerelの紹介 • DevOpsとMackerelの取り組み • 障害対応から改善につなげる例 • まとめ
Mackerelの紹介
会社紹介 社名 株式会社はてな 所在地 (本社) 〒604-0835 京都府京都市中京区御池通間之町東入高宮町206 御池ビル9F (本店)
〒107-0062 東京都港区南青山6-5-55青山サンライトビル3F 設立 2001年7月 売上高 2,542 百万円(2020年7月現在) 従業員数 161人(2020年7月現在) 2016年に東証マザーズ市場に上場 5 提供サービス(抜粋)
6
Mackerelの紹介 • エンジニアをワクワクさせる直感的サーバー監視サービス • 簡単に始められる • 直感的ユーザー体験 • 便利で奥が深い機能
すぐにはじめられる • ガイドにしたがってコマンドを実行するだけ • 数分あれば十分 • エージェントが死活監視とメトリック取得を自動で開始 • メトリックは自動的にグラフで可視化 8
直感的なユーザー体験 9
アーキテクチャ 10 (SaaS) URL外形監視 Mackerelから 外部サービスの 外形監視が可能
マルチクラウド対応(クラウドインテグレーション) クラウド製品も可視化。サービス/ロール/ホストの 概念でわかりやすく監視できます。 AWS、Azure、Google Cloudなどのクラウドサービスか ら様々なメトリックやイベントを可視化。 複雑なサービス環境も全体を俯瞰してシンプルに 管理できます。 11
育てていく監視 • 動的な管理モデル。サーバーを自然に役割で管理 • 豊富な通知連携 • 充実したAPI • 運用の中で育てていく監視
日本語サポート・国内コミュニティ 課題解決の手段と場所を整えています 13 ▽ 豊富な日本語コンテンツ (ブログ・ヘルプ・FAQ) ▽ 公式イベントの継続開催 (Meetup・オンラインセミナー) ▽
ユーザーコミュニティ (Slackで活動中) https://mackerel-ug-slackin.herokuapp.com/
日本語サポート・国内コミュニティ サポートチームへのお問い合わせも可能です 14 ご不明点がありましたら ぜひ、サポートチームへ ご連絡ください!
Mackerelの紹介(再掲) • エンジニアをワクワクさせる直感的サーバー監視サービス • 簡単に始められる • 直感的ユーザー体験 • 便利で奥が深い機能
DevOpsとMackerelの取り組み
ビジネス環境の変化 • クラウドの登場、ビジネス上の要求 ◦ クラウドによりシステム調達が不要に。インフラ管理の敷居が下がった。 ◦ システムの売り切りモデルから SaaSなどリテンションモデルへ。 • 価値を素早く届けるための方法論の登場
◦ アジャイル ◦ SRE ◦ DevOps
DevOps • ビジネス価値の提供に向き合う ◦ 「開発」と「運用」という観点は対立構造を生む ◦ ともに同じ価値の提供に向き合う • コラボレーション文化。問題に対してチームで向き合う ◦
情報の透明性 ◦ 問題vs私達の観点
監視という観点から見たDevOps • チームでのスキル獲得の観点 ◦ インフラ運用や監視が専門家のものになってしまうと、チームでの改善に取り組めない ◦ チームのスキルにしていく必要がある。 • 情報の透明性という観点 ◦
見ている情報が異なると目線が揃わない ◦ 前提の相違、情報格差による権威勾配。対立が生まれる構造ができる ◦ 情報の透明性がコラボレーションを助ける • 監視の問題は改善のチャンス ◦ チームでの問題発見、システムの改善に取り組む
監視という観点から見たDevOps • 開発・運用という垣根をこえて、チームで運用 = 価値の提供に向き合っていく必要が ある 「監視とは役割ではなくスキルであり、チーム内の全員がある程度のレベルに至っておくべ き。」 『入門 監視』
2019年1月 日本語訳出版(1.2 アンチパターン2:役割としての監視 )より
Mackerelの紹介(再) • エンジニアをワクワクさせる直感的サーバー監視サービス • 簡単に始められる • 直感的ユーザー体験 • 便利で奥が深い機能
Mackerelの取り組み • 簡単に始められる ◦ 敷居を下げて、誰でも取り組むことができる。 • 直感的ユーザー体験 ◦ 誰でも同じ目線で向き合える。 •
便利で奥が深い機能 ◦ 改善に取り組む、監視を育てていく。
障害対応から改善につなげる例
障害対応から改善につなげる例 はてな社内の事例をもとに、実際の流れを追っていきます • 障害発生 • 対応 • 振り返り • 改善
• アラートの通知。チャットツールやメールなどへの通知 • グラフやエラー状況を見て状況を把握 障害発生 • slack(などチャット)へのアラート通知
対応 • 対応者が集まり、対応開始 • Confluenceなどのドキュメントツールに対応を 記録 • リアルタイムな情報共有、認識の齟齬をなくす ◦ 電話、ビデオチャットでのコミュニケーション
◦ 対応ドキュメントをアップデートしていく ◦ グラフ共有などで同じものを見る
振り返り、改善 • チームでの振り返り実施 • 前提を把握する ◦ 対応ドキュメントの記録 ◦ チャットツールでの時系列情報 ▪
何時に何をしたか ▪ どのグラフを見て ▪ どのような判断を行ったか • チームで問題に向き合い、改善策を考える ◦ 動き方、役割分担は適切だったか。 ◦ 対応精度向上。 ▪ 対応時間を短縮できるポイントは存在したか、 ▪ 予兆は検知できたのか、できるための改善はなにか ◦ チーム全体で課題に向き合う
障害対応から改善につなげる • slack(などチャット)へのアラート連携 • アラート通知をきっかけにコミュニケー ション。 • チームで共同で調査・対応し • 経緯をポストモーテムとしてオンラインド
キュメントなどに蓄積。 • 根本対策に取り組む。 経緯をポストモー テムに残す 根本対策に継続し て取り組む
まとめ 障害対応から改善につなげるDevOpsへの取り組み方 • Mackerelの紹介 • DevOpsとMackerelの取り組み • 障害対応から改善につなげる例 • まとめ
Mackerelをぜひお試しください mackerel.io から 「無料で試してみる」をクリック!