Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オープンセミナー2024@広島 − XRE エンジニアを支える組織_信頼性を高めるって結局何だ...
Search
tomo
November 08, 2024
0
1.3k
オープンセミナー2024@広島 − XRE エンジニアを支える組織_信頼性を高めるって結局何だったの?
「オープンセミナー2024@広島 − XRE エンジニアを支える組織」でお話させていただいた、「信頼性を高めるって結局何だったの?」と題したセッションの資料です。
tomo
November 08, 2024
Tweet
Share
More Decks by tomo
See All by tomo
第34回 中国地方DB勉強会 in 広島_Why DBRE?
tomomo
8
2.5k
OracleDBを用いたDBREの実現 〜オイシックス・ラ・大地でやってみた〜
tomomo
2
4k
NW自動化を開発エンジニアがやってみた話
tomomo
5
3.5k
Featured
See All Featured
Reflections from 52 weeks, 52 projects
jeffersonlam
346
20k
Git: the NoSQL Database
bkeepers
PRO
427
64k
VelocityConf: Rendering Performance Case Studies
addyosmani
326
24k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
Faster Mobile Websites
deanohume
305
30k
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
26
1.8k
The Invisible Side of Design
smashingmag
298
50k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
5
430
Building a Scalable Design System with Sketch
lauravandoore
460
33k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
48
2.2k
Testing 201, or: Great Expectations
jmmastey
40
7.1k
Transcript
信頼性を高めるって 結局何だったの? オープンセミナー2024@広島 2024/11/09 @tomomo1015
名前 tomo(@tomomo1015) 職歴 新卒でSIerに1X年、PM&DBAに従事 事業会社にてSRE&DBREを3年 2024年2月から別事業会社でPdM XRE話 DataDogとNewRelicどちらを採用するかで アイコンが可愛いからって理由で DataDogを採用しました
ごめんなさい、毎日見るから可愛い方がいいんです 2 この話をする人
Q:なんで、あかずきんなんですか? A:初めて登壇したコミュニティイベントが 赤帽社さん主催のAnsibleのイベントで 赤い帽子で連想したキャラクターが 「あかずきん」だったから。 帽子の赤い色はずっと、Ansibleのロゴの色です Q:結局何のエンジニアなんですか?
A:DBやったりSRE、PM、PdMしたり、広く 浅くです。 でも、定期的にSQLを実行しないと禁断症状 出るので、多分DBAです。 3 余談(テンプレ)
4 XRE 「なんとかRE」に ついて
5 信頼性を高めることを 目的としたエンジニアリング
6 XRE関連のオライリーの書籍たち まだまだ あるかも!
7 XREの種類 まだまだ あるかも! SRE DBRE CRE PRE NRE MRE
8 XREの種類 SRE サイトやサービスの信頼性とパフォーマンスを 確保するために、ソフトウェアエンジニアリング の手法を用いてシステムを運用・管理します。 監視、インシデント対応、自動化、 キャパシティプランニングなどが 主な仕事です。 DBRE
データベースの信頼性、パフォーマンス、 スケーラビリティを確保することに特化した役割です。 データベースシステムの最適化、運用自動化、 バックアップやリカバリー計画の策定などを 主に行います。 Site Reliability Engineering Database Reliability Engineering
9 XREの種類 CRE 主にクラウドプロバイダーや大規模サービスを 運営する企業において、顧客のシステムが高い信頼性を 持つよう支援する役割です。 顧客と緊密に連携して、信頼性向上のための ベストプラクティスを提供します。 PRE クラウドプラットフォームや社内のインフラ基盤の
信頼性を高めるための役割です。 Kubernetes、CI/CDシステム、クラウドサービス などのプラットフォームの設計・運用が 主なフォーカスです。 Customer Reliability Engineering Platform Reliability Engineering
10 XREの種類 NRE ネットワークインフラの信頼性を確保する役割です。 ネットワークの設計、監視、インシデント対応、 トラフィック最適化などが主な業務です。 ネットワークと言っても大規模ネットワーク だけでなく、オフィス内ネットワーク等 広範囲に渡ます。 MRE
機械学習モデルの運用、デプロイ、監視、信頼性の 確保に特化した役割です。 データパイプラインの監視やモデルの スケールアウト、自動化などを行います。 Network Reliability Engineering Machine Learning Reliability Engineering
11 なんとなく思うこと 新しく生まれた というより 前からあったよね…?
12 備考:日本におけるクラウドプラットフォームのハイプ・サイクル
13 どうしてみんな 「信頼性」を 高めたいの?
14 ここで例をひとつ 見知らぬ誰か(信頼度ゼロ)から 話しかけられても そもそも話すら聞こうと思わない 最近純金製の時計が 手に入りましてね おひとついかがですか? この時計ですが…
15 ここで例をひとつ 同じ話の内容でも 友人や同僚など 信頼関係のある人の話なら少なくとも、話に耳を傾ける 最近純金製の時計を 買ったんだ! そういえば君も欲しい という話してたよね? お店だけど…
16 次の例 いつも経費精算ギリギリに出しても 丁寧に対応してくれる経理の方から 〇〇さん 先日の経費精算について 確認したいのですが … はい!よろこんで!! 背筋伸ばして、ニコニコ対応しますよね?
17 まだ続く例 あなたはネットワークエンジニアです Ciscoのスイッチと 無名メーカーのスイッチがあります どちらを採用しますか? よほどの理由がない限り Ciscoを選びますよね?
18 まだ続く例 あなたはクラウドの機能について調べようと 検索エンジンにアクセスしました Googleと知らない名前の検索エンジンがあります よほどの理由がない限り Googleにアクセスして、ぐぐりますよね?
19 何故「信頼性」が大切なのか 信頼性ある システム・サービス・事業・会社しか 利用されない 選ばれないから
20 何故「信頼性」が大切なのか 信頼性のない人、組織、会社の システム・サービス・事業は いかに素晴らしいものであっても 誰にも使われず いずれ消えてなくなるから
21 「信頼性」の築き方 個 組織 企業 信頼性は 個→組織→企業へと 広げていくもの もしくは 積み重ねていくもの
22 個の信頼性 • 最初に築く信頼性は「個」 ◦ XREの基礎。各オライリーに主に書いて あるのは、この分野のノウハウ ◦ 人、システム、もう少しミクロなもので あることもある
▪ 早期かつポイントを押さえたポストモーテム ▪ 障害に対する迅速な原因究明・暫定恒久 対処の立案 ◦ 技術的な対応だけでなく、論理的に説明 するなど、技術以外の手段も重要 ▪ クリティカルシンキング等 • せっかく取ったメトリクスも、うまく 説明できなかったらもったいない
23 個の信頼性(個人の見解) XREに必要なのは信頼を得るような 技術力+説明能力 ダッシュボード等から 得られた定量的な 根拠 発生事象や仕様について 整理した上で 論理的に説明する
聞き手にとって分かりやすく、納得を得られやすい 信頼を得る!
24 組織の信頼性 • 「個」から「組織」へ ◦ XREの各オライリーにこの分野も記載され ている ◦ 組織としての定量的なGOALを定めるこは当 たり前として、それがお客様に ど
のように貢献できるのかを定める ▪ 言うのは簡単だが、難しい… • 効果出しづらいので、マネジメント層が頭を 悩ませるところ • ユーザー体験向上って、早い=良い、でもない ◦ 「あの部署にお願いしたら大丈夫」と思わ れたら
25 企業の信頼性 • 「組織」から「企業」へ ◦ 組織の信頼から、企業への信頼へ ◦ 企業クラスになると、主に以下のポイント が重視される ▪
市場における信頼性 ▪ 企業間 ▪ etc… 個と組織の積み重ねによって 築き上げてきたもの 「当たり前にある」もの 企業にとっての命 この努力によって 築き上げた信頼を 一瞬で失うのが セキュリティ事故
26 信頼性を 高めるって 結局、何だった?
27 真新しいことでもない 以前からみんなが無意識に 当たり前にやっていたこと
28 目に見えない評価がしづらい 不明確で共通認識しづらかったものを 「信頼性向上」 という名前で形にして 共通認識できるようにした 明確な課題として提起した
29 やって 当たり前 暗黙の了解 評価 され辛い 信頼性向上 したよ!! 当然のこと でしょ
30 それが 「信頼性を高める」という 一つの言葉に表したのだと 私は思っています 個人の見解なので 人によってさまざま それでもOK!
31 これから始まる各セッションでは 信頼性向上のための 様々な取り組み・技術・事例を お話いただけると思います
32 ぜひ参考になるポイント 真似できるポイントを見つけて 業務に活かしちゃいましょう
Thank you for your attention!!