Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SREという働き方
Search
ryuichi1208
July 09, 2023
Technology
0
360
SREという働き方
ryuichi1208
July 09, 2023
Tweet
Share
More Decks by ryuichi1208
See All by ryuichi1208
実録_マルチテナント環境でのGmailガイドライン対応
ryuichi1208
7
1.7k
5分でわかるGoの自動計装
ryuichi1208
2
1.2k
入門EOL対応
ryuichi1208
21
7.6k
超入門 SRE
ryuichi1208
1
120
Mackerelを触り始めて2年経ったので 作ってきたプラグインを振り返る
ryuichi1208
0
1.5k
SREのチーム共通言語をGoにした話
ryuichi1208
2
510
入門障害対応
ryuichi1208
1
3.7k
インフラCI_CD継続的改善の道のり
ryuichi1208
1
1.2k
インシデントを楽しむ7つのコツ
ryuichi1208
0
160
Other Decks in Technology
See All in Technology
生産性向上チームの紹介
cybozuinsideout
PRO
1
880
Building Dashboards as a Hobby
egmc
0
280
ServiceNow Knowledge Learning Rise up
manarobot
0
210
ChatGPT for IT Service Management (IT Pro)
dahatake
7
1.6k
よく聞くけど使ったことないソフトウェアNo.1 KafkaとSnowflake
foursue
4
370
GraphQL 成熟度モデルの紹介と、プロダクトに当てはめた事例 / GraphQL maturity model
mh4gf
7
1.4k
推しは推せるときに推せ! プロダクトにフィードバックしていこう
nakasho
0
380
JAWS-UG Bedrock Claude Night
yamahiro
3
620
One engineer company with Ruby on Rails
rstankov
2
160
アクセス制御にまつわる改善 / Improving access control
itkq
0
560
Cracking the KubeCon CfP
inductor
2
250
ChatworkのSRE部って実は 半分くらいPlatform Engineering部かもしれない
saramune
0
160
Featured
See All Featured
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
60
14k
How GitHub (no longer) Works
holman
304
140k
A designer walks into a library…
pauljervisheath
200
23k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
9
8.3k
How To Stay Up To Date on Web Technology
chriscoyier
782
250k
Web development in the modern age
philhawksworth
202
10k
Imperfection Machines: The Place of Print at Facebook
scottboms
260
12k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
187
16k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
226
51k
ParisWeb 2013: Learning to Love: Crash Course in Emotional UX Design
dotmariusz
104
6.6k
The Power of CSS Pseudo Elements
geoffreycrofte
60
5k
How to Ace a Technical Interview
jacobian
272
22k
Transcript
1 SREという働き方 渡部 龍一 / GMO PEPABO inc.
2 • SREとは「Site Reliability Engineering」の頭文字をとった言葉 • 日本語では「サイト信頼性エンジニアリング」 • チームトポロジーの分類で考えると2つの側面があるチーム ◦
イネイブリングチーム ◦ プラットフォームチーム プラットフォームグループにおけるSRE
3 やってること
4 • PdM + SREチーム + アプリケーションチームで週次で実施 • サービスの信頼性に関する内容を共有する会 ◦
可用性に関連するイベントの共有 (メンテやアプデ)、各SLIの確認 ◦ SLO違反した際は事前に定義したポリシーに従って担当者をアサインして対応 ◦ インフラのコストなどもこの会で確認し削減出来そうなものがないかを確認 • SLI/SLOは四半期ごとに見直しを実施 SLI/SLOキープ
5 • パブリッククラウド(AWS/GCP)とプライベートクラウドの管理 ◦ キャパシティプランニング ◦ Terraform/Puppet/Ansibleの実装/レビュー ◦ 監視システムの設計 /構築やアラートの設定
◦ コストの最適化 ◦ オンコール対応 インフラ管理
6 • 便利CLIツール ◦ プライベートクラウド向けツール • 監視ツール ◦ MackerelプラグインやPrometheusプラグインを実装 •
Kubernetes関連 ◦ kubectlのプラグイン ◦ カスタムコントローラー • 便利SlackBot ◦ ChatOPSが盛んなのでSlackから使える便利Botを実装 • パフォーマンスチューニング ◦ N+1の改善/スロークエリ対応 ソフトウェアエンジニアリング
7 • k8s Operatorで運用負担減&ハイブリッドクラウドのコスト最適化をした話 • オンプレk8sとEKSの並行運用の実際 • SUZURIのマルチクラウド化で乗り越えたクラウド毎の「差分」を紹介します • Amazon
EFS を利用して管理運用をスリム化する • 入門障害対応 • オンコール体制をアップデートした話 チームメンバーの登壇資料/テックブログとか
8 最後に
9 • 中途 ◦ https://open.talentio.com/r/1/c/pepabo/pages/45336 • 新卒 ◦ https://recruit.pepabo.com/features/graduate/ 採用やってます!