Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SREという働き方
Search
ryuichi1208
July 09, 2023
Technology
0
420
SREという働き方
ryuichi1208
July 09, 2023
Tweet
Share
More Decks by ryuichi1208
See All by ryuichi1208
コロナ禍とその後:地方エンジニアが学んだキャリア戦略の変遷
ryuichi1208
2
250
入門オンコール対応
ryuichi1208
6
2.7k
MySQLのOOMと戦った話
ryuichi1208
3
2.6k
障害対応を楽しむ7つのコツ
ryuichi1208
7
4.5k
超入門 SRE
ryuichi1208
8
3.6k
SLO Docsのすゝめ
ryuichi1208
7
2.9k
SMTPでのOpenTelemetryの可能性を考えてみる
ryuichi1208
7
2.6k
実録_マルチテナント環境でのGmailガイドライン対応
ryuichi1208
9
2.1k
5分でわかるGoの自動計装
ryuichi1208
4
1.5k
Other Decks in Technology
See All in Technology
音声AIエージェントの世界とRetell AI入門 / Introduction to the World of Voice AI Agents and Retell AI
rkaga
4
800
タイミーのBraze活用 ~PUSH通知を活用したレコメンド~
ozeshun
2
130
脆弱星に導かれて
nishimunea
1
1.6k
AWSを始めた頃に陥りがちなポイントをまとめてみた
oshanqq
1
2.8k
株式会社M2X エンジニアチーム紹介資料
m2xsoftware
0
390
日経電子版から始まった内製開発の現在地と向き合っている課題/inhouse
nishiuma
0
240
Evolving DevOps Teams and Flexible Organizational Culture
kakehashi
1
160
バックログを導入し やっぱやめた話
ota42y
0
180
Eventual Detection Engineering
ken5scal
0
920
Javaにおける関数型プログラミンへの取り組み
skrb
7
270
ビジネスとエンジニアリングを繋ぐプロダクトを中心とした組織づくりの実践
sansantech
PRO
1
120
SHIFTの課題と目指したい組織像 / 20240827 Rinto Ikenoue
shift_evolve
0
150
Featured
See All Featured
Ruby is Unlike a Banana
tanoku
96
10k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
502
140k
[RailsConf 2023] Rails as a piece of cake
palkan
44
4.6k
Being A Developer After 40
akosma
82
580k
Creatively Recalculating Your Daily Design Routine
revolveconf
215
12k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
26
1.9k
Designing Experiences People Love
moore
138
23k
Fontdeck: Realign not Redesign
paulrobertlloyd
80
5.1k
Teambox: Starting and Learning
jrom
131
8.7k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
45
4.8k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
42
2k
Build The Right Thing And Hit Your Dates
maggiecrowley
30
2.2k
Transcript
1 SREという働き方 渡部 龍一 / GMO PEPABO inc.
2 • SREとは「Site Reliability Engineering」の頭文字をとった言葉 • 日本語では「サイト信頼性エンジニアリング」 • チームトポロジーの分類で考えると2つの側面があるチーム ◦
イネイブリングチーム ◦ プラットフォームチーム プラットフォームグループにおけるSRE
3 やってること
4 • PdM + SREチーム + アプリケーションチームで週次で実施 • サービスの信頼性に関する内容を共有する会 ◦
可用性に関連するイベントの共有 (メンテやアプデ)、各SLIの確認 ◦ SLO違反した際は事前に定義したポリシーに従って担当者をアサインして対応 ◦ インフラのコストなどもこの会で確認し削減出来そうなものがないかを確認 • SLI/SLOは四半期ごとに見直しを実施 SLI/SLOキープ
5 • パブリッククラウド(AWS/GCP)とプライベートクラウドの管理 ◦ キャパシティプランニング ◦ Terraform/Puppet/Ansibleの実装/レビュー ◦ 監視システムの設計 /構築やアラートの設定
◦ コストの最適化 ◦ オンコール対応 インフラ管理
6 • 便利CLIツール ◦ プライベートクラウド向けツール • 監視ツール ◦ MackerelプラグインやPrometheusプラグインを実装 •
Kubernetes関連 ◦ kubectlのプラグイン ◦ カスタムコントローラー • 便利SlackBot ◦ ChatOPSが盛んなのでSlackから使える便利Botを実装 • パフォーマンスチューニング ◦ N+1の改善/スロークエリ対応 ソフトウェアエンジニアリング
7 • k8s Operatorで運用負担減&ハイブリッドクラウドのコスト最適化をした話 • オンプレk8sとEKSの並行運用の実際 • SUZURIのマルチクラウド化で乗り越えたクラウド毎の「差分」を紹介します • Amazon
EFS を利用して管理運用をスリム化する • 入門障害対応 • オンコール体制をアップデートした話 チームメンバーの登壇資料/テックブログとか
8 最後に
9 • 中途 ◦ https://open.talentio.com/r/1/c/pepabo/pages/45336 • 新卒 ◦ https://recruit.pepabo.com/features/graduate/ 採用やってます!