Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
超入門 SRE
Search
ryuichi1208
June 25, 2024
Technology
4.2k
11
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
超入門 SRE
ryuichi1208
June 25, 2024
More Decks by ryuichi1208
See All by ryuichi1208
AIでサービス運用はどう変わるのか
ryuichi1208
0
140
入門 再発防止策
ryuichi1208
17
7.3k
金曜日デプロイ、するかしないか.pdf
ryuichi1208
1
74
会話で作る信頼性
ryuichi1208
0
180
シグナル(Unix)と仲良くなる
ryuichi1208
1
46
AI前提のサービス運用について再考する
ryuichi1208
6
1.4k
A Shallow Dive into the World of TCP
ryuichi1208
1
670
入門リトライ
ryuichi1208
20
8.3k
超入門SRE 2025
ryuichi1208
4
1.5k
Other Decks in Technology
See All in Technology
BPaaSで進むAIオペレーションの現在地 AI実装が効く領域とスケーラビリティの選定と実装
kentarofujii
0
210
ご挨拶「10周年を迎える共創ラボのこれまでとこれから」
iotcomjpadmin
0
150
自作お家AIエージェントスタックチャンFWで困っている所紹介
74th
0
160
デジタル・デザイン:次の50年を描く「進化する青写真」
y150saya
0
150
WebGIS AI Agentの紹介
_shimizu
0
600
IaC コードを資産へ:AWS CDK 社内ライブラリと横断展開 / aws-summit-japan-2026
gotok365
10
1.6k
どうして今サーバーサイドKotlinを選択したのか
nealle
0
120
本当の”仕事”を手放せる未来が見えた
mu7889yoon
0
200
AIペネトレーションテスト・ セキュリティ検証「AgenticSec」紹介資料
laysakura
2
7.7k
クレデンシャル流出 ― 攻撃 3 時間 vs 復旧 10 時間。この非対称性にどう備えるか
kazzpapa3
3
630
スタートアップにおけるアジャイルの実践について #shibuyagile
murabayashi
1
140
AWS Summit の片隅で、体育座りしながらコミュニティがにぎわう理由を考えた
k_adachi_01
2
290
Featured
See All Featured
Why Our Code Smells
bkeepers
PRO
340
58k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
260
Side Projects
sachag
455
43k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
260
Test your architecture with Archunit
thirion
1
2.3k
Accessibility Awareness
sabderemane
1
140
A Soul's Torment
seathinner
6
3k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.5k
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.3k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
2
1.6k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.6k
Transcript
1 超入門 SRE 何事もバランスが大事編 渡部 龍一/ GMO PEPABO inc. はじめてのIT勉強会
in 仙台(2024)
技術部プラットフォームグループ 2021年 中途入社 2 自己紹介 渡部 龍一 Watanabe Ryuichi •
GMOペパボ/仙台からリモート • ロール: SRE • SNS: @ryuichi_1208 • 好きなこと: EOL対応、障害対応 • SRE NEXTスタッフ
3 SRE、聞いたことありますか?
4 • SRE(Site Reliability Engineering)とは、元々Googleが提唱したシステム管理とサービ ス運⽤に対するアプローチ ◦ SREは、ソフトウェアエンジニアに運⽤チームの設計を依頼した時にできあがるもの ◦ 直訳するとサイト信頼性⼯学
▪ 信頼性⼯学とは「故障」という品質を扱う学問 ▪ 「事業の経済的損失」につながる可能性のある障害を全体的に最⼩にすることが⽬的 ◦ Site Reliability Engineerで職種を指したりする • Webサイトの信頼性を重要視したエンジニアリングを⾏ったり組織に対して導⼊ SREとは
5 なんで必要なの?
6 A社というスタートアップ企業と B社という新規参⼊をしてきた企業
7 まだ競合もいないサービスを作れた! 最高のチームで最高のサービスをやっていくぞ! A社
8 ユーザー数も順調に伸びて売り上げも好調! 今度テレビCMでさらなるユーザー獲得を狙うぞ! A社
9 CM放映後
10 CM流れた瞬間アクセス殺到で繋がらなくなった CMによるユーザー増加も見込みよりも下回ってしまった ... 新機能をリリースしたいけどアクセスを捌けないとユーザー増えな いしチームメンバー全員で対応しよう ... A社
11 この業界まだまだユーザー増えそう! 新機能開発しまくって宣伝してユーザー獲得するぞ! A社 B社
12 A社 B社 アクセス捌けるようになったが機能面で B社に劣ってしまっ ている。。。 新規ユーザーも増えないし困った。。。
13 • SREは信頼性をエンジニアリングしていく ◦ Webサイトを運営しながら短いサイクルで新機能のリリースを⾏うことを⽬標としていく ◦ SLO‧SLIを定義しサービスレベルの⽬標や指標を決めて運⽤していく ▪ 例えば⽬標としていた稼働率よりも低い時間しか稼働してないなら改善のために機能開発を⽌める ▪
⽬標よりも⾼い時間稼働しているなら多少のサービスダウンは機能開発を継続する ▪ ビジネス影響を考慮して⽬標数値を決めることをSREがサービスオーナーと決定していく SREがいると
14 • 信頼性に繋がることはなんでもやるという気概 • CUJ/SLI/SLO、エラーバジェットの設定 • CI/CDの整備 • 監視、オブザーバビリティの実装 •
障害対応、オンコール対応、ポストモーテム • コスト削減 SREの活動内容例
15 ⾊々やれて楽しい!
16 もっと知りたい
17
18
19 SRE NEXT@東京に向けて各地でイベントを開催 福岡、仙台、京都、広島で実施 そのイベントが今週の土曜日に開催されます! 参加者募集中!
20 ご静聴ありがとうございました