Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
超入門 SRE
Search
ryuichi1208
June 25, 2024
Technology
9
3.8k
超入門 SRE
ryuichi1208
June 25, 2024
Tweet
Share
More Decks by ryuichi1208
See All by ryuichi1208
AI前提のサービス運用ってなんだろう?
ryuichi1208
8
1.6k
入門 バックアップ
ryuichi1208
21
8.2k
効果的なオンコール対応と障害対応
ryuichi1208
8
3.6k
コロナ禍とその後:地方エンジニアが学んだキャリア戦略の変遷
ryuichi1208
5
360
入門オンコール対応
ryuichi1208
9
3.5k
MySQLのOOMと戦った話
ryuichi1208
6
3k
障害対応を楽しむ7つのコツ
ryuichi1208
8
4.8k
SLO Docsのすゝめ
ryuichi1208
8
3.3k
SMTPでのOpenTelemetryの可能性を考えてみる
ryuichi1208
8
2.9k
Other Decks in Technology
See All in Technology
実践! ソフトウェアエンジニアリングの価値の計測 ── Effort、Output、Outcome、Impact
nomuson
0
720
SpiderPlus & Co. エンジニア向け会社紹介資料
spiderplus_cb
0
290
生成AIによるテスト設計支援プロセスの構築とプロセス内のボトルネック解消の取り組み / 20241220 Suguru Ishii
shift_evolve
0
160
Denoで作るチーム開発生産性向上のためのCLIツール
sansantech
PRO
0
120
20241220_S3 tablesの使い方を検証してみた
handy
4
850
日本版とグローバル版のモバイルアプリ統合の開発の裏側と今後の展望
miichan
1
490
20241125 - AI 繪圖實戰魔法工作坊 @ 實踐大學
dpys
1
430
DUSt3R, MASt3R, MASt3R-SfM にみる3D基盤モデル
spatial_ai_network
3
470
ZOZOTOWN の推薦における KPI モニタリング/KPI monitoring for ZOZOTOWN recommendations
rayuron
1
690
メンタル面でもつよつよエンジニアになる/登壇資料(井田 献一朗)
hacobu
0
170
20241218_今年はSLI/SLOの導入を頑張ってました!
zepprix
0
250
AIエージェントに脈アリかどうかを分析させてみた
sonoda_mj
2
130
Featured
See All Featured
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
850
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
8
1.2k
The Language of Interfaces
destraynor
155
24k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
How GitHub (no longer) Works
holman
312
140k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
127
18k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
160
15k
Building Your Own Lightsaber
phodgson
104
6.1k
Designing Experiences People Love
moore
139
23k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.2k
Docker and Python
trallard
43
3.2k
For a Future-Friendly Web
brad_frost
176
9.5k
Transcript
1 超入門 SRE 何事もバランスが大事編 渡部 龍一/ GMO PEPABO inc. はじめてのIT勉強会
in 仙台(2024)
技術部プラットフォームグループ 2021年 中途入社 2 自己紹介 渡部 龍一 Watanabe Ryuichi •
GMOペパボ/仙台からリモート • ロール: SRE • SNS: @ryuichi_1208 • 好きなこと: EOL対応、障害対応 • SRE NEXTスタッフ
3 SRE、聞いたことありますか?
4 • SRE(Site Reliability Engineering)とは、元々Googleが提唱したシステム管理とサービ ス運⽤に対するアプローチ ◦ SREは、ソフトウェアエンジニアに運⽤チームの設計を依頼した時にできあがるもの ◦ 直訳するとサイト信頼性⼯学
▪ 信頼性⼯学とは「故障」という品質を扱う学問 ▪ 「事業の経済的損失」につながる可能性のある障害を全体的に最⼩にすることが⽬的 ◦ Site Reliability Engineerで職種を指したりする • Webサイトの信頼性を重要視したエンジニアリングを⾏ったり組織に対して導⼊ SREとは
5 なんで必要なの?
6 A社というスタートアップ企業と B社という新規参⼊をしてきた企業
7 まだ競合もいないサービスを作れた! 最高のチームで最高のサービスをやっていくぞ! A社
8 ユーザー数も順調に伸びて売り上げも好調! 今度テレビCMでさらなるユーザー獲得を狙うぞ! A社
9 CM放映後
10 CM流れた瞬間アクセス殺到で繋がらなくなった CMによるユーザー増加も見込みよりも下回ってしまった ... 新機能をリリースしたいけどアクセスを捌けないとユーザー増えな いしチームメンバー全員で対応しよう ... A社
11 この業界まだまだユーザー増えそう! 新機能開発しまくって宣伝してユーザー獲得するぞ! A社 B社
12 A社 B社 アクセス捌けるようになったが機能面で B社に劣ってしまっ ている。。。 新規ユーザーも増えないし困った。。。
13 • SREは信頼性をエンジニアリングしていく ◦ Webサイトを運営しながら短いサイクルで新機能のリリースを⾏うことを⽬標としていく ◦ SLO‧SLIを定義しサービスレベルの⽬標や指標を決めて運⽤していく ▪ 例えば⽬標としていた稼働率よりも低い時間しか稼働してないなら改善のために機能開発を⽌める ▪
⽬標よりも⾼い時間稼働しているなら多少のサービスダウンは機能開発を継続する ▪ ビジネス影響を考慮して⽬標数値を決めることをSREがサービスオーナーと決定していく SREがいると
14 • 信頼性に繋がることはなんでもやるという気概 • CUJ/SLI/SLO、エラーバジェットの設定 • CI/CDの整備 • 監視、オブザーバビリティの実装 •
障害対応、オンコール対応、ポストモーテム • コスト削減 SREの活動内容例
15 ⾊々やれて楽しい!
16 もっと知りたい
17
18
19 SRE NEXT@東京に向けて各地でイベントを開催 福岡、仙台、京都、広島で実施 そのイベントが今週の土曜日に開催されます! 参加者募集中!
20 ご静聴ありがとうございました