$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
超入門 SRE
Search
ryuichi1208
June 25, 2024
Technology
9
3.8k
超入門 SRE
ryuichi1208
June 25, 2024
Tweet
Share
More Decks by ryuichi1208
See All by ryuichi1208
AI前提のサービス運用ってなんだろう?
ryuichi1208
8
1.6k
入門 バックアップ
ryuichi1208
20
8.1k
効果的なオンコール対応と障害対応
ryuichi1208
8
3.5k
コロナ禍とその後:地方エンジニアが学んだキャリア戦略の変遷
ryuichi1208
5
350
入門オンコール対応
ryuichi1208
9
3.5k
MySQLのOOMと戦った話
ryuichi1208
6
2.9k
障害対応を楽しむ7つのコツ
ryuichi1208
8
4.7k
SLO Docsのすゝめ
ryuichi1208
8
3.2k
SMTPでのOpenTelemetryの可能性を考えてみる
ryuichi1208
8
2.9k
Other Decks in Technology
See All in Technology
.NET のUnified AI Building Blocks 入門...!
okazuki
0
190
40歲的我會給20歲的自己,關於軟體開發的7個建議
line_developers_tw
PRO
0
2.5k
pmconf2024_UPSIDER
upsider_tech
0
7.5k
2024 眼科AIコンテスト手法解説スライド 第5回日本眼科AI学会総会
minamikoyasuganka
0
120
12/2(月)のBedrockアプデ速報(re:Invent 2024 Daily re:Cap #1 with AWS Heroes)
minorun365
PRO
2
310
[GDG DevFest Bangkok 2024] - The Future of Retail E-commerce with Gemini AI
punsiriboo
0
300
職能を超えたモブプログラミングが品質に与えた良い影響
tonionagauzzi
1
190
GDGoC開発体験談 - Gemini生成AI活用ハッカソン / GASとFirebaseで挑むパン屋のフードロス解決 -
hotekagi
1
760
宇宙最速のランチRecap LT会(開発者ツール&運用監視編)
nnydtmg
1
180
まだチケットを手動で書いてるの?!GitHub Actionsと生成AIでチケットの作成を自動化してみた話 / 20241207 Yoshinori Katayama
shift_evolve
1
790
Oracle Base Database Service 技術詳細
oracle4engineer
PRO
5
52k
間違いだらけのポストモーテム - ホントに役立つレビューはこうだ!
jacopen
5
1k
Featured
See All Featured
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
8
1.2k
Rebuilding a faster, lazier Slack
samanthasiow
79
8.7k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
27
4.3k
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
The Power of CSS Pseudo Elements
geoffreycrofte
73
5.4k
What's in a price? How to price your products and services
michaelherold
243
12k
It's Worth the Effort
3n
183
27k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
43
9.3k
[RailsConf 2023] Rails as a piece of cake
palkan
53
5k
How to Think Like a Performance Engineer
csswizardry
21
1.2k
Docker and Python
trallard
41
3.1k
Gamification - CAS2011
davidbonilla
80
5.1k
Transcript
1 超入門 SRE 何事もバランスが大事編 渡部 龍一/ GMO PEPABO inc. はじめてのIT勉強会
in 仙台(2024)
技術部プラットフォームグループ 2021年 中途入社 2 自己紹介 渡部 龍一 Watanabe Ryuichi •
GMOペパボ/仙台からリモート • ロール: SRE • SNS: @ryuichi_1208 • 好きなこと: EOL対応、障害対応 • SRE NEXTスタッフ
3 SRE、聞いたことありますか?
4 • SRE(Site Reliability Engineering)とは、元々Googleが提唱したシステム管理とサービ ス運⽤に対するアプローチ ◦ SREは、ソフトウェアエンジニアに運⽤チームの設計を依頼した時にできあがるもの ◦ 直訳するとサイト信頼性⼯学
▪ 信頼性⼯学とは「故障」という品質を扱う学問 ▪ 「事業の経済的損失」につながる可能性のある障害を全体的に最⼩にすることが⽬的 ◦ Site Reliability Engineerで職種を指したりする • Webサイトの信頼性を重要視したエンジニアリングを⾏ったり組織に対して導⼊ SREとは
5 なんで必要なの?
6 A社というスタートアップ企業と B社という新規参⼊をしてきた企業
7 まだ競合もいないサービスを作れた! 最高のチームで最高のサービスをやっていくぞ! A社
8 ユーザー数も順調に伸びて売り上げも好調! 今度テレビCMでさらなるユーザー獲得を狙うぞ! A社
9 CM放映後
10 CM流れた瞬間アクセス殺到で繋がらなくなった CMによるユーザー増加も見込みよりも下回ってしまった ... 新機能をリリースしたいけどアクセスを捌けないとユーザー増えな いしチームメンバー全員で対応しよう ... A社
11 この業界まだまだユーザー増えそう! 新機能開発しまくって宣伝してユーザー獲得するぞ! A社 B社
12 A社 B社 アクセス捌けるようになったが機能面で B社に劣ってしまっ ている。。。 新規ユーザーも増えないし困った。。。
13 • SREは信頼性をエンジニアリングしていく ◦ Webサイトを運営しながら短いサイクルで新機能のリリースを⾏うことを⽬標としていく ◦ SLO‧SLIを定義しサービスレベルの⽬標や指標を決めて運⽤していく ▪ 例えば⽬標としていた稼働率よりも低い時間しか稼働してないなら改善のために機能開発を⽌める ▪
⽬標よりも⾼い時間稼働しているなら多少のサービスダウンは機能開発を継続する ▪ ビジネス影響を考慮して⽬標数値を決めることをSREがサービスオーナーと決定していく SREがいると
14 • 信頼性に繋がることはなんでもやるという気概 • CUJ/SLI/SLO、エラーバジェットの設定 • CI/CDの整備 • 監視、オブザーバビリティの実装 •
障害対応、オンコール対応、ポストモーテム • コスト削減 SREの活動内容例
15 ⾊々やれて楽しい!
16 もっと知りたい
17
18
19 SRE NEXT@東京に向けて各地でイベントを開催 福岡、仙台、京都、広島で実施 そのイベントが今週の土曜日に開催されます! 参加者募集中!
20 ご静聴ありがとうございました