Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
超入門 SRE
Search
ryuichi1208
June 25, 2024
Technology
4.2k
11
Share
超入門 SRE
ryuichi1208
June 25, 2024
More Decks by ryuichi1208
See All by ryuichi1208
会話で作る信頼性
ryuichi1208
0
150
シグナル(Unix)と仲良くなる
ryuichi1208
1
30
AI前提のサービス運用について再考する
ryuichi1208
6
1.4k
A Shallow Dive into the World of TCP
ryuichi1208
1
650
入門リトライ
ryuichi1208
20
8.1k
超入門SRE 2025
ryuichi1208
4
1.5k
Goで作って学ぶWebSocket
ryuichi1208
5
4.1k
コード化されていない稼働中のサーバを移設_再構築する技術
ryuichi1208
20
15k
AI前提のサービス運用ってなんだろう?
ryuichi1208
9
2k
Other Decks in Technology
See All in Technology
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.4k
国内外の生成AIセキュリティの最新動向 & AIガードレール製品「chakoshi」のご紹介 / Latest Trends in Generative AI Security (Domestic & International) & Introduction to AI Guardrail Product "chakoshi"
nttcom
4
1.5k
プラットフォームエンジニアリングの実践 - AWS コンテナサービスで構築する社内プラットフォーム / AWS Containers Platform Meetup #1
literalice
1
210
生成AI時代のドキュメントに対する期待の整理と実践から得た学び / Rethinking Documentation for LLM: Lessons from Practice
bitkey
PRO
1
100
AI駆動1on1〜AIに自分を育ててもらう〜
yoshiakiyasuda
0
150
音声言語モデル手法に関する発表の紹介
kzinmr
0
140
Microsoft 365 / Microsoft 365 Copilot : 自分の状態を確認する「ラベル」について
taichinakamura
0
350
"おまじない"を卒業する ボイラープレート再入門
shunsuke_1b
1
110
AIが書いたコードを信じられない問題 〜レビュー負荷を下げるために変えたこと〜 / The AI Code Trust Gap: Reducing the Review Burden
bitkey
PRO
8
1.4k
Claude Code を安全に使おう勉強会 / Claude Code Security Basics
masahirokawahara
12
37k
基盤を育てる 外部SaaS連携の運用
gamonges_dresscode
1
120
巨大プラットフォームを進化させる「第3のROI」
recruitengineers
PRO
2
1.3k
Featured
See All Featured
A Tale of Four Properties
chriscoyier
163
24k
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
280
Writing Fast Ruby
sferik
630
63k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
150
Docker and Python
trallard
47
3.8k
Discover your Explorer Soul
emna__ayadi
2
1.1k
Leo the Paperboy
mayatellez
7
1.7k
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
110
How to build a perfect <img>
jonoalderson
1
5.4k
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.1k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
64
54k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.7k
Transcript
1 超入門 SRE 何事もバランスが大事編 渡部 龍一/ GMO PEPABO inc. はじめてのIT勉強会
in 仙台(2024)
技術部プラットフォームグループ 2021年 中途入社 2 自己紹介 渡部 龍一 Watanabe Ryuichi •
GMOペパボ/仙台からリモート • ロール: SRE • SNS: @ryuichi_1208 • 好きなこと: EOL対応、障害対応 • SRE NEXTスタッフ
3 SRE、聞いたことありますか?
4 • SRE(Site Reliability Engineering)とは、元々Googleが提唱したシステム管理とサービ ス運⽤に対するアプローチ ◦ SREは、ソフトウェアエンジニアに運⽤チームの設計を依頼した時にできあがるもの ◦ 直訳するとサイト信頼性⼯学
▪ 信頼性⼯学とは「故障」という品質を扱う学問 ▪ 「事業の経済的損失」につながる可能性のある障害を全体的に最⼩にすることが⽬的 ◦ Site Reliability Engineerで職種を指したりする • Webサイトの信頼性を重要視したエンジニアリングを⾏ったり組織に対して導⼊ SREとは
5 なんで必要なの?
6 A社というスタートアップ企業と B社という新規参⼊をしてきた企業
7 まだ競合もいないサービスを作れた! 最高のチームで最高のサービスをやっていくぞ! A社
8 ユーザー数も順調に伸びて売り上げも好調! 今度テレビCMでさらなるユーザー獲得を狙うぞ! A社
9 CM放映後
10 CM流れた瞬間アクセス殺到で繋がらなくなった CMによるユーザー増加も見込みよりも下回ってしまった ... 新機能をリリースしたいけどアクセスを捌けないとユーザー増えな いしチームメンバー全員で対応しよう ... A社
11 この業界まだまだユーザー増えそう! 新機能開発しまくって宣伝してユーザー獲得するぞ! A社 B社
12 A社 B社 アクセス捌けるようになったが機能面で B社に劣ってしまっ ている。。。 新規ユーザーも増えないし困った。。。
13 • SREは信頼性をエンジニアリングしていく ◦ Webサイトを運営しながら短いサイクルで新機能のリリースを⾏うことを⽬標としていく ◦ SLO‧SLIを定義しサービスレベルの⽬標や指標を決めて運⽤していく ▪ 例えば⽬標としていた稼働率よりも低い時間しか稼働してないなら改善のために機能開発を⽌める ▪
⽬標よりも⾼い時間稼働しているなら多少のサービスダウンは機能開発を継続する ▪ ビジネス影響を考慮して⽬標数値を決めることをSREがサービスオーナーと決定していく SREがいると
14 • 信頼性に繋がることはなんでもやるという気概 • CUJ/SLI/SLO、エラーバジェットの設定 • CI/CDの整備 • 監視、オブザーバビリティの実装 •
障害対応、オンコール対応、ポストモーテム • コスト削減 SREの活動内容例
15 ⾊々やれて楽しい!
16 もっと知りたい
17
18
19 SRE NEXT@東京に向けて各地でイベントを開催 福岡、仙台、京都、広島で実施 そのイベントが今週の土曜日に開催されます! 参加者募集中!
20 ご静聴ありがとうございました