Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
”信頼性”の使い方
Search
gr1m0h
August 23, 2023
Technology
0
170
”信頼性”の使い方
gr1m0h
August 23, 2023
Tweet
Share
More Decks by gr1m0h
See All by gr1m0h
"君は見ているが観察していない"で考えるインシデントマネジメント
grimoh
4
2.7k
Enabling Client-side SLO
grimoh
7
3.9k
Luupの開発組織におけるインシデントマネジメントの変遷 ver.RoadtoSRENEXT2024
grimoh
2
700
Luupの開発組織におけるインシデントマネジメントの変遷
grimoh
2
1.1k
IoTサービスにおけるSLI設計とLUUPでの実践
grimoh
2
1.4k
Luupの開発組織におけるインシデントマネジメントのこれから
grimoh
2
1.2k
電動マイクロモビリティのシェアサービス「LUUP」におけるEnabling SLOの実践
grimoh
3
1.7k
SRE NEXT 2023への招待
grimoh
0
5.3k
LuupにおけるSLOの物語
grimoh
2
5.9k
Other Decks in Technology
See All in Technology
Exadata Database Service on Dedicated Infrastructure(ExaDB-D) UI スクリーン・キャプチャ集
oracle4engineer
PRO
2
3.2k
初心者向けAWS Securityの勉強会mini Security-JAWSを9ヶ月ぐらい実施してきての近況
cmusudakeisuke
0
120
[CV勉強会@関東 ECCV2024 読み会] オンラインマッピング x トラッキング MapTracker: Tracking with Strided Memory Fusion for Consistent Vector HD Mapping (Chen+, ECCV24)
abemii
0
220
B2B SaaSから見た最近のC#/.NETの進化
sansantech
PRO
0
680
TanStack Routerに移行するのかい しないのかい、どっちなんだい! / Are you going to migrate to TanStack Router or not? Which one is it?
kaminashi
0
580
個人でもIAM Identity Centerを使おう!(アクセス管理編)
ryder472
3
190
Python(PYNQ)がテーマのAMD主催のFPGAコンテストに参加してきた
iotengineer22
0
470
Security-JAWS【第35回】勉強会クラウドにおけるマルウェアやコンテンツ改ざんへの対策
4su_para
0
170
スクラム成熟度セルフチェックツールを作って得た学びとその活用法
coincheck_recruit
1
140
適材適所の技術選定 〜GraphQL・REST API・tRPC〜 / Optimal Technology Selection
kakehashi
1
160
AIチャットボット開発への生成AI活用
ryomrt
0
170
The Role of Developer Relations in AI Product Success.
giftojabu1
0
120
Featured
See All Featured
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
109
49k
Testing 201, or: Great Expectations
jmmastey
38
7.1k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
42
9.2k
Music & Morning Musume
bryan
46
6.2k
GraphQLの誤解/rethinking-graphql
sonatard
67
10k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
6
410
A Philosophy of Restraint
colly
203
16k
Visualization
eitanlees
145
15k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
720
Product Roadmaps are Hard
iamctodd
PRO
49
11k
Agile that works and the tools we love
rasmusluckow
327
21k
Writing Fast Ruby
sferik
627
61k
Transcript
“信頼性”の使い方 2023年8月23日 すごい広島535 with Unity & IT系の濃ゆい話をする会 LT Wataru Tsuda
/ gr1m0h
whoami Wataru Tsuda / gr1m0h SRE @ Luup,inc. SRE Lounge
/ SRE NEXT 運営メンバー Platform Engineering Meetup 運営メンバー SRE NEXT 2023 Chair
“信頼性”とは 「[システムが]求められる機能を、定められた条件の下で、定められた期間 にわたり、障害を起こすことなく実行する確率」 P.O’Connor and A.Kleyner, Practical Reliability Engineering, 5th
edition: Wiley, 2012. https://sre.google/sre-book/preface/#id-gA2u2Iyh4 システムが予期した機能を提供し、約束された条件で動作すること システムが安全なデータ保管方法を使用し、データ漏洩のリスクを最小限に 抑えていること
“信頼性”とは 人を選ぶ時は“信頼”が必要 サービスを選ぶ時も”信頼”が必要(信頼性) 信頼できるかは”期待に応えられるか”がある 期待値
“信頼性”の辛さ • コストがかかる ◦ 100%に近づけるためにコストがどんどん跳ね上がる ◦ 直線ではなく急な曲線を描いて増加していく • 100%は不可能 ◦
世の中に完全なものはない....よく言われるやつ ◦ (実際100%は不要です) • 「非機能」「守り」的アプローチなので「機能」開発と反する ◦ 機能開発してリリースしてユーザーに価値を届けたい by 開発者vs 機 能開発のスピードを落として障害を起こさないようにしたい by 運用者
“信頼性”の辛さ • コストがかかる ◦ 100%に近づけるためにコストがどんどん跳ね上がる ◦ 直線ではなく急な曲線を描いて増加していく • 100%は不可能 ◦
世の中に完全なものはない....よく言われるやつ ◦ (実際100%は不要です) • 「非機能」「守り」的アプローチなので「機能」開発と反する ◦ 機能開発してリリースしてユーザーに価値を届けたい by 開発者vs 機 能開発のスピードを落として障害を起こさないようにしたい by 運用者 ”信頼性”をコントロールする必要がある!
“信頼性工学”を実践する! 信頼性工学 = SRE:Site Reliability Enginnering SREとは? • 本番環境を信頼性高く開発/運用していくための一連の手法/考え方 •
class SRE implements DevOps 信頼性のコントロールのためにSREが必要 = 開発チームが信頼性という観点を獲得するためにSREが必要
“信頼性工学”を実践する! 信頼性工学 = SRE:Site Reliability Enginnering SREとは? • 本番環境を信頼性高く開発/運用していくための一連の手法/考え方 •
class SRE implements DevOps 信頼性のコントロールのためにSREが必要 = 開発チームが信頼性という観点を獲得するためにSREが必要 ”SRE”をどうやって活用すれば、 信頼性をコントロールできるのか?
“信頼性指標”を使う! 信頼性指標 = SLI:Service Level Indicator SLIとは? • 信頼性をメトリクスにできる形で測定する •
数値にすることで意思決定が容易になる ◦ 目標を設定してそれを達成しているかどうか(よくやるやつ SLIの目標値(SLO)
SLI/SLOを使うことで.... • “サービスがユーザーの期待値に答えているか” を測定し、定量的な判断を 可能にする • 監視をSLI/SLOベースにすると、アラートを常にアクショナブルなものにできる • SLI/SLOを組織全体の意思決定指標として活用することができる
さいごに
whoami Wataru Tsuda / gr1m0h SRE @ Luup,inc. SRE Lounge
/ SRE NEXT 運営メンバー Platform Engineering Meetup 運営メンバー SRE NEXT 2023 Chair
whoami Wataru Tsuda / gr1m0h SRE @ Luup,inc. SRE Lounge
/ SRE NEXT 運営メンバー Platform Engineering Meetup 運営メンバー SRE NEXT 2023 Chair ロール(役割)としてのSREは信頼性工学の専門家という立場 SREを実践、活用していくのは開発組織全体!会社全体!