Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
高度に発達したシステムの異常は神の怒りと見分けがつかない / IPSJ-ONE 2017 y_uuki
Yuuki Tsubouchi (yuuk1)
March 19, 2017
Technology
3
23k
高度に発達したシステムの異常は神の怒りと見分けがつかない / IPSJ-ONE 2017 y_uuki
IPSJ-ONE 2017 スライド。
Yuuki Tsubouchi (yuuk1)
March 19, 2017
Tweet
Share
More Decks by Yuuki Tsubouchi (yuuk1)
See All by Yuuki Tsubouchi (yuuk1)
AI時代に向けたクラウドにおける信頼性エンジニアリングの未来構想 / DICOMO2022 6A-1
yuukit
6
1.6k
AIOps研究録―SREのための システム障害の自動原因診断 / SRE NEXT 2022
yuukit
7
8.8k
Interactive AIOps
yuukit
0
1.3k
Meltria: マイクロサービスにおける 異常検知・原因分析のための データセットの動的生成システム / Meltria in IOTS2021
yuukit
1
990
AIOpsの研究動向と AIOps向けデータセットの動的生成の研究 / Introducing AIOps and A Dynamic Datasets Generating System
yuukit
1
420
分散アプリケーションの高信頼化のための 運用技術に関する研究 / A Study on Operation Technology for High Reliability of Distributed Applications
yuukit
1
560
ネットワークサービスの依存発見に向いた TCP/UDP通信の低負荷なトレース手法 / Low Overhead TCP-UDP Tracing in Kernel
yuukit
5
3.2k
クラウドのシステム運用技術に機械学習を応用する研究 / CLOUD AI
yuukit
4
2.6k
TSifter: マイクロサービスにおける性能異常の迅速な診断に向いた時系列データの次元削減手法 / TSifter in proceedings of IOTS2020
yuukit
1
1.8k
Other Decks in Technology
See All in Technology
オンプレk8sとEKSの並行運用の実際
ch1aki
0
280
MoT/コネヒト/Kanmu が語るプロダクト開発xデータ分析 - 分析から機械学習システムの開発まで一人で複数ロールを担う大変さ
masatakashiwagi
3
730
02_プロトタイピングの進め方
kouzoukaikaku
0
470
re:Inventで発表があったIoT事例の紹介と考察
kizawa2020
0
180
re:Invent2022 前後の Amazon EventBridge のアップデートを踏まえつつ、情シスの仕事をより楽しくしたい話。 / EventBridge for Information Systems Department
_kensh
2
730
Oktaの管理者権限を適切に移譲してみた
shimosyan
2
270
SmartHRからOktaへのSCIM連携で作り出すHRドリブンのアカウント管理
jousysmiler
1
120
【NGK2023S】 ノードエディタ形式の画像処理ツール「Image-Processing-Node-Editor」
kazuhitotakahashi
0
290
データベースの発表には RDBMS 以外もありますよ
maroon1st
0
240
💰年度末予算消化祭💰 Large Memory Instance で 画像分類してみた
__allllllllez__
0
100
立ち止まっても、寄り道しても / even if I stop, even if I take a detour
katoaz
0
570
OCI DevOps 概要 / OCI DevOps overview
oracle4engineer
PRO
0
490
Featured
See All Featured
BBQ
matthewcrist
75
8.1k
GraphQLとの向き合い方2022年版
quramy
20
9.9k
Embracing the Ebb and Flow
colly
75
3.6k
Building Your Own Lightsaber
phodgson
96
4.9k
How to name files
jennybc
47
73k
Unsuck your backbone
ammeep
659
56k
GitHub's CSS Performance
jonrohan
1020
430k
It's Worth the Effort
3n
177
26k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
318
19k
Imperfection Machines: The Place of Print at Facebook
scottboms
254
12k
What’s in a name? Adding method to the madness
productmarketing
12
1.9k
Reflections from 52 weeks, 52 projects
jeffersonlam
338
18k
Transcript
ߴʹൃୡͨ͠ γεςϜͷҟৗ ਆͷౖΓͱ ݟ͚͕͔ͭͳ͍ Πϯλʔωοτͱӡ༻ٕज़ݚڀձਪન גࣜձࣾͯͳ ௶༎थ
શࣗಈ γεςϜ
શࣗಈ γεςϜ
24࣌ؒ 365
ྗ
Infrastructure as Code Ϋϥυʹ͓͚Δαʔ όཧͷݪଇͱϓϥΫ ςΟε Photo by O’reilly Media
/ CC by 3.0 https://www.oreilly.co.jp/books/9784873117966/ https://creativecommons.org/licenses/by/3.0/deed
Kief Morris ஶ ٶԼ ߶ี ༁ ඌ ߴ߂ ༁ ʰInfrastructure
As Code Ϋϥυʹ͓͚ΔαʔόཧͷݪଇͱϓϥΫςΟεʱΑΓ Φʔτϝʔγϣϯπʔϧ͕Ͳ͏ ͍͏݁ՌΛੜΉ͔ʹ͍ͭͯࣗ৴ ͕࣋ͯͳ͍ͨΊɺΦʔτϝʔγϣ ϯπʔϧʹ͖ͤΓʹͳΔͷ ා͔ͬͨɻ 1.3.5 Φʔτϝʔγϣϯڪා
அ
ߴʹൃୡ
ࣗવք
ҟৗ
ະ
ਆͷౖΓ
؍ଌ
ࢹ Monitoring
ϔϞάϩϏϯ ݂ٿ ϔϚτΫϦοτ ന݂ٿ ݂খ൘ ݂ਗ਼ΧϧγϜ .$7 .$) .$)$ ૯ίϨεςϩʔϧ
)%-ίϨεςϩʔϧ -%-ίϨεςϩʔϧ தੑࢷ ۭෲ݂࣌ ऩॖظ݂ѹ ֦ுظ݂ѹ ͨΜͺ͘ જ݂ ૉૉ ΫϨΞνχϯ જ݂ ;55 "45 "-5 Ѝ(51 "-1 ૯ϏϦϧϏϯ ϩϏϦϊʔήϯ ૯ͨΜͺ͘ Ξϧϒϛϯ )#T߅ମ )#T߅ݪ )$7߅ମ Ξϛϥʔθ $31 ϦϚτΠυҼࢠ ݈߁அ
JOUFSGBDFFUIUY#ZUFT pMFTZTUFNYWEBVTFE MPBEBWH DQVVTFS DQVJEMF DQVTUFBM NFNPSZVTFE MJOVYTT4:/3&$7 MJOVY5*.&@8"*5 MJOVY6/$0//
MJOVYTT'*/8"*5 MJOVY$-04&8"*5 MJOVY-*45&/ JOPEFYWEBUPUBM DQVOJDF DQVTZTUFN DQVHVFTU NFNPSZCV⒎FST MJOVY$-04*/( MJOVY-"45"$, MJOVYTT'*/8"*5 NFNPSZGSFF JOUFSGBDFFUISY#ZUFT NFNPSZ
[email protected]
MJOVY
[email protected]
MJOVYGPSLT MJOVY6/,08/ MJOVY-*45&/ MJOVYTT4:/4&/5 MJOVYTT&45"# NFNPSZDBDIFE DQVJPXBJU DQVTPGUJSR DQVIBSEJSR NFNPSZ
[email protected]
NFNPSZUPUBM EJTLYWEBSFBET EJTLYWEBXSJUFT pMFTZTUFNYWEBTJ[F JOPEFYWEBGSFF ݈߁அ
σʔλ ϕʔε
ੑೳ VS ͓ۚ
)%% 44% ϝϞϦ
)%% 44% ϝϞϦ ͍ ;ͭ͏ ͍
)%% 44% ϝϞϦ ߴ͍ ;ͭ͏ ͍҆
ݹ͍σʔλ ΄ͱΜͲΞΫηε ͞Εͳ͍ͷͰ ͯ͘Α͍
)%% 44% ϝϞϦ ݹ͍ ৽͍͠ ͍ ͍҆
)%% 44% ϝϞϦ ݹ͍ ৽͍͠ ౷ ߹
DiamonDB https://github.com/yuuki/diamondb
ࢹ͚σʔλϕʔεੈͷதʹͨ͘ ͞Μ͋Δ Facebook͍ͭͬͯ͘Δ ΞΠσΞࣗମݹయత ͔͠͠ɺ ࢹ͚σʔλϕʔεʹద ༻͍ͯ͠Δྫͳ͍
ͯͳͷݱߦσʔλϕʔε ͱൺֱ͠ 100+ഒ ͷσʔλྔͷอ͕࣋ݱ࣮త ͳίετͰՄೳ
࣮ݧ
“PRINCIPLES OF CHAOS ENGINEERING”, http://principlesofchaos.org/ ΑΓ Chaos Engineering is the
discipline of experimenting on a distributed system in order to build confidence in the system’s capability to withstand turbulent conditions in production.
Θ͟ͱ ҟৗΛى͜͢
؍ଌ ࣮ݧ γεςϜ Ϟσϧ
؍ଌͱ࣮ݧʹΑΓ γεςϜಛੑΛ ֶश͠ͳ͕Β ࣗಈ࡞͢ΔγεςϜ
γεςϜཧऀΛ ະͷڪΕ͔Β ղ์͍ͨ͠