Upgrade to Pro — share decks privately, control downloads, hide ads and more …

About_Resilience.pdf

 About_Resilience.pdf

Ea3572f7de8fb9c26bacf448d55170f8?s=128

tsuyoshi nakamura

December 06, 2018
Tweet

More Decks by tsuyoshi nakamura

Other Decks in Programming

Transcript

  1. About Resilience 2018.12.xx 社内勉強会 @nakamura_244

  2. ” 基本的に個人的な見解なのでその 辺りはよろしくお願いします 2

  3. Resilienceという言葉が出てくる前 1 ▹ クラウドが出てくる前、データセンターでのサーバ運用がメイン ▹ そこでの運用思想は、ダウンタイム自体をなるべく発生させない ▹ 安定して一瞬でも落とさずに長時間運用するかが指標 ▸ 冗長回線、冗長電源、。。。。とにかく冗長化が大好き

    ▸ 今でも冗長化は出てくるけどね。ざっくり理解ですよ
  4. Publicクラウドがメインになると 2 ▹ クラウドベースになってもインフラ側の障害は致し方なく起きるし、少なから ず影響を受ける ▹ クラウドベンダー(=プロフェッショナル)が設計・運用しても障害はなくならな い -> おそらく自社(中小規模)で設計運用しても障害はなくならない

    ▹ だったら受けれてた設計をしよう!
  5. Resilience 3 ▹ 直訳すると回復性 ▹ 昨今のシステムでいうと障害からいち早く回復して稼働する ▹ 逆にいうと障害はある程度致し方ない ▹ 障害はありうるという事を受け入れた上でダウンタイムをいかに短くできるか

    という所がポイント ▹ SLAで定めた稼働時間とかは逆に1ヶ月のうち何分は落としても良いという解 釈の仕方 ▹ だからといって障害を回避する努力は怠ってはいけないよ。当然
  6. 対比 4 Failure-resilient … 障害耐性 Failure-resistant … 故障耐性

  7. ” ちなみに私がResilienceを知った経 緯 7

  8. 私がResilienceという言葉との出会いは 5 ▹ 2016年にやった社内勉強会でSREcon の内容をレポートしたのがきっかけ ▹ PinterestのSERのセッションを聞いて知った