Upgrade to Pro — share decks privately, control downloads, hide ads and more …

About_Resilience.pdf

 About_Resilience.pdf

tsuyoshi nakamura

December 06, 2018
Tweet

More Decks by tsuyoshi nakamura

Other Decks in Programming

Transcript

  1. About Resilience
    2018.12.xx
    社内勉強会
    @nakamura_244

    View full-size slide


  2. 基本的に個人的な見解なのでその
    辺りはよろしくお願いします
    2

    View full-size slide

  3. Resilienceという言葉が出てくる前
    1
    ▹ クラウドが出てくる前、データセンターでのサーバ運用がメイン
    ▹ そこでの運用思想は、ダウンタイム自体をなるべく発生させない
    ▹ 安定して一瞬でも落とさずに長時間運用するかが指標
    ▸ 冗長回線、冗長電源、。。。。とにかく冗長化が大好き
    ▸ 今でも冗長化は出てくるけどね。ざっくり理解ですよ

    View full-size slide

  4. Publicクラウドがメインになると
    2
    ▹ クラウドベースになってもインフラ側の障害は致し方なく起きるし、少なから
    ず影響を受ける
    ▹ クラウドベンダー(=プロフェッショナル)が設計・運用しても障害はなくならな
    い -> おそらく自社(中小規模)で設計運用しても障害はなくならない
    ▹ だったら受けれてた設計をしよう!

    View full-size slide

  5. Resilience
    3
    ▹ 直訳すると回復性
    ▹ 昨今のシステムでいうと障害からいち早く回復して稼働する
    ▹ 逆にいうと障害はある程度致し方ない
    ▹ 障害はありうるという事を受け入れた上でダウンタイムをいかに短くできるか
    という所がポイント
    ▹ SLAで定めた稼働時間とかは逆に1ヶ月のうち何分は落としても良いという解
    釈の仕方
    ▹ だからといって障害を回避する努力は怠ってはいけないよ。当然

    View full-size slide

  6. 対比
    4
    Failure-resilient … 障害耐性
    Failure-resistant … 故障耐性

    View full-size slide


  7. ちなみに私がResilienceを知った経

    7

    View full-size slide

  8. 私がResilienceという言葉との出会いは
    5
    ▹ 2016年にやった社内勉強会でSREcon の内容をレポートしたのがきっかけ
    ▹ PinterestのSERのセッションを聞いて知った

    View full-size slide