Upgrade to Pro — share decks privately, control downloads, hide ads and more …

When Walking like SREs

maru
June 06, 2024

When Walking like SREs

maru

June 06, 2024
Tweet

More Decks by maru

Other Decks in Technology

Transcript

  1. ˜-:$PSQPSBUJPO  ͜ͷεϥΠυͰ࢖͏༻ޠ SREing Site Reliability Engineering SREプラクティス自体のこと。誰がやるかは関係なし。 SREs Site

    Reliability Engineers SREingに責任を持つ専門のエンジニアロールのこと。 SWEs Software Engineers SREsと対比した時にサービス開発のエンジニアのこと
  2. ˜-:$PSQPSBUJPO  ͜ͷεϥΠυͰ࢖͏༻ޠ SREing Site Reliability Engineering SREプラクティス自体のこと。誰がやるかは関係なし。 SREs Site

    Reliability Engineers SREingに責任を持つ専門のエンジニアロールのこと。 SWEs Software Engineers SREsと対比した時にサービス開発のエンジニアのこと 最初の文章を翻訳すると
  3. ˜-:$PSQPSBUJPO  ॻ੶ʮνʔϜτϙϩδʔʯ༻ޠ Stream Aligned Team ビジネス価値提供の継続的な流れ(ストリーム)を一貫して担当する。 プロダクト・サービスの開発運用がここに含まれる。 Enabling Team

    Stream Aligned Teamがその時点で持っていない必要な能力を獲得することを支援する。 複数のStream Aligned Teamを横断的に支援する。 Platform Team Stream Aligned Teamが下位サービスの再開発する必要性をなくし、認知負荷を下げるよ うにする。 最も単純なプラットフォームは下位サービスのリンク集のドキュメント。 Complicated Subsystem Team 機械学習や動画エンコーディングなどの特定分野のスペシャリスト。
  4. ˜-:$PSQPSBUJPO  ୅දతͳ43&JOHνʔϜ࣮૷ྫ Embedded SRE SWEsによるSREing Stream Aligned Team 特定プロダクト・サービスの開発運用の中で信頼性を制御する。

    サービスのオンコールにも入る。 Enabling SRE Enabling Team Stream Aligned Teamがその時点で持っていない必要な能力を獲得す ることを支援する。 e.g. SLI/SLO, オブザーバビリティ, ポストモーテム Platform SRE Platform Team 信頼性に関連するツールを管理し、as a Serviceとして提供する。 N/A Complicated Subsystem Team 機械学習や動画エンコーディングなどの特定分野のスペシャリス ト。
  5. ˜-:$PSQPSBUJPO  ୅දతͳ43&JOHνʔϜ࣮૷ྫ Embedded SRE SWEsによるSREing Stream Aligned Team 特定プロダクト・サービスの開発運用の中で信頼性を制御する。

    Enabling SRE Enabling Team Stream Aligned Teamがその時点で持っていない必要な能力を獲得す ることを支援する。 e.g. SLI/SLO, オブザーバビリティ, ポストモーテム Platform SRE Platform Team 信頼性に関連するツールを管理し、as a Serviceとして提供する。 N/A Complicated Subsystem Team 機械学習や動画エンコーディングなどの特定分野のスペシャリス ト。 先ほどの文章をさらに翻訳すると
  6. ˜-:$PSQPSBUJPO  ॻ੶ʮνʔϜτϙϩδʔʯ༻ޠ Stream Aligned Team ビジネス価値提供の継続的な流れ(ストリーム)を一貫して担当する。 プロダクト・サービスの開発運用がここに含まれる。 Enabling Team

    Stream Aligned Teamがその時点で持っていない必要な能力を獲得することを支援する。 複数のStream Aligned Teamを横断的に支援する。 Platform Team Stream Aligned Teamが下位サービスの再開発する必要性をなくし、認知負荷を下げるよ うにする。 最も単純なプラットフォームは下位サービスのリンク集のドキュメント。 Complicated Subsystem Team 機械学習や動画エンコーディングなどの特定分野のスペシャリスト。
  7. ˜-:$PSQPSBUJPO • 4USFBN"MJHOFE5FBN͕ • 意: 私たちEnabling teamとは別チームであり、ビジネスストリームに責任を持つチームが • ͦͷ࣌఺Ͱ͍࣋ͬͯͳ͍ •

    意: 獲得するのに多かれ少なかれ学習の負荷がかかる • ඞཁͳೳྗΛ • 意: 必要だと認識している、本当に必要な能⼒を ֫ಘ͢Δ͜ͱΛࢧԉ͢Δɻ  &OBCMJOH5FBNͷ೉͠͞ “Stream Aligned Teamがその時点で持っていない必要な能力を獲得することを支援する”
  8. ˜-:$PSQPSBUJPO • 4USFBN"MJHOFE5FBN͕ • 意: 私たちEnabling teamとは別チームであり、ビジネスストリームに責任を持つチームが • ͦͷ࣌఺Ͱ͍࣋ͬͯͳ͍ •

    意: 獲得するのに多かれ少なかれ学習の負荷がかかる • ඞཁͳೳྗΛ • 意: 必要だと認識している、本当に必要な能⼒を ֫ಘ͢Δ͜ͱΛࢧԉ͢Δɻ  &OBCMJOH5FBNͷ೉͠͞ “Stream Aligned Teamがその時点で持っていない必要な能力を獲得することを支援する”
  9. ˜-:$PSQPSBUJPO • 4USFBN"MJHOFE5FBN͕ • 意: 私たちEnabling teamとは別チームであり、ビジネスストリームに責任を持つチームが • ͦͷ࣌఺Ͱ͍࣋ͬͯͳ͍ •

    意: 獲得するのに多かれ少なかれ学習の負荷がかかる • ඞཁͳೳྗΛ • 意: 必要だと認識している、本当に必要な能⼒を ֫ಘ͢Δ͜ͱΛࢧԉ͢Δɻ  &OBCMJOH5FBNͷ೉͠͞ “Stream Aligned Teamがその時点で持っていない必要な能力を獲得することを支援する”
  10. ˜-:$PSQPSBUJPO • ো֐΍ࣄނΛᑏࢠʹ࢖ͬͯɺ༧๷΍վળͱͯ͠༏ઌ౓Λ্͛Δ • 障害が発生してから予防策を考えるのではなく、優先度的に今実施できない予防策を予め検討し ておくイメージ • 燃えそうなところにあえて火をつけるのも一つの手段 • ໰୊ΛΠγϡʔͱͯ͠໌֬ʹݴޠԽ͢Δ

    • イシューをProposalとして文書化して、チームに共有する  જࡏతͳΠγϡʔͷ༏ઌ౓ͷ্͛ํ DeNA南場代表取締役会⻑「⾔語化するとその問題がより深刻になって進んでしまう」 引用: Youtube 【南場ガチ1on1】チームにおける『価値が⾼い⼈』とは?!
  11. ˜-:$PSQPSBUJPO  4USFBN"MJHOFE5FBN಺Ͱͷ &OBCMJOH·Ͱͷεςοϓ これをStream Aligned Teamの外にいるEnabling Teamがサポートする必要がある Stream Aligned

    Teamの持っているニーズ・イシューに気づく ニーズ・イシューをStream Aligned Team内で言語化する ソリューションを導入する ソリューションを使いこなす
  12. ˜-:$PSQPSBUJPO  ࢲ͕ͨͪͨͲΓண͍ͨ&OBCMJOH5FBN खஈͱͯ͠ͷ&NCFEEFE Embedded SRE SWEsによるSREing Stream Aligned Team

    特定プロダクト・サービスの開発運用の中で信頼性を制御する。 Enabling SRE Enabling Team Stream Aligned Teamがその時点で持っていない必要な能力を獲得す ることを支援する。 e.g. SLI/SLO, オブザーバビリティ, ポストモーテム Platform SRE Platform Team 信頼性に関連するツールを管理し、as a Serviceとして提供する。 N/A Complicated Subsystem Team 機械学習や動画エンコーディングなどの特定分野のスペシャリス ト。 よくある言い換え: 「Enabling Teamは常に現場にいる必要がある」 「Enabling Teamは“象牙の塔”を避けよう」 「“あなたたちわたしたち”を避けよう」