Upgrade to Pro — share decks privately, control downloads, hide ads and more …

SRE≠インフラなんだけどもう誤解されちゃってる から、DevOps新実装として Site Production Engineering はいかがでしょう?

Toshiaki Baba
September 02, 2022

SRE≠インフラなんだけどもう誤解されちゃってる から、DevOps新実装として Site Production Engineering はいかがでしょう?

JAWS DAYS 2022登壇資料
『SRE≠インフラなんだけどもう誤解されちゃってる から、DevOps新実装として Site Production Engineering はいかがでしょう?』

Toshiaki Baba

September 02, 2022
Tweet

More Decks by Toshiaki Baba

Other Decks in Technology

Transcript

  1. SRE≠インフラなんだけどもう誤解されちゃってる
    から、DevOps新実装として
    Site Production Engineeringはいかがでしょう?
    株式会社X-Tech 5 取締役CTO
    馬場俊彰
    @netmarkjp
    スポンサーセッション

    View Slide

  2. DevOpsとSRE推進により、
    ITインフラ・システムの運用と組織の課題を解決します
    X-Tech 5は単なるアウトソーサーとしてだけでなく、企業のビジネス変革を遂行するパートナーとして、
    ビジネス価値の高いユーザー・エクスペリエンスの実現を主眼としたDevOpsおよびSRE
    (Site Reliability Engineering)を、人材育成も含めて組織的に実践する支援サービスを提供します。

    View Slide

  3. SRE事例
    非ITの事業会社にSREと言わずにSREを持ち込んだ
    SRE NEXT 2022 https://sre-next.dev/2022/schedule#jp31

    View Slide

  4. 馬場 俊彰:株式会社X-Tech 5 取締役CTO
    2008~2020 株式会社ハートビーツ取締役CTO
    2020~ 電気通信大学ウェブシステムデザインプログラム講師
    2020~ 株式会社X-Tech 5 取締役CTO
    得意領域:
    ● OSSを活用したWebシステムのインフラ~アプリケーションの運用・改善
    ● OSSのOS~ミドルウェア( Linux、Apache、Nginx、MySQL、Docker、
    Kubernetes )
    ● Webシステムのモニタリング・パフォーマンスチューニング・DevOps
    ● クラウド活用(特にIaaS、PaaS、FaaS)
    ● プログラミング( Python、Go )
    認定・資格:
    ● AWS 認定ソリューションアーキテクト - プロフェッショナル
    ● 情報処理技術者試験 テクニカルエンジニア(データベース)
    ● 情報システム学修士(専門職)
    著書・講演:
    https://netmark.jp/portfolio/
    @netmarkjp

    View Slide

  5. 認識を共有したい
    この世界の真理

    View Slide

  6. システムは動かし始めた瞬間から老朽化していく
    放っておくと壊れるし
    よくわからない状態になる
    認識を共有したい、この世界の真理(1/3)

    View Slide

  7. システムは動かし始めがスタートライン
    認識を共有したい、この世界の真理(2/3)

    View Slide

  8. システムを ”利用可能” かつ
    “役に立つ” 状態にしておくためには、
    多くの設備や機材と同様に、
    プロフェッショナルによる継続的なメンテナンスが必要
    認識を共有したい、この世界の真理(3/3)

    View Slide

  9. 本当に必要な、知らないところで誰かががんばっていること
    システムを”利用可能”かつ“役に立つ”状態にし続ける

    SREでもいいんだけど、コンテキストによってはSite
    Production Engineering と呼ぶとスムーズ!

    View Slide

  10. SREと何が違うの?

    ユーザ体験のために技術領域の壁・運営組織の壁を越
    えていくという意味で同じ

    View Slide

  11. メンテナンス観点の例
    ● システム・サービス・ビジネスの状態計測や分析
    ● パフォーマンス
    ● セキュリティ
    ● コスト
    ● ESG
    ● 身内の生産性維持向上(開発者、サポート、マーケティング…)
    ● プロダクトライフサイクル管理
    システムを ”利用可能” かつ“役に立つ” 状態にしておく
    Site Production Engineering
    • ユーザのためには【いつか誰かがやらねば】ということ
    • システム自体と提供者を支え支援すること
    • 丁寧にコツコツ続けていると「事故らないための神頼みの比率」を劇的に下げられる
    • 成すにはサービス全体・ビジネスの視座が必要
    (分業は人類の都合、多くの場合は既存スキルセットの都合であり、システムの都合ではない)

    View Slide

  12. 問いかけ・聞きたい
    Site Production Engineering と呼んだもろもろ、
    みなさんどうやっていい感じにしてますか?
    できてますか?
    仕組みの上でスムーズにできている?:発見 / 起案 / 稼働確保 / アサイン /評価/…
    障壁・引け目はない?:チームの壁 / 技術レイヤの壁 / 担当プロダクトの壁 / …
    ユーザークレーム前のパフォーマンスチューニング / アラート対応でない範囲のモニタリング改善 / 運用作業の
    セルフ化 / 監査で指摘されない範囲のセキュリティ向上 / コード内のTODOやFIXMEをやっつける / 利用してい
    るライブラリのメジャーバージョンアップ / HTTPSで利用可能なアルゴリズムの更新 / CI/CD高速化 / ・・・
    宣伝:X-Tech 5がお手伝いできます!
    https://x-tech5.co.jp/contact_form/

    View Slide

  13. Production Engineering was created at Facebook to work with engineering teams and partners to champion the Reliability,
    Scalability, Performance, and Security posture of production services. PEs are hybrid software and systems engineers; they
    are the glue holding things together, whether that’s infrastructure and software or teams and processes.
    The true power of Production Engineering comes from developing strong relationships with partner engineering teams and
    valuing collaboration and knowledge sharing to build technical expertise and community. PE’s write production code and
    solve hard problems in systems serving billions of people across Facebook, services like Instagram, WhatsApp, and Oculus,
    and in diverse infrastructure areas like machine learning/inference, storage, and networking.
    Production Engineering at Facebook - Engineering at Meta https://engineering.fb.com/category/production-engineering/
    We adapted ideas to suit our scale with three key goals in reorganizing the teams:
    • Focus on automation over manual toil
    • Reducing the number of disconnected teams with operational responsibility; and,
    • Producing ready to use tools and infrastructure for all Shopify developers
    The resulting model was a new organization called Production Engineering. This organization brought together the various
    teams that previously split operations responsibility, along with a roughly equal number of developers from other
    development teams.
    Why Shopify Moved to The Production Engineering Model — Infrastructure
    https://shopify.engineering/why-shopify-moved-to-the-production-engineering-model
    参考

    View Slide

  14. わたしとJAWS-UG:JAWS DAYS2019登壇
    「技術力を上げたい!どうやって? というか技術力って一体何なんだっけ? -
    ハートビーツの場合
    https://speakerdeck.com/netmarkjp/ji-shu-li-woshang-getai-douyatute-toiukaji-shu-li-tute-ti-he-nandatuke-hatobitufalsechang-he

    View Slide