Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ProductionReadyと開発プロセス改善

Sponsored · SiteGround - Reliable hosting with speed, security, and support you can count on.
Avatar for OPTiM OPTiM
November 27, 2020

 ProductionReadyと開発プロセス改善

Avatar for OPTiM

OPTiM

November 27, 2020
Tweet

More Decks by OPTiM

Other Decks in Technology

Transcript

  1. 2 Tsuda / 津⽥ p@grim0h pSRE at OPTiM pFavorite Topics

    • Production Ready, Capacity Planning, Monitoring, Security, ... • AWS, Kubernetes, Go, k6, ... Who am I ?
  2. 3 Tsuda / 津⽥ p@grim0h pSRE at OPTiM pFavorite Topics

    • Production Ready, Capacity Planning, Monitoring, Security, ... • AWS, Kubernetes, Go, k6, ... Who am I ?
  3. 4 p SRE: Site Reliability Engineer • サイト信頼性エンジニア p システムの信頼性をコントロールするためにあれこれするエンジニア

    • 開発者/運⽤者とは違う ? • 信頼性の担保のためなら開発/運⽤を⾏う場合もある • システムの信頼性のコントロール • 早く機能をリリースすること or システムへの変更を減らして信頼性を⾼めること - e.g. ‣ 運⽤負荷軽減 => Eliminating Toil ‣ サービスの信頼性を担保するためのチェック => Production Ready ‣ サービスの拡張性の担保とリソース(e.g. CPU, Memory)最適化 => Capacity Planning ‣ サービスのリリースまでの時間を早くする => CI/CD What is SRE ?
  4. 5 Tsuda / 津⽥ p@grim0h pSRE at OPTiM pFavorite Topics

    • Production Ready, Capacity Planning, Monitoring, Security, ... • AWS, Kubernetes, Go, k6, ... Who am I ?
  5. 7 p「サービスを本番トラフィックを任せられるほどの信頼がある状態」 とはどういう状態だろう ? • 本番環境にリリースできる状態ということではない • Alphaリリース、Betaリリースというケースがある • 各チーム/各社ごとに「信頼」の定義は異なる

    • 負荷に耐えられるか︖、監視できているか︖など⾊々観点はある • ISO/IEC 25010 製品品質モデルだと以下が含まれる - 性能効率性、互換性、信頼性、セキュリティ、保守性、移植性 What is Production Ready ?
  6. 9 p レビュー • ⽤語: Production Readiness Review • SREによるサービスの

    Production Ready 対応度合いのレビュー p チェックリスト • ⽤語: Production Readiness Checklist • サービスの Production Ready 対応度合いをチェックリストに記載 • チェックリストに記載されている観点がレビュー観点になる ⼀般的(?)な Production Ready 適⽤フロー
  7. 10 p ロードマップ • ⽤語: Production Readiness Roadmap • より

    信頼性の⾼いサービスを⽬指していくためにロードマップを作成 p 受け⼊れ/引き渡し • ⽤語: SRE Onboarding/Takeover • SREが本番環境を管理しているため、SREにサービスを引き渡す ⼀般的(?)な Production Ready 適⽤フロー
  8. 11 OPTiM Cloud IoT OS に適⽤する Production Readyの適⽤ p Production

    Readiness Review p Production Readiness Checklist p Production Readiness Roadmap p SRE Onboarding/Takeover
  9. 12 OPTiM Cloud IoT OS に適⽤する Production Readyの適⽤ p Production

    Readiness Review p Production Readiness Checklist p Production Readiness Roadmap p SRE Onboarding/Takeover p OPTiM Cloud IoT OSのプロダクト特性 • マイクロサービスエコシステム • DevOpsの体制ではない • SREが本番環境を管理していない • ウォーターフォール型開発、アジャイル型開発
  10. 15 pサービスのフェーズ • プロト版 ? ベータ版 ? 製品としてリリースされている ? •

    直販ではなく販社を挟んで販売している ? p依存しているサービスの多さ • このサービスに依存しているサービス数は ? pCall数、トラフィック数の多さ • ユーザはどのくらい使⽤している ? p障害発⽣率 • どのくらい障害が発⽣している ? • 発⽣している障害のインパクトは ? Production Ready適⽤サービスの優先度 仕組みの開発
  11. 16 p Production Ready 活動状況 • レビュー: • チェックリスト: •

    ロードマップ: • 運⽤者へサービスの受け⼊れ/引き渡し: Production Ready 対応(以前)
  12. 20 pOPTiM Cloud IoT OSにおける早期エンゲージメントモデル p企画から運⽤までのプロセスが対象 早期エンゲージメントモデル type: OPTiM Cloud

    IoT OS 企画 設計 開発 運⽤ レビュー レビュー サポート/ レビュー サポート 設計書 運⽤⼿順書 システム構築基礎知識 インセプションデッキ
  13. 21 p Production Ready 活動状況 • レビュー: • チェックリスト: •

    ロードマップ: • 運⽤者へサービスの受け⼊れ/引き渡し: • 企画/開発/運⽤者による事前レビュー: • サービスドキュメント: • ガイドラインの提供: Production Ready 対応(現在)
  14. 22 p 各サービスのドキュメント集 • 設計書 • 運⽤⼿順書 • システム構築基礎知識 •

    負荷試験レポート p ドキュメントテンプレートも⽤意 • フォーマットを揃えること • 項⽬/観点の抜け漏れを無くすこと サービスドキュメント
  15. 27 pOPTiM Cloud IoT OSのProduction Readyの導⼊について • 「早期エンゲージメントモデル」をベースにしたモデル • 各フェーズごとにドキュメントを作成することで項⽬漏れ/⼿戻りのない

    レビューが可能 • 開発者の声: • 設計漏れが起こらなかった、スムーズなレビューと運⽤引き渡しが可能 pProduction Ready のアプローチはサービス/チームによって違う pProduction Ready を導⼊してみてください Conclusion