Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ProductionReadyと開発プロセス改善

OPTiM
November 27, 2020

 ProductionReadyと開発プロセス改善

OPTiM

November 27, 2020
Tweet

More Decks by OPTiM

Other Decks in Technology

Transcript

  1. 2 Tsuda / 津⽥ p@grim0h pSRE at OPTiM pFavorite Topics

    • Production Ready, Capacity Planning, Monitoring, Security, ... • AWS, Kubernetes, Go, k6, ... Who am I ?
  2. 3 Tsuda / 津⽥ p@grim0h pSRE at OPTiM pFavorite Topics

    • Production Ready, Capacity Planning, Monitoring, Security, ... • AWS, Kubernetes, Go, k6, ... Who am I ?
  3. 4 p SRE: Site Reliability Engineer • サイト信頼性エンジニア p システムの信頼性をコントロールするためにあれこれするエンジニア

    • 開発者/運⽤者とは違う ? • 信頼性の担保のためなら開発/運⽤を⾏う場合もある • システムの信頼性のコントロール • 早く機能をリリースすること or システムへの変更を減らして信頼性を⾼めること - e.g. ‣ 運⽤負荷軽減 => Eliminating Toil ‣ サービスの信頼性を担保するためのチェック => Production Ready ‣ サービスの拡張性の担保とリソース(e.g. CPU, Memory)最適化 => Capacity Planning ‣ サービスのリリースまでの時間を早くする => CI/CD What is SRE ?
  4. 5 Tsuda / 津⽥ p@grim0h pSRE at OPTiM pFavorite Topics

    • Production Ready, Capacity Planning, Monitoring, Security, ... • AWS, Kubernetes, Go, k6, ... Who am I ?
  5. 7 p「サービスを本番トラフィックを任せられるほどの信頼がある状態」 とはどういう状態だろう ? • 本番環境にリリースできる状態ということではない • Alphaリリース、Betaリリースというケースがある • 各チーム/各社ごとに「信頼」の定義は異なる

    • 負荷に耐えられるか︖、監視できているか︖など⾊々観点はある • ISO/IEC 25010 製品品質モデルだと以下が含まれる - 性能効率性、互換性、信頼性、セキュリティ、保守性、移植性 What is Production Ready ?
  6. 9 p レビュー • ⽤語: Production Readiness Review • SREによるサービスの

    Production Ready 対応度合いのレビュー p チェックリスト • ⽤語: Production Readiness Checklist • サービスの Production Ready 対応度合いをチェックリストに記載 • チェックリストに記載されている観点がレビュー観点になる ⼀般的(?)な Production Ready 適⽤フロー
  7. 10 p ロードマップ • ⽤語: Production Readiness Roadmap • より

    信頼性の⾼いサービスを⽬指していくためにロードマップを作成 p 受け⼊れ/引き渡し • ⽤語: SRE Onboarding/Takeover • SREが本番環境を管理しているため、SREにサービスを引き渡す ⼀般的(?)な Production Ready 適⽤フロー
  8. 11 OPTiM Cloud IoT OS に適⽤する Production Readyの適⽤ p Production

    Readiness Review p Production Readiness Checklist p Production Readiness Roadmap p SRE Onboarding/Takeover
  9. 12 OPTiM Cloud IoT OS に適⽤する Production Readyの適⽤ p Production

    Readiness Review p Production Readiness Checklist p Production Readiness Roadmap p SRE Onboarding/Takeover p OPTiM Cloud IoT OSのプロダクト特性 • マイクロサービスエコシステム • DevOpsの体制ではない • SREが本番環境を管理していない • ウォーターフォール型開発、アジャイル型開発
  10. 15 pサービスのフェーズ • プロト版 ? ベータ版 ? 製品としてリリースされている ? •

    直販ではなく販社を挟んで販売している ? p依存しているサービスの多さ • このサービスに依存しているサービス数は ? pCall数、トラフィック数の多さ • ユーザはどのくらい使⽤している ? p障害発⽣率 • どのくらい障害が発⽣している ? • 発⽣している障害のインパクトは ? Production Ready適⽤サービスの優先度 仕組みの開発
  11. 16 p Production Ready 活動状況 • レビュー: • チェックリスト: •

    ロードマップ: • 運⽤者へサービスの受け⼊れ/引き渡し: Production Ready 対応(以前)
  12. 20 pOPTiM Cloud IoT OSにおける早期エンゲージメントモデル p企画から運⽤までのプロセスが対象 早期エンゲージメントモデル type: OPTiM Cloud

    IoT OS 企画 設計 開発 運⽤ レビュー レビュー サポート/ レビュー サポート 設計書 運⽤⼿順書 システム構築基礎知識 インセプションデッキ
  13. 21 p Production Ready 活動状況 • レビュー: • チェックリスト: •

    ロードマップ: • 運⽤者へサービスの受け⼊れ/引き渡し: • 企画/開発/運⽤者による事前レビュー: • サービスドキュメント: • ガイドラインの提供: Production Ready 対応(現在)
  14. 22 p 各サービスのドキュメント集 • 設計書 • 運⽤⼿順書 • システム構築基礎知識 •

    負荷試験レポート p ドキュメントテンプレートも⽤意 • フォーマットを揃えること • 項⽬/観点の抜け漏れを無くすこと サービスドキュメント
  15. 27 pOPTiM Cloud IoT OSのProduction Readyの導⼊について • 「早期エンゲージメントモデル」をベースにしたモデル • 各フェーズごとにドキュメントを作成することで項⽬漏れ/⼿戻りのない

    レビューが可能 • 開発者の声: • 設計漏れが起こらなかった、スムーズなレビューと運⽤引き渡しが可能 pProduction Ready のアプローチはサービス/チームによって違う pProduction Ready を導⼊してみてください Conclusion