Upgrade to Pro — share decks privately, control downloads, hide ads and more …

heyにおけるSREの大切さ~マルチプロダクト運用の「楽しさ」と「難しさ」および今後の展望~

 heyにおけるSREの大切さ~マルチプロダクト運用の「楽しさ」と「難しさ」および今後の展望~

SRE NEXT2022の登壇資料です。
https://sre-next.dev/2022/schedule#sp15

Ryoma Fujiwara

May 12, 2022
Tweet

More Decks by Ryoma Fujiwara

Other Decks in Programming

Transcript

  1. 自己紹介 藤原 涼馬 ヘイ株式会社 プロダクト基盤本部 SRE (他にもいろいろ) 経歴  SIer R&D

    →      → 趣味  自動車の運転  模型製作  各種寄稿・登壇 好きなAWSサービス  ECS Fargate / AWS SSO + 他 今ここ
  2. 会社概要 会社名 ヘイ株式会社 設立 2012年3月23日 代表取締役社長 佐藤裕介 資本金 1億円 所在地

    〒150-0011 東京都渋谷区東3丁目16番3号 エフ・ ニッセイ恵比寿ビル4階 事業内容 インターネットビジネスの企画・開発・ 運営
  3. 従業員数・職種比率 従業員数 350名 (2021/04 時点) エンジニア 31% セールス・ マーケ・事業開発 30%

    サポート・ サクセス 23% デザイナー 5.5% PM 2.8% コーポレート 8% エンジニア職の比率 31%
  4. 狩野モデル 充足 不充足 充足状況 満足感 一 元 的 品 質

    満足 不満 魅力的品質 当たり前品質 品質特性 • 魅力的品質 ◦ 操作していて楽しくなるユーザー体験 • 一元的品質 ◦ 業務を遂行するのに必要な機能が揃っている • 当たり前品質 ◦ システムや機能が意図した通りに動く
  5. 狩野モデルとSREの役割の関係 品質特性 • 魅力的品質 ◦ 操作していて楽しくなるユーザー体験 • 一元的品質 ◦ 業務を遂行するのに必要な機能が揃っている

    • 当たり前品質 ◦ システムや機能が意図した通りに動く リリースエンジニアリング プロダクション環境におけ るサービスの可用性、遅延 対応、変更管理、緊急対 応、容量管理
  6. もう一段読み替える 品質特性 • 魅力的品質 ◦ 操作していて楽しくなるユーザー体験 • 一元的品質 ◦ 業務を遂行するのに必要な機能が揃っている

    • 当たり前品質 ◦ システムや機能が意図した通りに動く リリースエンジニアリング プロダクション環境におけ るサービスの可用性、遅延 対応、変更管理、緊急対 応、容量管理 価値提供の支援 “魅力品質、一元的品質”実現のために リリースエンジニアリングを介して 実装された機能を滞りなくユーザーに届けられるようにする
  7. もう一段読み替える 品質特性 • 魅力的品質 ◦ 操作していて楽しくなるユーザー体験 • 一元的品質 ◦ 業務を遂行するのに必要な機能が揃っている

    • 当たり前品質 ◦ システムや機能が意図した通りに動く リリースエンジニアリング プロダクション環境におけ るサービスの可用性、遅延 対応、変更管理、緊急対 応、容量管理 価値提供の支援 “魅力品質、一元的品質”実現のために リリースエンジニアリングを介して 実装された機能を滞りなくユーザーに届けられるようにする 提供価値の維持 “当たり前品質”実現のために、アーキテクチャ設計や運用設計に 非機能的観点から関与し、安定運用の責務を担う。 提供している価値の維持を通じて機会損失の発生を防ぐ
  8. SREの活動事例(リアーキテクチャリングにおける関わり方) エンジニアリング マネジメント 時間軸 全体アーキテクチャ 把握 プロダクト固有の 制約条件確認 移行方式の 提案と設計

    移行方式の 実装とテスト 切替実施 全体スケジューリング 進捗管理 SREが本来は把握しているべき(※)だが、 プロダクト開発者に教えてもらいつつ推進
  9. SREの活動事例(リアーキテクチャリングにおける関わり方) エンジニアリング マネジメント 時間軸 全体アーキテクチャ 把握 プロダクト固有の 制約条件確認 移行方式の 提案と設計

    移行方式の 実装とテスト 切替実施 全体スケジューリング 進捗管理 プロダクト開発者の実現したいことを 確認しつつSREとして主導して推進 QAに協力してもらう範囲なども確定
  10. SREの活動事例(リアーキテクチャリングにおける関わり方) エンジニアリング マネジメント 時間軸 全体アーキテクチャ 把握 プロダクト固有の 制約条件確認 移行方式の 提案と設計

    移行方式の 実装とテスト 切替実施 全体スケジューリング 進捗管理 SRE主導で推進しつつ手が足りない部分をプロ ダクト開発者に支援してもらう
  11. SREの活動事例(リアーキテクチャリングにおける関わり方) エンジニアリング マネジメント 時間軸 全体アーキテクチャ 把握 プロダクト固有の 制約条件確認 移行方式の 提案と設計

    移行方式の 実装とテスト 切替実施 全体スケジューリング 進捗管理 プロダクト開発者とSREだけでなく PdMやQAにも助力いただきながら進める
  12. SREの活動事例(リアーキテクチャリングにおける関わり方) エンジニアリング マネジメント 時間軸 全体アーキテクチャ 把握 プロダクト固有の 制約条件確認 移行方式の 提案と設計

    移行方式の 実装とテスト 切替実施 全体スケジューリング 進捗管理 PdMやEMを中心に推進 SREからはスケジュール的な制約や、 システム面での顧客影響の情報を提供
  13. 知識の集約と活用の容易化 横断的に活用可能な知識集約と活用の容易化 • 知識の集約場所の確保 • 知識活用の容易化 • 個別プロダクトの知識を集約するための(仮想)組織の準備 • プロダクト個別の取組

    ー 固有事情 = 横断的に利用可能な知識 (レアケースだが重要なもののなどの知識が蓄積できる e.g. DBのメジャーバージョンアップに伴う停止時間の最小化など )
  14. 知識の集約と活用の容易化 横断的に活用可能な知識集約と活用の容易化 • 知識の集約場所の確保 • 知識活用の容易化 • 個別プロダクトの知識を集約するための(仮想)組織の準備 • プロダクト個別の取組

    ー 固有事情 = 横断的に利用可能な知識 (レアケースだが重要なもののなどの知識が蓄積できる e.g. DBのメジャーバージョンアップに伴う停止時間の最小化など ) • 横断的に利用可能なコードの提供 • いわゆるソフトウェアの再利用性といった大きな課題にしっかり取り組む (まずはドメイン依存の少ない部分かつ必ず必要な部分から e.g. インフラのネットワーク、ストレージ、ログ集約など)
  15. MORE INFO heyのオープンな社内報 hey note https://days.hey.jp/ Tech イベント hey connpass

    https://hey.connpass.com/ プロダクト開発の裏側を発信中 hey Product Blog https://tech.hey.jp/ heyのメディア hey MAGAZINE https://mag.hey.jp プロダクトのこと、技術のこと色々お話しましょう カジュアル面談 (Meety) https://meety.net/ heyのひとびとを伝える動画 hey People https://vimeo.com/heyinc