Upgrade to Pro — share decks privately, control downloads, hide ads and more …

BEから未経験でSREへ_オンボーディングとトイル改善の記録.pptx.pdf

Avatar for tomita_kazuki tomita_kazuki
February 15, 2026
840

 BEから未経験でSREへ_オンボーディングとトイル改善の記録.pptx.pdf

Avatar for tomita_kazuki

tomita_kazuki

February 15, 2026
Tweet

Transcript

  1. 5
 自己紹介 富田和喜 (@Cooking_ENG) • 2025年9月 ファインディに入社 • 元和食料理人 •

    BEから未経験でSREに挑戦中 • SLO振り返り会のモデレータやトイルの 削減を担当 • キャンプ/ゴルフ/料理 ファインディ株式会社/CTO室 Platform開発/SRE
  2. 8
 BEからSREを目指した背景 当時、私はアプリケーション開発に集中して取り組んでいましたが、その裏で CTO は以下の ような対応を行っていました。 • 新サービスの環境構築 • GitHub

    Actions を使ったデプロイ設定 • ブランチ運用ルールの作成 • Stg環境へのデプロイフローの改善 • mainブランチへの直接 push の制限 etc.. 自らもアプリケーションの実装を進めながら、並行してこのような開発環境の整備にも取り 組んでいました。 

  3. 1 半年間でやってきたこと • SLO振り返り会の資料作成、モデレータ • DataDogのダッシュボード/アラートの設定 ◦ Terraformで実装 • AWSでの新環境構築

    ◦ ファインディでは汎用モジュールを使っ て構築 • GitHubActionsを使ったECSコンテナ Scale機能 実装 ◦ トイルの削減 • Amazon RDSのReserved Instanceの購入 ◦ コスト削減 他にも... • LP公開のためDNSにAレコードを追加 • レコード追加作業をDevinで自動化 • 監査対応のスナップショットバックアップ・ リストアの実行                  etc… SREは細かいものも対応しています。
  4. 1 半年間でやってきたこと • SLO振り返り会の資料作成、モデレータ • DataDogのダッシュボード/アラートの設定 ◦ Terraformで実装 • AWSでの新環境構築

    ◦ ファインディでは汎用モジュールを使っ て構築 • GitHubActionsを使ったECSコンテナ Scale機 能実装 ◦ トイルの削減 • Amazon RDSのReserved Instanceの購入 ◦ コスト削減 他にも... • LP公開のためDNSにAレコードを追加 • レコード追加作業をDevinで自動化 • 監査対応のスナップショットバックアップ・ リストアの実行                  etc… SREは細かいものも対応しています。

  5. 2 トイル削減 Findy Conferenceは、ファインディのサービスの中でも瞬間的なトラ フィックが多いサービスとなっています。 【瞬間的なトラフィックが多くなる原因】 • セッション終了直後、次の配信視聴のために参 加者が一斉に行動 •

    チャンネル切り替えを目的に、ポータルサイト へのアクセスが短時間に集中(オンライン) ※ 実際にCPUの負荷が上が 、スパイクが起こったDataDogのメトリクスの画像
  6. 2 トイル削減 この瞬間的なトラフィックに対応するため... • 事前にコンテナ数を調整が必要 • そのために本番環境のAWS マネージドコンソールで作業 • 本番環境での作業のためペアオペは必須(2人分の工数が取られる)

    • Findy Conferenceに関係する複数環境の調整により、約1~2時間弱かかる カンファレンス開催のたび毎回この作業が生まれる... 完全にトイルです!!!!!!!!!!!! 毎回2時間近く時間を取られていたら他のタスク進まないですね... ヒューマンエラーも怖いし...