Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
BEから未経験でSREへ_オンボーディングとトイル改善の記録.pptx.pdf
Search
tomita_kazuki
February 15, 2026
0
1.1k
BEから未経験でSREへ_オンボーディングとトイル改善の記録.pptx.pdf
tomita_kazuki
February 15, 2026
Tweet
Share
More Decks by tomita_kazuki
See All by tomita_kazuki
SREを目指すあなたへ ~今から準備できること~
tmtkzk0823
0
1.1k
Featured
See All Featured
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.8k
Embracing the Ebb and Flow
colly
88
5k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
91
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
500
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
0
250
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
What does AI have to do with Human Rights?
axbom
PRO
1
2.1k
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
150
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.3k
Site-Speed That Sticks
csswizardry
13
1.1k
Transcript
BEから未経験でSREへ オンボーディングとトイル改善の記録 Findyのサービスを支える、横断SREチームのマネジメントと技術の挑戦 2026/2/9 ファインディ(株) / CTO室 プラットフォーム 開発チーム/SRE 富田
和喜(@Cooking_ENG)
アジェンダ • 自己紹介 • BEからSREにキャリアチェンジを目指した背景 • 半年間でやってきたこと • SLO振り返り会 •
トイル削減 • まとめ
3
アジェンダ • 自己紹介 • BEからSREにキャリアチェンジを目指した背景 • 半年間でやってきたこと • SLO振り返り会 •
トイル削減 • まとめ
5 自己紹介 富田和喜 (@Cooking_ENG) • 2025年9月 ファインディに入社 • 元和食料理人 •
BEから未経験でSREに挑戦中 • SLO振り返り会のモデレータやトイルの 削減を担当 • キャンプ/ゴルフ/料理 ファインディ株式会社/CTO室 Platform開発/SRE
アジェンダ • 自己紹介 • BEからSREにキャリアチェンジを目指した背景 • 半年間でやってきたこと • SLO振り返り会 •
トイルを削減 • まとめ
7 BEからSREを目指した背景 経歴 教育系スタートアップの自社アプリケーションの開発 (2年半) • 4ヶ月に4つ新サービスをリリースするプロジェクトに配属 • 1つのプロジェクトのリリース頻度はすべて約1ヶ月
• スピードが求められる環境 • 開発チーム体制 ◦ CTO ◦ エンジニア 2人 ◦ デザイナー1人
8 BEからSREを目指した背景 当時、私はアプリケーション開発に集中して取り組んでいましたが、その裏で CTO は以下の ような対応を行っていました。 • 新サービスの環境構築 • GitHub
Actions を使ったデプロイ設定 • ブランチ運用ルールの作成 • Stg環境へのデプロイフローの改善 • mainブランチへの直接 push の制限 etc.. 自らもアプリケーションの実装を進めながら、並行してこのような開発環境の整備にも取り 組んでいました。
9 BEからSREを目指した背景 この開発経験とCTOの姿勢をみて... • アプリ開発にとどまらず、開発環 境そのものを整備 したい • エンジニアが開発しやすい環境を 整えたい
⇩ ⇩ ⇩ SREへ転向を決意
アジェンダ • 自己紹介 • BEからSREにキャリアチェンジを目指した背景 • 半年間でやってきたこと • SLO振り返り会 •
トイルを削減した話 • まとめ
1 半年間でやってきたこと • SLO振り返り会の資料作成、モデレータ • DataDogのダッシュボード/アラートの設定 ◦ Terraformで実装 • AWSでの新環境構築
◦ ファインディでは汎用モジュールを使っ て構築 • GitHubActionsを使ったECSコンテナ Scale機能 実装 ◦ トイルの削減 • Amazon RDSのReserved Instanceの購入 ◦ コスト削減 他にも... • LP公開のためDNSにAレコードを追加 • レコード追加作業をDevinで自動化 • 監査対応のスナップショットバックアップ・ リストアの実行 etc… SREは細かいものも対応しています。
1 半年間でやってきたこと • SLO振り返り会の資料作成、モデレータ • DataDogのダッシュボード/アラートの設定 ◦ Terraformで実装 • AWSでの新環境構築
◦ ファインディでは汎用モジュールを使っ て構築 • GitHubActionsを使ったECSコンテナ Scale機 能実装 ◦ トイルの削減 • Amazon RDSのReserved Instanceの購入 ◦ コスト削減 他にも... • LP公開のためDNSにAレコードを追加 • レコード追加作業をDevinで自動化 • 監査対応のスナップショットバックアップ・ リストアの実行 etc… SREは細かいものも対応しています。
アジェンダ • 自己紹介 • BEからSREにキャリアチェンジを目指した背景 • 半年間でやってきたこと • SLO振り返り会 •
トイルを削減した話 • まとめ
1 SLO振り返り会 PlatformSREと各プロダクトのエンジニアで隔週、DataDog、Grafanaを見ながら、現在のアプリ ケーションの状態を確認する定点観測会
1 SLO振り返り会 議事録はDataDog情報をGeminiで 解析して作成 ※ 現在はプロンプトの調整で、議事録を作成しています が、DataDog MCPがGAされれば完全自動化も!!!
1 SLO振り返り会 SLO振り返り会のモデレータをするメリット
アジェンダ • 自己紹介 • BEからSREにキャリアチェンジを目指した背景 • 半年間でやってきたこと • SLO振り返り会 •
トイル削減 • まとめ
1 トイル削減
1 トイル削減 実際にファインディのサービスの1つである【Findy Conference】の運 用で発生したトイルの削減をした事例を紹介します。
2 トイル削減 Findy Conferenceは、ファインディのサービスの中でも瞬間的なトラ フィックが多いサービスとなっています。 【瞬間的なトラフィックが多くなる原因】 • セッション終了直後、次の配信視聴のために参 加者が一斉に行動 •
チャンネル切り替えを目的に、ポータルサイト へのアクセスが短時間に集中(オンライン) ※ 実際にCPUの負荷が上が 、スパイクが起こったDataDogのメトリクスの画像
2 トイル削減 この瞬間的なトラフィックに対応するため... • 事前にコンテナ数を調整が必要 • そのために本番環境のAWS マネージドコンソールで作業 • 本番環境での作業のためペアオペは必須(2人分の工数が取られる)
• Findy Conferenceに関係する複数環境の調整により、約1~2時間弱かかる カンファレンス開催のたび毎回この作業が生まれる...
2 トイル削減 この瞬間的なトラフィックに対応するため... • 事前にコンテナ数を調整が必要 • そのために本番環境のAWS マネージドコンソールで作業 • 本番環境での作業のためペアオペは必須(2人分の工数が取られる)
• Findy Conferenceに関係する複数環境の調整により、約1~2時間弱かかる カンファレンス開催のたび毎回この作業が生まれる... 完全にトイルです!!!!!!!!!!!! 毎回2時間近く時間を取られていたら他のタスク進まないですね... ヒューマンエラーも怖いし...
2 トイル削減 この瞬間的なトラフィックに対応するため... • 事前にコンテナ数を調整が必要 • そのために本番環境のAWS マネージドコンソールで作業 • 本番環境での作業のためペアオペは必須(2人分の工数が取られる)
• Findy Conferenceに関係する複数環境の調整により、約1~2時間弱かかる カンファレンス開催のたび毎回この作業が生まれる...
2 トイル削減 このトイルを削減するため、GitHubActions workflow_dispatchと AWS CLIを使ってGitHub上からコンテナ数の変更可能に。 ※ フロントエンド、バックエンド両方の環境をこの画面1つで完了
2 トイル削減 GitHubActions上からコンテナの調整ができるようにしたことで... • 約2時間かかっていた作業が大幅に短縮🎉 • 本番環境のAWSマネージドコンソールに入ることもなくなったので ヒューマンエラーの心配も解消🎉
• SRE以外のエンジニアもコンテナ数の調整が可能に🎉
2 トイル削減 コンテナを使っているのであれば、オートスケールがあるのでは...?
2 トイル削減 コンテナを使っているのであれば、オートスケールがあるのでは...?
アジェンダ • 自己紹介 • BEからSREにキャリアチェンジを目指した背景 • 半年間でやってきたこと • SLO振り返り会 •
トイル削減 • まとめ
2 まとめ BEからSREに転身し、トイル削減などできることから挑戦してきました。 しかし、チームとしてはまだまだやりたいことが山積みです! ご興味のある方は、ぜひこの後の懇親会でお話しましょう!
ご清聴ありがとうございました!