Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
プロダクト成長を支える開発基盤とスケールに伴う課題
Search
yuu26
February 03, 2026
Technology
1.5k
4
Share
プロダクト成長を支える開発基盤とスケールに伴う課題
yuu26
February 03, 2026
More Decks by yuu26
See All by yuu26
LLM 機能を支える Langfuse / ClickHouse のサーバレス化
yuu26
9
5.4k
Datadog 関数クイズ (初級編)
yuu26
0
150
バクラクにおける可観測性向上の取り組み
yuu26
4
2.3k
AWS アーキテクチャクイズ
yuu26
3
1.5k
EMになって半年でやったこと
yuu26
1
3.1k
ローカル開発環境をAWSへ移行して爆速にした
yuu26
15
11k
AWS Systems Manager で実現する SSH レスでセキュアなクラウド運用
yuu26
2
4.9k
Other Decks in Technology
See All in Technology
QGISプラグイン CMChangeDetector
naokimuroki
1
400
[OAWTT26][THR1028] Oracle AI Database 26ai へのアップグレード:ベストプラクティスと最新情報
oracle4engineer
PRO
1
110
ネットワーク運用を楽にするAWS DevOps Agent活用法!! / 20260421 Masaki Okuda
shift_evolve
PRO
2
210
ARIA Notifyについて
ryokatsuse
1
120
実践ハーネスエンジニアリング:TAKTで実現するAIエージェント制御 / Practical Harness Engineering: AI Agent Control Enabled by TAKT
nrslib
11
4.6k
目的ファーストのハーネス設計 ~ハーネスの変更容易性を高めるための優先順位~
gotalab555
8
2.2k
コードや知識を組み込む / Incorporate Code and Knowledge
ks91
PRO
0
150
ワールドカフェI /チューターを改良する / World Café I and Improving the Tutors
ks91
PRO
0
320
サイボウズ 開発本部採用ピッチ / Cybozu Engineer Recruit
cybozuinsideout
PRO
10
78k
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.4k
AgentCore×VPCでの設計パターンn選と勘所
har1101
3
280
AWS認定資格は本当に意味があるのか?
nrinetcom
PRO
2
270
Featured
See All Featured
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.8k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
320
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
210
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
360
30k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
GitHub's CSS Performance
jonrohan
1032
470k
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
730
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.8k
Prompt Engineering for Job Search
mfonobong
0
270
Transcript
プロダクト成長を支える開発基盤と スケールに伴う課題 2026-02-03 "しくじり"から学ぶ!急成⻑プロダクト「バクラク」 「Bill One」の裏側~技術編~
自己紹介 自己紹介 上原 佑介 インフラエンジニア → SRE 株式会社LayerX バクラク事業部 Platform
Engineering部 SREグループ AWS, Datadog, Terraform あたりをよく触る 趣味 旅行、飛行機 ゲームいろいろ © LayerX Inc. 2
今日話すこと © LayerX Inc. 今日話すこと プロダクト成長を支える開発基盤の仕組み 自動化が産んだスケールに伴う課題 (しくじり) 改善に向けた現在の取り組み AI
時代に向けた直近の対応 3
バクラクについて
バクラクについて © LayerX Inc. 5
バクラクの開発を支えるプラットフォーム © LayerX Inc. バクラクについて バクラクには layerone と呼ばれる開発プラットフォームがある サービス定義ファイルを軸とした自動生成の仕組みを持つ 基盤チームや
SRE に依存しないセルフサービス化 例: auth ドメインの token サービスを作る場合 サービス定義ファイルに以下の記述をする インフラ、アプリケーションコードのテンプレ、CI/CD、監視設定が自動生成される 6
バクラクの開発を支えるプラットフォーム バクラクについて Universal Binary によるコンテナイメージ集約 多くのマイクロサービスが含まれるシングルバイナリ 環境変数やコマンド引数で起動したいサービスを指定 ビルドの高速化とイメージ管理コストを削減 ローカル環境および本番環境で運用中 マイクロサービスは月に3つほど増加、現在120サービス超
9 プロダクトを SRE チーム 5 人で横断的に見れる状態に © LayerX Inc. 7
プロダクト成長に伴う課題
リリース作業における課題 © LayerX Inc. プロダクト成長に伴う課題 プロダクト特性もあり、定期的な機能リリースタイミングを設けている 100以上のサービスが短時間にデプロイされる 1サービス = 1
ECS Service の単位 GitHub Actions レートリミット AWS ECS API のスロットリングによる失敗 依存関係によるデプロイ順待ちも発生 定期リリースに数時間以上かかる状態に 9
運用面の課題 © LayerX Inc. プロダクト成長に伴う課題 リソースの上限や制約により自動生成に失敗 ALB ターゲットグループのアタッチ上限 100 共通リソースにおけるアクセスポリシーの文字数上限突破
監視設定・ユーザの拡大に伴うアラート発報増加 自動生成も含めて 3,000 件以上のアラートが存在 サービス特性に沿った監視の最適化が追いつかない ユーザ操作に伴うエラーログの流量増加 初期は機能していた仕組みがスケールに伴い合わなくなってきた 10
解決に向けた取り組み
デプロイ周りの改善 (着手中) © LayerX Inc. 解決に向けた取り組み 依存関係のないサービスを独立デプロイ可能に 一部サービスから始めて拡大中 定期リリースを待たずに出せる分は出す お客様への価値提供の高速化にもつながる
デプロイ単位の集約 1マイクロサービス = 1 ECS Service の形にこだわらない ドメイン単位やプロダクト単位でのデプロイ集約を検討 Universal Binary や ECS Managed Instance を活用したインフラ集約 デプロイ待ち・レートリミット等のリソース制約を回避 12
アラート増加への対応 (検討中) © LayerX Inc. 解決に向けた取り組み リソース使用率ではなくユーザ影響を軸にした監視へ移行 一律で自動生成するメトリクス監視をやめる 重要エンドポイントやリクエスト成功率・レイテンシに着目する ログ出力に関するポリシー決め
Datadog Error Tracking などの活用 緊急度に応じた Critical / Error / Warn などの使い分けを統一 必要なログのみを出力・監視することで、費用と運用コストを最適化 これまでの仕組みを一から見直し、監視ポリシーを再設計 13
今後の進化を支えるために
AI/LLM を組み込んだ機能開発が増加 © LayerX Inc. 今後の進化を支えるために 2025年7月に AI 申請レビュー 機能をリリース
申請作成時に LLM が内容をリアルタイムでレビュー 15
AI 時代のプロダクト開発を支える基盤 © LayerX Inc. 今後の進化を支えるために Temporal Workflow 分散ワークフローエンジンの Temporal
を導入 非同期処理の呼び出し、ロングタスクをプロダクトに組み込みやすく Langfuse LLM 機能の開発や検証を支える基盤として構築 LLM 実行結果のトレース、モデルごとの精度検証・比較などで活用されている 既存基盤の改善を行いつつ、今後に向けた取り組みも同時に進行中 16
さいごに
まとめ © LayerX Inc. まとめ 初期は機能していた仕組みが、スケールに伴い一部ボトルネックに 自動生成の仕組みを軸とした開発プラットフォーム リソースの上限制約や運用面の課題に直面 定期リリースに数時間かかる状態 さらなるスケールに備えた再設計のタイミングが来た
サービス数の増加に伴うリソース集約 デプロイサイクルやアラート基準の見直し 同時に、プロダクトの進化を止めないための対応 AI/LLM による非同期処理や可視化要求への備え 18
エンジニア積極採用中! We are hiring! SRE を含めた幅広い職種で募集中です! やれること・やりたいことが沢山あります 0→1、1→10 などフェーズの異なるプロダクトに関われます Open
Door 募集中 30分のカジュアル面談をどなたでも申し込めます LayerX や SRE について気になることがあればお気軽に! © LayerX Inc. 19