Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
サービスパフォーマンス改善セッション ( Datadog Event 2026/02/10 )
Search
bell033
February 13, 2026
Technology
0
12
サービスパフォーマンス改善セッション ( Datadog Event 2026/02/10 )
bell033
February 13, 2026
Tweet
Share
More Decks by bell033
See All by bell033
7,000万ユーザーの信頼を守る「TimeTree」のオブザーバビリティ実践 ( Datadog Live Tokyo )
bell033
1
160
Other Decks in Technology
See All in Technology
非同期・イベント駆動処理の分散トレーシングの繋げ方
ichikawaken
1
160
BFCacheを活用して無限スクロールのUX を改善した話
apple_yagi
0
130
Blue/Green Deployment を用いた PostgreSQL のメジャーバージョンアップ
kkato1
0
160
Why we keep our community?
kawaguti
PRO
0
330
【Oracle Cloud ウェビナー】データ主権はクラウドで守れるのか?NTTデータ様のOracle Alloyで実現するソブリン対応クラウドの最適解
oracle4engineer
PRO
3
120
Bref でサービスを運用している話
sgash708
0
200
昔話で振り返るAWSの歩み ~S3誕生から20年、クラウドはどう進化したのか~
nrinetcom
PRO
0
110
GitHub Copilot CLI で Azure Portal to Bicep
tsubakimoto_s
0
280
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
5
1.2k
Embeddings : Symfony AI en pratique
lyrixx
0
380
タスク管理も1on1も、もう「管理」じゃない - KiroとBedrock AgentCoreで変わった“判断の仕事”
yusukeshimizu
0
140
AI時代のIssue駆動開発のススメ
moongift
PRO
0
280
Featured
See All Featured
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.4k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
200
WCS-LA-2024
lcolladotor
0
500
Designing for Timeless Needs
cassininazir
0
170
Embracing the Ebb and Flow
colly
88
5k
Building a Scalable Design System with Sketch
lauravandoore
463
34k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.5k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
360
30k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
260
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
500
Facilitating Awesome Meetings
lara
57
6.8k
BBQ
matthewcrist
89
10k
Transcript
サービスパフォーマンス改善セッション — 改善サイクルとチーム横断での意思決定をどう実装するのか — 01 TimeTree 2026/02/10(Tue.) Datadog Event
02 TimeTree 本名 : 小笹 彰太 ( Shota Ozasa )
ニックネーム : Bell ⾃⼰紹介 株式会社 TimeTree 技術本部 SREチーム エンジニア 趣味: お酒の飲み比べ、アニメ鑑賞
03 TimeTree Agenda 1. TimeTree の SRE 2. TimeTree の
定点観測 3. TimeTree の 改善サイクル 4. まとめ
1 TimeTree と SRE 04 TimeTree
05 TimeTree TimeTree とは? 予定の「共有」「可視化」と そこで生まれる「コミュニケーション」 によって、予定管理を誰にとっても 当たり前で簡単なものにします。 数あるサービスの中で、 パーソナル
× 共有を軸に 価値提供しているプロダクトです。 05
06 TimeTree 新しくつくられた予定、変更された予定は、 TimeTreeがあなたに代わって相手に素早くお知らせ します。 大切な予定を忘れることも、言った言わないのすれ ちがいも起きません。 TimeTree TimeTree 共有カレンダー
TimeTreeを使ってだれでも気軽にイベント情報を発 信することもできます。 見逃してほしくない大事な予定情報を発信するオ フィシャルサイトが簡単につくれます。 公開カレンダー
07 TimeTree Google Cloud ・Cloud Run ・Cloud Spanner ・Memorystore AWS
・Lambda ・CloudFront ・S3 技術スタック ( ⼀部抜粋 ) Ruby on Rails バックエンドアプリケーション GitHub Actions CI / CD インフラ構成 Terraform IaC
08 TimeTree Observability の構成 ( 概略図 ) Run ( BE
Service ) Run ( AI Service ) Engineer APM Dashboard Google Cloud App Container DD Agent App Container DD Agent Spanner CDN Integration Slack Alert
09 TimeTree チーム体制 共有カレンダー事業部 iOS, Android, Web, Backend 公開カレンダー事業部 iOS,
Android, Web, Backend ・各事業部に SRE 担当が Join ・定点観測会も 事業部 / チーム ごとで開催 SRE チーム ※ この他にも Ads / Data 事業部 などもあります Join Join
2 TimeTree の定点観測 010 TimeTree
011 TimeTree 共有カレンダー事業部 iOS, Android, Web, Backend 公開カレンダー事業部 iOS, Android,
Web, Backend ・各事業部に SRE 担当が Join ・定点観測会も 事業部 / チーム ごとで開催 SRE チーム ※ この他にも Ads / Data 事業部 などもあります Join Join 週1で実施 週1で実施 2軸の定点観測と参加者
012 TimeTree SRE チーム内での定点観測 Push 通知施策の 負荷の結果は... 共有カレンダー 担当 SRE
公開カレンダー 担当 SRE 参考にします。 Ads 担当 SRE Data 担当 SRE etc... このエラーについては... 例 : Dashboard を⾒ながら 各事業部の施策や 過去の対応などの 情報を交換できる 個々の SRE だけでは 気づきにくいような、 SRE 全員で⾒た時の 気づきを、お互いに 共有できる
013 TimeTree 事業部チーム内 ( SRE × BE ) での定点観測 xx
のレイテンシーが良く なっていますが... 共有カレンダー 担当 SRE 共有カレンダー 担当 BE ライブラリのアップデート がありました。 他メンバー 来週 xx 機能がリリース 予定なので... 例 : Dashboard を⾒ながら 今週のリリース内容の 解像度⾼め、 その影響を追いやすく なる 来週のリリース内容の 解像度⾼め、 状況に応じてインフラ の備えがしやすくなる
014 TimeTree SRE × BE での定点観測を⾏うメリットと 効率化の⼯夫 インフラ整備や負荷対策などお互いの相談の場にもなる ( メリット
) API レイテンシー先週⽐を降順で確認できるようにしておく ( ⼯夫 ) コード改修によるパフォーマンスへの影響を お互いに把握することができる ( メリット )
015 TimeTree コード改修によるパフォーマンスへの影響を お互いに把握することができる ( メリット ) インフラ整備や負荷対策などお互いの相談の場にもなる ( メリット
) API レイテンシー先週⽐を降順で確認できるようにしておく ( ⼯夫 ) SRE × BE での定点観測を⾏うメリットと 効率化の⼯夫
016 TimeTree コード改修によるパフォーマンスへの影響を お互いに把握することができる ( メリット ) インフラ整備や負荷対策などお互いの相談の場にもなる ( メリット
) API レイテンシー先週⽐を降順で確認できるようにしておく ( ⼯夫 ) SRE × BE での定点観測を⾏うメリットと 効率化の⼯夫
3 TimeTree の改善サイクル 017 TimeTree
018 TimeTree 改善タスクの検知パターンの例 (1) 週次の定点観測での発覚 ユーザーからの問い合わせ Slack へのアラート通知 SRE チームによる
メトリクス確認 & 各チームへの 確認・共有 修正・改善タスク
019 TimeTree 改善タスクの検知パターンの例 (2) 週次の定点観測での発覚 ユーザーからの問い合わせ Slack へのアラート通知 Zendesk SNS
( X など )
020 TimeTree 改善タスクの検知パターンの例 (3) 週次の定点観測での発覚 ユーザーからの問い合わせ Slack へのアラート通知 Sentry Cloud
Monitoring Alert Datadog Monitor Slack
021 TimeTree 改善タスクの両⽴ 改善タスク 施策に基づく開発タスク 2割 8割 スクラム開発 1 スプリントの内訳
スクラム開発を採⽤している 事業部によっては、スプリントの中で⼀定割合を 改善タスクにリソースを充てている
4 まとめ 022 TimeTree
023 TimeTree 定点観測の運⽤ • SRE 内だけでなく、 事業部 ( BE ×
SRE ) でも定点観測を毎週 実施する • これにより、チーム間 の温度差や情報ギャッ プが減る まとめ 改善の判断基準 • コード改修後は、API レイテンシーやスロー クエリ、リクエスト数 など、TimeTree の サービス特性的には 先週比で見ることも大 切 改善タスクの両⽴ • 改善タスクが発生する キッカケは様々で、 日常的に発生する • 仕組みとしてスクラム開 発の中に、改善タスクの ためのリソース 2 割を 意識的に確保することが 大切
024 TimeTree サンプリングの塩梅 Bits AI の活⽤ ここ最近の課題とやりたいこと • サービスが拡大すると、当然 Trace
や Span が膨らむ • 細かくサンプリングが設定できる が故に、最適解を模索中 • 少数のエンジニアでも、より効率的 な SRE 業務を目指したい • 特にコストと見合う使い方を模索中 もしよければ、このあとのネットワーキングで ユースケースが聞けたらいいなと思っています!
Thank you! Shota Ozasa SRE, TimeTree, Inc.
[email protected]
025 TimeTree