Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
サービスパフォーマンス改善セッション ( Datadog Event 2026/02/10 )
Search
bell033
February 13, 2026
Technology
0
8
サービスパフォーマンス改善セッション ( Datadog Event 2026/02/10 )
bell033
February 13, 2026
Tweet
Share
More Decks by bell033
See All by bell033
7,000万ユーザーの信頼を守る「TimeTree」のオブザーバビリティ実践 ( Datadog Live Tokyo )
bell033
1
160
Other Decks in Technology
See All in Technology
JAWS DAYS 2026 CDP道場 事前説明会 / JAWS DAYS 2026 CDP Dojo briefing document
naospon
0
200
楽しく学ぼう!コミュニティ入門 AWSと人が つむいできたストーリー
hiroramos4
PRO
1
160
クラウド時代における一時権限取得
krrrr38
1
170
AIエージェント・エコノミーの幕開け 〜 オープンプロトコルが変えるビジネスの未来 〜
shukob
0
110
【SLO】"多様な期待値" と向き合ってみた
z63d
2
310
製造業ドメインにおける LLMプロダクト構築: 複雑な文脈へのアプローチ
caddi_eng
1
520
事例に見るスマートファクトリーへの道筋〜工場データをAI Readyにする実践ステップ〜
hamadakoji
0
220
越境する組織づくり ─ 多様性を前提にしたチームビルディングとリードの実践知
kido_engineer
2
140
Claude Code Skills 勉強会 (DevelersIO向けに調整済み) / claude code skills for devio
masahirokawahara
0
280
オンプレとGoogle Cloudを安全に繋ぐための、セキュア通信の勘所
waiwai2111
3
1.1k
マルチアカウント環境でSecurity Hubの運用!導入の苦労とポイント / JAWS DAYS 2026
genda
0
110
タスク管理も1on1も、もう「管理」じゃない ― KiroとBedrock AgentCoreで変わった"判断の仕事"
yusukeshimizu
5
1.9k
Featured
See All Featured
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
130
Building Applications with DynamoDB
mza
96
6.9k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
200
From π to Pie charts
rasagy
0
150
The Cult of Friendly URLs
andyhume
79
6.8k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.1k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.9k
ラッコキーワード サービス紹介資料
rakko
1
2.6M
4 Signs Your Business is Dying
shpigford
187
22k
The Pragmatic Product Professional
lauravandoore
37
7.2k
Ruling the World: When Life Gets Gamed
codingconduct
0
160
Transcript
サービスパフォーマンス改善セッション — 改善サイクルとチーム横断での意思決定をどう実装するのか — 01 TimeTree 2026/02/10(Tue.) Datadog Event
02 TimeTree 本名 : 小笹 彰太 ( Shota Ozasa )
ニックネーム : Bell ⾃⼰紹介 株式会社 TimeTree 技術本部 SREチーム エンジニア 趣味: お酒の飲み比べ、アニメ鑑賞
03 TimeTree Agenda 1. TimeTree の SRE 2. TimeTree の
定点観測 3. TimeTree の 改善サイクル 4. まとめ
1 TimeTree と SRE 04 TimeTree
05 TimeTree TimeTree とは? 予定の「共有」「可視化」と そこで生まれる「コミュニケーション」 によって、予定管理を誰にとっても 当たり前で簡単なものにします。 数あるサービスの中で、 パーソナル
× 共有を軸に 価値提供しているプロダクトです。 05
06 TimeTree 新しくつくられた予定、変更された予定は、 TimeTreeがあなたに代わって相手に素早くお知らせ します。 大切な予定を忘れることも、言った言わないのすれ ちがいも起きません。 TimeTree TimeTree 共有カレンダー
TimeTreeを使ってだれでも気軽にイベント情報を発 信することもできます。 見逃してほしくない大事な予定情報を発信するオ フィシャルサイトが簡単につくれます。 公開カレンダー
07 TimeTree Google Cloud ・Cloud Run ・Cloud Spanner ・Memorystore AWS
・Lambda ・CloudFront ・S3 技術スタック ( ⼀部抜粋 ) Ruby on Rails バックエンドアプリケーション GitHub Actions CI / CD インフラ構成 Terraform IaC
08 TimeTree Observability の構成 ( 概略図 ) Run ( BE
Service ) Run ( AI Service ) Engineer APM Dashboard Google Cloud App Container DD Agent App Container DD Agent Spanner CDN Integration Slack Alert
09 TimeTree チーム体制 共有カレンダー事業部 iOS, Android, Web, Backend 公開カレンダー事業部 iOS,
Android, Web, Backend ・各事業部に SRE 担当が Join ・定点観測会も 事業部 / チーム ごとで開催 SRE チーム ※ この他にも Ads / Data 事業部 などもあります Join Join
2 TimeTree の定点観測 010 TimeTree
011 TimeTree 共有カレンダー事業部 iOS, Android, Web, Backend 公開カレンダー事業部 iOS, Android,
Web, Backend ・各事業部に SRE 担当が Join ・定点観測会も 事業部 / チーム ごとで開催 SRE チーム ※ この他にも Ads / Data 事業部 などもあります Join Join 週1で実施 週1で実施 2軸の定点観測と参加者
012 TimeTree SRE チーム内での定点観測 Push 通知施策の 負荷の結果は... 共有カレンダー 担当 SRE
公開カレンダー 担当 SRE 参考にします。 Ads 担当 SRE Data 担当 SRE etc... このエラーについては... 例 : Dashboard を⾒ながら 各事業部の施策や 過去の対応などの 情報を交換できる 個々の SRE だけでは 気づきにくいような、 SRE 全員で⾒た時の 気づきを、お互いに 共有できる
013 TimeTree 事業部チーム内 ( SRE × BE ) での定点観測 xx
のレイテンシーが良く なっていますが... 共有カレンダー 担当 SRE 共有カレンダー 担当 BE ライブラリのアップデート がありました。 他メンバー 来週 xx 機能がリリース 予定なので... 例 : Dashboard を⾒ながら 今週のリリース内容の 解像度⾼め、 その影響を追いやすく なる 来週のリリース内容の 解像度⾼め、 状況に応じてインフラ の備えがしやすくなる
014 TimeTree SRE × BE での定点観測を⾏うメリットと 効率化の⼯夫 インフラ整備や負荷対策などお互いの相談の場にもなる ( メリット
) API レイテンシー先週⽐を降順で確認できるようにしておく ( ⼯夫 ) コード改修によるパフォーマンスへの影響を お互いに把握することができる ( メリット )
015 TimeTree コード改修によるパフォーマンスへの影響を お互いに把握することができる ( メリット ) インフラ整備や負荷対策などお互いの相談の場にもなる ( メリット
) API レイテンシー先週⽐を降順で確認できるようにしておく ( ⼯夫 ) SRE × BE での定点観測を⾏うメリットと 効率化の⼯夫
016 TimeTree コード改修によるパフォーマンスへの影響を お互いに把握することができる ( メリット ) インフラ整備や負荷対策などお互いの相談の場にもなる ( メリット
) API レイテンシー先週⽐を降順で確認できるようにしておく ( ⼯夫 ) SRE × BE での定点観測を⾏うメリットと 効率化の⼯夫
3 TimeTree の改善サイクル 017 TimeTree
018 TimeTree 改善タスクの検知パターンの例 (1) 週次の定点観測での発覚 ユーザーからの問い合わせ Slack へのアラート通知 SRE チームによる
メトリクス確認 & 各チームへの 確認・共有 修正・改善タスク
019 TimeTree 改善タスクの検知パターンの例 (2) 週次の定点観測での発覚 ユーザーからの問い合わせ Slack へのアラート通知 Zendesk SNS
( X など )
020 TimeTree 改善タスクの検知パターンの例 (3) 週次の定点観測での発覚 ユーザーからの問い合わせ Slack へのアラート通知 Sentry Cloud
Monitoring Alert Datadog Monitor Slack
021 TimeTree 改善タスクの両⽴ 改善タスク 施策に基づく開発タスク 2割 8割 スクラム開発 1 スプリントの内訳
スクラム開発を採⽤している 事業部によっては、スプリントの中で⼀定割合を 改善タスクにリソースを充てている
4 まとめ 022 TimeTree
023 TimeTree 定点観測の運⽤ • SRE 内だけでなく、 事業部 ( BE ×
SRE ) でも定点観測を毎週 実施する • これにより、チーム間 の温度差や情報ギャッ プが減る まとめ 改善の判断基準 • コード改修後は、API レイテンシーやスロー クエリ、リクエスト数 など、TimeTree の サービス特性的には 先週比で見ることも大 切 改善タスクの両⽴ • 改善タスクが発生する キッカケは様々で、 日常的に発生する • 仕組みとしてスクラム開 発の中に、改善タスクの ためのリソース 2 割を 意識的に確保することが 大切
024 TimeTree サンプリングの塩梅 Bits AI の活⽤ ここ最近の課題とやりたいこと • サービスが拡大すると、当然 Trace
や Span が膨らむ • 細かくサンプリングが設定できる が故に、最適解を模索中 • 少数のエンジニアでも、より効率的 な SRE 業務を目指したい • 特にコストと見合う使い方を模索中 もしよければ、このあとのネットワーキングで ユースケースが聞けたらいいなと思っています!
Thank you! Shota Ozasa SRE, TimeTree, Inc.
[email protected]
025 TimeTree