Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
サービスパフォーマンス改善セッション ( Datadog Event 2026/02/10 )
Search
bell033
February 13, 2026
Technology
17
0
Share
サービスパフォーマンス改善セッション ( Datadog Event 2026/02/10 )
bell033
February 13, 2026
More Decks by bell033
See All by bell033
7,000万ユーザーの信頼を守る「TimeTree」のオブザーバビリティ実践 ( Datadog Live Tokyo )
bell033
1
180
Other Decks in Technology
See All in Technology
Spring AI × MCP 入門〜AIエージェントへのツール公開、境界設計から始める最小構成 〜
yuyamiyamoto
0
200
エンジニアは生成AIと どのように向き合うべきか? ことばの意味という観点から
verypluming
3
330
ルールやカスタム機能、どう使う?理想の出力を引き出すために今知りたいIBM Bob 5つの機能
muehara
1
280
OpenID Connectによるサービス間連携
takesection
0
150
Generative UI × A2UI で AI エージェントを作った話 AI-DLC も使ってみた!
kmiya84377
1
310
脅威をエンジニアリングの糧にして:恐怖を乗り越えた先にあったもの / Turn threats into fuel for engineering: what lay beyond overcoming fear
nrslib
1
370
地元にいないローカルオーガナイザーの立ち回り
uvb_76
1
440
【Gen-AX】20260530開催_JJUG CCC 2026 Spring
genax
0
350
美味しいスイスチーズを作ろう🧀🐭
taigamikami
1
220
製造業のクラウド活用最適解〜AI,DXを加速するデータ基盤の作り方〜
hamadakoji
0
300
Claude Codeを組織で使いこなす— サーバサイドAIエージェント運用の実践知
techtekt
PRO
0
170
速さだけじゃない! VoidZero ツールが移行先に選ばれる理由
mizdra
PRO
6
730
Featured
See All Featured
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.6k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9.1k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
550
Claude Code のすすめ
schroneko
67
220k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
200
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.3k
Everyday Curiosity
cassininazir
0
220
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
22k
Speed Design
sergeychernyshev
33
1.8k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
430
エンジニアに許された特別な時間の終わり
watany
107
240k
Practical Orchestrator
shlominoach
191
11k
Transcript
サービスパフォーマンス改善セッション — 改善サイクルとチーム横断での意思決定をどう実装するのか — 01 TimeTree 2026/02/10(Tue.) Datadog Event
02 TimeTree 本名 : 小笹 彰太 ( Shota Ozasa )
ニックネーム : Bell ⾃⼰紹介 株式会社 TimeTree 技術本部 SREチーム エンジニア 趣味: お酒の飲み比べ、アニメ鑑賞
03 TimeTree Agenda 1. TimeTree の SRE 2. TimeTree の
定点観測 3. TimeTree の 改善サイクル 4. まとめ
1 TimeTree と SRE 04 TimeTree
05 TimeTree TimeTree とは? 予定の「共有」「可視化」と そこで生まれる「コミュニケーション」 によって、予定管理を誰にとっても 当たり前で簡単なものにします。 数あるサービスの中で、 パーソナル
× 共有を軸に 価値提供しているプロダクトです。 05
06 TimeTree 新しくつくられた予定、変更された予定は、 TimeTreeがあなたに代わって相手に素早くお知らせ します。 大切な予定を忘れることも、言った言わないのすれ ちがいも起きません。 TimeTree TimeTree 共有カレンダー
TimeTreeを使ってだれでも気軽にイベント情報を発 信することもできます。 見逃してほしくない大事な予定情報を発信するオ フィシャルサイトが簡単につくれます。 公開カレンダー
07 TimeTree Google Cloud ・Cloud Run ・Cloud Spanner ・Memorystore AWS
・Lambda ・CloudFront ・S3 技術スタック ( ⼀部抜粋 ) Ruby on Rails バックエンドアプリケーション GitHub Actions CI / CD インフラ構成 Terraform IaC
08 TimeTree Observability の構成 ( 概略図 ) Run ( BE
Service ) Run ( AI Service ) Engineer APM Dashboard Google Cloud App Container DD Agent App Container DD Agent Spanner CDN Integration Slack Alert
09 TimeTree チーム体制 共有カレンダー事業部 iOS, Android, Web, Backend 公開カレンダー事業部 iOS,
Android, Web, Backend ・各事業部に SRE 担当が Join ・定点観測会も 事業部 / チーム ごとで開催 SRE チーム ※ この他にも Ads / Data 事業部 などもあります Join Join
2 TimeTree の定点観測 010 TimeTree
011 TimeTree 共有カレンダー事業部 iOS, Android, Web, Backend 公開カレンダー事業部 iOS, Android,
Web, Backend ・各事業部に SRE 担当が Join ・定点観測会も 事業部 / チーム ごとで開催 SRE チーム ※ この他にも Ads / Data 事業部 などもあります Join Join 週1で実施 週1で実施 2軸の定点観測と参加者
012 TimeTree SRE チーム内での定点観測 Push 通知施策の 負荷の結果は... 共有カレンダー 担当 SRE
公開カレンダー 担当 SRE 参考にします。 Ads 担当 SRE Data 担当 SRE etc... このエラーについては... 例 : Dashboard を⾒ながら 各事業部の施策や 過去の対応などの 情報を交換できる 個々の SRE だけでは 気づきにくいような、 SRE 全員で⾒た時の 気づきを、お互いに 共有できる
013 TimeTree 事業部チーム内 ( SRE × BE ) での定点観測 xx
のレイテンシーが良く なっていますが... 共有カレンダー 担当 SRE 共有カレンダー 担当 BE ライブラリのアップデート がありました。 他メンバー 来週 xx 機能がリリース 予定なので... 例 : Dashboard を⾒ながら 今週のリリース内容の 解像度⾼め、 その影響を追いやすく なる 来週のリリース内容の 解像度⾼め、 状況に応じてインフラ の備えがしやすくなる
014 TimeTree SRE × BE での定点観測を⾏うメリットと 効率化の⼯夫 インフラ整備や負荷対策などお互いの相談の場にもなる ( メリット
) API レイテンシー先週⽐を降順で確認できるようにしておく ( ⼯夫 ) コード改修によるパフォーマンスへの影響を お互いに把握することができる ( メリット )
015 TimeTree コード改修によるパフォーマンスへの影響を お互いに把握することができる ( メリット ) インフラ整備や負荷対策などお互いの相談の場にもなる ( メリット
) API レイテンシー先週⽐を降順で確認できるようにしておく ( ⼯夫 ) SRE × BE での定点観測を⾏うメリットと 効率化の⼯夫
016 TimeTree コード改修によるパフォーマンスへの影響を お互いに把握することができる ( メリット ) インフラ整備や負荷対策などお互いの相談の場にもなる ( メリット
) API レイテンシー先週⽐を降順で確認できるようにしておく ( ⼯夫 ) SRE × BE での定点観測を⾏うメリットと 効率化の⼯夫
3 TimeTree の改善サイクル 017 TimeTree
018 TimeTree 改善タスクの検知パターンの例 (1) 週次の定点観測での発覚 ユーザーからの問い合わせ Slack へのアラート通知 SRE チームによる
メトリクス確認 & 各チームへの 確認・共有 修正・改善タスク
019 TimeTree 改善タスクの検知パターンの例 (2) 週次の定点観測での発覚 ユーザーからの問い合わせ Slack へのアラート通知 Zendesk SNS
( X など )
020 TimeTree 改善タスクの検知パターンの例 (3) 週次の定点観測での発覚 ユーザーからの問い合わせ Slack へのアラート通知 Sentry Cloud
Monitoring Alert Datadog Monitor Slack
021 TimeTree 改善タスクの両⽴ 改善タスク 施策に基づく開発タスク 2割 8割 スクラム開発 1 スプリントの内訳
スクラム開発を採⽤している 事業部によっては、スプリントの中で⼀定割合を 改善タスクにリソースを充てている
4 まとめ 022 TimeTree
023 TimeTree 定点観測の運⽤ • SRE 内だけでなく、 事業部 ( BE ×
SRE ) でも定点観測を毎週 実施する • これにより、チーム間 の温度差や情報ギャッ プが減る まとめ 改善の判断基準 • コード改修後は、API レイテンシーやスロー クエリ、リクエスト数 など、TimeTree の サービス特性的には 先週比で見ることも大 切 改善タスクの両⽴ • 改善タスクが発生する キッカケは様々で、 日常的に発生する • 仕組みとしてスクラム開 発の中に、改善タスクの ためのリソース 2 割を 意識的に確保することが 大切
024 TimeTree サンプリングの塩梅 Bits AI の活⽤ ここ最近の課題とやりたいこと • サービスが拡大すると、当然 Trace
や Span が膨らむ • 細かくサンプリングが設定できる が故に、最適解を模索中 • 少数のエンジニアでも、より効率的 な SRE 業務を目指したい • 特にコストと見合う使い方を模索中 もしよければ、このあとのネットワーキングで ユースケースが聞けたらいいなと思っています!
Thank you! Shota Ozasa SRE, TimeTree, Inc.
[email protected]
025 TimeTree