Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
『家族アルバム みてね』で計測しているSLIの事例 / SLI as measured in ...
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Isao Shimizu
August 23, 2023
Technology
850
4
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
『家族アルバム みてね』で計測しているSLIの事例 / SLI as measured in FamilyAlbum
2023/8/23 みんなで考えるシステムの安定運用Night〜信頼性から紐解くこれからの開発〜
Isao Shimizu
August 23, 2023
More Decks by Isao Shimizu
See All by Isao Shimizu
Notion x ポストモーテムで広げる組織の学び / Notion x Postmortem
isaoshimizu
1
370
New Relicを活用したSREの最初のステップ / NRUG OKINAWA VOL.3
isaoshimizu
3
1.1k
「家族アルバム みてね」における運用管理・ オブザーバビリティの全貌 / Overview of Operation Management and Observability in FamilyAlbum
isaoshimizu
5
4.3k
約10年間MIXIのインフラを 支えてきたPagerDutyの活用事例 / PagerDuty on Tour 2024
isaoshimizu
6
1.3k
家族アルバム みてねにおけるGrafana活用術 / Grafana Meetup Japan Vol.1 LT
isaoshimizu
2
1.9k
家族アルバム みてねで直面してきた技術的負債 / MIXI KAG 2024
isaoshimizu
18
9.2k
今年1年のEKS運用振り返り/3-shake SRE Tech Talk
isaoshimizu
2
450
ポストモーテムの基礎知識と最新事例 / Fundamentals of Postmortem
isaoshimizu
12
3.4k
全世界1,800万人が利用する「家族アルバム みてね」におけるNew Relic活用法 / FutureStack Tokyo 2023
isaoshimizu
1
640
Other Decks in Technology
See All in Technology
ルールやカスタム機能、どう活かす?ハンズオンで体感するIBM Bobの出力コントロール
muehara
1
150
Bucharest Tech Week 2026 - Reinventing testing practices in the AI era
edeandrea
PRO
1
150
SONiC Scale-Up Working Group から探る Scale-UpやUltraEthernet機能の実装方法
ebiken
PRO
2
250
フロンティアAIのゲート化と地政学リスク
nagatsu
0
130
RSA暗号を手計算したくなること、ありますよね?? (20260615_orestudy6_rsa)
thousanda
0
350
なぜ Platform Engineering の土台に Kubernetes を選ぶのか
r4ynode
2
630
ACE-Step-1.5で見る 音楽生成AIのしくみと“破綻だけ直す”Retake機能の開発【zennfes spring 2026 登壇資料】
personabb
1
290
protovalidate-es を導入してみた
bengo4com
0
180
MCP Appsを作ってみよう
iwamot
PRO
4
600
脆弱性対応、どこで線を引くか
rymiyamoto
1
380
Building applications in the Gemini API family.
line_developers_tw
PRO
0
3.2k
【NRUG vol.18】なぜ多くのオブザーバビリティ導入は失敗するのか
nrug_member
0
120
Featured
See All Featured
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
Visualization
eitanlees
152
17k
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
Balancing Empowerment & Direction
lara
6
1.2k
Building Adaptive Systems
keathley
44
3k
Paper Plane
katiecoart
PRO
1
51k
We Have a Design System, Now What?
morganepeng
55
8.2k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
56k
KATA
mclloyd
PRO
35
15k
Technical Leadership for Architectural Decision Making
baasie
3
410
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
200
Marketing to machines
jonoalderson
1
5.4k
Transcript
©MIXI 「家族アルバム みてね」 で計測しているSLIの事例 2023/8/23 みんなで考えるシステムの安定運⽤Night〜信頼性から紐解くこれからの開発〜 Vantageスタジオ みてねプロダクト開発部 基盤開発グループ 清⽔
勲
©MIXI About me 清⽔ 勲 @isaoshimizu 2011年〜 株式会社ミクシィ(現MIXI) • 2011年8⽉〜
SNS「mixi」運⽤エンジニア • 2014年4⽉〜 モンスターストライク SRE • 2018年2⽉〜 家族アルバム みてね SRE • 2022年1⽉〜 SREグループ マネージャー • 2023年4⽉〜 基盤開発グループ マネージャー • 週末は社会⼈吹奏楽団での活動(楽団⻑、トロンボーン約30年、たまに指揮者)。 キャンプとクラフトビールが好き。 2
©MIXI ՈΞϧόϜΈͯͶ 3
©MIXI 家族アルバム みてね 4 パパ・ママが撮った⼦どもの写真や動画を、祖⽗⺟や親戚など 招待した家族だけに簡単に共有できる写真・動画共有アプリ フォトブック 写真プリント 商品の例
©MIXI 家族アルバム みてね 5 みてねみまもりGPS みてね出張撮影 みてね年賀状 みてねコールドクター
©MIXI 家族アルバム みてね • 7⾔語・175の国と地域でサービスを提供。海外では「FamilyAlbum」という名称で展開中 • 2023年5⽉、利⽤者数が1,800万⼈※1 を突破 • ⽇本国内ではママやパパの約半数となる47.1%の⽅※2
がご利⽤ 6 ※1 iOS・Android™ アプリ登録者数、ブラウザ版登録者数の合計 ※2「みてね」登録時に⼊⼒されたお⼦さまの誕⽣⽇と厚⽣労働省発表「⼈⼝動態統計」から算出。2022年8⽉時点で47.1%
©MIXI ここから本題
©MIXI 家族アルバム みてね における クリティカル・ユーザー・ジャーニー(CUJ)とは
©MIXI クリティカル・ユーザー・ジャーニー(CUJ) • ユーザーにとって重要な体験 • ビジネス、サービスにとって重要なユーザーの⾏動
©MIXI 「写真・動画をアップロードする」 みてねのCUJの⼀例
©MIXI 写真・動画をアップロードする アップロード 操作 Amazon S3 メディア用バケット 写真・動画がアップロードされることで様々な体験につながる
©MIXI どう計測するか
©MIXI クライアント内 ユーザー アップロード 操作 処理プロセス ① 処理プロセス ② 処理プロセス
③ Amazon S3 メディア用バケット アップロード ログサーバー どこのプロセスで問題が発⽣したかログから把握できる Amazon S3 ログ用バケット S3ログ ログ 写真・動画のアップロードにおけるログ取得
©MIXI 収集されたログからアップロードの成功率を計測する (SLI)
©MIXI ユーザーの端末スペックやネットワーク環境によって 数値が影響を受ける場合もある
©MIXI Amazon S3 ログ用バケット ログを分析してSLIを計測 Amazon Athena Redash 開発者主体で計測、モニタリング
©MIXI ⼀定期間分析して⽬指すべき成功率を決める (SLO) ※これはまだ運⽤できていない
©MIXI 他にも国内・海外のAPIアクセスにおける レスポンスタイム計測の事例も https://team-blog.mitene.us/mitene-infra-multi-region-614717f0162d
©MIXI まとめ l SLIの計測の事例について⼀部ご紹介しました l 各フェーズごとのログ収集からの分析によって、どこで問題が起きているのかわかりやすい l ネットワーク環境など⼀部のユーザー環境によって影響を受けるケースはパーセンタイルを 活⽤するなどして外れ値を除外するとよさそう l
現状SLOは運⽤できていないが、⼀定期間から得られたSLIをもとに仮置きして、⽬標値を 定めていくと良さそう 19