Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「家族アルバム みてね」を支える SREのこれまでとこれから
Search
MIXI ENGINEERS
PRO
August 29, 2023
Technology
1.1k
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
「家族アルバム みてね」を支える SREのこれまでとこれから
ゆるSRE勉強会 #1 でお話させていただいた、みてねSREの伊東(@_nihi)の登壇資料です。
https://yuru-sre.connpass.com/event/292063/
MIXI ENGINEERS
PRO
August 29, 2023
More Decks by MIXI ENGINEERS
See All by MIXI ENGINEERS
インフラ室事例集_JANOG58
mixi_engineers
PRO
1
64
【2026年版】プロジェクトマネジメント実践論|現役エンジニアが語る!~チームでモノづくりをする時のコツとは?~
mixi_engineers
PRO
1
200
AIエージェントで加速する開発と意思決定:ナレッジ蓄積型AIエージェントと対話型KPI分析の最前線
mixi_engineers
PRO
0
140
法務DXの最前線: ゼロからのAI導入とバックオフィスの変革 ~ 46の施策で検証した「コスト」と「リードタイム」削減の裏側 ~
mixi_engineers
PRO
0
80
AIで有人対応の品質チェックを"同じ物差し"に:CSの評価軸設計とプロンプト調整
mixi_engineers
PRO
0
45
AI活用を“個人技”で終わらせない ― 現場の自律性と成果を両立させた推進の裏側 ―
mixi_engineers
PRO
1
110
投資プロセス全体の再設計:投資先データ活用の取り組み
mixi_engineers
PRO
0
46
AI推進委員会とGemini Enterpriseが牽引する全社AI活用とナレッジ活用基盤の刷新
mixi_engineers
PRO
0
180
「プロンプトって何?」から始まった1年。 監査メソドロジーへのAIアシスタント実装と組織変革の記録
mixi_engineers
PRO
0
79
Other Decks in Technology
See All in Technology
LLMと共に進化するプロセスを目指して
ymatsuwitter
12
3.9k
protovalidate-es を導入してみた
bengo4com
0
170
2026TECHFRESH畢業分享會 - 葬送的通靈師:化系統與用戶雜訊成行動訊號
line_developers_tw
PRO
0
720
AIの性能が向上しても未解決な組織の重大問題は何か?/An Unsolved Organizational Problem in the Age of AI
moriyuya
3
600
FinOps × AIエージェントで実現する コストインシデントの自動調査
oasis1994liveforever
0
110
Agentic Web
dynamis
1
200
DevOps Agentで始めるAWS運用 〜フロンティアエージェントが変える運用の現場〜
nyankotaro
1
380
小さくはじめるSLI/SLO ~育てながら組織に定着させる実践知~ / Starting Small with SLI/SLOs: Building Adoption Through Continuous Growth
nari_ex
3
1.4k
生成 AI × MCP で切り拓く次世代 SRE!自律型運用への挑戦と開発者体験の進化
_awache
0
190
作って終わりにしない タイミーのセマンティックレイヤー育成の現在地
chanyou0311
3
2.1k
Claude Code×Terraform IaC テンプレート駆動開発
itouhi
1
490
白金鉱業Meetup_Vol.24_「AIエージェントは分けるほど良い」は本当か? / Is it true that “the more you divide AI agents, the better”?
brainpadpr
1
270
Featured
See All Featured
Agile that works and the tools we love
rasmusluckow
331
21k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
310
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
1
250
Between Models and Reality
mayunak
4
330
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.2k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
230
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
300
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.5k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
860
Transcript
「家族アルバム みてね」を支える SREのこれまでとこれから ゆるSRE勉強会 #1
MIXI, Inc. 自己紹介 株式会社MIXI Vantageスタジオ みてねプロダクト開発部 基盤開発グループ SREチーム
伊東 宏起 https://hekki.info
MIXI, Inc. 家族アルバム みてねの紹介 写真プリント フォトブック スマホで撮影した子どもの写真や動画を家族と共有し、 コミュニケーションして楽しむ家族アルバムサービスで す。
MIXI, Inc. 家族アルバム みてねの紹介 利用者数1,800万人を突破(2023年5月時点) ※ iOS・Android™ アプリ登録者数、ブラウザ版登録者数の合計 7言語・175の国と地域でサービスを提供
MIXI, Inc. 本日お話する内容 - みてねでのSREチームの立ち上げ - 立ち上げ移行のこれまでの振り返り -
これからの展望 - まとめ
MIXI, Inc. みてねでのSREチームの立ち上げ - サービス開始は2015年4月 - 当時インフラを専任で担当するメンバーはおらず、インフラ上の問題は開発者が都度対応 - 次第にユーザー体験や開発者体験に悪影響が出始める
- そこでサービス開始から約3年後の2018年2月、SRE組織を立ち上げることになる
MIXI, Inc. みてねでのSREチームの立ち上げ - サービス初期からの開発メンバー・別の部署のSREチーム・別の部署のアプリ開発者の3名でスタート - 当初のSRE組織を立ち上げた目標 -
ユーザーがより良いサービス体験を得られるようにする - 開発者が開発に集中し、ユーザーへの価値提供を最速・最大化するための下支えをする
MIXI, Inc. みてねSREチームのこれまで(チーム規模 3〜4名) - ユーザーと開発者の体験向上 - メディアのアップロード・ダウンロードの高速化 -
Terraformを導入し、IaCの考え方を取り入れる - ログ分析基盤の構築 - インフラコストの削減 - S3のストレージクラスやライフサイクルルールの最適化 - セキュリティ向上 - AWSアカウントの分離やGuardDutyの活用 - OS/ミドルウェア/フレームワーク等のアップデート - Grafanaの導入 - オブザーバビリティの改善と同時に、平常時の様子が分かるようになった
MIXI, Inc. - 開発者が新機能開発に集中できるように、それ以外の課題をSREが巻き取るというポリシーで運用 - インフラコストの削減には継続してチャレンジ - ユーザーへの動画配信にHLS(HTTP
Live Streaming)を活用 - 詳細は「みてねの動画再生にHLSを導入した話」をご覧ください - AWS OpsWorksからAmazon EKSへの移行 - 前述したTerraformの導入やAWSアカウントの分割もこの前準備 - 詳細は「4年間のEKS移行の取り組みを振り返って」をご覧ください - オンコール当番制度の導入 - 夜間や休日など業務時間外もサービスの品質を低下させないために、オンコール当番制度を導入 - 制度設計を丁寧にしないと破綻するので要注意 - 詳細は「『家族アルバム みてね』を支えるオンコールエンジニア制度」をご覧ください みてねSREチームのこれまで(チーム規模 4〜5名)
MIXI, Inc. - サービスの拡大と共に組織も大きくなり、組織のスケーラビリティという課題に直面 - 「新規開発以外の課題をSREが巻き取る」というポリシーに限界が見え始める - そこで開発者自身で問題の発見・解決ができる環境をSREが提供するポリシーに変化 -
海外ユーザーの体験向上 - サービスの海外展開に注力し始めた一方、それまでインフラは全て日本国内に構築 - 海外ユーザーにも快適にサービスを利用していただくために、インフラをマルチリージョン化 - 詳細は「みてね マルチリージョン」で検索 - オブザーバビリティ改善 - 「開発者自身で問題の発見・解決ができる環境」を目標とした取り組み - Grafana Lokiを使ったリアルタイムなログ検索基盤の構築 - APM(Application Performance Monitoring)の普及やトレーニング みてねSREチームのこれまで(チーム規模 5〜6名)
MIXI, Inc. - まだまだ課題は山積み - SLI/SLOの運用 - ユーザー数の増加に伴いアプリケーション開発の難易度も格段にアップ -
開発スピードの低下や、リリース後に問題が顕在化するといった課題が発生 - さらなるオブザーバビリティ改善、大規模なデータ・アクセスを開発環境上で再現するといった、複数の施策で 対策予定 - DBの負荷増大 - コンテンツの大量生成・大量配信など、特定期間にDBへのクエリが集中 - スケールアップにも限度があるので、マルチDBやシャーディングなど負荷分散にチャレンジ - 開発チームがスケールしても破綻しないSRE組織作り - 引き続き開発チームが自走できるための支援に注力 これからの展望
MIXI, Inc. - サービスの規模・フェーズや目標に合わせてSREチームも柔軟に目標を変化させてきました - はじめから完璧なSRE組織を作って運用するのではなく、スモールスタートで取り組むことが大切 - SREチーム発足から5年以上経過した今でも、完璧にGoogleが提唱するSREのプラクティスを実践できているとはいえ
ません - SREのプラクティスを組織全体に浸透させていくことが大切 - 究極的にはSREチームが必要となくなる(=開発チームが自走してSREのプラクティスを実践できるようになる)ことを 目指す - これからSREに挑戦する方々の参考になれば幸いです! まとめ
MIXI, Inc.