Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
みてねSREチームの取り組み / What the Mitene SRE team has i...
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Isao Shimizu
September 05, 2018
Technology
3.2k
1
Share
みてねSREチームの取り組み / What the Mitene SRE team has improved
みてねのMeetup #2 for サーバーサイド/SRE
September 5, 2018
Isao Shimizu
September 05, 2018
More Decks by Isao Shimizu
See All by Isao Shimizu
Notion x ポストモーテムで広げる組織の学び / Notion x Postmortem
isaoshimizu
1
340
New Relicを活用したSREの最初のステップ / NRUG OKINAWA VOL.3
isaoshimizu
3
1.1k
「家族アルバム みてね」における運用管理・ オブザーバビリティの全貌 / Overview of Operation Management and Observability in FamilyAlbum
isaoshimizu
5
3.8k
約10年間MIXIのインフラを 支えてきたPagerDutyの活用事例 / PagerDuty on Tour 2024
isaoshimizu
6
1.3k
家族アルバム みてねにおけるGrafana活用術 / Grafana Meetup Japan Vol.1 LT
isaoshimizu
2
1.9k
家族アルバム みてねで直面してきた技術的負債 / MIXI KAG 2024
isaoshimizu
18
9.2k
今年1年のEKS運用振り返り/3-shake SRE Tech Talk
isaoshimizu
2
440
ポストモーテムの基礎知識と最新事例 / Fundamentals of Postmortem
isaoshimizu
12
3.3k
全世界1,800万人が利用する「家族アルバム みてね」におけるNew Relic活用法 / FutureStack Tokyo 2023
isaoshimizu
1
630
Other Decks in Technology
See All in Technology
AgentCore RuntimeからS3 Filesをマウントしてみる
har1101
3
370
New CBs New Challenges
ysuzuki
1
150
不確実性と戦いながら見積もりを作成するプロセス/mitsumori-process
hirodragon112
1
200
ログ基盤・プラグイン・ダッシュボード、全部整えた。でも最後は人だった。
makikub
5
1.2k
OPENLOGI Company Profile
hr01
0
83k
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
11k
Podcast配信で広がったアウトプットの輪~70人と音声発信してきた7年間~/outputconf_01
fortegp05
0
240
Webアクセシビリティは“もしも”に備える設計
tomokusaba
0
170
【PHPカンファレンス小田原2026】Webアプリケーションエンジニアにも知ってほしい オブザーバビリティ の本質
fendo181
0
320
あるアーキテクチャ決定と その結果/architecture-decision-and-its-result
hanhan1978
2
540
AI時代に新卒採用、はじめました/junior-engineer-never-die
dmnlk
0
200
Claude Teamプランの選定と、できること/できないこと
rfdnxbro
1
1.7k
Featured
See All Featured
Unsuck your backbone
ammeep
672
58k
A designer walks into a library…
pauljervisheath
211
24k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
200
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.1k
What does AI have to do with Human Rights?
axbom
PRO
1
2.1k
Raft: Consensus for Rubyists
vanstee
141
7.4k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.3k
Agile that works and the tools we love
rasmusluckow
331
21k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.7k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
1k
What's in a price? How to price your products and services
michaelherold
247
13k
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.2k
Transcript
みてねSRE チームの取り組み みてねのMeetup #2 for サーバーサイド/SRE September 5, 2018 Isao
Shimizu
About me 清水 勲 @isaoshimizu 株式会社ミクシィ ヴァンテージスタジオ みてね事業部 開発グループ 2011
年8 月 中途入社、SNS mixi のアプリ運用チーム 2014 年4 月 モンスターストライクのサーバーエンジニア、SRE 2018 年2 月 みてねSRE AWS Summit, TechLION, hbstudy, Internet Week, Think Japan IBM Code Day などの登壇 Qiita, Medium, Software Design 記事執筆 記事: 大規模インフラのSRE から社内スタートアップへの挑戦。ベテランエンジニアのキャリアの作り方 2
「みてね」とは 3
4
300 万人が使う No.1 家族アルバムアプリ「みてね」 公式ページ https://mitene.us/ 特徴 子供の写真や動画を共有、整理 家族だけで安心して使えるアルバムアプリ フォトブック、DVD
の販売 2015 年4 月 サービス開始 2017 年7 月 英語版提供開始 2018 年7 月 ユーザー数 300 万人突破 5
この約半年、SRE チームがやってきたこと 6
OS 、ライブラリのアップデート 古いAmazon Linux を最新に ImageMagick OpenCV 7
ミドルウェアのアップデート Amazon ElastiCache Redis Connection 増問題 tcp-keepalive が起因していた可能性 Redis 3.2
以降の場合 tcp-keepalive がデフォルトで設定される(300 秒) 8
ログ転送の最適化 Fluentd Aggregator の撤廃 よく詰まる問題が発生していた 設定のチューニングに追われる日々 Amazon Kinesis Data Firehose
の利用 S3 へのログ保存がより簡単に 9
CDN 最適化 API アクセスをCDN 経由に 署名付きURL の効率化 ワイルドカードを使った一括取得 URL 自体をクライアントサイドでキャッシュ
海外展開を目指すアプリで実装したセキュアで高速な画像配信の話 TTL 調整 長くて良いものはより長く 10
IPv6 対応(結果: 未対応) 転送、レイテンシーの高速化を狙う 対象はAPI 、画像、動画アクセス(CloudFront 、S3 ) 端末、OS 、キャリアとの相性により接続不能な環境があった
本格的に対応した事例があったらぜひ教えてください 11
Amazon Aurora 移行 RDS(MySQL 5.6) からの移行 クエリのキャパシティが大幅に増えた ディスクサイズ制限からの開放 年間におけるピークも無事に乗り切った 12
開発環境の再整備 ステージング環境の整備 エンジニアの増員により、さらに必要になった CircleCI 最適化 Ubuntu -> Amazon Linux のDocker
イメージ利用 契約プラン見直し、並列度の調整 Schedule Job の活用 1 日1 回 bundle outdated で古いgem の検出 simplecov を使ったテストカバレッジ計測 13
Ruby 、Gem のアップデート 2.2.7 -> 2.3.7 -> 2.4.4 までアップデート さらにアップデートし続けていく
環境によっては最新版 数多くのgem もアップデート Rails アップデートは進行中(4 系 -> 5 系へ) 14
Amazon S3 最適化 Amazon S3 Transfer Acceleration の利用 主に海外からのアップロードの高速化 バージョニングのライフサイクル設定
不要なバケットの削除 15
分析基盤のリニューアル(進行中) EC2 上でのスクリプト実行やCron 実行から、Luigi を使ったワークフ ロー管理へ https://github.com/spotify/luigi マネージドサービスを中心に設計 インフラのコード化、デプロイの自動化などもあわせて 16
Terraform へ移行 Terraform https://www.terraform.io/ 手軽なCloudWatch Alarm から移行し、IAM 、Security Group miam
、piculet から移行(さらに管理対象を増やしていく) CI との連携実装済み GitHub Pull Request 作成で terraform plan 、マージで terraform apply tfnotify の活用 https://github.com/mercari/tfnotify workspace は使わずディレクトリで分ける構成 17
コンテナ環境への移行(進行中) AWS OpsWorks から移行 Amazon ECS, EKS の検証 コンテナイメージのビルドフロー構築 AWS
CodeBuild 積極活用 Docker Hub からAmazon ECR へ移行 開発環境のコンテナ化 本番環境のコンテナ化(Kubernetes 利用予定) 18
その他 Nginx gzip 対応 JSON レスポンスの圧縮 AWS SDK のアップデート New
Relic Mobile 導入 AWS メンテ対応(Redis ) 不要なEBS 、RDS 、EC2 インスタンス、スナップショットの削除 19
これからもさらなる改善を続けていきます! 20
Join our team!! https://mitene.us/recruit 21