Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
アプリ起動時間高速化 ~推測するな、計測せよ~
Search
gree_tech
PRO
November 11, 2021
Technology
0
590
アプリ起動時間高速化 ~推測するな、計測せよ~
GREE Tech Conference 2021 で発表された資料です。
https://techcon.gree.jp/2021/session/Session-11
gree_tech
PRO
November 11, 2021
Tweet
Share
More Decks by gree_tech
See All by gree_tech
REALITY株式会社における開発生産性向上の取り組み: 失敗と成功から学んだこと
gree_tech
PRO
2
130
『ヘブンバーンズレッド』におけるフィールドギミックの裏側
gree_tech
PRO
2
90
セキュリティインシデント対応の体制・運用の試行錯誤 / greetechcon2024-session-a1
gree_tech
PRO
1
95
『アナザーエデン 時空を超える猫』国内海外同時運営実現への道のり ~別々で開発されたアプリを安定して同時リリースするまでの取り組み~
gree_tech
PRO
1
78
『アサルトリリィ Last Bullet』におけるクラウドストリーミング技術を用いたブラウザゲーム化の紹介
gree_tech
PRO
1
88
UnityによるPCアプリの新しい選択肢。「PC版 Google Play Games」への対応について
gree_tech
PRO
1
110
実機ビルドのエラーによる検証ブロッカーを0に!『ヘブンバーンズレッド』のスモークテスト自動化の取り組み
gree_tech
PRO
1
110
"ゲームQA業界の技術向上を目指す! 会社を超えた研究会の取り組み"
gree_tech
PRO
1
140
Jamstack でリニューアルするグリーグループのメディア
gree_tech
PRO
2
300
Other Decks in Technology
See All in Technology
隣接領域をBeyondするFinatextのエンジニア組織設計 / beyond-engineering-areas
stajima
1
270
TanStack Routerに移行するのかい しないのかい、どっちなんだい! / Are you going to migrate to TanStack Router or not? Which one is it?
kaminashi
0
570
AWS Media Services 最新サービスアップデート 2024
eijikominami
0
190
初心者向けAWS Securityの勉強会mini Security-JAWSを9ヶ月ぐらい実施してきての近況
cmusudakeisuke
0
120
B2B SaaSから見た最近のC#/.NETの進化
sansantech
PRO
0
670
Can We Measure Developer Productivity?
ewolff
1
150
Amazon CloudWatch Network Monitor のススメ
yuki_ink
1
200
ドメインの本質を掴む / Get the essence of the domain
sinsoku
2
150
OCI Security サービス 概要
oracle4engineer
PRO
0
6.5k
AWS Lambda のトラブルシュートをしていて思うこと
kazzpapa3
2
170
データプロダクトの定義からはじめる、データコントラクト駆動なデータ基盤
chanyou0311
2
280
ドメイン名の終活について - JPAAWG 7th -
mikit
33
20k
Featured
See All Featured
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
6.8k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
25
1.8k
Documentation Writing (for coders)
carmenintech
65
4.4k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
4
370
Speed Design
sergeychernyshev
24
610
What's in a price? How to price your products and services
michaelherold
243
12k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
44
2.2k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
The World Runs on Bad Software
bkeepers
PRO
65
11k
Become a Pro
speakerdeck
PRO
25
5k
Gamification - CAS2011
davidbonilla
80
5k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
31
2.7k
Transcript
REALITY株式会社 エンジニア 伊藤弘一郎 REALITY株式会社 エンジニア 高塚翔悟 アプリ起動時間高速化 ~推測するな、計測せよ~
REALITY 2 アバター作成 ライブ配信 ギフト・コラボ マルチプレイ ゲーム ライブ視聴
REALITY 3 2020 2018 2019 8月 視聴アプリ 「REALITY」リリース 1 0月
配信アプリ 「REALITY Avatar」リリース 3月 視聴/配信アプリ統合 現在の「REALITY」リリース 4月〜 配信コラボ/ガチャ チャットなど機能拡張が進む 1 2月 新Live配信基盤 低遅延モード配信実装 6月 YouTube視聴やLiveゲームなど Live機能類が拡充 11月 初の海外リリース 海外展開が加速。 2021 8月 ワールド機能のリリース メタバース事業に参入
REALITY 4 Q1 Q2 Q3 Q4 Q1 Q2 Q4 2020
2021 アクティブ配信者数 国内 15% 海外 85% ユーザ分布
REALITY 5 Q1 Q2 Q3 Q4 Q1 Q2 Q4 2020
2021 アクティブ配信者数 国内 15% 海外 85% ユーザ分布 絶好調!?
6 と言いたいところなんですが、 規模拡大などに起因しさまざまな問題が起きています
7 品質改善プロジェクト(SRE)紹介 REALITY
1. 障害原因の調査、改善、それを継続して行う仕組みづくり 1. スケーラブルなシステムの構築 サービスの成長に合わせた利用ツールや環境構築方法の選定 WebAPIの設計見直しによるリクエスト数の削減 1. 高速化 サーバのスループット改善 レスポンス速度向上
1. 自動化 定常運用業務の自動化(Web, Nativeアプリ, Libraryのリリース作業など)による作業コスト削減 同様にヒューマンエラーの抑止 1. その他テスト文化の普及推進、定期的な進捗確認 REALITY SRE 8
半期に数件実施 エンジニアが企画・進行を担当し、仕様書作成や効果測定までを行う 品質改善プロジェクト 9 FY21上期終わりなき挑戦プロジェクト - 配信中フリーズ改善 - アセットバンドルロード時間改善 -
音声の安定化 - 端末発熱改善 FY21下期品質改善プロジェクト - エコーキャンセル - エラーハンドリング改善 - 起動時間短縮 - 見かけ上のUX改善 FY22上期品質改善プロジェクト(WIP) - 通信速度向上のためのProtobuf対応 - 不正ユーザ対策 - メタバースに向けたアバター描画軽量化 - US通信速度改善 改善Week(半期ごと3回) - DevOps改善 - コードリファクタ
品質改善プロジェクト 10 FY21上期終わりなき挑戦プロジェクト - 配信中フリーズ改善 - アセットバンドルロード時間改善 - 音声の安定化 -
端末発熱改善 FY21下期品質改善プロジェクト - エコーキャンセル - エラーハンドリング改善 - 起動時間短縮 - 見かけ上のUX改善 FY22上期品質改善プロジェクト(WIP) - 通信速度向上のためのProtobuf対応 - 不正ユーザ対策 - メタバースに向けたアバター描画軽量化 - US通信速度改善 改善Week(半期ごと3回) - DevOps改善 - コードリファクタ 半期に数件実施 エンジニアが企画・進行を担当し、仕様書作成や効果測定までを行う
半期に数件実施 エンジニアがPMを担当し、エンジニアが仕様書作成や効果測定までを行う 品質改善プロジェクト 11 FY21上期終わりなき挑戦プロジェクト - 配信中フリーズ改善 - アセットバンドルロード時間改善 -
音声の安定化 - 端末発熱改善 FY21下期品質改善プロジェクト - エコーキャンセル - エラーハンドリング改善 - 起動時間短縮 - 見かけ上のUX改善 FY22上期品質改善プロジェクト(WIP) - 通信速度向上のためのProtobuf対応 - 不正ユーザ対策 - メタバースに向けたアバター描画軽量化 - US通信速度改善 改善Week(半期ごと3回) - DevOps改善 - コードリファクタ
品質改善プロジェクト 12 FY21上期終わりなき挑戦プロジェクト - 配信中フリーズ改善 - アセットバンドルロード時間改善 - 音声の安定化 -
端末発熱改善 FY21下期品質改善プロジェクト - エコーキャンセル - エラーハンドリング改善 - 見かけ上のUX改善 FY22上期品質改善プロジェクト(WIP) - 通信速度向上のためのProtobuf対応 - 不正ユーザ対策 - メタバースに向けたアバター描画軽量化 - US通信速度改善 改善Week(半期ごと3回) - DevOps改善 - コードリファクタ 半期に数件実施 エンジニアがPMを担当し、エンジニアが仕様書作成や効果測定までを行う - 起動時間短縮
13 起動時間短縮プロジェクト REALITY
「ランチャーアイコンタップからコンテンツ表示までの時間」と定義 アプリの起動時間はUX/ユーザの離脱率に影響 起動時間とは 14 何秒かかった?
プロジェクトの進行 15 1. 計測 アプリ起動処理の全体像の把握 問題箇所に目星を付け、対応項目別に優先度整理する 2. 実装 3. リリース後の計測・運用
それぞれの項目別に調査・改善する 本番環境で実際に改善されているか確認する 継続的に監視できる基盤を整える
プロジェクトの進行 16 1. 計測 アプリ起動処理の全体像の把握 問題箇所に目星を付け、対応項目別に優先度整理する 2. 実装 3. リリース後の計測・運用
それぞれの項目別に調査・改善する 本番環境で実際に改善されているか確認する 継続的に監視できる基盤を整える
REALITYはNativeアプリにUnityを ライブラリとして含む構成 -> 「Unityライブラリ初期化がボ トルネックかな?」 プロジェクト開始前の見立て 17 推測 Native Unity
iOS アプリ起動時に初期化 -> 起動処理のボトルネックと推測 Android Unity画面起動時に初期化 -> なんらか起動処理の遅延に影響と推測 ※Unityライブラリ初期化について
1. アプリ起動シーケンスの調査 • ボトルネックに目星を付ける • 改善可能な箇所の精査 1. 本番環境での起動処理周りの実態調査 • [Client]
Firebase : Performance Monitoring • [Server] GCP : Stackdriver Trace 計測 18
XCode:Instruments (Time Profiler, Signposts) iOSの起動シーケンスを確認 19 認証API ログインAPI Unity初期化 配信一覧取得
アプリ起動処理の全体像の把握:iOS 認証API ログインAPI Unity初期化 配信一覧取得
20 アプリ起動処理 library(dlib)初期化等 重い。。。 認証API ログインAPI Unity初期化 配信一覧取得 XCode:Instruments (Time
Profiler, Signposts) iOSの起動シーケンスを確認 アプリ起動処理の全体像の把握:iOS 認証API ログインAPI Unity初期化 配信一覧取得 重い?妥当? 要調査 遅い
Android Studio:CPU Profiler Androidの起動シーケンスを確認 21 アプリ起動処理の全体像の把握:Android
22 😅 < あれ、ボトルネックじゃなくない? Android Studio:CPU Profiler Androidの起動シーケンスを確認 アプリ起動処理の全体像の把握:Android
「Unityライブラリ初期化がボトルネックかな?」 調査・計測から 23
「Unityライブラリ初期化がボトルネックかな?」 「アプリ起動処理・配信一覧画面初期化処理の高速化がコスパ良」 調査・計測から 24
Firebase:Performance Monitoring • Clientのパフォーマンス計測に利用 • Client処理の区間トレースが可能。DashBoard化してくれる。 25 アプリ起動処理の全体像の把握:ユーザ環境での計測
Firebase:Performance Monitoring • 開発者の手元環境ではなく、実際のユーザ環境での起動時間を認識する • ネットワークリクエストの応答時間を国/デバイス別に確認できる 26 アプリ起動処理の全体像の把握:ユーザ環境での計測 ログインAPIの例: ユーザ環境において
日本とブラジルで300 msec以上差を確認
Firebase:Performance Monitoring • 開発者の手元環境ではなく、実際のユーザ環境での起動時間を認識する • ネットワークリクエストの応答時間を国/デバイス別に確認できる 27 アプリ起動処理の全体像の把握:ユーザ環境での計測 全世界 日本
iOS 6.2 秒 5.2 秒 Android 6.5 秒 4.2 秒 ユーザ環境における起動時間の中央値(2021/03) 😅 < めっちゃ遅い
GCP:Cloud Trace • GCPの分散トレーシングシステム • ボトルネックの検出 • レイテンシ分布の可視化 28 改善前配信一覧取得APIのトレース
• 処理のタイムシーケンスを可視化 • ボトルネックの可視化 並列化 できない? 不必要な処理が多い アプリ起動処理の全体像の把握:サーバ処理
1. [client] アプリの起動処理改善 Android最適化 : App Startup導入、キャッシュ改善など iOS最適化:謎のblankを削除、library初期化処理改善など 1. [server]
配信一覧取得API高速化 並列処理、ボトルネック改善にて対応 1. [client] UnityLibrary初期化改善 (optional) 調査を行い、現実的な規模の改修で時間を短縮できれば改善を入れる 空シーン起動など 対応優先度を決定 29
プロジェクトの進行 30 1. 計測 アプリ起動処理の全体像の把握 問題箇所に目星を付け、対応項目別に優先度整理する 2. 実装 3. リリース後の計測・運用
それぞれの項目別に調査・改善する 本番環境で実際に改善されているか確認する 継続的に監視できる基盤を整える
31 Android編 起動時間短縮
32 Androidの起動処理改善のフロー 1.ボトルネックのあたりをつける 2.コードレベルで問題箇所を特定する 3.修正を入れる
33 Androidの起動処理改善のフロー 1.ボトルネックのあたりをつける 2.コードレベルで問題箇所を特定する 3.修正を入れる
34 起動処理のボトルネック検出手法 Jetpack Macro Benchmark • テストを実行する形で起動時間を計測可能 • cold/warm/hot start
の計測 • テスト結果をトレースファイルとして閲覧 • Android 10(API 29)以上で利用可能 logcat • スタックトレースやシステムメッセージのログをダンプする コマンドラインツール • 起動処理のスタックトレースを細かく取れる
35 Androidの起動処理計測の例 Application onCreate Activity init Activity onCreate その他 inflate
views etc アカウント認証 ログイン処理 etc
36 Androidの起動処理計測の例 Application onCreate Activity init Activity onCreate その他 inflate
views etc アカウント認証 ログイン処理 etc 画面の生成 コンテンツ表示
37 Androidの起動処理計測の例 Application onCreate Activity init Activity onCreate その他 inflate
views etc アカウント認証 ログイン処理 etc Displayed time Fully Drawn time
ActivityTaskManagerでlogcatに起動時間を出力 38 logcatによる計測の例
ActivityTaskManagerでlogcatに起動時間を出力 39 logcatによる計測の例 I/ActivityTaskManager: Displayed ***************** + 4s80ms Displayed timeに4.08
sかかっている
ActivityTaskManagerでlogcatに起動時間を出力 40 logcatによる計測の例 I/ActivityTaskManager: Fully drawn ************* + 5s529ms Fully
Drawn timeは5.529 s
ActivityTaskManagerでlogcatに起動時間を出力 41 logcatによる計測の例 つまりその他は 1.449s みたいに計測できる 今回は前半部分を細かく計測していく
42 認証API ログインAPI Unity初期化 配信一覧取得 XCode:Instruments (Time Profiler, Signposts) iOSの起動シーケンスを確認
アプリ起動処理の全体像の把握:iOS 認証API ログインAPI Unity初期化 配信一覧取得 今回細かく見たいのはここ
43 Androidの起動処理 Application onCreate Activity init Activity onCreate その他 inflate
views etc アカウント認証 ログイン処理 etc Displayed time Fully Drawn time ここのボトルネックを探す
44 Androidの起動処理 Application onCreate Activity init Activity onCreate その他 inflate
views etc アカウント認証 ログイン処理 etc Displayed time Fully Drawn time より細かく調べていく
45 Androidの起動処理 Application onCreate Activity init Activity onCreate その他 inflate
views etc アカウント認証 ログイン処理 etc Displayed time Fully Drawn time より細かく調べていく
46 Androidの起動処理改善のフロー 1.アプリ起動処理の全体像を眺める 2.コードレベルで問題箇所を特定する 3.修正を入れる
47 CPU Profilerでの特定 各スレッドを開くと時系列に沿った各メソッドの実行時間が確認 できる
48 CPU Profilerでの特定 各スレッドを開くと時系列に沿った各メソッドの実行時間が確認 できる 気になる処理をポチると
49 Frame Chartでさらに詳しく 左から実行時間の長い順に並ぶ
50 Frame Chartでさらに詳しく 左から実行時間の長い順に並ぶ ここに時間がかかってる
51 Androidの起動処理改善のフロー 1.アプリ起動処理の全体像を眺める 2.コードレベルで問題箇所を特定する 3.コードに修正を入れる
52 処理を短縮するには大まかに分けて3つ • キャッシュを入れる • 処理の並列化・平行化 • 不要な処理の削除(遅延)
53 キャッシュを入れる 配信一覧のキャッシュ 配信一覧のコンテンツがロードされていない 間はキャッシュしたデータを表示して待機時 間をなくす
54 並列化・並行化 AppStartupの導入 ContentProviderによるライブラリ初期化を最適化する
55 不要な処理の削除(遅延) 起動時にやる必要がない処理や、そもそも不要な処理は削除した り起動時以外のタイミングに移動 例 ・不要なdelayが入っていたのを削除 ・ローディング表示の修正 泥臭い地道な計測や処理の改善が必要。。。
56 Server編 起動時間短縮
配信一覧取得APIの特徴 • View初期化のためアプリ起動処理に使用 • レイテンシがUXに直結 配信一覧取得APIの高速化 57 認証API ログインAPI Unity初期化
配信一覧取得 1秒以上の遅延 認証API ログインAPI Unity初期化 配信一覧取得
配信一覧取得APIの特徴 • View初期化のためアプリ起動処理に使用 • レイテンシがUXに直結 大まかな処理 • 最初の画面すべてのコンテンツを生成して返す • フォロータブ
• おすすめタブ • … etc (計7タブ) • それぞれのタブをソートなど(パーソナライズ) • 配信リスト • 相互フォローリスト • ゲームリスト • … etc 配信一覧取得APIの高速化 58
GCP:Cloud Trace • GCPの分散トレーシングシステム • ボトルネックの検出 • レイテンシ分布の可視化 59 改善前配信一覧取得APIのトレース
• 処理のタイムシーケンスを可視化 • ボトルネックの可視化 並列化 できない? 不必要な処理が多い 配信一覧取得APIの高速化
配信一覧取得APIの高速化 60 必要リソースのFetch タブのコンテンツ生成 大量のFetchHogehogeが並ぶ 並列化すべき箇所が 並列化されていない
配信一覧取得APIの高速化 61 余談: REALITY APIサーバはGolang製 goroutineによる並列化を行う
配信一覧取得APIの高速化 62 並列化 並列化
配信一覧取得APIの高速化 さらに、配信一覧画面初期化には必要のない処理・情報を削減 画面初期化に必要な情報だけ返し、残りは遅延して取得させる 処理の削減
ログイン時APIリクエストを一つに統合 複数リクエストする際のオーバーヘッドを削減 ログインAPIと配信一覧取得APIを合体 64 認証API ログインAPI Unity初期化 配信一覧取得 統合 認証API
ログインAPI Unity初期化 配信一覧取得
処理の最適化 65 遅いリクエスト Cloud Traceのレイテンシグラフでは遅いリクエストなど抽出可能 該当リクエストのTraceを参照して、改善する
処理の最適化 66 Cloud Profiler • GCPで利用可能なプロファイラ • 関数単位でCPUTimeやHeapを確認可能
処理の最適化 67 Cloud Profiler 不要なデータを大量に取得しており、jsonのdesirializeに時間が かかっている。これも改善。(泥臭い案件)
もともと配信一覧アイコンは 1024×1024 のpngを使用 • 256×256 のwebpに変換し軽量化 • サイズを 96~99 %
程度カット Clientのクラッシュ率低下、CDN費用削減の副次効果も 画像読み込み高速化 68 https://developers.google.com/speed/webp
69 本番リリース 起動時間短縮
70 改善前の起動時間 全世界 日本 iOS 6.2 秒 5.2 秒 Android
6.5 秒 4.2 秒 ユーザ環境における起動時間の中央値(2021/03)
結果 71 ※手元環境での実測(日本ユーザ環境 iOS:2.3 s, Android, 2.5s 程度)
プロジェクトの進行 72 1. 計測 アプリ起動処理の全体像の把握 問題箇所に目星を付け、対応項目別に優先度整理する 2. 実装 3. リリース後の計測・運用
それぞれの項目別に調査・改善する 本番環境で実際に改善されているか確認する 継続的に監視できる基盤を整える
本番リリース後に大幅に起動時間を短縮したことを確認 Firebase Performance Monitoring 73
本番リリース後に大幅に起動時間を短縮したことを確認 Firebase Performance Monitoring 74
監視用のログ入れて何か効果あった? 75
76 とある変更により、起動時間が悪化したことを検知 😅 < なんかめっちゃ悪化しとる 監視用のログ入れて何か効果あった?
監視用のログ入れて何か効果あった? 77 とある変更により、起動時間が悪化したことを検知 😅 < なんかめっちゃ悪化しとる 即検知、即修正 効果は大いにあった
監視用のログ入れて何か効果あった? 78 とある変更により、起動時間が悪化したことを検知 😅 < なんかめっちゃ悪化しとる 遅くしない運用を作る
ログを活用できていないのは、ログを取っていないのと同じ • Slackに流す、アラートを設定する 遅くしないための運用 79
ログを活用できていないのは、ログを取っていないのと同じ • 誰が見ても理解できるようにダッシュボード化する • 定例mtgやリリースmtgなどで都度確認する 遅くしないための運用 80 Data Portal(BIツール) Performance
Monitoring ↓ BigQuery ↓ Data Portal にデータをエクスポートして使用
まとめ 起動時間短縮は泥臭い作業の積み上げにより実現 • 並列化、キャッシュ、処理の削減(遅延)など 本プロジェクトでは、計測により • 想定とは異なるボトルネックの存在確認 • 継続的に監視できる基盤を作成 計測・監視はパフォーマンス改善や不具合の早期検知をするためには必要
「問題が生じてからログを入れる」のではなく、常日頃から「監視できる 仕組みを作る」ことが望ましい 81 本事例では、 「品質改善プロジェクト」として エンジニア主体で進行できたのが良 かったかな感
余談 本プロジェクトをnote等で技術発信して、 ユーザから感触の良い評価を得られた 今回の事例の他にも • 端末の発熱 • 配信中の入出力音声の音量測定 などREALITYユニークな計測事例もあり、 REALITYのnoteで掲載中
82 https://note.com/reality_eng
絶賛エンジニア募集中! 83 meety wantedly REALITYの未来を作ってくれる人を募集中! 是非、ご応募ください!
84