Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GAE を利用したゲーム内通貨管理サービスの運用〜可用性を損なわないための工夫〜
Search
Takumasa Sakao
May 14, 2019
Technology
0
1.2k
GAE を利用したゲーム内通貨管理サービスの運用〜可用性を損なわないための工夫〜
Takumasa Sakao
May 14, 2019
Tweet
Share
More Decks by Takumasa Sakao
See All by Takumasa Sakao
k9s のプラグイン機構とモダンな watch コマンド、viddy の紹介
sachaos
0
1.4k
Cloud Run でシェルスクリプトを動かす
sachaos
0
2.6k
Go の静的解析ツールの作成と活用
sachaos
0
2.8k
レイトレーシングとGoroutine
sachaos
2
1.1k
OSSを作っている時に 考えていること ーUNIX哲学を添えてー
sachaos
2
480
GCPをフル活用したゲームログ収集基盤の構築
sachaos
6
2.9k
Other Decks in Technology
See All in Technology
商品レコメンドでのexplicit negative feedbackの活用
alpicola
1
340
2024年活動報告会(人材育成推進WG・ビジネスサブWG) / 20250114-OIDF-J-EduWG-BizSWG
oidfj
0
210
30分でわかる「リスクから学ぶKubernetesコンテナセキュリティ」/30min-k8s-container-sec
mochizuki875
3
440
東京Ruby会議12 Ruby と Rust と私 / Tokyo RubyKaigi 12 Ruby, Rust and me
eagletmt
3
870
2025年に挑戦したいこと
molmolken
0
160
今年一年で頑張ること / What I will do my best this year
pauli
1
220
Amazon Q Developerで.NET Frameworkプロジェクトをモダナイズしてみた
kenichirokimura
1
200
Bring Your Own Container: When Containers Turn the Key to EDR Bypass/byoc-avtokyo2024
tkmru
0
850
シフトライトなテスト活動を適切に行うことで、無理な開発をせず、過剰にテストせず、顧客をビックリさせないプロダクトを作り上げているお話 #RSGT2025 / Shift Right
nihonbuson
3
2.1k
PaaSの歴史と、 アプリケーションプラットフォームのこれから
jacopen
7
1.4k
[IBM TechXchange Dojo]Watson Discoveryとwatsonx.aiでRAGを実現!事例のご紹介+座学②
siyuanzh09
0
110
Formal Development of Operating Systems in Rust
riru
1
420
Featured
See All Featured
How STYLIGHT went responsive
nonsquared
96
5.3k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
28
4.5k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
Six Lessons from altMBA
skipperchong
27
3.6k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
132
33k
GraphQLとの向き合い方2022年版
quramy
44
13k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.9k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Fashionably flexible responsive web design (full day workshop)
malarkey
406
66k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.2k
Producing Creativity
orderedlist
PRO
343
39k
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
Transcript
GAE を利用した ゲーム内通貨管理サービスの運用 可用性を損なわないための工夫 酒とゲームとインフラと GCP 第10回
自己紹介 @sachaos (サカオスと読みま す)Twitter, GitHub やってます 所属: 株式会社アカツキ 技術基盤開発チーム 仕事:
GCP, Go キーボードレンタル業 最近あったつらいこと : Cloud Next 19 に参加して パスポートを紛失しました
ゲーム内通貨管理サービスの概要
ゲーム内通貨管理サービスの概要 • ゲーム内通貨(いわゆる石)を管理する • ストア(Apple App Store, Google Play Store)で発行されたレシートの検証
無償・有償を含むゲーム内通貨の残高の管理 • 複数のゲームにまたがって利用される
サービスの概観図 Cloud Datastore App Engine BigQuery ゲームプロジェクトA ゲームプロジェクトB ゲーム内通貨管理サービス 石の消費・付与・購入
ログの送信 プレイヤーの石の残高 使用済みレシートなどを管理 石の残高の問い合わせ レシートの検証 石を増減させる
サービスの特に重要な要件 • 石の購入、付与、消費トランザクションのログの完全性 ◦ 売上の計算、資金決済法の供託金の計算のため ◦ ログが欠損しては正しく計算ができない • 高可用性、高スケール性能 ◦
複数のゲームから利用されるものとなるため、高い可用性が求められる ◦ ゲームのピーキーなトラフィックに耐えられるスケール性能が求められる
サービスの特に重要な要件 • 石の購入、付与、消費トランザクションのログの完全性 ◦ 売上の計算、資金決済法の供託金の計算のため ◦ ログが欠損しては正しく計算ができない • 高可用性、高スケール性能 ◦
複数のゲームから利用されるものとなるため、高い可用性が求められる ◦ ゲームのピーキーなトラフィックに耐えられるスケール性能が求められる GAE + Datastore を採用
GAE + Datastore • GAE: GCP が提供している PaaS の Google
App Engine Datastore: GCP が提供している サーバーレスのデータベース • GAE 99.95%, Datastore 99.9% の可用性 • 高いスケール性能 • Service, Version, Traffic Splitting, タスクキューなどの 運用が考えられている設計・機能
GAE の運用における工夫 • 多段カナリアデプロイ • タスクキュー処理サービスのオンラインでの分離
多段カナリアデプロイ
カナリアデプロイ • GAE の機能である Traffic Splitting を使用することにより バージョンごとにトラフィックを任意の割合で振り分ける事が可能 • ゲーム通貨管理サービスでは
新しいバージョンを 1% のトラフィックをカナリアに流すようにしていた 100% 0% 99% 1% 0% 100%
カナリアデプロイの不安要素 • 複合的な条件で起こるバグは検知しにくい。 • トラフィック増加によって発生する問題も検知できない。
多段カナリアデプロイ • 1% => 10% => 50% => 100% でカナリアデプロイを行う。
• 1% ではAPIが正しく機能しているかを調べる • 10% では複合的要因で発生する論理的な問題を発見する • 50% では大規模なトラフィックで発生する問題を調べる
動的に min_instances を設定する • トラフィックの割合を上げる際に 適切な数のインスタンスが立ち上がっている必要がある ◦ 立ち上がっていないと loading request
となりレイテンシが高くなる • トラフィックの割合を上げる前に現在立ち上がっている インスタンス数に応じた min_instances を設定することにより、 予めインスタンスを作成した上で割合をあげる • min_instances は API を通して動的に変更可能 ◦ https://github.com/gcpug/nouhau/issues/56
タスクキュー処理サービスの オンラインでの分離
ログの送信方法 • push タスクキューを使用してログを非同期に BigQuery へ転送 • push キューはそれぞれが 300/sec
の頻度で捌くものを 80 個作成し 合計で 24,000/sec のログの転送を可能にしている • Transactional Task Enqueuing を使用 ◦ Datastore のトランザクションに Task のエンキュー操作を含めることができる ◦ いままで 2700万レコード超をこの機構で送信したが欠損は 0 %! ◦ BigQuery へ Streaming Insert する際にエラーが起こるが push キューであれば自動でリトライしてくれるので、最終的には書き込みが成功する
ログの送信方法 概観図 1. ログ吐き出しを伴う リクエストを処理する
ログの送信方法 概観図 1. ログ吐き出しを伴う リクエストを処理する 2. ログ吐き出し処理を タスクキューへ流し レスポンスを返す
ログの送信方法 概観図 1. ログ吐き出しを伴う リクエストを処理する 2. ログ吐き出し処理を タスクキューへ流し レスポンスを返す 3.
タスクキューが再度リクエスト
ログの送信方法 概観図 1. ログ吐き出しを伴う リクエストを処理する 2. ログ吐き出し処理を タスクキューへ流し レスポンスを返す 3.
タスクキューが再度リクエスト 4. タスクの処理で BigQuery への書き込みをする
タスクキューを処理する サービスが同じことによる問題 • BigQuery への送信という待ちが大きくなるリクエストが ゲームからのリクエストと同じリクエストキューを使用する。 ◦ 不必要にゲームからのリクエストのレイテンシに影響する可能性 • 可観測性の問題
◦ GAE のダッシュボードで確認できる指標 (レイテンシ etc)に ログ送信のタスク処理も含まれてしまう
このようにしたい 1. default サービスが ログ吐き出しを伴う リクエストを処理する
このようにしたい 1. default サービスが ログ吐き出しを伴う リクエストを処理する 2. ログ吐き出し処理を タスクキューへ流し レスポンスを返す
このようにしたい 1. default サービスが ログ吐き出しを伴う リクエストを処理する 2. ログ吐き出し処理を タスクキューへ流し レスポンスを返す
3. タスクキューが Task Handler サービスへ リクエストする
このようにしたい 1. default サービスが ログ吐き出しを伴う リクエストを処理する 2. ログ吐き出し処理を タスクキューへ流し レスポンスを返す
3. タスクキューが Task Handler サービスへ リクエストする 4. Task Handler サービスが BigQuery への書き込みをする
サービスを分割する際の要求 • オンラインで、かつログを欠損させることなくサービスの分割をしたい • カナリアを適用して一定の割合のリクエストは 分割されたサービスを使用するようにしたい。
オンラインでサービスを分割する戦略 1. Task の作成時にタスクを処理するHostを指定する 2. 処理する先をキューに指定する
Task の作成時に タスクを処理するHostを指定する • Task が処理先の Host を持つことになるので、 万が一 Host
を間違えた場合 Task は永遠に滞留する • 復旧する際には滞留した Task から手作業で BigQuery に格納するということが必要になる
Task の作成時に タスクを処理するHostを指定する • Task が処理先の Host を持つことになるので、 万が一 Host
を間違えた場合 Task は永遠に滞留する • 復旧する際には滞留した Task から手作業で BigQuery に格納するということが必要になる 万が一の場合の復旧に工数がかかるためボツ
処理する先をキューに指定する • 滞留した場合でもキューを変更することで処理先を変更することができる ◦ queue.yaml の target はオンラインで変更することが可能 ◦ Task
が滞留した状態で向き先を変更しても破棄されることはない • queue.yaml の分割された 80 個のうちの一つのキューを変えて カナリアデプロイをすることができる 1つだけ新しいサービスに向ける 全て新しいサービスを使用する
まとめ • GAE などの GCP のサーバレスサービスを効果的に使用することによって スケーラブルで高可用性のあるアプリケーションが作成可能です • さらに高可用性を保ったままサービスを提供するために 以下のことを行いました
◦ 多段カナリアデプロイ ◦ オンラインでのサービス分割
ご清聴ありがとうございました