Slide 1

Slide 1 text

第26回 酒とゲームとインフラとGCP@タイミー コロプラ最新作インフラ構 成について 2025.02.21

Slide 2

Slide 2 text

● 須藤 順康 ● 株式会社コロプラ 技術基盤本部 インフラストラクチャ部 ● 2024年1月入社 自己紹介 2

Slide 3

Slide 3 text

コロプラについて Vision エンターテインメントで日常をより楽しく、より素晴らしく Mission 3

Slide 4

Slide 4 text

コロプラについて 4 @COLOPL, Inc.

Slide 5

Slide 5 text

1/27リリース! 5

Slide 6

Slide 6 text

新作紹介 6

Slide 7

Slide 7 text

異世界∞異世界のインフラ構成

Slide 8

Slide 8 text

インフラ設計の方針 ● コロプラで実績のある安定構成を採用 ○ 既存タイトルの運用実績からメンテナンスをなるべく入れないことができる構成 ● なるべくマネージドサービスを採用 ○ GKE上にすべてのコンポーネントを乗せることはできるが、GKEやミドルウェアのアップ デートの手間やリスクを考えると、多少コストがかかってもマネージドに寄せる方がメリッ トがあるという判断 ○ マネージドサービスはダウンタイムを考慮し、メンテナンスタイムを設けない運用ができる サービスを選定 8 …

Slide 9

Slide 9 text

全体構成 9 iOS/Android/Steam Cloud Load Balancing Apps Google Kubernetes Engine Artifact Registry Cloud Spanner Cloud SQL Spinnaker Google Kubernetes Engine PvP Google Kubernetes Engine Cloud Logging CDN GitLab Compute Engine RabbitMQ Compute Engine Redis Enterprise ElasticSearch Cloud Monitoring BigQuery

Slide 10

Slide 10 text

Apps 10 iOS/Android/Steam Cloud Load Balancing Apps Google Kubernetes Engine Artifact Registry Cloud Spanner Cloud SQL Spinnaker Google Kubernetes Engine PvP Google Kubernetes Engine Cloud Logging CDN GitLab Compute Engine RabbitMQ Compute Engine Redis Enterprise ElasticSearch Cloud Monitoring BigQuery PHP/Laravelのゲームサーバー

Slide 11

Slide 11 text

Database 11 iOS/Android/Steam Cloud Load Balancing Apps Google Kubernetes Engine Artifact Registry Cloud Spanner Cloud SQL Spinnaker Google Kubernetes Engine PvP Google Kubernetes Engine Cloud Logging CDN GitLab Compute Engine RabbitMQ Compute Engine Redis Enterprise ElasticSearch Cloud Monitoring BigQuery

Slide 12

Slide 12 text

Database ● Cloud SQLとCloud Spannerを併用 ○ 過去にCloud Spannerにmaster dataを配置した際にイベントデータへのアクセスでホットス ポットが発生して、Spanner全体のレイテンシが非常に悪化したことがある ● Cloud SQLにmaster dataを保存 ○ 同じデータを全ユーザーが参照 ■ アイテムやキャラクターデータ ○ 昨年のリリースでEnterprise Plusのメンテナンス時のダウン時間が大幅に縮小 ● Cloud Spannerにはuser dataを保存 ○ EditionはStandard ○ Enterprise Editionにするメリットとコストを比較して、今回はStandardが適切と判断 ■ 増分バックアップ->リリース時に容量が読めない ■ Full Text Search-> まだ社内実績や検証が十分でない ■ (将来的にGAな) managed auto scaler->OSSで運用できてしまっている 12

Slide 13

Slide 13 text

CI/CD 13 iOS/Android/Steam Cloud Load Balancing Apps Google Kubernetes Engine Artifact Registry Cloud Spanner Cloud SQL Spinnaker Google Kubernetes Engine PvP Google Kubernetes Engine Cloud Logging CDN GitLab Compute Engine RabbitMQ Compute Engine Redis Enterprise ElasticSearch Cloud Monitoring BigQuery CI経由でコンテナイメージを Artifact Registryにpush spinnakerがイメージの pushをト リガーにパイプラインを起動 本番デプロイを進めるには起動 したパイプラインに手動で操作が 必要

Slide 14

Slide 14 text

Logging/Monitoring/Alerting 14 iOS/Android/Steam Cloud Load Balancing Apps Google Kubernetes Engine Artifact Registry Cloud Spanner Cloud SQL Spinnaker Google Kubernetes Engine PvP Google Kubernetes Engine Cloud Logging CDN GitLab Compute Engine RabbitMQ Compute Engine Redis Enterprise ElasticSearch Cloud Monitoring BigQuery

Slide 15

Slide 15 text

Logging/Monitoring/Alerting ● ログはCloud LoggingとBigQuery、Datadogで収集 ○ 主にアプリケーションログはDatadog、プレイログはBigQuery、それ以外はCloud Logging ● 可視化のダッシュボードにはgrafanaを使用 ○ Google Cloudの各種メトリクスとPHPや各種ミドルウェアのカスタムメトリクスを可視化 ○ Google Cloud内のリソースだけではなく、CDNやElasticSearch(みたいなやつ)のメトリク スも見れるようにしている ○ Google Cloud以外のメトリクスも豊富なプラグインが存在するため使い勝手が良かった ● アラートはAlert Manager、Cloud Monitoring、Datadogを併用 ○ Alert Manager: prometheus経由の基本的なインフラメトリクスアラート ○ Datadog: アプリケーション寄りのアラート ○ CloudMonitoring: Datadogで事足りるので廃止予定 ■ Logging経由でのアラート通知が1日当たり20件が上限のため、アプリケーションログ のエラー通知には不向きと判断 15

Slide 16

Slide 16 text

PvP 16 iOS/Android/Steam Cloud Load Balancing Apps Google Kubernetes Engine Artifact Registry Cloud Spanner Cloud SQL Spinnaker Google Kubernetes Engine PvP Google Kubernetes Engine Cloud Logging CDN GitLab Compute Engine RabbitMQ Compute Engine Redis Enterprise ElasticSearch Cloud Monitoring BigQuery

Slide 17

Slide 17 text

PvP ● PvP(マルチプレイ)用のゲームサーバーが動くGKEクラスター ○ PvP自体は未リリース ● 以下の主に二つで構成する予定 ○ Agones ■ k8s上で動作するゲームサーバーを管理するOSS ○ prizm ■ 内製リアルタイムフレームワーク 17

Slide 18

Slide 18 text

リリースまでに困ったこと

Slide 19

Slide 19 text

バグ修正等でアプリ審査が直前ま で続いたためSpannerのウォー ムアップのタイミングが難しかっ た

Slide 20

Slide 20 text

Spannerのウォームアップについて ● リリース前にCloud Spannerにウォームアップが必要 ○ 通常はリリース直前(2日以内)に本番環境のSpannerにテストデータを保存してスプリットを 確保する ● アプリの審査からリリースまで ○ アプリの審査を概ね1〜2ヶ月前から開始 ○ 審査中は本番環境は触れない ○ クリスマス/年末年始もあり審査スケジュールが読めない ○ バグ修正等で直前までアプリ審査が続いた ○ 審査完了がリリース日直前になる可能性も ● 対応:ウォームアップ用に負荷試験環境を流用 ○ 通常は本番apps -> 本番spanner、負荷試験apps -> 負荷試験spannerとなっているところ一 時的に向き先を入れ替える ○ ウォームアップ時には本番apps ->負荷試験spanner 、負荷試験apps -> 本番spannerとし、 アプリの審査完了後に元に戻す 20

Slide 21

Slide 21 text

AgonesがサポートするGKEバー ジョンがGKEのAuto Upgrade バージョンに追いつかない

Slide 22

Slide 22 text

AgonesとGKEのサポートバージョン ● Agonesは1バージョンにつき、k8sの3バージョンをサポートしている ○ Agonesの最新版は1.47、k8sのサポートバージョンは1.29-1.31(資料作成時点) ● GKEはおよそ3ヶ月に1回程度の頻度でバージョンアップ ○ 1.32のAuto Upgrade(Stable)は2025/4 (資料作成時点) ● リリース前にGKEのバージョンはなるべく上げておきたいが、現時点では Agones 1.47 + GKE 1.31まで ● このまま1.32のAuto Upgradeが4月になるとAgonesのサポート外バージョ ンになってしまう ○ ただし、今までAuto UpgradeでAgonesのサポート外バージョンになったことはない ○ そもそもGKE 1.32がリリースされているのはRapidだけ 22

Slide 23

Slide 23 text

ご清聴ありがとうございました

Slide 24

Slide 24 text

● 技術情報発信しているのでフォローしてもらえると嬉しいです ○ 「アーキテクチャ Conference 2024」登壇時の資料や ○ 「 PHP Conference Japan 2024」登壇時の記事など技術ブログで公開しています ○ 登壇者・執筆者のモチベーションにつながるので立ち寄ってもらえればと 最後に宣伝 24 COLOPL Tech Blog https://blog.colopl.dev/