Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ライブ配信サービスの インフラのジレンマ -マルチクラウドに至ったワケ-

ライブ配信サービスの インフラのジレンマ -マルチクラウドに至ったワケ-

「インフラアーキテクチャ選択のジレンマ」(https://findy-tools.connpass.com/event/362401/) の登壇資料です。内容は、2025年8月7日(木)登壇時のものです。

Avatar for Mirrativ

Mirrativ

August 11, 2025
Tweet

More Decks by Mirrativ

Other Decks in Programming

Transcript

  1. 自己紹介 • 2018年10月 株式会社ミラティブにJoin ◦ OSS活動、スタートアップを経てDeNAへ入社し、ゲームの 大規模トラフィックやSHOWROOMのライブ配信サービス の基盤設計・運用に携わる。2018年にミラティブへ入社 し、インフラ・ストリーミング領域のマネージャーとして ライブ配信基盤/インフラ基盤に携わる

    • ミラティブでの役割 ◦ インフラ・ストリーミング部門のMGR ◦ インフラ基盤・ストリーミング基盤の設計開発 ◦ 基盤ミドルウェア設計開発 2 Yusuke Hata (漢 祐介) 株式会社ミラティブ 基盤開発部 インフラ・ストリーミンググループ MGR
  2. 5

  3. 6

  4. 7

  5. 8

  6. クラウドサービスには色々な特色がある • SaaS的な機能が豊富だったり、サービス連携が容易だったり • 料金体系もクラウドサービスごとにさまざま Mirrativでは、クラウドの機能に完全に乗っからないようにしている • IaaS 利用がメイン •

    クラウドの機能も基本的なものだけ、複雑なものは避ける (何かあったときに代替可能なものにする) ロックインを避ける目的と、よりよいクラウドが出てきた時に 機能に依存せずに移し替えれるようにしている 12
  7. スケーラビリティだけじゃない クラウドを利用する利点の一つは “スケーラビリティ” Mirrativでは物理マシンも積極的に利用 • スケーラビリティの代わりに 高可用性とパフォーマンスを重視 ◦ ハードウェアロードバランサー ◦

    ベアメタルサーバ ◦ 性能が安定して出せる チューニング次第ではマシン性能を使い切れる • プライベートクラウドも導入してる ◦ 開発環境のように予測可能な環境に導入 ◦ サイジングを工夫してコスト最適化 (CPU overcommit 等) • ただしスケーラビリティが必要な場面(Edge)ではクラウドも活用 ◦ オートスケールなども活用 13
  8. Compute Engineはライブマイグレーションが優れてる GCPのCompute Engineにはライブマイグレーション という機能がとても優秀 • データベースのような継続して動かし続けるサー バではとてもメリットがある • 突然死はありえるが、サーバのメンテナンスを大

    幅に減らせる 少数のチームで運用する場合、メンテナンスの手間は大 きな課題。サーバの台数が多い場合は特に課題。 またメンテナンスイベント情報が事前に取得出来るので メンテナンス予告が発生したらサービスアウト対応もで きるので便利。 一方で、性能が安定しない問題は避けられない 余裕を持ったキャパシティプランニングは必要 14
  9. 適材適所 • 全部物理マシン vs 全部クラウドではなく 長所を活かした選択 ◦ 安定した高い性能を出したい = ベアメタルサーバ

    ◦ サイジングを工夫できる = プライベートクラウド ◦ 柔軟な構成やスケーラビリティを確保 = パブリッククラウド • GCP / IDCF Cloud / プライベートクラウド どこでも動かせれるインフラ構成にするのが大事 15
  10. インターネットのトラフィックに乗せることなく、 可能な限り内部NWで必要な機能の実装をしてる • 配信文字起こし • 動画のプレビュー配信 (CDN は Fastly) •

    動画の録画・アーカイブ (S3互換ストレージを内製化) トラフィックは内部NWだけなのでトラフィック量 は大幅にカット CDNはFastlyのOriginShieldも活用して、Originへ の負荷もトラフィックも軽減 19 トラフィックを内部ネットワークに
  11. 21 お互いのクラウドを監視出来る 単一のクラウドだけでお互いのクラウドを 外側から相互監視することができる (内部だけの監視ではどうしても何かに引っ張られがち) • 外形監視 • E2E監視 •

    死活監視 E2E/死活監視の通信はインターネット経路を使 うことで実際の利用中のユーザさんと同じよう な状態を作り、正確な監視を用意 別拠点からも死活監視も行っていると経路の問 題なども切り分けがしやすい