OPENREC.tvにおけるDynamoDBを用いたデザインパターン

OPENREC.tvにおけるDynamoDBを用いたデザインパターン | CA BASE NEXT

by CyberAgent

Slide 1

Slide 1 text

No content

Slide 2

Slide 2 text

藤井貴大 2019年度新卒入社株式会社CyberZ 開発本部プロダクト開発局 SRE 普段の業務ではEKSの運用や負荷対策などを中心に OPENREC.tvのサービス開発に従事 @toro-ponz @toro_ponz

Slide 3

Slide 3 text

・ゲームを中心とした、高品質低遅延なライブ配信プラットフォーム・AWS上にシステムを構築し提供・2015年1月サービス開始・2019年 EKSの本番運用を開始について

Slide 4

Slide 4 text

について

Slide 5

Slide 5 text

今回は Amazon DynamoDB を用いて実現している、タイムライン機能についてご紹介します。について

Slide 6

Slide 6 text

1.タイムライン機能について 2.RDBで実現するタイムライン 3.DynamoDBで実現するタイムライン 4.まとめ目次

Slide 7

Slide 7 text

タイムライン機能とは

Slide 8

Slide 8 text

タイムライン機能とは自分がフォローしている配信者のライブ配信を時系列順に追うことができるページ・機能

Slide 9

Slide 9 text

RDBで実現する時系列タイムライン機能

Slide 10

Slide 10 text

前提: DB設計ユーザーテーブルフォローテーブル配信情報テーブル

Slide 11

Slide 11 text

RDBでの実現例: 取得SQL SELECT * FROM lives WHERE user_id IN ( SELECT followee_user_id FROM follows WHERE user_id = 12345 ) ORDER BY published_at LIMIT 40; SELECT * FROM lives JOIN follows ON lives.user_id = follows.followee_user_id WHERE follows.user_id = 12345 ORDER BY lives.published_at LIMIT 40; フォロイーのID一覧を取得して WHERE INで絞る配信テーブルとフォローテーブルを JOINする OR

Slide 12

Slide 12 text

メリットデータ構造がシンプルで実装コストが低い複雑な検索も場合によっては可能フォロー数が増えるにつれ、クエリ速度が低下する同様に配信レコード数が増えるにつれ、クエリ速度が低下する => サービスの成長と共に、フォロー数の多いヘビーユーザーで顕著化メリットデメリット

Slide 13

Slide 13 text

解決策: ユーザーごとのデータ保存ユーザーごとにタイムラインのデータを持ち、ユーザーごとに時系列を維持する (Write Heavyな方式)

Slide 14

Slide 14 text

Amazon DynamoDBで実現する時系列タイムライン機能

Slide 15

Slide 15 text

キー設計 Partition Key: 参照ユーザーID Sort Key: タイムスタンプ + 配信ID(重複防止)

Slide 16

Slide 16 text

Queryによる取得(PartiQL) SELECT * FROM timeline WHERE user_id = 12345 ORDER BY sort DESC LIMIT 40; SELECT * FROM timeline WHERE user_id = 12345 AND sort < “xxxxx_yyyy” ORDER BY sort DESC LIMIT 40; SELECT * FROM timeline WHERE user_id = 12345 AND BEGINS_WITH( sort, “20210501” ) ORDER BY sort DESC LIMIT 40; 最新の40件取得特定のキーより前の 40件取得 (ページング等) 特定の日付の40件取得

Slide 17

Slide 17 text

BatchWriteItemによる保存配信開始時にフォロワー数分のアイテムが作成される最大で数十万のアイテムを作成するため SQS & Lambdaで非同期化 PatitionKeyはフォロワーのIDのため、書き込みが均等に分散する PartitionKeyが適切に分散しないと、特定パーティションに書き込みリクエストが集中しスロットリングする恐れがある

Slide 18

Slide 18 text

Lambdaでリトライアプリケーションの実装でリトライ AWS SDKでリトライ SQSでリトライ無限リトライを防ぐため、リトライ回数の上限で DLQへ流す DynamoDBでの実現例: リトライ

Slide 19

Slide 19 text

予め必要なキャパシティを予約しておく方式そのキャパシティが使われなくても課金されるオートスケーリングを設定できる余分な課金の割合が高い消費した分だけ課金消費したキャパシティに対する従量課金方式過去の消費キャパシティの 2倍に自動でスケール => 今回の場合オンデマンドモードを選択・オンデマンドモード・プロビジョンドモード

Slide 20

Slide 20 text

配信情報のマスターデータはRDBに永続化されている RDBとDynamoDBのデータをどこまで同期するかを定義する必要があるデータのライフサイクル例: 配信削除時、非公開時など 1. DynamoDBからBatchWriteItemで全て削除 2. アプリケーション (取得API) 側で除外 → こちらを採用

Slide 21

Slide 21 text

DynamoDBにはキャパシティ以外にも、ストレージ課金が存在そのままだと無限にデータが増え、コストが増えるタイムラインのデータは新しいものほどアクセスされ、古いものほどアクセスされない特性がある一定期間以上経過したデータを削除する → TTL (Time To Live) の設定 TTL

Slide 22

Slide 22 text

まとめ

Slide 23

Slide 23 text

まとめ DynamoDBは時系列データをユーザーごとに保存する用途として有用ただし正しくキー設計をしないと、スケーラビリティが損なわれる数秒〜数十秒かかっていた場合もあったリクエストタイムを 100ms程度に短縮オンデマンドモードを利用することで、スパイク耐性や料金の最適化ができる予測が難しく、かつユーザー数に比例しづらい突発的なアクセスでは有効単位当たりの料金ではオンデマンドの方が割高なため注意データのライフサイクルなどを適切に定義する必要があるリトライ戦略および監視 RDBとのデータ整合性

Slide 24

Slide 24 text

参考 How CyberZ performs read-light operations to display followees’ activities in the timeline using Amazon DynamoDB en: https://aws.amazon.com/jp/blogs/database/how-cyberz-performs-read-light-operations-to-display-followe es-activities-in-the-timeline-using-amazon-dynamodb/ ja: https://aws.amazon.com/jp/blogs/news/how-cyberz-performs-read-light-operations-to-display-followees- activities-in-the-timeline-using-amazon-dynamodb/

Slide 25

Slide 25 text

No content