DMM.com のビッグデータ基盤を支える技術

DMM.comのビッグデータ基盤を支える技術 TECH PLAY Conference 2017 DMM.com Labo システム本部ビッグデータ部鈴木
翔太 / 吉田龍馬

2 © DMM.com Group @szyn 自己紹介 Node.js で内製BIツール開発 Presto導入 Hadoop/日次バッチ運用
最近のお気に入り: Golang 鈴木翔太 DMM.com Labo システム本部ビッグデータ部 @i_szyn

3 © DMM.com Group 自己紹介 Node.js で内製BIツール開発 Hadoopクラスタの構築 /
運用 AWS を利用した分析基盤の検証ユーザートラッキングシステムの刷新吉田龍馬 DMM.com Labo システム本部ビッグデータ部 @ryysud @ryysud

4 © DMM.com Group DMM.comについてサービスとグループについて

5 © DMM.com Group サービスについて DMM.comは1999年から続く老舗サービスサイトです。時代のニーズに合わせた多彩なコンテンツを、17年間培った独自プラットフォームで安定的に提供し
ています。 About Service 40以上の幅広いサービスを展開

6 © DMM.com Group グループについて DMM.com Groupは、動画や電子書籍などのダウンロード販売ほか、ゲームや通販、オンラインレンタルなどを提供するサイト
「DMM.com」の構築から運営までを手がけているグループです。 About Group ԯԁ ച্ߴਪҠ˞ ʢԯԁʣ ʢ೥݄ʣ ※DMM.comɺDMM.comϥϘɺDMM.comূ݊ɺDMM.com OVERRIDEɺDMM.com Baseɺଞ࿈݁ ձһ਺ਪҠ ձһ਺ ສਓಥഁʂ ʢ೥݄ʣ ʢສਓʣ ※ւ֎ձһؚΉ 株式会社DMM.com 事業の企画・営業株式会社DMM.comラボシステム開発・運営ネットワークインフラの提供 Webマーケティング株式会社株式会社DMM.com証券 FX・CFDの運営株式会社DMM.futureworks DMM VR THEATERの運営およびプロデュース・企画、音楽・映像コンテンツの制作株式会社DMM.com Base DISCメディアのプレス、アッセンブリ業務物流サービス事業 DVD、CD、BDなどのソフトレンタル事業株式会社DMM.com OVERRIDE DMM GAMES制作・運営 2D / 3Dデザイン制作ゲームネットワークインフラの運用

7 © DMM.com Group ビッグデータ部について仕事・これまでの活動

8 © DMM.com Group ビッグデータ部のミッションビッグデータを用いて事業のKPI（重要経営指標）向上へ貢献することデータドリブンマーケティングマーケティングオートメーション施策の効果など今後の計画を練るための情報を提供
レコメンドや検索エンジンなどを通してユーザーに適切な情報を提供

9 © DMM.com Group ビッグデータ部の仕事 Hadoop 基盤運用レコメンド検索データ分析
メルマガアフィリエイト

10 © DMM.com Group ビッグデータ部の対外活動 ※一部抜粋 2015/02 Developers Summit Winter
2015：Sparkによるリアルタイムレコメンド 2015/09 Developers Summit 2015 FUKUOKA：Kafka・HBaseによるビッグデータ収集 2015/11 Cloudera World Tokyo 2015：Spark+Kafkaを使ったアーキテクチャ説明 2016/02 Hadoop / Spark Conference Japan 2016：Hive on Sparkを活用した高速データ分析 2016/06 IBM Datapalooza Tokyo：DMM.comにおけるビッグデータ処理のためのSQL活用術 2016/11 Cloudera World Tokyo 2016：Deep Learningを用いた類似画像レコメンド DMM.comラボとIDCフロンティア、コンテンツレコメンドの精度向上を共同検証 https://www.idcf.jp/pressrelease/2017/20170516001.html Sparkを活用したアジアパシフィック初のレコメンド基盤実現 http://www.cloudera.co.jp/customers/dmm.html

11 © DMM.com Group アジェンダシステム全体図概要説明当時の課題課題解決の事例紹介 CDHクラスタ移行
分散クエリエンジンPresto導入新ワークフローエンジンDigdagへのリプレイスまとめ

12 © DMM.com Group システム全体図 2015年12月〜2017年8月のデータ分析基盤変遷

13 © DMM.com Group システム全体図 - 2015年12月 - CDH Spark
Hive YARN HDFS Sqoop 各種API (レコメンド等) Consumer RabbitMQ Tracking-API DMM.com JSLibrary MariaDB 各種API (レコメンド等) Jenkins Aerospike ※ ビッグデータ部発足当初

14 © DMM.com Group User Tracking - システム紹介 - CDH
Spark Hive YARN HDFS Sqoop 各種API (レコメンド等) Consumer RabbitMQ Tracking-API DMM.com JSLibrary MariaDB 各種API (レコメンド等) Jenkins Aerospike

15 © DMM.com Group User Tracking - システム概要 - CDH
Spark Hive YARN HDFS Sqoop 各種API (レコメンド等) Consumer RabbitMQ Tracking-API DMM.com JSLibrary MariaDB 各種API (レコメンド等) Jenkins Aerospike ユーザ行動ログ収集 PV/クリック/レコメンド表示/サジェスト表示 API (Node.js) ピークタイム時は 6~7K qps Aerospikeで経由情報の補完 Consumer (Erlang) Hadoop (HDFS) にログを格納

17 © DMM.com Group CDH - システム構成 - CDH Spark
Hive YARN HDFS Sqoop 各種API (レコメンド等) DMM.com MariaDB 各種API (レコメンド等) Jenkins Cloudera社のCDHを利用 Cloudera’s Distribution including Apache Hadoop Hadoopクラスタ運用管理ツールである『Cloudera Manager』でサーバの設定・管理・監視などの運用コストを削減主な利用コンポーネント HDFS / YARN / Hive / Hue / Spark / Sqoop

18 © DMM.com Group CDH - システム構成 - CDH Spark
Hive YARN HDFS Sqoop 各種API (レコメンド等) DMM.com MariaDB 各種API (レコメンド等) Jenkins 動的リソースプールを活用 YARNのリソース配分を動的に変更昼間はアドホック集計 / 夜間はバッチ向けにレコメンドで Hive on Spark を活用日次バッチは Jenkins (※2015年12月時点) Sqoopによるデータ取り込み処理 Hiveによる集計処理

19 © DMM.com Group 当時の分析基盤における課題 ② アドホック集計が遅い分散クエリエンジンPresto導入 ③ 日次バッチがJenkins依存
ワークフローエンジンDigdagへのリプレイス ① CDHクラスタのリソース不足 CDHクラスタ移行

Hive YARN HDFS Sqoop 各種API (レコメンド等) Consumer RabbitMQ Tracking-API DMM.com JSLibrary MariaDB 各種API (レコメンド等) Digdag Aerospike Presto Re:dash Batch Zeppelin EFK

23 © DMM.com Group CDH CDHクラスタ移行

24 © DMM.com Group 当時の分析基盤における課題 ① ログの増加に伴うクラスタの容量不足ビッグデータ部発足時からユーザー数が増加 2015年12月：会員数 1,500万人
2017年6月：会員数 2,700万人ジョブの増加に伴うリソース枯渇

26 © DMM.com Group CDH クラスタについて OLD Cluster CDH 5.7.1
サーバスペック CPU Core: 560C Disk (SSD): 57.5TB Memory: 1.7TB NEW Cluster CDH 5.10.0 サーバスペック CPU Core: 560C Disk (HDD): 1.4PB Memory: 5.1TB

27 © DMM.com Group CDH クラスタ移行の流れ新クラスタ構築物理サーバ調達構築作業並行稼動
distcpでデータ移行新クラスタ切り替え旧クラスタから新クラスタへ切り替え障害テスト / チューニングも実施並行稼動は約2週間

28 © DMM.com Group 並行稼動中に障害試験を実施（全21項目）バッチでのファイル書き込み中に NameNode を停止 HiveでのMapReduce実行中に Hive
Server2 を停止 HiveでのMapReduce実行中に DataNode 1台の NIC を停止 Hive Metastore DBの停止 (MariaDB Galera Cluster) , etc. 移行の際に併せて実施したこと①

29 © DMM.com Group 並行稼動中にチューニングを実施　OS のパラメーター変更 txqueuelen → 1000
/ 4096 / 10000 /sys/block/sda/queue/scheduler ( I/Oスケジューラ ) → cfq / deadline 　HDFS / YARN のパラメーター変更 dfs.datanode.handler.count → 3 / 10 mapred.map.output.compression.codec → BZip2Codec / SnappyCodec mapreduce.reduce.shuﬄe.parallelcopies → 10 / 40 mapreduce.reduce.input.buﬀer.percent → 0 / 0.5 / 1 mapreduce.reduce.merge.inmem.threshold → 1000 / 500 / 0 , etc. 移行の際に併せて実施したこと②

30 © DMM.com Group ファイルフォーマット / 圧縮形式の見直しこれまで Sequence File
/ Bzip2 (※圧縮率を最優先) 検証の末 ORC / Snappy へ変更カラムナフォーマットを採用移行の際に併せて実施したこと③

31 © DMM.com Group リソース増強&チューニングで処理高速化 MapReduce の中間データを Bzip2 ➡ Snappy
にバッチA 00:48 ➡ 00:26 バッチB 03:59 ➡ 01:55 バッチC 01:07 ➡ 00:44 処理時間が約半分に短縮！コンポーネント類のバージョンアップ特にSpark周り (ver.2系も利用可能に) ここが良くなった所要時間 (分) 0 75 150 225 300 バッチA バッチB バッチC チューニング前チューニング後

32 © DMM.com Group Presto 分散クエリエンジンPresto導入

33 © DMM.com Group 当時の分析基盤における課題 ② Hive on MapReduceが遅い同じクラスタで定常バッチ
/ アドホック集計アドホック分析の際に何度もクエリを書き直し&実行を繰り返すが実行時間が長いため非常に効率が悪い

34 © DMM.com Group Facebook社が開発する分散クエリエンジン(≠DB) ANSI SQLを採用大規模なデータセットに対して高速にクエリ実行 DAGベースの処理中間データをメモリ上に持つため低レイテンシ
様々なデータソースに対応異なるデータソースであってもJOIN可能例) HiveとRDBにあるデータをクエリでJOIN Prestoとは何か ref. Presto: Interacting with petabytes of data at Facebook https://www.facebook.com/notes/facebook-engineering/presto-interacting-with-petabytes-of-data-at-facebook/10151786197628920

36 © DMM.com Group Presto周辺の構成図 Presto Zeppelin Presto Re:dash Elasticsearch
& Kibana Batch MariaDB API Hadoop

& Kibana Batch MariaDB API Hadoop 分析環境アナリストが任意のクエリを実行する環境 PrestoクエリはRe:dash / Zeppelinから実行長期稼働しているクエリは、 Elasticsearch / Kibana で監視。エンジニアが状況に応じてクエリをキャンセル Coordinator 1, Worker 20

& Kibana Batch MariaDB API Hadoop バッチ環境システムから発行されるクエリの実行環境 Hadoop上のデータをAPI経由で他システムに連携するための抽出処理に利用定型的なクエリがメイン Coordinator 2, Worker 6

39 © DMM.com Group パフォーマンス比較下記要領で、パフォーマンス比較を実施 Prestoは分析環境を利用対象テーブルは ORC /
Snappy 形式過去3ヶ月の期間集計 (対象: 約163億レコード) 3パターンのクエリを実行クエリA: PV数カウント（カウント数）クエリB: 検索されたワードのランキング（Window関数）クエリC: 特定ページのPV数カウント (クエリA + 条件追加)

40 © DMM.com Group パフォーマンス比較実行時間 (秒) 0 100 200
300 400 Hive Presto クエリA - PV数 - クエリB - 検索ワードランキング - クエリC - 特定条件PV数 - Hive 176 s 310 s 383 s Presto 10 s 30 s 46 s

41 © DMM.com Group ここが良くなったアドホックな集計が高速にできるようになった Hiveと比較し圧倒的な早さアナリスト/エンジニアが気軽にデータに触れられるように 1日平均400クエリが実行(過去30日分実績) 高速なバッチ処理を実現
高速に集計をしたいバッチはPrestoを利用

42 © DMM.com Group DMMでのPrestoおよび周辺エコシステムの運用事例 https://goo.gl/teykfR ビッグデータを使ってバナーを動的表示させたらコンバージョンが323%増加した話 https://goo.gl/j1E43X 参考:
Prestoの発表事例

45 © DMM.com Group Digdagとは Tresure Data社が開発するワークフローエンジン処理のフローをコード（YAMLのDSL)で管理高い可用性タスクの状態はPostgreSQLに永続化
リトライ機能スケーラビリティサーバを増やすことで分散してタスクを実行タスクの並列実行も簡単 ref. Digdagによる大規模データ処理の自動化とエラー処理 https://www.slideshare.net/frsyuki/digdag-76749443

46 © DMM.com Group いわゆるETL チーム内における日次バッチデータ収集ツールで実行 ( Python製 )
加工したデータを Hive / MariaDB に転送 Hiveクエリでデータ加工 Extract データ取得処理 ※ sqoop / mysql Transform 取得データ加工処理 Load DWH / Data Mart へデータ転送

47 © DMM.com Group 保持しているデータ扱っているデータは様々各サービスが保持するデータを一箇所に集約 Digdagの日次ワークフロー
23 workﬂows ※ 一部 ※ ただし個人情報は除く検索ログ検索INDEXのデータメール配信ログメルマガ配信ログレコメンドログ提供したレコメンド情報購買ログユーザー購買ログ行動ログユーザーの行動ログ PVなど , etc.

49 © DMM.com Group ETLシステム概要図 PostgreSQL (Primary) pgpool-II (Active) PostgreSQL
(Standby) Watchdog pgpool-II (Standby) Streaming Replication lsyncd & rsync VIP Digdag Server Digdag Server

50 © DMM.com Group ETLシステム概要図 1. 日次バッチ実行 MariaDB 3.2. MariaDBに集計結果転送
(Load) Hadoop DataNode Digdag Server Hadoop DataNode … 2.2. DataNodeから各DBへ接続& データ取り込み(Extract) 3.1. Hiveでデータ加工/集計 (Transform) 事業部所有DB … 2.1. テーブルメタデータ取得

56 © DMM.com Group 各プロジェクトで得られた成果 CDHクラスタ移行により… リソース増強&チューニングによるジョブの高速化 Presto導入により… アドホック分析が高速に高速なバッチ集計処理を実現
Digdag導入により… 日次バッチの見通しが改善並列処理により処理が高速化

58 © DMM.com Group 現在抱えている課題と行っている取り組みユーザー行動ログが利用できるまでに時間がかかる現状: 最短でも1時間前のデータリアルタイム性を重視したアーキテクチャへ鮮度の高い情報をレコメンドに活かせるように
データ分析を全社展開する際のオンプレリソース不足 AWS活用: Athenaなど

ご清聴ありがとうございました！

DMM.com のビッグデータ基盤を支える技術

DMM.com のビッグデータ基盤を支える技術

More Decks by Ryuma Yoshida

Other Decks in Technology

Featured

Transcript