decode17

Copyright©2017 NTT corp. All Rights Reserved. 分散並列処理の基本と分散並列処理系の最近の動向について小沢健史 NTT
Software Innovation Center 2017/5/24

2 Copyright©2017 NTT corp. All Rights Reserved. •小沢健史(Ozawa Tsuyoshi)
•Apache Hadoop Committer/PMC •Hadoop 徹底入門第2版 Chapter 22(YARN) •gihyo.jp “Hadoopはどのように動くのか” Hadoop，Tez，YARN 自己紹介

3 Copyright©2017 NTT corp. All Rights Reserved. 分析で Excel・DB を
使っている方

4 Copyright©2017 NTT corp. All Rights Reserved. •処理するデータがどんどん増える… •HDD からデータの読み込み
→ データ量に応じて時間がかかってしまう困ったことはありませんか？ 100MB 100GB 100TB 1秒 1000秒 (=約16分) 読み込みで1000000秒! (=約11日)

5 Copyright©2017 NTT corp. All Rights Reserved. •処理するデータがどんどん増える… •HDD からデータの読み込み
→ データ量に応じて時間がかかってしまう困ったことはありませんか？ 100MB 100GB 100TB 1秒 10000秒 (=1分半) 読み込みで1000000秒! (=約11日) そこで並列処理！

6 Copyright©2017 NTT corp. All Rights Reserved. •計算資源を並べることで速く処理すること •例 •HDD
を10個並べる並列処理 (Parallel processing) 100 MB/sec x 10個 = 最大1GB/sec

7 Copyright©2017 NTT corp. All Rights Reserved. 並列処理の注意どころ (1) 並列処理の効果は処理依存
•ディスクI/Oの割合が 99% 99 1

•ディスクI/Oの割合が 99% 99 1 1 1 99倍効果:50倍

•ディスクI/Oの割合が 99% 99 1 1 1 効果:50倍 99倍 •ディスクI/Oの割合が 50% 50 50 0.5 99倍 50

•ディスクI/Oの割合が 99% 99 1 1 1 99倍 •ディスクI/Oの割合が 50% 50 50 0.5 効果:約2倍 99倍 50 効果:50倍

11 Copyright©2017 NTT corp. All Rights Reserved. 並列処理の注意どころ (2) 拡張性の限界
•値段的限界 L4 L8 L16 L32 $0.5 $1 $2 $4 https://azure.microsoft.com/en- us/pricing/details/virtual-machines/windows/

12 Copyright©2017 NTT corp. All Rights Reserved. 並列処理の注意どころ (2) 拡張性の限界
•値段的限界 •物理的限界一台の計算機に足せるドライブ数に限界 L4 L8 L16 L32 $0.5 $1 $2 $4 https://azure.microsoft.com/en- us/pricing/details/virtual-machines/windows/

13 Copyright©2017 NTT corp. All Rights Reserved. •故障確率が向上 •1日に1%の確率で1つのHDDが壊れると仮定 •64個ドライブのある計算機の場合，
1日に1つ以上ドライブが壊れる確率は約48%=1 – (0.99 ** 64) 並列処理の注意どころ (3)

14 Copyright©2017 NTT corp. All Rights Reserved. •性能向上率はワークロード次第 •拡張性に限界 •故障確率が向上
並列処理の注意どころまとめ

並列処理の注意どころまとめ並列処理の特性

並列処理の注意どころまとめ

並列処理の注意どころまとめそこで分散処理！

18 Copyright©2017 NTT corp. All Rights Reserved. •複数の計算機をまたがって処理すること •目的は処理の高速化に限らない分散処理
(Distributed processing)

19 Copyright©2017 NTT corp. All Rights Reserved. •複数の計算機をまたがって処理すること •目的は処理の高速化に限らない •例
•異なる計算機2台に同じ計算をさせる → 故障しなかった方を採用分散処理 (Distributed processing) 計算機1 計算機2 依頼主投入

•異なる計算機2台に同じ計算をさせる → 故障しなかった方を採用分散処理 (Distributed processing) 計算機1 計算機2 故障依頼主

•異なる計算機2台に同じ計算をさせる → 故障しなかった方を採用分散処理 (Distributed processing) 計算機1 計算機2 無事回答! 依頼主

22 Copyright©2017 NTT corp. All Rights Reserved. •データのコピーを複数持つ •目的 •データへアクセスできる確率を向上させるため
•処理が無事に終わる確率を向上させるため分散処理でよく行われること

•処理が無事に終わる確率を向上させるため分散処理でよく行われること計算機1 計算機2 書き手保存しといてデータ

•処理が無事に終わる確率を向上させるため分散処理でよく行われること計算機1 計算機2 書き手コピーデータデータ

•処理が無事に終わる確率を向上させるため分散処理でよく行われること計算機1 計算機2 データデータ

•処理が無事に終わる確率を向上させるため分散処理でよく行われること計算機1 計算機2 データデータ故障

•処理が無事に終わる確率を向上させるため分散処理でよく行われること計算機1 計算機2 データデータ読み手読みたい

•処理が無事に終わる確率を向上させるため分散処理でよく行われること計算機1 計算機2 データデータ読み手成功！データ

29 Copyright©2017 NTT corp. All Rights Reserved. 分散処理の注意どころ (1) 分散のためにオーバヘッドが発生
•1台にコピー •2台にコピー通信量増大書き手計算機書き手計算機1 計算機2

30 Copyright©2017 NTT corp. All Rights Reserved. •故障時のエラーハンドリング分散処理の注意どころ (2)
書き手計算機1 計算機2 データ

書き手計算機1 計算機2 データ書込要求

書き手計算機1 計算機2 データ書込応答応答なし

書き手計算機1 計算機2 データ過負荷で書き込みに失敗

計算機1 計算機2 データ

計算機1 計算機2 データ読み手

計算機1 計算機2 データ読み手過負荷でアクセスできず読込要求

計算機1 計算機2 データ読み手過負荷でアクセスできずデータがないように見える！

計算機1 計算機2 データ読み手過負荷でアクセスできずデータがないように見える！自分でケアするのは大変

計算機1 計算機2 データ読み手過負荷でアクセスできずデータがないように見える！とても大変！

計算機1 計算機2 データ読み手過負荷でアクセスできずデータがないように見える！そこで並列分散処理基盤

41 Copyright©2017 NTT corp. All Rights Reserved. 並列処理と分散処理を組み合わせた処理基盤 → 高速に，故障を意識せずに使える！
並列分散処理基盤

42 Copyright©2017 NTT corp. All Rights Reserved. •データを溜めるファイルシステムデータを処理する処理系 •Spark/MapReduce
+ HDFS など •データベース •SQL Server・Amazon Redshift など最近の並列分散処理基盤の組み合わせ

44 Copyright©2017 NTT corp. All Rights Reserved. なぜFSとDBは分かれているか？大量のデータを永続的に格納する手段としては，(中略) OS
により提供されるファイルがある．しかし，ファイルシステムには(中略)問題点があり，これらがデータベースの開発の動機となっている．データベースシステム・北川博之著 p.2-p.3 より抜粋

45 Copyright©2017 NTT corp. All Rights Reserved. なぜFSとDBは分かれているか？大量のデータを永続的に格納する手段としては，(中略) OS
により提供されるファイルがある．しかし，ファイルシステムには(中略)問題点があり，これらがデータベースの開発の動機となっている．データベースシステム・北川博之著 p.2-p.3 より抜粋思想から異なる

47 Copyright©2017 NTT corp. All Rights Reserved. •処理系を柔軟に変更可能ファイルシステムベースの処理系の利点ファイルシステム
処理系1 処理系2

48 Copyright©2017 NTT corp. All Rights Reserved. •処理系を柔軟に変更可能 Hadoop エコシステムで起きていること
FileSystem API Spark HDFS MapReduce

FileSystem API Spark HDFS MapReduce

FileSystem API Spark HDFS MapReduce Azure Data Lake Store Amazon S3

51 Copyright©2017 NTT corp. All Rights Reserved. •処理系を柔軟に変更可能 •ファイルシステムの実装が変更可能に →
クラウドとの相性良い Hadoop エコシステムで起きていること FileSystem API Spark HDFS MapReduce Azure Data Lake Store Amazon S3

FileSystem API Spark HDFS MapReduce Azure Data Lake Store Amazon S3 最適化のためにやりとりできる情報が限られる

56 Copyright©2017 NTT corp. All Rights Reserved. •データを分散ファイルシステムから読む MapReduce FileSystem
API HDFS MapReduce Azure Data Lake Store Amazon S3 読出

57 Copyright©2017 NTT corp. All Rights Reserved. •データを分散ファイルシステムから読む •ユーザが指定した処理をする MapReduce
FileSystem API HDFS MapReduce Azure Data Lake Store Amazon S3 処理

58 Copyright©2017 NTT corp. All Rights Reserved. •データを分散ファイルシステムから読む •ユーザが指定した処理をする •分散ファイルシステムに結果を書き出し
MapReduce FileSystem API HDFS MapReduce Azure Data Lake Store Amazon S3 書出

59 Copyright©2017 NTT corp. All Rights Reserved. •基本は同じ Spark FileSystem
API HDFS Azure Data Lake Store Amazon S3 Spark 読出

60 Copyright©2017 NTT corp. All Rights Reserved. •基本は同じ Spark FileSystem
API HDFS Azure Data Lake Store Amazon S3 Spark 処理

61 Copyright©2017 NTT corp. All Rights Reserved. •基本は同じ •毎回も書き出さずに，Spark の世界の中で
最適化されたデータ形式で保持が可能 Spark FileSystem API HDFS Azure Data Lake Store Amazon S3 Spark 結果保持

62 Copyright©2017 NTT corp. All Rights Reserved. •基本は同じ •毎回も書き出さずに，Spark の世界の中で
最適化されたデータ形式で保持が可能 •最終的には書出 Spark FileSystem API HDFS Azure Data Lake Store Amazon S3 Spark 書出

64 Copyright©2017 NTT corp. All Rights Reserved. •データ処理とデータ保持部が密結合データベース保持部
処理部データベース

65 Copyright©2017 NTT corp. All Rights Reserved. •密結合により，最適化がしやすい •プログラミングしやすい特性(ACID)をもつデータベースの利点
保持部処理部データベース

66 Copyright©2017 NTT corp. All Rights Reserved. •スキーマ(型情報)を予め定義し、それを並列処理のヒント情報として利用 •分析用DBの場合、列数がかなり多い傾向(30以上)
分析用データベースの概要

→列方向にデータを分割必要な列のみにアクセス分析用データベースの概要

→列方向にデータを分割必要な列のみにアクセス分析用データベースの概要 userId username project … 1 Tsuyoshi Hadoop … 2 Neo Azure … … … … …

→列方向にデータを分割必要な列のみにアクセス分析用データベースの概要 userId username project … 1 Tsuyoshi Hadoop … 2 Neo Azure … … … … … 計算機1

→列方向にデータを分割必要な列のみにアクセス分析用データベースの概要 userId username project … 1 Tsuyoshi Hadoop … 2 Neo Azure … … … … … 計算機1 計算機2

73 Copyright©2017 NTT corp. All Rights Reserved. •NTT DATA の例
MapReduce/データベースの使い分け秒分時間日 Big Data Processing 応答時間 Size Online Processing GB TB PB Online Batch Processing データベース分析データベース Hadoop/ Spark Query & Search Processing Enterprise Batch Processing

81 Copyright©2017 NTT corp. All Rights Reserved. •バッチではなく，ストリーミング処理を高速に動作させたい処理速度に対する要求の多様化
インタラクティブクエリ系 • Apache Impala • Presto • Hive(LLAP) 深層学習特化 • TensorFlow • MXNet • CNTK • Chainer ストリーミング処理系 • Apache Storm • Spark Streaming

82 Copyright©2017 NTT corp. All Rights Reserved. •ワークロードによる使い分けが普通に処理速度に対する要求の多様化インタラクティブ
クエリ系 • Apache Impala • Presto • Hive(LLAP) 深層学習特化 • TensorFlow • MXNet • CNTK • Chainer ストリーミング処理系 • Apache Storm • Spark Streaming

83 Copyright©2017 NTT corp. All Rights Reserved. •ワークロードによる使い分けが普通に処理速度に対する要求の多様化インタラクティブ
クエリ系 • Apache Impala • Presto • Hive(LLAP) 深層学習特化 • TensorFlow • MXNet • CNTK ストリーミング処理系 • Apache Storm • Spark Streaming データ同期が大変に…

推薦エンジン分析DB Hadoop メール通知

推薦エンジン分析DB Hadoop メール通知そこで Apache Kafka

•データベースの特徴 •最近の動向まとめ

•データベースの特徴 •最近の動向まとめさいごに

•データベースの特徴 •最近の動向まとめ分散並列処理が身近になってきた

•データベースの特徴 •最近の動向まとめ何が何でも分散処理？

•データベースの特徴 •最近の動向まとめ効果が出るかは問題次第

•データベースの特徴 •最近の動向まとめ上手く使いこなしてビジネスの役に立ててください

•データベースの特徴 •最近の動向まとめエンジニアのみなさまの力量にかかっています！

decode17

decode17

More Decks by OZAWA Tsuyoshi

Other Decks in Programming

Featured

Transcript