Slide 1

Slide 1 text

© MapR Technologies ® © MapR Technologies ® マップアール・テクノロジーズ株式会社 システムエンジニア 草薙 昭彦 2014 年年 2 ⽉月 26 ⽇日 ビジネスへの本格活⽤用が 始まった Hadoop の今 〜~MapR が選ばれる理理由〜~

Slide 2

Slide 2 text

© MapR Technologies ® Hadoop による お客様のビジネスの成功

Slide 3

Slide 3 text

© MapR Technologies ® Hadoop ディストリビューション INFRASTRUCTURE INNOVATIONS MANAGEMENT INNOVATIONS OPEN SOURCE OPEN SOURCE OPEN SOURCE MANAGEMENT INNOVATIONS ディストリビューションC ディストリビューションM ディストリビューションA

Slide 4

Slide 4 text

© MapR Technologies ® Hadoop ディストリビューション INFRASTRUCTURE INNOVATIONS MANAGEMENT INNOVATIONS OPEN SOURCE OPEN SOURCE OPEN SOURCE MANAGEMENT INNOVATIONS ディストリビューションC ディストリビューションA

Slide 5

Slide 5 text

© MapR Technologies ® お客様が直⾯面する現実の課題 データの移動 ⼈人⼿手・コスト をかけない 運⽤用 ⾼高信頼の データ基盤を 全社で共有

Slide 6

Slide 6 text

© MapR Technologies ® 課題1: データの移動 ステージング ファイルサーバ 企業内ユーザー 分析システム 専⽤用ツール による バッチ投⼊入 専⽤用コネクタ による RDBへの ロード RDBからのダンプ ・ファイル転送 レポーティング ・クエリー ETL・整形・集計 ・キューブ作成 「とにかく時間がかかる」 「専⽤用ツール・コネクタの メンテナンスが⼤大変」 業務システム

Slide 7

Slide 7 text

© MapR Technologies ® MapR NFS ダイレクトアクセス レポーティング ・クエリー ETL・整形・集計 ・キューブ作成 NFSによる 直接投⼊入 NFS経由で RDBネイティブ ローダー利利⽤用 より直近のデータを分析対象に 外部システムが変わっても NFS ならば対応が容易易 企業内ユーザー 分析システム 業務システム

Slide 8

Slide 8 text

© MapR Technologies ® HDFS vs MapR FS HDFS Hadoop 標準ファイルシステム MapR FS MapR 最適化ファイルシステム NFS のフル機能と⾼高い性能を提供できるのは アーキテクチャが異異なるから ライトワンス 同時 R/W アクセス不不可 (ファイルクローズするまで他から⾒見見えない) ランダム R/W 同時 R/W 可能 (書き込み中のファイルが他から読める)

Slide 9

Slide 9 text

© MapR Technologies ® 課題2: データ基盤の共有 部⾨門B 部⾨門A 部⾨門C 「障害の影響やポリシーの違いを考慮して、他部⾨門と運⽤用を分けているが・・」

Slide 10

Slide 10 text

© MapR Technologies ® Volume, Snapshot, Mirroring 部⾨門B 部⾨門A 部⾨門C 部⾨門Aボリューム 部⾨門Bボリューム 部⾨門Cボリューム

Slide 11

Slide 11 text

© MapR Technologies ® Volume, Snapshot, Mirroring 部⾨門B 部⾨門A 部⾨門C 部⾨門Aボリューム 部⾨門Bボリューム 部⾨門Cボリューム 部⾨門A ミラーボリューム 部⾨門B ミラーボリューム 部⾨門C ミラーボリューム スナップショット スナップショット スナップショット スナップショット スナップショット スナップショット 災害対策⽤用リモートクラスタ

Slide 12

Slide 12 text

© MapR Technologies ® HDFS vs MapR FS ⼀一貫性のあるスナップショット・ミラーリングを 提供できるのはアーキテクチャが異異なるから MapR FS Mirroring HDFS Snapshot MapR FS Snapshot ディレクトリ単位、⼀一貫性の ないイメージ (メタデータのみの⼀一貫性) ボリューム単位の ⼀一貫性のあるイメージ HDFS ベースの分散コピー MapReduce ジョブによる ファイル単位の転送 ⼀一貫性のないイメージ ネイティブプロセスによる ブロック単位の転送 ⼀一貫性のあるイメージ

Slide 13

Slide 13 text

© MapR Technologies ® 課題3: ⼈人⼿手/コストをかけない運⽤用 クラスタの規模が⼤大きくなってく ると、サーバ台数を数%増やすだけ で年年間数千万円のコスト増に・・・ ハードウェアのコモディティ化が 進んだ今、もっとも貴重でコスト が⾼高いリソースは⼈人。システムの 運⽤用よりもコアビジネスにエンジ ニアを多く割り当てたい・・・

Slide 14

Slide 14 text

© MapR Technologies ® サーバ台数削減による TCO 改善 Read/Write スループット ベンチマーク DFSIO Read スループット DFSIO Write スループット MB per Second MB per Second ソース: Flux7 Labs Study, 2013年年10⽉月 120台 50台 他ディストリビューション 実際の事例例

Slide 15

Slide 15 text

© MapR Technologies ® MapR 統合データプラットフォーム §  NoSQLカラムストア   §  Apache HBase API §  In-Hadoopデータベース HBase JVM HDFS JVM ext3/ext4 ディスク 他ディストリビューション テーブル/ファイル ディスク MapR M7 多層のレイヤーを統合し、オーバーヘッドを除去 ⾼高い性能と運⽤用管理理の⼤大幅な簡素化を実現

Slide 16

Slide 16 text

© MapR Technologies ® © MapR Technologies Architecture Matters アーキテクチャがすべてを左右する

Slide 17

Slide 17 text

© MapR Technologies ® MapR Distribution for Hadoop MapR Data Platform エンタープライズ グレード パフォーマンス マルチテナント データ保護 相互運⽤用性 業務 & 分析 Management MapR Data Platform MAPR-DB MAPR-FS APACHE HADOOP ECOSYSTEM Hue ... Shark Impala Drill Hive/ Stinger/ Tez Sqoop Storm Sentry Spark Solr Cascading Mahout Flume Oozie HBase MapReduce YARN Pig Whirr Zookeeper MapR Data Platform TABLES FILES MapR Data Platform MAPR-DB MAPR-FS Patent Pending •  ⾼高可⽤用性 •  データ保護 •  ディザスタリカバリ •  2〜~5倍の性能 •  標準ファイルアクセス •  標準データベースア クセス •  プラガブルサービス •  幅広い開発者⽀支援 •  エンタープライズ セキュリティ認証 •  ワイヤレベル認証 •  データガバナンス •  予測分析・リアル タイムデータベー ス処理理・⾼高レート のデータ流流⼊入をサ ポートする能⼒力力 •  トランザクション の完全性を提供す る処理理フレームワ ークユニット •  クラスタを論論理理的に 分割して異異なる⽤用途 ・ジョブの種類・ユ ーザーグループ・管 理理者をサポート

Slide 18

Slide 18 text

© MapR Technologies ® 多くの Hadoop プロジェクトは まだ実験段階 幅広い業務利利⽤用 10 – 2000 ノード 最初の業務事例例 1 – 10 ノード 開発/テストが中⼼心: 教育/サービス

Slide 19

Slide 19 text

© MapR Technologies ® リアルタイム広告オークション Advertising Automation Cloud ! Sellers Cloud ! Buyers ! Cloud ! 900億 広告オークション ⼀一⽇日あたり

Slide 20

Slide 20 text

© MapR Technologies ® フォーチュン100⼩小売⼤大⼿手 4,500万 買い物客 ⼀一ヶ⽉月あたり分析対象

Slide 21

Slide 21 text

© MapR Technologies ® 世界最⼤大のバイオメトリックDB 12億 ⼈人

Slide 22

Slide 22 text

© MapR Technologies ® MapR 最新のリリース 1 2 3 YARN をサポートした Apache Hadoop 2.2 を含む最新のデ ィストリビューションを発表 無償で使⽤用できる開発者向け Hadoop Sandbox を発表 HP Vertica プラットフォームを MapR 上で提供 O’Reilly Strata Conference 2014 in Santa Clara (2014/2/11〜13) での発表 既存アプリと MapReduce以外の アプリを共存可能に 開発と運⽤用⼿手法の 習得を加速 SQLでの分析・ 業務処理理の統合

Slide 23

Slide 23 text

© MapR Technologies ® さっそく MapR を始めましょう MapR Sandbox 無償の開発者向け シングルノードVMイメージ Amazon Web Services (EMR) Google Compute Engine 数分でクラウド上でクラスタを⽴立立ち上げ MapR 評価版ダウンロード 30⽇日間無償の評価ライセンス Free Trial