Upgrade to Pro — share decks privately, control downloads, hide ads and more …

PoCにおけるRedshiftへの データ格納時に感じた課題・疑問点の解決

PoCにおけるRedshiftへの データ格納時に感じた課題・疑問点の解決

【クラスメソッド・アクセンチュア デジタル共催】 最新テクノロジー案件最前線!実践ノウハウから伝えるLT×10本勉強会 〜サーバーレス、ビッグデータ、IoT、認証、そしてDevOpsなど〜
https://dev.classmethod.jp/news/190716-lt-ac-vs-cm/

アクセンチュア登壇資料

T.Koichi

July 16, 2019
Tweet

More Decks by T.Koichi

Other Decks in Technology

Transcript

  1. 背景 Copyright © 2019 Accenture. All rights reserved. PoCプロジェクトにおけるデータ受領 分析チーム

    クライアント 月次 データ提供 S3 アクセンチュア AWSアカウント Redshift  データ取り込み時間…  ストレージ不足… 1ファイル毎 Copy
  2. 課題①データ取り込み時間 当初のRedshiftクラスター Redshift リーダー ノード コンピュート ノード コンピュート ノード コンピュート

    ノード (dc2.large) コンピュート ノード スライス数(2×4=8スライス)にファイルを分割 最大7時間ほどかかっていたCopyが約1時間で終わるようになった RAM RAM Core Core Disk Disk RAM RAM Core Core Disk Disk RAM RAM Core Core Disk Disk RAM RAM Core Core Disk Disk Copyright © 2019 Accenture. All rights reserved.
  3. 課題②ストレージ不足 想定していたElastic Resize後のRedshiftクラスター Redshift リーダー ノード コンピュート ノード (dc2.large) RAM

    RAM Core Core Disk Disk コンピュート ノード RAM RAM Core Core Disk Disk コンピュート ノード RAM RAM Core Core Disk Disk コンピュート ノード RAM RAM Core Core Disk Disk コンピュート ノード RAM RAM Core Core Disk Disk コンピュート ノード RAM RAM Core Core Disk Disk コンピュート ノード RAM RAM Core Core Disk Disk コンピュート ノード RAM RAM Core Core Disk Disk Elastic Resizeの結果、上記クラスター(2×8=16スライス)になると想定 Copyright © 2019 Accenture. All rights reserved.
  4. 課題②ストレージ不足 Copyright © 2019 Accenture. All rights reserved. AWS見解 Elastic

    Resizeでは既存スライスを新ノードに割り当てているだけ
  5. 課題②ストレージ不足 Elastic Resize後のRedshiftクラスター Redshift リーダー ノード コンピュート ノード (dc2.large) コンピュート

    ノード コンピュート ノード コンピュート ノード コンピュート ノード コンピュート ノード コンピュート ノード コンピュート ノード RAM Core Disk RAM Core Disk RAM Core Disk RAM Core Disk RAM Core Disk RAM Core Disk RAM Core Disk RAM Core Disk 上記クラスター(1×8=8スライス)になっていると思われる Copyright © 2019 Accenture. All rights reserved.