実演Amazon Redshift 最新機能

© 2021, Amazon Web Services, Inc. or its Affiliates. Daisuke
Hirama Solutions Architect, Analytics Amazon Web Services Japan K.K. 実演 Amazon Redshift 最新機能

© 2021, Amazon Web Services, Inc. or its Affiliates. ⾃⼰紹介
平間⼤輔アマゾンウェブサービスジャパンソリューションアーキテクトアナリティクス分野の技術⽀援を担当好きなAWSサービス • Amazon Redshift • Amazon QuickSight • AWS Glue

© 2021, Amazon Web Services, Inc. or its Affiliates. お客様の要望に応じて進化し続ける
Amazon Redshift Analyze all your data Lake house with AWS integration Low cost & best value Predictable costs Data Lake Export Federated Query Amazon Redshift Spectrum + Lake Formation Amazon Redshift ML Lambda UDF Partner console integration AQUA HyperLogLog Materialized views Performance & scale Fast and self-tuning Concurrency scaling Data API RA3 nodes & managed storage Data sharing Automatic workload manager Cross-AZ cluster recovery Pause and resume Built-in security features Cost controls Super data type with JSON support 100K tables Performance tuning: automated On-demand and RIs

© 2021, Amazon Web Services, Inc. or its Affiliates. こんなときに
新機能を使ってみよう

© 2021, Amazon Web Services, Inc. or its Affiliates. 1.
朝イチでアクセスが集中してクエリの実⾏待ちが発⽣︕ • Amazon Redshift のような DWH 向けの RDBMS は、複雑で⼤量のデータを処理するリソース⼤⾷いのクエリに合わせてチューニングされている • そのため、単⼀クエリに⼗分なリソースを割り当てられるように、同時実⾏クエリ数を少なめに抑えていることが多い • ⼀⽅、ユーザーが出社直後にBIダッシュボードを⼀⻫に閲覧するなど、同時実⾏クエリ数が⼀時的にスパイクすることはしばしば発⽣する Amazon Redshift では、どうすれば︖

© 2021, Amazon Web Services, Inc. or its Affiliates. ピーク時にコンピュートを⾃動拡張する
Concurrency Scaling Amazon Redshift 追加クラスター(1~10) メインクラスターディスパッチ + + + Redshift にクエリが集中してクエリをさばくためのリソースが⾜りなくなった場合、裏で⾃動的に別のクラスターを⽴ち上げ、処理を待たせずに実⾏してくれる 1⽇1時間は無償で使える上に、無償枠を超えないよう利⽤キャップもかけられる

© 2021, Amazon Web Services, Inc. or its Affiliates. Demo:
Concurrency Scalingを効かせてみる • dc2.8xlarge x 2ノードのクラスタを2つ⽤意 • ⽚側のみConcurrency Scalingを有効に設定（Max 5クラスタに設定） • その他の設定は2クラスタで同⼀ • Auto WLM有効 • ショートクエリアクセラレーション有効 • リザルトキャッシュ無効 • ベンチマークツール(※)を使って分析系のワークロードを20セッションから同時実⾏ ※ HammerDB : https://www.hammerdb.com Amazon Redshift 広帯域ネットワーキング Redshift フォーマットデータメインクラスター追加クラスター(1~10) +++

様々な場所にある、様々な形式のデータを Amazon Redshift で分析したい Amazon Redshift に取り込んでいるデータ以外にも、データレイクや基幹DBには、古いデータから最新のデータまで蓄積・更新されている。そのため、以下のような要望が出てきている • 基幹DB上にある当⽇の履歴データや最新マスターと Amazon Redshift 上のテーブルとを結合して分析したい • データレイク上の古いデータを取り込まずに検索したい • 他のシステムで作成されたJSONファイルを、形式を変えずに取り込みたいウェブセンサーソーシャルデータレイクデバイス基幹DB Amazon Redshift

© 2021, Amazon Web Services, Inc. or its Affiliates. Amazon
Redshift Federated Query データウェアハウス、データレイク、業務データベースにまたがったデータを統合して分析 Amazon RDS PostgreSQL, MySQL Amazon Aurora PostgreSQL, MySQL Amazon S3 Data lake Amazon Redshift JDBC / ODBC データ移動なしに最新のデータを分析 Amazon Redshift から Amazon RDS/Aurora PostgreSQL 上のデータに直接クエリすることが可能セキュアで⾼パフォーマンスなデータアクセス Amazon RDS/Aurora MySQL は 2021/4/6 現在プレビューでのサポート

© 2021, Amazon Web Services, Inc. or its Affiliates. Redshift
Spectrum でアーキテクチャをデータレイクに拡張 Amazon Redshift JDBC/ODBC オープンフォーマットファイル (Parquet, ORC, JSON, CSV etc) アプリケーションは、データウェアハウスとデータレイクの双⽅のデータに透過的にアクセスできる Amazon Redshift Spectrum • S3 上のファイルに対する並列クエリ実⾏エンジンデータレイク • ユーザー管理 S3 バケット

© 2021, Amazon Web Services, Inc. or its Affiliates. SUPER
データ型半構造化データをスキーマ指定なしにテーブルに取り込み、クエリ可能ネイティブに半構造化データをサポートする SUPER データ型ネストされた JSON データの取り込みが従来のようにフラット化して取り込むよりも最⼤で 5 倍⾼速に SUPER 型のデータを Materialized View 化することによる⾼速な分析も容易直感的にわかりやすい SQL でスキーマレスなネストデータへの分析をかんたんに⾏えるように Public Preview SELECT name.given AS firstname, ph.num FROM customers c, c.phones ph WHERE ph.type = ’cell’; firstname | num ----------+--------------- "Jane" | 6505550101 id INTEGER name SUPER phones SUPER 1 {"given":"Jane", "family":"Doe"} [{"type":"work", "num":"9255550100"}, {"type":"cell", "num": 6505550101} ] 2 {"given":„Richard", "family":„Roe"}, [{"type":"work", "num": 5105550102}]

複数のDWHクラスターで同じデータをシェアしたいそれぞれ別々な処理要件を持つ多様なユースケースに対して、個別に費⽤計算をしたいワークロードを分離して適切に費⽤計算⼀括管理せずにセルフサービスでグループやチームごとに、⾃分たちに必要な処理能⼒を独⽴して管理したいデータをシェアして第三者がデータ利⽤をしやすくしたい組織の枠を超えたデータ利⽤⾼度な分析や機械学習を利⽤可能に使⽤する分析ツールやフレームワークを⾃由に選べるようにしたい DWH クラスターが社内に複数⽴てられている環境では、クラスター間でデータをシェアしたいという要望があることが多い

© 2021, Amazon Web Services, Inc. or its Affiliates. Amazon
Redshift Data Sharing Redshift クラスター間でセキュアに簡単にデータを共有することが可能プロデューサークラスターコンピュートノードコンピュートノードコンピュートノードコンピュートノードリーダーノードコンシューマークラスターコンピュートノードコンピュートノードコンピュートノードリーダーノードコンピュートノードコンピュートノード Amazon Redshift マネージドストレージ共有データの読み込みプライベートデータの読み込みと書き込み • プロデューサークラスターが書き込んだ共有データを、データの移動なしにコンシューマークラスターに read only で共有することが可能 • アクセス権の管理と共有状況の監査により、セキュアなデータ共有を実現 RA3 インスタンス RA3 インスタンス

© 2021, Amazon Web Services, Inc. or its Affiliates. Demo:
ワークロード別にクラスターを分けてみる • ETLクラスターのテーブルを、アドホッククエリ⽤のクラスター、ダッシュボード⽤のクラスターに共有する • 各クラスターでクエリを実⾏し、それぞれのクラスターが⾃分のリソースのみを使ってクエリを実⾏している様⼦を確認 • ETLクラスターでテーブルを更新し、各クラスターで更新結果が反映されることを確認 ETL クラスタダッシュボードクラスタ 2-node RA3.4XL 2-node RA3.4XL 2–node RA3.4XL アドホッククエリクラスタ

© 2021, Amazon Web Services, Inc. or its Affiliates. まとめ
Amazon Redshift は現在も活発に新機能追加が進められています。以前はできないと思っていたことも、現在はできるようになっているかもしれません今回ご紹介した新機能はほんの⼀部です。Amazon Redshiftの最新機能をぜひお試しください︕

実演Amazon Redshift 最新機能

実演Amazon Redshift 最新機能

Daisuke Hirama

More Decks by Daisuke Hirama

Other Decks in Technology

Featured

Transcript

© 2021, Amazon Web Services, Inc. or its Affiliates. Daisuke

© 2021, Amazon Web Services, Inc. or its Affiliates. ⾃⼰紹介

© 2021, Amazon Web Services, Inc. or its Affiliates. お客様の要望に応じて進化し続ける

© 2021, Amazon Web Services, Inc. or its Affiliates. こんなときに

© 2021, Amazon Web Services, Inc. or its Affiliates. 1.

© 2021, Amazon Web Services, Inc. or its Affiliates. ピーク時にコンピュートを⾃動拡張する

© 2021, Amazon Web Services, Inc. or its Affiliates. Demo:

© 2021, Amazon Web Services, Inc. or its Affiliates. 2.

© 2021, Amazon Web Services, Inc. or its Affiliates. Amazon

© 2021, Amazon Web Services, Inc. or its Affiliates. Redshift

© 2021, Amazon Web Services, Inc. or its Affiliates. SUPER

© 2021, Amazon Web Services, Inc. or its Affiliates. 3.

© 2021, Amazon Web Services, Inc. or its Affiliates. Amazon

© 2021, Amazon Web Services, Inc. or its Affiliates. Demo:

© 2021, Amazon Web Services, Inc. or its Affiliates. まとめ

© 2021, Amazon Web Services, Inc. or its Affiliates. Thank