Slide 1

Slide 1 text

1

Slide 2

Slide 2 text

2 re:Growth 2023 AWS re:Invent 2023 Analytics Updates 2023/12/14 データアナリティクス事業本部 ⽯川 覚

Slide 3

Slide 3 text

3 Agenda •Introduction •Pre re:Invent / November Updates •re:invent 2023 •Amazon Redshift Upadtes •Amazon Athena Upadtes •Amazon QuickSight Upadtes •AWS Glue Upadtes •Amazon DataZone

Slide 4

Slide 4 text

4 Introduction

Slide 5

Slide 5 text

5 ⾃⼰紹介 名前︓⽯川 覚(いしかわ さとる) 所属︓データアナリティクス事業本部 インテグレーション部 コンサルティングチーム 担当︓コンサルタント、ブログ・登壇等 経歴︓メーカーでSE、研究開発 →ITベンチャーで製品開発、受託研究 →クラスメソッド(2014/6〜) 好きなサービス︓Amazon Redshift/Athena、Google BigQuery 5 Sapporo 2020-2023 Japan AWS Top Engineers 2020-2023 Japan AWS All Certifications Engineers

Slide 6

Slide 6 text

6 データアナリティクス通信(AWSデータ分析編) ほぼ毎⽉、AWSのアナリティクス関連サービスのアップデート情報をお届けします

Slide 7

Slide 7 text

7 Pre re:Invent / November Updates

Slide 8

Slide 8 text

8 re:Invent2023 直前のアップデート • Amazon RedshiftがマルチAZ がRA3クラスター向けに⼀般提供開始 • 昨年のre:Invent2022に発表された機能が⼀般提供(GA) • Redshiftを複数のアベイラビリティーゾーン (AZ) で同時に実⾏し、予期しない障害シナリ オでも運⽤を続けることができる • Amazon Athenaがクエリパフォーマンスを強化するコストベースのオプティ マイザーを追加 • ついにコストベースオプティマイザー (CBO) に対応 • CBOによるクエリプランを最適化、SQLコードを変更することなくパフォーマンスが向上 • AWS GlueデータカタログがApache Icebergテーブルの⾃動圧縮をサポート • ⾃動圧縮を有効にすると、Glueデータカタログが新しいデータ書き込みを継続的にモニタ リングし、S3ストレージの⼩さなファイルをバックグラウンドで⾃動圧縮 • Icebergテーブルに合わせてS3のレイアウトが常に最適化、データレイクの読み取りパフォ ーマンスが向上 • Amazon QuickSightでGoogle BigQueryに対する接続のサポートを開始 • QuickSightからBigQueryに直接接続できるネイティブコネクタの⼀般提供を開始 • BigQueryの⼤規模なデータセットの分析を迅速に実⾏するためのQuickSight の SPICE (超 ⾼速、並列、インメモリ計算エンジン) サポートが提供

Slide 9

Slide 9 text

9 re:Invent2023 直前のアップデート • Amazon QuickSight launches a new redesigned analysis experience • 3 つのペインに分割、データ、可視化構築、オブジェクトプロパティ間を簡単に移動できる • 分析ツールバーにより、必須の作成、編集、ペイン管理機能にワンクリックでアクセス 機能メニューがツールバーに集約 フィールドウェルの配置変更 参考: [アップデート]Amazon QuickSightの分析画⾯が新しくなりました | Developers.IO

Slide 10

Slide 10 text

10 re:Invent 2023

Slide 11

Slide 11 text

11 今年もアップデートがいっぱいありました

Slide 12

Slide 12 text

12 AWS re:Invent 2023 •AWS 最⼤の技術イベント •毎年 100 を超えるアップデートを発表 •今年は 2023/11/27 〜 12/1 で開催 •オンラインとオフライン(ラスベガス)の同時開催 •オンデマンド配信 https://reinvent.awsevents.com/on-demand/

Slide 13

Slide 13 text

13 AWS re:Invent2023のポータルサイト開設 •クラスメソッドでは、AWS re:Invent2023のポータルサイト開設 • https://event.classmethod.jp/reinvent/2023

Slide 14

Slide 14 text

14 AWS re:Invent 2023の記事⼀覧 •速報、アップデート、やってみた、セッションレポートを提供 • https://dev.classmethod.jp/referencecat/aws-reinvent-2023/

Slide 15

Slide 15 text

15 AWS Japan アップデート速報 https://aws.amazon.com/jp/blogs/news/2023-12-reinvent2023-aws-blackbelt/ •AWS Japan が公式のアップデート速報を提供しています •本⽇の勉強会で紹介できなかったサービスについてはこちらをご参 照ください •[AWS Black Belt Online Seminar] AWS re:Invent 2023速報 資料及び動画公開のご案内 | Amazon Web Services ブログ

Slide 16

Slide 16 text

16 Amazon Redshift Updates

Slide 17

Slide 17 text

17 Zero-ETL︕Zero-ETL︕Zero-ETL︕ • Amazon Aurora PostgreSQL, Amazon DynamoDB, Amazon RDS for MySQLで Amazon Redshift とのZero-ETL がプレビューで利⽤可能に • Amazon Aurora MySQL(11⽉にGA)に続き、Zero-ETLをサポートするサービスの追加 • Redshiftから各DBのデータにアクセス、ほぼリアルタイムの分析や機械学習が可能になる • 「Zero」と名前についているようにETLの複雑なデータパイプラインの構築不要

Slide 18

Slide 18 text

18 • Amazon DynamoDB から Amazon Opensearch Service(Provision Cluster、Serverless)とのZero-ETLが利⽤可能(GA) • Amazon S3 から Amazon Opensearch Service(Provision Cluster) とのZero-ETL がプレビューで利⽤可能 Zero-ETL︕ Zero-ETL︕Zero-ETL︕Zero-ETL︕Zero-ETL︕

Slide 19

Slide 19 text

19 Redshift Serverless AIドリブンのスケーリングと最適化 • Amazon Redshift Serverlessの次世代AIドリブンなスケーリングと最適化 機能がプレビューで利⽤可能に • Redshift Serverlessは、データ量の変化・同時接続ユーザー・クエリの複雑さなどの、ワ ークロードにおける主要な観点の変化に応じて⾃動的にスケーリング • 内部テストでは、変化のあるワークロードに対して⾃動でコストパフォーマンスの向上 • クエリの複雑さやデータ量などの側 ⾯に基づいてワークロードパターン を学習 • 1⽇を通してリソースを継続的に調整 • 実際のワークロードのニーズに基づ いて容量を⾃動的に・プロアクティ ブに調整 • ⾃動マテリアライズドビューやデー タの⾃動的な整理 • パフォーマンススライダーを使⽤し て、ワークロードに対する希望のコ スト・パフォーマンス⽬標を設定

Slide 20

Slide 20 text

20 Amazon Q generative SQLがQueryEditorV2で利⽤可能 • Amazon Redshift クエリエディタがAmazon Q generative SQLの新機能 が発表されました(プレビュー) • Amazon Q generative SQL in Amazon Redshift Query Editor V2という、データから抽 出したいことを⾃然⾔語で問い合わせして、SQLを⽣成する新機能が発表 • ⽣成AI(Generative AI)をSQLに応⽤した⽣成SQL(Generative SQL)サービス

Slide 21

Slide 21 text

21 データ共有が複数のDWHからの書き込みクエリをサポート • Amazon Redshift データ共有が複数のデータウェアハウスからの書き込みク エリをサポートしました(プレビュー) • データ共有を介した複数のデータウェアハウスからの書き込みクエリをサポート • AWSアカウント内またはアカウント間で読み取りと書き込みの両⽅のクエリをデータ共有 で実⾏できるようになりました。 参考: AWS re:Invent 2023 - Multi-data warehouse writes through Amazon Redshift data sharing (ANT351)

Slide 22

Slide 22 text

22 Amazon Redshift その他アップデート • Redshiftは、その他にも期間中に多くのアップデートが発表されました • https://dev.classmethod.jp/articles/20231126-amazon-redshift-ml-llm-support/ • https://dev.classmethod.jp/articles/20231126-amazon-redshift-concurrency- scaling-ctas-supported/ • https://dev.classmethod.jp/articles/20231126-amazon-redshift-multi-data- warehouse-writes-through-data-sharing-preview/ • https://dev.classmethod.jp/articles/20231128-amazon-redshift-fgac-to-nested- objects/ • https://dev.classmethod.jp/articles/20231128-amazon-redshift-multidimensional- data-layouts/ • https://dev.classmethod.jp/articles/20231128-amazon-redshift-incremental- refresh-for-mv/ • https://aws.amazon.com/jp/about-aws/whats-new/2023/11/amazon-redshift- metadata-security-tenant-applications/ • https://aws.amazon.com/jp/about-aws/whats-new/2023/11/amazon-redshift-row- level-security-enhancements/ • https://aws.amazon.com/jp/about-aws/whats-new/2023/11/amazon-redshift- serverless-manageability-usability-features/

Slide 23

Slide 23 text

23 Amazon Athena Updates

Slide 24

Slide 24 text

24 Amazon AthenaとS3 Express One Zoneによるクエリを⾼速化 • Amazon AthenaとAmazon S3 Express One Zoneによるクエリを⾼速化 • Amazon S3 Express One Zoneは、S3 Standardよりも最⼤10倍優れたパフォーマンス、 ⼀貫した1桁ミリ秒のレイテンシで毎秒数⼗万のリクエストを処理するように設計された新 しいS3ストレージクラス • Amazon AthenaとAmazon S3 Express One Zoneストレージクラスに保存されたデータ 使⽤すると、S3 Standardよりも最⼤2.1倍⾼速なクエリパフォーマンスの改善すると説明 参考: AWS re:Invent 2023 - Whatʼs new with Amazon S3 (STG204)

Slide 25

Slide 25 text

25 Amazon QuickSight Updates

Slide 26

Slide 26 text

26 ⽣成BI機能でデータ探索簡単に Amazon Q in QuickSightを発表 • QuickSight Q+⽣成BI機能をさらに拡張した「Amazon Q in QuickSight」 が発表されました(プレビュー) • 従来のQuickSight Q は⾃然⾔語で問い合わせでダッシュボードなどにインサイトを提供 • Bedrock がリリースされたタイミングで、QuickSight Q に⽣成BI機能が追加、⽣成AI機能 を使って⾃然⾔語で実現したい分析を伝えることでダッシュボードや分析を⾃動作成でした • 今回のアップデートは、「QuickSight Q アドオンの機能強化」 として新たに 「データス トーリー機能」 と 「エグゼクティブサマリー機能」 が追加(プレビュー)

Slide 27

Slide 27 text

27 AWS Glue Updates

Slide 28

Slide 28 text

28 AWS Glue の Amazon Q 統合が発表 • AWS GlueのAmazon Q統合が発表、⾃然⾔語でのデータ統合パイプライン作 成が可能に(Coming Soon) • ⽣成系AIアシスタントサービスであるAmazon Qを使うことで、⾃然⾔語でGlueによるデ ータパイプラインを作成 • チャットインターフェースで⾃然⾔語でのトラブルシューティングも可能になり、Glue Job の作成がスムーズになる

Slide 29

Slide 29 text

29 AWS Glue Data Qualityが異常検出と動的ルールに対応 • AWS Glue Data Qualityが異常検出と動的ルールに対応(プレビュー) • 従来のGlue Data Quorityは、ユーザーが定義したルールに従って、データの品質検査を実 施できる機能 • 今回の新機能で、データの変化を監視し、監視しているメトリクスが予想される値の範囲外 の場合でも検知が可能になる 参考:AWS re:Invent 2023 - Reimagine data integration with generative AI and machine learning (ANT216)

Slide 30

Slide 30 text

30 Amazon DataZone Updates

Slide 31

Slide 31 text

31 Amazon DataZone AI recommendationsを発表 • Amazon DataZoneで⽣成系AIベースのビジネスデータカタログ強化のため の機能が発表されました(プレビュー) • データカタログに記載する概要およびカラムの説明⽂を⽣成系AIでワンクリックで⾃動作成 • ⾃動⽣成された説明⽂は、検索結果が詳細な説明、考えられる使⽤例、主要な列に基づいて 表⽰されるようになるため、より充実した検索体験を可能にする

Slide 32

Slide 32 text

32 まとめ •Amazon Q • セキュリティとプライバシが組み込まれた⽣成AIアシスタント • 今後、開発者やデータを利活⽤するビジネスパーソンも⽀援する • 将来的なAmazon DataZoneとの連携を鑑み、ビジネスメタデータを今から登 録・充実させることが鍵となる •Amazon Redshift / Redshift Serverless • Data Sharingの読み書きも可能になり、1つのクラスタに集約する • OLTPとOLAPの混在するワークロードは、Zero-ETLというアプローチで解決 (not HTAP) • Redshift Serverlessは、データ量の変化・同時接続ユーザー・クエリの複雑さ など、AIが必要に応じて⾃動的にスケーリング •Amazon S3 Express One Zone • Athena2.1倍、EMRが4.0倍、SageMaker5.8倍 • 将来的に、他のアナリティクスサービスもパフォーマンス改善が期待できる

Slide 33

Slide 33 text

ソリューションアーキテクト(データ分析分野)の募集 急募︕