Amazon Q data integration in AWS Glue 試してみた

2024年9月27日 JAWS-UG AI/ML #21:Generative AI LT大会 JAWS-UG 名古屋古林信吾
Amazon Q data integration in AWS Glue 試してみた @mujyun_furu

名前 :古林信吾(ふるばやししんご) 所属 :JAWS-UG名古屋役割 :System Administrator/Architect 得意分野
:オンプレ/クラウドのインフラ運用、構築ペット :ハリネズミ、リチャードソンジリスライフワーク:美味しい日本酒を呑むこと好きな機能:Amazon EC2(好きだけど嫌い) 2 自己紹介

▪話すこと AWS Glue について Amazon Q data integration in AWS
Glue について ▪話さないこと Amazon Q の他の機能について 3 話すこと/話さないこと

１．はじめに２．AWS Glue とは３．Amazon Q data integration in AWS
Glue とは４．試してみた５．まとめ 4 アジェンダ

１．はじめに 5

6 １．はじめに４か月前に登壇した内容の続編 JAWS-UG東京ランチタイムLT会 #11 「インフラエンジニアがAthenaと格闘してみた」 https://jawsug.connpass.com/event/316451/ OpsJAWS Meetup29
ロギング、ログ管理「インフラエンジニアが生成AIを活用してログ解析してみた」 https://opsjaws.connpass.com/event/314570/ ※QRコードから動画視聴可能

7 １．はじめに ⇒当時GAして１か月で検証出来て無かったので改めて検証してみた

２．AWS Glue とは 8

9 ２．AWS Glue とは

10 ２．AWS Glue とは

３．Amazon Q data integration in AWS Glue とは 11

12 ３．Amazon Q data integration in AWS Glue とは

13 ３．Amazon Q data integration in AWS Glue とは ⇒2024/4/30
に GA された、Amazon Q Developer と統合してイイ感じにコード生成したり、トラブルシューティングできるというものただし、英語で質問

４．試してみた 14

15 ４．試してみた CloudWatch Logs から、サブスクリプションフィルターで Amazon Data Firehose を使い、 Amazon
S3 にデータを格納している。該当のデータは、Lambda を使っておらず、Firehose の解凍機能も使っていないので、不要な CloudWatch の情報が含まれている。そのため、Amazon Athena で簡単に解析できない、JSON がネストしている状態になっている。 S3 に格納されたデータを、AWS Glue の Glue Crawlers でカタログ化した。この後、Glue Job で Athena から解析しやすい形にデータをコンバートし、別の S3 に格納したい。 1つのデータファイルには、取得したいログが複数含まれているので、それぞれのログを改行して1つのファイルにまとめたい。上記内容の ETL 処理に、Glue DataCatalog の gluetest データベースの gluetest_raw_crawlergluetest202406_raw テーブルを使いたい。 ETL 後のデータは、 s3://gluetest-output の S3 に、s3://gluetest202406-raw と同じフォルダ構成で書き出したい。要件を満たす Glue Job の作成をお願します。

16 ４．試してみた From CloudWatch Logs, the data is stored in
Amazon S3 using Amazon Data Firehose with a subscription filter. The data in question does not use Lambda and does not use Firehose's decompression feature, so it contains unnecessary CloudWatch information. Therefore, the data is in a state of nested JSON that cannot be easily parsed by Amazon Athena. The data stored in S3 was cataloged by Glue Crawlers of AWS Glue. After this, we want to convert the data into a form that is easy to analyze from Athena with Glue Job and store it in another S3. One data file contains multiple logs that we want to retrieve, so we want to combine each log into one file with newlines. We want to use the gluetest_raw_crawlergluetest202406_raw table in the gluetest database in Glue DataCatalog for the ETL process described above. We want to export the data after ETL to S3 at s3://gluetest-output with the same folder structure as s3://gluetest202406-raw. Please create a Glue Job that meets the requirements.

17 ４．試してみた

18 ４．試してみた  今回のデモでは成功したが、毎回うまくいくわけではない  Job が成功しても、求める動作になるとは限らない  入力1000文字までの制限がある

19 ４．試してみた  エラーが発生した際にエラー内容について聞くと、的確な答えが返ってくる  基本形式は正しいのでベースとなる案は作れる

20 ４．試してみた AWS Glue Studio Notebook への Amazon Q Developer
の統合  Jupyter Notebook ベース  コードをセル単位で実行し、即座に結果を確認  # から始まるコメント文1行で英語入力し、Tab＋Enter するとコメント文を Amazon Q Developer が解釈し、コードを提案

21 ４．試してみた

５．まとめ 22

23 ５．まとめ  Amazon Q data integration in AWS Glue
の良いところ • AWS 内部情報を踏まえた提案がもらえる • トラブルシューティングの解像度が高い • AWS Glue Studio Notebook で使うのが便利  改善して欲しいところ • Chat の入力文字数制限の緩和(5000文字は欲しい) • 編集中の Glue Job のコード全体を見て改善点を提案して欲しい • I'm sorry I can't continue. Please try again.

Amazon Q data integration in AWS Glue 試してみた

Amazon Q data integration in AWS Glue 試してみた

@mujyun_furu

More Decks by @mujyun_furu

Featured

Transcript

2024年9月27日 JAWS-UG AI/ML #21:Generative AI LT大会 JAWS-UG 名古屋古林信吾

名前 :古林信吾(ふるばやししんご) 所属 :JAWS-UG名古屋役割 :System Administrator/Architect 得意分野

▪話すこと AWS Glue について Amazon Q data integration in AWS

１．はじめに２．AWS Glue とは３．Amazon Q data integration in AWS

１．はじめに 5

6 １．はじめに４か月前に登壇した内容の続編 JAWS-UG東京ランチタイムLT会 #11 「インフラエンジニアがAthenaと格闘してみた」 https://jawsug.connpass.com/event/316451/ OpsJAWS Meetup29

7 １．はじめに ⇒当時GAして１か月で検証出来て無かったので改めて検証してみた

２．AWS Glue とは 8

9 ２．AWS Glue とは

10 ２．AWS Glue とは

３．Amazon Q data integration in AWS Glue とは 11

12 ３．Amazon Q data integration in AWS Glue とは

13 ３．Amazon Q data integration in AWS Glue とは ⇒2024/4/30

４．試してみた 14

15 ４．試してみた CloudWatch Logs から、サブスクリプションフィルターで Amazon Data Firehose を使い、 Amazon

16 ４．試してみた From CloudWatch Logs, the data is stored in

17 ４．試してみた

18 ４．試してみた  今回のデモでは成功したが、毎回うまくいくわけではない  Job が成功しても、求める動作になるとは限らない  入力1000文字までの制限がある

19 ４．試してみた  エラーが発生した際にエラー内容について聞くと、的確な答えが返ってくる  基本形式は正しいのでベースとなる案は作れる

20 ４．試してみた AWS Glue Studio Notebook への Amazon Q Developer

21 ４．試してみた

５．まとめ 22

23 ５．まとめ  Amazon Q data integration in AWS Glue