Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWS Glueを使ってRDSからS3+Athena環境を作ってみよう / Let's cre...
Search
Kitano Yuichi
June 19, 2020
Technology
1
8.8k
AWS Glueを使ってRDSからS3+Athena環境を作ってみよう / Let's create Athena from RDS using AWS Glue
Kitano Yuichi
June 19, 2020
Tweet
Share
More Decks by Kitano Yuichi
See All by Kitano Yuichi
CognitoでWebアプリケーション(not SPA)に ログインさせたい時、何を作らなくてはならないのか? / What do I create when I want to log in to a web application with Amazon Cognito?
kitano_yuichi
1
3.6k
SPAとWebアプリケーションでCognitoの使い方はどう変わるのか? / How do we use cognito with SPA and web applications?
kitano_yuichi
0
6.6k
オンプレとVPCをつなぐ環境のUpdate/re:Cap connecting on-premises and vpc
kitano_yuichi
0
1.5k
Other Decks in Technology
See All in Technology
[VPoE Global Summit] サービスレベル目標による信頼性への投資最適化
satos
0
200
OAuthからOIDCへ ― 認可の仕組みが認証に拡張されるまで
yamatai1212
0
150
Biz職でもDifyでできる! 「触らないAIワークフロー」を実現する方法
igarashikana
3
1.2k
Sansan Engineering Unit 紹介資料
sansan33
PRO
1
3k
CREが作る自己解決サイクルSlackワークフローに組み込んだAIによる社内ヘルプデスク改革 #cre_meetup
bengo4com
0
150
Wasmの気になる最新情報
askua
0
180
組織改革から開発効率向上まで! - 成功事例から見えたAI活用のポイント - / 20251016 Tetsuharu Kokaki
shift_evolve
PRO
2
220
Dylib Hijacking on macOS: Dead or Alive?
patrickwardle
0
430
Introdução a Service Mesh usando o Istio
aeciopires
1
260
ソースを読むプロセスの例
sat
PRO
15
9.6k
Claude Codeを駆使した初めてのiOSアプリ開発 ~ゼロから3週間でグローバルハッカソンで入賞するまで~
oikon48
10
5.2k
それでも私が品質保証プロセスを作り続ける理由 #テストラジオ / Why I still continue to create QA process
pineapplecandy
0
150
Featured
See All Featured
A Tale of Four Properties
chriscoyier
161
23k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.5k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.1k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
9
920
Making the Leap to Tech Lead
cromwellryan
135
9.6k
The Cost Of JavaScript in 2023
addyosmani
55
9.1k
Why You Should Never Use an ORM
jnunemaker
PRO
59
9.6k
Java REST API Framework Comparison - PWX 2021
mraible
34
8.9k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.7k
[RailsConf 2023] Rails as a piece of cake
palkan
57
5.9k
GraphQLの誤解/rethinking-graphql
sonatard
73
11k
Code Review Best Practice
trishagee
72
19k
Transcript
"84(MVFΛͬͯ3%4͔Β 4 "UIFOBڥΛ࡞ͬͯΈΑ͏ "84ࣄۀຊ෦ ίϯαϧςΟϯά෦ ༎Ұ
2 ࣗݾհ • ༎Ұʢ,JUBOP:VJDIJʣ • Ϋϥεϝιουגࣜձࣾ • "84ࣄۀຊ෦ ίϯαϧςΟϯά෦
• "1/"845PQ&OHJOFFST • ͖ͳ"84αʔϏε • "84$-* • $PHOJUP
3 3%4ɺͬͯ·͔͢ʁ
4 "84ͷ3%#αʔϏε • "VSPSBΫϥυ͚ʹߏங͞Εͨ3%# • 3%4Ϛωʔδυܕ3%#αʔϏε Aurora RDS
5 3%#ͷσʔλੳ͕͍ͨ͠ • ຊ൪ڥʹӨڹ͕͋Γͦ͏ʜ • ৽͍͠3%4Λ͏Ұཱͭͯͯσʔλ෮ݩʁ • ͦΜͳʹΘͳ͍ͷʹ͍ͬͨͳ͍ͷͰʁ Aurora RDS
SQLで本番データの 分析がしたい
6 ͦΜͳͱ͖ʹ"UIFOBΛਪ͍ͨ͠ • 4ͷσʔλΛ42-ΫΤϦͰੳͰ͖Δ • αʔόϨεͳͷͰΠϯϑϥͷཧෆཁ • ࣮ߦͨ͠ΫΤϦʹରͯ͠ͷΈྉ͕͔͔ۚΔ Athena S3
標準SQLでクエリ
7 ࠓճͷత 3%4͔Β"UIFOBڥ ؆୯ʹߏஙͰ͖Δʂ ʜͱ͍͏͜ͱΛͬͯΒ͏
8 "UIFOBͷը໘ %#ɾදߏ (MVFσʔλΧλϩά 42-ΫΤϦ ΫΤϦ݁Ռ
9 (MVFσʔλΧλϩά ͬͯԿʁ
10 "UIFOB4ʹΫΤϦ͢ΔαʔϏε͕ͩʜ • 4୯ͳΔσʔλอଘઌͰ͋Δ • ςʔϒϧ໊ʁ • ΧϥϜ໊ʁ • σʔλܕʁ
Athena S3 標準SQLでクエリ ・データのみ
11 (MVFσʔλΧλϩάͱʁ • ςʔϒϧߏ ϝλσʔλ Λఆٛ͢ΔαʔϏε • ςʔϒϧʹ͖ͭ̍ͭ࡞ Athena S3
標準SQLでクエリ Glue データカタログ ・データのみ ・テーブル名 ・カラム名 ・データ型 等 表構造としてデータ カタログを参照
12 (MVFσʔλΧλϩάͬͯͲ͏ͬͯ࡞Δʁ • (MVFΫϩʔϥΛར༻ͯࣗ͠ಈੜ • (MVFσʔλΧλϩάΛखͰ࡞ "UIFOBͷςʔϒϧ࡞Οβʔυ • )JWF%%-Λར༻ $3&"5&&95&3/"-5"#-&
13 (MVFΫϩʔϥ ͬͯԿʁ
14 (MVFΫϩʔϥͱʁ • σʔλετΞ 4 ͷσʔλߏΛਪଌͯ͠ɺ σʔλΧλϩάʹ දߏΛొ͢ΔαʔϏε S3 Glue
データカタログ ・データのみ ・テーブル名 ・カラム名 ・データ型 等 データ構造の 解析&推測 Glue クローラ 表構造の登録
15 3%4εφοϓγϣοτ͔Β4FYQPSU • 3%4ͷεφοϓγϣοτ͔Β1BSRVFUܗࣜͰ 4FYQPSUͰ͖·͢ ,.4Ͱ҉߸Խ͞Ε·͢ S3 RDSのスナップショット作成 Aurora RDS
Snapshot Parquet形式でexport KMS 暗号化キーを参照
16 (MVFΫϩʔϥͰ҉߸Խ͞Εͨσʔλͷಡࠐ • ,.4Ͱ҉߸Խ͞ΕͨσʔλΛಡΈࠐΉͨΊʹɺ LNT%FDSZQUݖݶΛ༩͠·͢ S3 暗号化された S3データの読込 Glue クローラ
KMS KMSで 暗号化 されている KMSで復号
17 શମߏ • શମతͳߏ͜Μͳײ͡ʹͳΓ·͢ɻ S3 Aurora&RDS Snapshot Glue クローラ Glue
データカタログ Athena ①snapshot作成 ②parquet形式 でexport ③データ構造の 解析&推測 ④表構造の登録 ⑤ʼ表構造の参照 ⑤SQLでクエリ KMS ②ʼKMSで暗号化 ③ʼKMSで復号 暗号
18 ࣮ࡍʹ࡞ͬͯΈ·͢ʂ
19 લఏ݅ • ςʔϒϧఆٛ͞Εͨ3%4ͱͦͷ4OBQTIPUɺ ࠷ॳ͔Β͋Δͷͱ͠·͢ɻ S3 Aurora&RDS Snapshot Glue クローラ
Glue データカタログ Athena ①snapshot作成 ②parquet形式 でexport ③データ構造の 解析&推測 ④表構造の登録 ⑤ʼ表構造の参照 ⑤SQLでクエリ KMS ②ʼKMSで暗号化 ③ʼKMSで復号 暗号
20 ,.4ͷ࡞ • ·ͣ҉߸ԽͷΩʔͱͳΔ,.4Λ࡞͠·͢ S3 Aurora&RDS Snapshot Glue クローラ Glue
データカタログ Athena ①snapshot作成 ②parquet形式 でexport ③データ構造の 解析&推測 ④表構造の登録 ⑤ʼ表構造の参照 ⑤SQLでクエリ KMS ②ʼKMSで暗号化 ③ʼKMSで復号 暗号
21 4#VDLFUͷ࡞ • 4OBQTIPUͷFYQPSUઌͱ͢Δ 4Λ࡞͠·͢ S3 Aurora&RDS Snapshot Glue クローラ
Glue データカタログ Athena ①snapshot作成 ②parquet形式 でexport ③データ構造の 解析&推測 ④表構造の登録 ⑤ʼ表構造の参照 ⑤SQLでクエリ KMS ②ʼKMSで暗号化 ③ʼKMSで復号 暗号
22 4OBQTIPUΛ4FYQPSU • 3%4ͷ4OBQTIPUΛ4FYQPSU͠·͢ S3 Aurora&RDS Snapshot Glue クローラ Glue
データカタログ Athena ①snapshot作成 ②parquet形式 でexport ③データ構造の 解析&推測 ④表構造の登録 ⑤ʼ表構造の参照 ⑤SQLでクエリ KMS ②ʼKMSで暗号化 ③ʼKMSで復号 暗号
23 (MVFΫϩʔϥͷ࡞ • 4͔ΒදߏΛղੳ͢Δ(MVFΫϩʔϥΛ ࡞͠·͢ S3 Aurora&RDS Snapshot Glue クローラ
Glue データカタログ Athena ①snapshot作成 ②parquet形式 でexport ③データ構造の 解析&推測 ④表構造の登録 ⑤ʼ表構造の参照 ⑤SQLでクエリ KMS ②ʼKMSで暗号化 ③ʼKMSで復号 暗号
24 (MVFΫϩʔϥͷ࣮ߦ • (MVFΫϩʔϥΛ࣮ߦͯ͠ɺ(MVFσʔλ ΧλϩάΛొ͠·͢ S3 Aurora&RDS Snapshot Glue クローラ
Glue データカタログ Athena ①snapshot作成 ②parquet形式 でexport ③データ構造の 解析&推測 ④表構造の登録 ⑤ʼ表構造の参照 ⑤SQLでクエリ KMS ②ʼKMSで暗号化 ③ʼKMSで復号 暗号
25 "UIFOBΛͬͯΈΔ • ߏஙͨ͠ڥΛར༻ͯ͠ɺ"UIFOBͰ42-Λ ࣮ߦͯ͠Έ·͢ S3 Aurora&RDS Snapshot Glue クローラ
Glue データカタログ Athena ①snapshot作成 ②parquet形式 でexport ③データ構造の 解析&推測 ④表構造の登録 ⑤ʼ表構造の参照 ⑤SQLでクエリ KMS ②ʼKMSで暗号化 ③ʼKMSで復号 暗号
26 ·ͱΊ "UIFOBͷΠϝʔδ Θ͖·ͨ͠ʁ
27 ͦͦ͜ͷσʔλ3%4ʹೖΕΔඞཁ͋Δʁ • "UIFOBͰ42-ੳͰ͖Δ͜ͱ͕Θ͔Εɺ ੳσʔλΛ4ʹอଘ͢Δબ͋Γɻ S3 Aurora&RDS Snapshot Athena SQLクエリ
アプリケーション データ保存 データ保存
28 ·ͱΊ • "UIFOBͰ4ʹ42-ΫΤϦͰσʔλੳ • ຊ൪ͱͨ͠αʔόϨεͳσʔλੳڥ • 3%4ͷόοΫΞοϓ͔Β؆୯ʹߏஙͰ͖Δ
None