Slide 4
Slide 4 text
4
今⽇の内容
Amazon AthenaとAWS Step Functionsを組み合わせると、
AWSだけで簡単にETL処理(データの読み出し・加⼯・書き込み)が
できて便利︕
• Athenaで、SQLで簡単にビッグデータ処理が実⾏できる。
(本来はGlueやPySparkの使い⽅を覚える必要があるが、今回の構成では不要。)
• Step FunctionsのAPI統合を使うことでワークフロー化できる。
という話がしたかったが、データエンジニアリングの要件は近年より多くなってきており、
ほかにも考えることがある。(DMBOKで議論されているデータマネジメントなど)
• データリネージ
• データ品質
• などなど…
• 簡単構成を例に、なにがどう便利か、
より良くするにはなにが必要か、ということをお話ししたい。