Slide 1

Slide 1 text

Azure Data Factory Mapping Data Flow を使ってみた 第三十五回 Azureもくもく会@品川 2019/07/06 Yoppi

Slide 2

Slide 2 text

Azure Data Factory (ADF) 使ってますか?

Slide 3

Slide 3 text

フルマネージドな ETL基盤

Slide 4

Slide 4 text

データソース Azure Data Factory

Slide 5

Slide 5 text

Data Factoryでデータ変換したい!(SSIS) https://azure.microsoft.com/en-in/blog/lift-sql-server-integration-services-packages-to-azure-with-azure-data-factory/ うーん、難しい。もっとお手軽にやりたい。

Slide 6

Slide 6 text

Data Factoryでデータ変換したい!(Function App) Copy Activity なんか 他の処理 そんな難しくない データ処理関数 こいつ、非同期で動くぞ。。。 パイプライン2つに分けて、パイプライン実行を FunctionからRESTで叩けばいけるかも? Service Busとの統合がほしいなぁ。。。 そもそもLogic Appsでいいじゃん

Slide 7

Slide 7 text

違う、そうじゃない

Slide 8

Slide 8 text

フルマネージドな ETL基盤 ⇓ 全部ADFで完結したい!

Slide 9

Slide 9 text

Data Mapping Flow(Public Preview)

Slide 10

Slide 10 text

用意したデータ 顧客マスタ 購入明細

Slide 11

Slide 11 text

Demo Time Select, Join, Exist, Aggregateあたりのよく使いそうな処理に ついて実画面を見せながら説明しました。 また、Blobとして出力して、別パイプラインに連携して Cosmos DBにUpsertするところまでを実装しました。

Slide 12

Slide 12 text

注意点(Data Factory 全般) ・基本的にはUIからポチポチだけでたまにドキュメント見るくらいでいける  →園児ニアの強い味方! ・途中セーブができない(パイプラインとして完成していないとダメ)  →ARM Template Export で凌ぐのはアリ ・パイプライン実行中はData Flow内の実行ステータスは見れない

Slide 13

Slide 13 text

注意点(Mapping Data Flowについて) ・データソースのフォーマットが作業中にリセットされることがある ・Data FlowのSinkとしてCosmos DBを選択できない  →DataLake Storage, SQL Database は可能 ・ファイル名の指定はデバッグモードでは動かない ・デバッグモードでもDatabrics分のお金がかかる(一時間¥150くらい)

Slide 14

Slide 14 text

Fin ありがとうございました