Slide 10
Slide 10 text
#MerpayTechFest
Mercari Dataflow Template 使い方
● データ処理内容をJSON形式で定義
○ Sources, Transforms, Sinks 3種類を組み合わせ
● Source -> Transform -> Sink で処理を定義
{
"sources": [{
"name": "bigqueryInput",
"module": "bigquery",
"parameters": {...}
}],
"transforms": [{
"name": "beamsqlTrans",
"module": "beamsql",
"inputs": ["bigqueryInput"],
"parameters": {...}
}],
"sinks": [{
"name": "spannerOutput",
"module": "spanner",
"input": "beamsqlTrans",
"parameters": {...}
}]
}
各Module 入力対象
nameをinputで指定
source1
sink1
transform1
source2
sink2
transform2
一つ Module 出力を
複数モジュールが利用したり
Transformを省いたり連結する
定義も可能