Slide 4
Slide 4 text
© 2023 NTT DATA Corporation 4
そもそもUDFって?どうやって使うの?
➢ UDF(User Defined Function)とは、POWやSQRT、HASHなどのシステム定義関数と同じように使用できる
関数を自作できる機能です。
• 各入力行を複数のノードで並列処理するため、効率的に計算できます。
[Python: UDF定義]
@udf(name=multiply)
def multiply(
a:float, b:float
):
return a*b
1
2
3
a b a b a*b
ノード1:1×2
ノード2:2×3
ノード3:3×4
2
3
4
2
6
12
4
5
ノード4:4×5
ノード5:5×6
5
6
20
30
[SQL: UDF呼び出し]
select a, b, multiply(a,b)
from table;
UDFの処理イメージ
インプットデータ アウトプットデータ
UDFの定義・呼び出しイメージ