Upgrade to Pro — share decks privately, control downloads, hide ads and more …

小売DXプロダクトを2ヶ月で立ち上げるデータエンジニアリング

 小売DXプロダクトを2ヶ月で立ち上げるデータエンジニアリング

オレシカナイトVol16登壇スライド

登壇動画:
https://www.youtube.com/watch?v=T-2ImdFLqT8

イベント詳細:
https://cyberagent.connpass.com/event/227271/

Chisato Nakamura

November 18, 2021
Tweet

Other Decks in Technology

Transcript

  1. 当時の状況 • 人員 ◦ ソフトウェアエンジニア(SE): 2人 (うち1人がPdM兼) ◦ データサイエンティスト(DS): 2人

    • DMP完成までの期限: 2ヶ月 • 肝心のデータは来ていないものもたくさん... 圧倒的に人と時間が足りない!!

  2. 実装のハードルを下げる為のインフラの工夫 例: • ETLを足すときに実装箇所や命名規則が 明確なコード設計 • Infrastructure as Code(IaC) ◦

    terraform, digdag ◦ コードで管理することで真似しやすくレビューしやすくする • すぐ壊せる ◦ s3, glue data catalog, redshift spectrum 誰が実装しても負債にならないこと
  3. クエリの自動生成 • 複数の演算子 ◦ 時間に関する演算子 (固定日時 / 変動日時) ◦ 複数の値が入りうる演算子

    ◦ 数値?日時?文字列? • 複数の結合条件 ◦ AND/OR/NOT • これらの条件をどうDBに保存する? どうオブジェクト指向として表現する? 演算子の例 equal (=) greater than (>) less than (<) greater than or equal to (>=) less than or equal to (<=) not equal to (!=) between is multiple is not multiple in the past of days in the past of months in between the past of days in between the past of manth