Slide 15
Slide 15 text
ケース1「報告系」
課題
・自動化以前に何をやっているかよくわからない処理が多数存在
やったこと
「集計を1回のSQLで済ませる」ように書き直した
・マスターデータをHadoop環境にもコピーしてもらった
⇒ ログデータとマスターデータをJOINできるように
・SQLを真面目に勉強した
・環境下で使える関数を一通り調べた
・WITH句を使うようにした
・JOIN の結合条件を工夫した
・簡単な行間比較が書けるようになった
・WINDOW関数
・同じtable同士のJOIN
イメージ図
市販統計解析ソフト