Upgrade to Pro — share decks privately, control downloads, hide ads and more …

集計屋さんからの「前向き」な脱却 アナリストとしての立場でやったこと/20200514

集計屋さんからの「前向き」な脱却 アナリストとしての立場でやったこと/20200514

第3回 データアーキテクト(データ整備人)を”前向きに”考える会
https://analytics-and-intelligence.connpass.com/event/174369/presentation/

NagaokaShohei

May 14, 2020
Tweet

Other Decks in Business

Transcript

  1. 自己紹介 名前 長岡 彰平 (twitter: @nyangao1212) 略歴 2012年 ソニー入社 民生用カメラレンズの光学設計部署に配属

    主に歩留シミュレーションや工場のデータ解析を担当 2016年 社内募集でSMN株式会社に異動 ⇒ データマイニング課でアナリストとして働く 免責事項 本資料はあくまで個人の見解であり、所属組織の公式的な見解ではありません
  2. ネット広告ビジネスフロー上の「集計屋」の立ち位置 配信ログ 企画 技術 R&D 営業・運用 広告主 ad 商談 配信設定

    戦略立案 要件定義 配信制御 機械学習 Hadoop基盤構築 「集計屋」はビジネスフローの 本流には登場しないが・・ 集計屋
  3. ネット広告ビジネスフロー上の「集計屋」の立ち位置 配信ログ 企画 技術 R&D 営業・運用 広告主 ad 間接的な部分では需要がある 集計屋

    SQL A広告主の〇月×日分の 配信ログ出して 新商材の売上を週次で 見たい 媒体側で〇〇の変更があっ たから影響度を見たい
  4. アナリスト視点で集計業務を整理 分析が介在 する余地 スケール アナリストとして 注力すべき領域 他部署の サポート 無数の小タスク 大

    小 大 小 時間かけても無駄 そもそも手を付けたら負け 小タスクの積み上げで業務負荷が上がっていた ⇒ この領域を効率化することに 目指すべきはここ! ここの対応で 疲弊・・
  5. ケース1「報告系」 Hadoop 依頼者 dm課 GUI + SQL 市販統計解析ソフト SQL メール

    csv csv csv 特徴 ・都度依頼者から集計値を求められる ・ある程度型が決まっているが、WHERE句の条件等のパラメータは毎回異なる やろうとしたこと ・頻出パターンの定型化&自動化 A社のログ ほしい
  6. ローカルPC ケース1「報告系」 課題 ・pythonからHadoopへの繋ぎ方がわからない ・ローカルPCの電源切れない ・その他わからないことが多すぎる Hadoop Google Sheets ?

    依頼者 今流行りのpythonとやらを使ってGoogle Sheetsの中身を読み込めたぞ! これでインターフェースが作れる! あれ、でもどうやってHadoopにSQL投げれば良いの・・? dm課 ?
  7. 分析用サーバー ケース1「報告系」 ・・ 解決!! Hadoop 依頼者 Google Sheets Google Forms

    SQL フォーム 入力 import hadoop_tools import gsuite_tools ・ ・ automate_task.py 最終的にこうなった 該当業務を完全に自動化することができた 意外なことに依頼の総量は自動化後増えた (今までは遠慮?していた依頼者がいたのかもしれない)
  8. ケース2「そういう業務フローだから・・」 特徴 ・依頼をトリガーにして、集計を含め複数の作業が発生する ・もはや集計依頼ですらない Hadoop DB 例 設定画面 課題 多いので次ページ以降に

    a社の設定を Aに変えて 1:依頼 2:SQL 3:集計結果 4: 集計結果を登録 5: バッチ処理 6: DB に反映されたか見に行く 7: DB反映後 完了連絡 依頼者 dm課
  9. ケース③「そういう業務フローだから・・」 解決! 依頼者 Hadoop DB App シンプルかつ イケてるUI 中間テーブル処理を挟んで クエリ負荷軽減

    入力に応じて条件分岐 DB登録完了後自動通知 dm課 アドホックにSQLを書 く必要がある場合のみ 作業発生 最終的にこうなった 作業頻度が劇的に減った 依頼者にアンケートをとったところ 「フローがわかりやすくなった」と肯定的な意見多数