Upgrade to Pro — share decks privately, control downloads, hide ads and more …

GUIプリパレーションツールに潜む光と闇(voovovo)

Eb70c7fa5ac50be8239f5a5b9d4e7f47?s=47 voovovo
April 19, 2020

 GUIプリパレーションツールに潜む光と闇(voovovo)

Eb70c7fa5ac50be8239f5a5b9d4e7f47?s=128

voovovo

April 19, 2020
Tweet

Transcript

  1. データアナリスト Vo Nhat Huy (voovovo) GUIプリパレーションツールに潜む 光 と ・・ 闇

  2. アウトライン • GUIプリパレーションツールとは? • メリット • デメリット • 対策 2

  3. 自己紹介 名前:Vo Nhat Huy (voovovo) 会社:株式会社truestar 肩書:シニアアナリスト 仕事:↓導入・技術サポート 3 ベトナム人独身男性

    (30)
  4. GUIプリパレーションツールとは? 4

  5. GUIプリパレーションツールとは • データ抽出・加工等の前処理 • グラフィックUIベース • クリック、ドラッグアンドドロップ • コーディング不要 •

    ビジネスアナリスト、データアナリスト、データサイエンティスト向け • ビジネスユーザー向けでもある 5
  6. GUIプリパレーションツールとは ツール紹介 6 Alteryx Tableau Prep DataSpider Informatica Talend Trifacta

  7. GUIプリパレーションツールとは ツール紹介 7 Alteryx

  8. GUIプリパレーションツールとは ツール紹介 8 • ETL処理 • 機械学習 • 空間情報処理 •

    R・Pythonスクリプト組み込み • レポート自動化 • 「Code free, Code friendly」
  9. メリット 9

  10. メリット • 人ベースでの社内リソース効率化 • ラーニングコストの低さ • 処理の可視化 10

  11. メリット • 人ベースでの社内リソース効率化 • ラーニングコストの低さ • 処理の可視化 11

  12. メリット 人ベースでの社内リソース効率化 • Before 12 いろいろできちゃう 凄いデータサイエンティスト 社内で重宝されてる 凄腕データ系の人たち ・データサイエンティスト

    ・データエンジニア等など スキルも知見もあり重宝されがゆえに・・・
  13. メリット 人ベースでの社内リソース効率化 • Before 13 あれ ほしい データ 作って いい感じで

    よろしく いろいろできてしまった 凄いデータサイエンティスト 大量の 依頼
  14. メリット 人ベースでの社内リソース効率化 • Before 14 いろいろ参ってしまった 凄いデータサイエンティスト スキルも知見もあり重宝されがゆえに・・・ 本来やりたい 高度な分析に避ける時間

    が無くなってしまう
  15. メリット 人ベースでの社内リソース効率化 • After 15 時間ができ始めた 凄いデータサイエンティスト 大量の 依頼

  16. メリット 人ベースでの社内リソース効率化 • After 16 本領を発揮した 凄いデータサイエンティスト 依頼してきていたビジネスユーザーでも 軽度の処理を任せられる 本領である高度な分析に時間をさ

    けられる
  17. メリット • 人ベースでの社内リソース効率化 • ラーニングコストの低さ • 処理の可視化 17

  18. メリット ラーニングコストの低さ 簡易な処理ができるまでの習得時間が短い 18 Python、R、SQLの記法、仕組み データ構造 サービス連携、API ツールの使用法 データ構造 前処理含めた

    色々な処理 ビジネスユーザが使う分だけの 前処理
  19. メリット • 人ベースでの社内リソース効率化 • ラーニングコストの低さ • 処理の可視化 19

  20. メリット 処理の可視化 処理の可視化・俯瞰ができ共有しやすい 20

  21. デメリット 21

  22. デメリット • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 22

  23. デメリット • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 23

  24. デメリット 個人ベースの定義の乱発化 末端ユーザーが増えることで同じ値を出すのにもユーザーに よって定義が違う事案が増える(※更に増える) 24 売上=単価*個数 売上= システムがなんか出し た数字 売上=単価*個数

    +忖度ロジック
  25. デメリット • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 25

  26. デメリット 金額コストの高さ 単純に高い 26

  27. デメリット 金額コストの高さ 単純に高い 27

  28. デメリット 金額コストの高さ 効率化・自動化など コストカット目線で ビジネスサイドが検討してくるため、費用対効果の費用に目が行きがちになる 28

  29. デメリット 金額コストの高さ 効率化・自動化など コストカット目線で ビジネスサイドが検討してくるため、費用対効果の費用に目が行きがちになる 効果はデータ側の人じゃないので 検討時点ではよくわかってない 29

  30. デメリット • 個人ベースの定義の乱発化 • 価格コストの高さ • 処理のカオス化 30

  31. デメリット 処理のカオス化 ラーニングコストが低い故にデータ側の職じゃない人でもすぐに処理実装・実行 ができる。共有もしやすい。 ↓ 共有のための作法・統制が取れないまま走りが ちになる 31

  32. デメリット 処理のカオス化 理想 32

  33. デメリット 処理のカオス化 現実 33 「なんか動かなくなったから 改修して」 だと・・・? これで・・・?

  34. 対策 34

  35. 対策 • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 35

  36. 対策 • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 36 データマネジメント担当を置く

  37. 対策 データマネジメント担当を置く 定義や作法のコントロールのために • データカタログの導入検討 • 定義書の概念普及 • 共有作法などツール展開後を見据えた教育 等を担うチャンピオンとよばれるポジションを置くか育てる

    37
  38. 対策 データマネジメント担当を置く チャンピオンとは: ツールのスペシャリストであり、社内ユーザーに展開する際のロールモデルになり える人 CoE(Center of Excellence)でも化 ビジネス寄りのデータの人、データ寄りのビジネスの人の2人いるとなお良い 38

  39. 対策 データマネジメント担当を置く 39 CoE チャンピオン 少数精鋭での 育成後 各組織へ

  40. 対策 • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 40 検討時に意見を言える データ側の人を必ず加える

  41. 対策 検討時に意見を言えるデータ側の人を必ず加える 費用対効果の効果の部分を説明できるデータ側の人間を検討チームに入 れる。 この時だいたい力関係的にビジネス側の人が強い傾向があるため、 モノ言える ※ データの人をお勧めする 41

  42. 対策 検討時に意見を言えるデータ側の人を必ず加える 費用対効果の効果の部分を説明できるデータ側の人間を検討チームに入 れる。 この時だいたい力関係的にビジネス側の人が強い傾向があるため、 モノ言える ※ データの人をお勧めする ※いなかったら、強くなれ 42

  43. まとめ 43

  44. まとめ 便利になるGUIプリパレーションツール導入の時には… • データマネジメント強化のため、チャンピオンを置く • モノ言えるデータ側の人を用意する 44

  45. データラーニングギルド 第1回 DLG Cross 資料 GUIプリパレーションツールに潜む光と闇 Vo Nhat Huy (voovovo)

    • 参考サイト • https://www.irasutoya.com/ • https://www.alteryx.com/ja/products/platform- details/pricing • https://www.dnp.co.jp/biz/st/digital- marketing/column/detail/015data- preparation.html 45