Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Data Prep 触ってみた

Data Prep 触ってみた

2020年9月29日に開催されたEinsteinAnalytics同好会 #2のLT資料です。
Summer' 20 にベータ版が公開されたData Prepについて紹介させていただきました。

EinsteinAnalytics同好会:
https://einstein-analytics-club.connpass.com/

8b1aa98d1d849a1767b3abf14dc76832?s=128

nishiyama hiroaki

September 29, 2020
Tweet

Transcript

  1. Data Prep 触ってみた nishiyama hiroaki

  2. ⽬次 • サマリ • ⾃⼰紹介 • Data Prepとは • チャーン分析データセットを作ってみた

    • (時間があったら)触りながら解説 • 本⽇の結論
  3. サマリ POSITIVE →期待⼤!みんなでData Prepを育てましょう! • データ準備ツールとして、 レシピ・データフローが統合された完全上位互換! • より⾒やすく使いやすく •

    これまでのかゆいところに⼿が届くように
  4. サマリ NEGATIVE →細かいところが⾊々と気になる • めっちゃエラーでる、けど、デバッグしづらい • 「予期せぬエラーのため、データをプレビューできません。」 • 「UNKNOWN」 •

    「 Your query request was running for too long.」 • 操作の度にプレビューのためにクエリを投げているようで、レスポンスが悪い • 変更に弱く、メンテナンス性に不安あり • 途中で項⽬⾜す、変更する、などでエラーが出まくる • ノードの名前を変更しても項⽬名のプレフィクスに反映されない • ⽇本語名だとcase⽂でエラーが起きるが、あとから変更できない • ⾔語は英語、データセット名や項⽬名もアルファベットをつかって被害を最⼩限に抑えよう
  5. ⾃⼰紹介 nishiyama hiroaki • BIがすき • 社会⼈歴=SI歴=BI歴4年半、Salesforce歴3年 • 明後⽇から3社⽬

  6. Data Prepとは Welcome to the new data platform • 新規ユーザーが参⼊しやすいように改良された、これまでのデータ準備ツールを統合したツールです

    • 時間の問題で、Data Prepは他のどのデータ準備オプションよりも強⼒になります • 多くのユーザが求めている以下の機能を将来的に含みます • レシピとデータフローから最⾼のものを組み合わせた新しいレイアウト • さまざまなノードを表す明確なアイコンと⾊を使⽤したフロー • 変換を編集するときのデータのプレビュー • フローは扱いやすく、エラーのリスクを⾼くすることなく新しいノードを追加できます • データですぐに使⽤できるパッケージ化された機械学習機能 • 既存ユーザは次のことを考慮してください • リリースノートが利⽤可能になったら注意深く読み、変更点の詳細を理解してください • ⼀部の要件には、これまでとは異なる⽅法でアプローチする必要があります • 最終的に、データフローはData Prepで開くことができるようになります。 • データフローの移⾏ツールが利⽤可能になったら、データフローをData Prepに移⾏する必要があるかどうかを評価してください • Data Prep内のフィードバックボタンを使⽤して、製品チームにあなたが気になることを知らせてください Rikke Hovgaardさん のブログより
  7. Data Prepとは Welcome to the new data platform Rikke Hovgaardさん

    のブログより
  8. Data Prepとは Journey Behind Einstein Analyticsʼ New Data Platform •

    2018年に⾏ったユーザー調査によると、 データの準備はEinsteinAnalyticsを使⽤する上で最も困難で苛⽴たしい部分でした • ユーザーがデータの準備に成功し、Einstein Analyticsを使い始めるまでに、3〜6か⽉かかりました • Einstein Analyticsチームは、ユーザー中⼼のアプローチによって改善事項を洗い出し優先順位づけをしました 1. ユーザを理解する 2. ユーザが抱える課題を理解する(右図) 3. Opportunityを特定する 4. Opportunityをソリューションに変換する 5. 正しくなるまで繰り返す Richa Prajapatiさん のブログより
  9. Data Prepとは Journey Behind Einstein Analyticsʼ New Data Platform •

    ユーザを理解する Richa Prajapatiさん のブログより
  10. Data Prepとは Journey Behind Einstein Analyticsʼ New Data Platform •

    ユーザが抱える課題を理解する Richa Prajapatiさん のブログより
  11. サブスクリプションサービスでよくある チャーン分析データセットを作ってみた 年 ⽉ 前⽉までのアカウント数 当⽉解約アカウント数 前⽉の総収益 当⽉のアカウント解約で失った収益 • 当⽉解約アカウント数/前⽉までのアカウント数=カスタマーチャーンレート

    • 当⽉のアカウント解約で失った収益/前⽉の総収益=レベニューチャーンレート 正直⼤変だったし、まだまだ改善の余地あり。。 • ⼤変だったポイント • サービスの解約とアカウントの解約は異なる。サービスを全て解約したらアカウントの解約として判定。 • 前⽉末時点での総収益・アカウント数と当⽉の解約を⽐較するため、実績をずらして並べる必要あり。 • Data Prepでやるには重すぎる処理?最終的に5つのData Prepに分割して作成した。
  12. チャーン分析 ダッシュボード

  13. チャーン分析 Data Prep ①

  14. チャーン分析 Data Prep ②

  15. チャーン分析 Data Prep ③

  16. チャーン分析 Data Prep ④

  17. チャーン分析 Data Prep ⑤

  18. 時間があったら 触りながら解説! Developer Editionでも触れるよ

  19. 本⽇の結論 Data Prepは、Einstein Analyticsで最も⼤きな壁となる データの準備におけるユーザビリティを格段に⾼めてくれる 可能性を秘めています。 みんなでData Prepを育てましょう!

  20. ご静聴いただきありがとうございました