Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Data Prep 触ってみた

Data Prep 触ってみた

2020年9月29日に開催されたEinsteinAnalytics同好会 #2のLT資料です。
Summer' 20 にベータ版が公開されたData Prepについて紹介させていただきました。

EinsteinAnalytics同好会:
https://einstein-analytics-club.connpass.com/

nishiyama hiroaki

September 29, 2020
Tweet

More Decks by nishiyama hiroaki

Other Decks in Technology

Transcript

  1. サマリ NEGATIVE →細かいところが⾊々と気になる • めっちゃエラーでる、けど、デバッグしづらい • 「予期せぬエラーのため、データをプレビューできません。」 • 「UNKNOWN」 •

    「 Your query request was running for too long.」 • 操作の度にプレビューのためにクエリを投げているようで、レスポンスが悪い • 変更に弱く、メンテナンス性に不安あり • 途中で項⽬⾜す、変更する、などでエラーが出まくる • ノードの名前を変更しても項⽬名のプレフィクスに反映されない • ⽇本語名だとcase⽂でエラーが起きるが、あとから変更できない • ⾔語は英語、データセット名や項⽬名もアルファベットをつかって被害を最⼩限に抑えよう
  2. Data Prepとは Welcome to the new data platform • 新規ユーザーが参⼊しやすいように改良された、これまでのデータ準備ツールを統合したツールです

    • 時間の問題で、Data Prepは他のどのデータ準備オプションよりも強⼒になります • 多くのユーザが求めている以下の機能を将来的に含みます • レシピとデータフローから最⾼のものを組み合わせた新しいレイアウト • さまざまなノードを表す明確なアイコンと⾊を使⽤したフロー • 変換を編集するときのデータのプレビュー • フローは扱いやすく、エラーのリスクを⾼くすることなく新しいノードを追加できます • データですぐに使⽤できるパッケージ化された機械学習機能 • 既存ユーザは次のことを考慮してください • リリースノートが利⽤可能になったら注意深く読み、変更点の詳細を理解してください • ⼀部の要件には、これまでとは異なる⽅法でアプローチする必要があります • 最終的に、データフローはData Prepで開くことができるようになります。 • データフローの移⾏ツールが利⽤可能になったら、データフローをData Prepに移⾏する必要があるかどうかを評価してください • Data Prep内のフィードバックボタンを使⽤して、製品チームにあなたが気になることを知らせてください Rikke Hovgaardさん のブログより
  3. Data Prepとは Journey Behind Einstein Analyticsʼ New Data Platform •

    2018年に⾏ったユーザー調査によると、 データの準備はEinsteinAnalyticsを使⽤する上で最も困難で苛⽴たしい部分でした • ユーザーがデータの準備に成功し、Einstein Analyticsを使い始めるまでに、3〜6か⽉かかりました • Einstein Analyticsチームは、ユーザー中⼼のアプローチによって改善事項を洗い出し優先順位づけをしました 1. ユーザを理解する 2. ユーザが抱える課題を理解する(右図) 3. Opportunityを特定する 4. Opportunityをソリューションに変換する 5. 正しくなるまで繰り返す Richa Prajapatiさん のブログより
  4. Data Prepとは Journey Behind Einstein Analyticsʼ New Data Platform •

    ユーザを理解する Richa Prajapatiさん のブログより
  5. Data Prepとは Journey Behind Einstein Analyticsʼ New Data Platform •

    ユーザが抱える課題を理解する Richa Prajapatiさん のブログより
  6. サブスクリプションサービスでよくある チャーン分析データセットを作ってみた 年 ⽉ 前⽉までのアカウント数 当⽉解約アカウント数 前⽉の総収益 当⽉のアカウント解約で失った収益 • 当⽉解約アカウント数/前⽉までのアカウント数=カスタマーチャーンレート

    • 当⽉のアカウント解約で失った収益/前⽉の総収益=レベニューチャーンレート 正直⼤変だったし、まだまだ改善の余地あり。。 • ⼤変だったポイント • サービスの解約とアカウントの解約は異なる。サービスを全て解約したらアカウントの解約として判定。 • 前⽉末時点での総収益・アカウント数と当⽉の解約を⽐較するため、実績をずらして並べる必要あり。 • Data Prepでやるには重すぎる処理?最終的に5つのData Prepに分割して作成した。