Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Tableau 新データモデル丸わかりテキスト

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

Tableau 新データモデル丸わかりテキスト

Tableau2020.2の新機能リレーションシップについて解説書。
ベータ版で試した内容です。
誤りがありましたらコメント下さい。

Avatar for junjitab

junjitab

May 06, 2020
Tweet

Other Decks in Technology

Transcript

  1. 目次 2 • はじめに • 初心者向け説明 • 概要 • ブレンドとリレーションシップの違い

    • リレーションシップを使った結合 • 操作面での変化点 • まとめ • 中級者向け • 新データモデルの概要 • リレーションシップを使った集計結合 • JOIN(結合)を使った集計結合の場合 • JOIN(結合)・ブレンドとリレーションシップの使用方法比較 • JOIN(結合)・ブレンドとリレーションシップの機能比較表 • 注意事項 • その他 • まとめ • 参考
  2. リレーションシップを使った結合の例 (1/2) サンプルスーパーストアのように「注文」と「関係者」テーブルを結合して、 「注文」テーブルに無い”地域マネージャー”情報も併せて取得する場合。 14 注文NO 地域 注文数量 A 中国地方

    100 B 中部地方 50 C 近畿地方 120 地域 地域マネージャー 中国地方 雨宮 武 中部地方 辻岡 美羽 + 注文テーブル 関係者テーブル 注文NO 地域 地域マネージャー 注文数量 A 中国地方 雨宮 武 100 B 中部地方 辻岡 美羽 50 C 近畿地方 120 結合した結果
  3. リレーションシップを使った集計結合の例 (1/3) 複数のキー(注文NO)が存在し結合する場合。 32 注文NO 注文日付 注文数量 A 2020/1/10 100

    A 2020/1/11 50 B 2020/1/12 200 C 2020/1/13 300 注文NO 返品日付 返品数量 A 2020/2/1 150 + 注文テーブル 返品テーブル
  4. リレーションシップを使った集計結合の例 (2/3) 集計した結果を結合することで正しい値が取得できる。 33 注文NO 注文日付 注文数量 A 2020/1/10 100

    A 2020/1/11 50 B 2020/1/12 200 C 2020/1/13 300 注文NO 返品日付 返品数量 A 2020/2/1 150 + 注文テーブル 返品テーブル 注文NO 注文数量 返品数量 A 100 150 B 200 C 300
  5. リレーションシップが実現していること Tableauが自動で判断し、キー(注文NO)で集計した結果同士を結合して正しい集計結果を表示します。 35 注文NO 注文日付 注文数量 A 2020/1/10 100 A

    2020/1/11 50 B 2020/1/12 200 C 2020/1/13 300 注文NO 返品日付 返品数量 A 2020/2/1 150 注文NO 注文数量 返品数量 A 100 150 B 200 C 300 注文NO 注文数量 A 150 B 200 C 300 注文NO 返品数量 A 150 + + 集計した結果で結合される 注文テーブル 返品テーブル 注文NOで集計 注文NOで集計
  6. JOIN(結合)を使った集計結合の場合 (2/3) キーが重複する場合、データが複製されて誤った集計結果になってしまう…。 38 注文NO 注文日付 注文数量 A 2020/1/10 100

    A 2020/1/11 50 B 2020/1/12 200 C 2020/1/13 300 注文NO 返品日付 返品数量 A 2020/2/1 150 注文NO 注文日付 注文数量 返品数量 A 2020/1/10 100 150 A 2020/1/11 50 150 B 2020/1/12 200 C 2020/1/13 300 注文NO 注文数量 返品数量 A 100 300 B 200 C 300 + 注文NOで結合すると 複製されてしまう… 間違った結果が表示される 〇:150 注文テーブル 返品テーブル
  7. JOIN(結合) VS リレーションシップ JOIN(結合)の場合はデータが複製されてしまうことを意識する必要があり、 それに合わせて集計方法の変更が必要。 41 JOIN(結合) リレーションシップ 結合条件を設定 Vizに配置

    →誤った答え 集計条件を変更 必要なテーブルを D&D Vizに配置 →自動で集計結果を結合 意識して設定・メジャーの変更やLOD計算が必要 意識せず配置するだけで勝手に最適な結合をしてくれる
  8. ブレンド VS リレーションシップ ブレンドでは集計方法の変更は不要だがプライマリー・セカンダリを意識して繋ぐ必要あり。 また、使える結合の種類は左外部結合(LEFT OUTER JOIN)のみ。 42 ブレンド リレーションシップ

    必要なテーブルを D&D Vizに配置 →自動で集計結果を結合 ブレンドするデータソースを2つ接続すると結合できる 意識せず配置するだけで勝手に最適な結合をしてくれる データソースを 2つ接続 Vizに配置 →自動で集計結果を結合
  9. JOIN(結合) VS リレーションシップ機能比較表 事前に結合の種類を設定する必要は無くVizの状態によって最適な結合が可能。 44 JOIN(結合) リレーションシップ Level of Detail

    行レベル 集計 インプット 物理テーブル 論理テーブル アウトプット 結合されたテーブル全て Vizで扱うテーブルのみ ※パフォーマンスが最適 結合の種類 Inner/Left/Right/Outer データセットで決定 Vizに配置したディメンション, メジャーによる クエリ 全テーブルで実行される Vizで扱うテーブルのみ 抽出 事前計算できる 事前計算できない
  10. ブレンド VS リレーションシップ機能比較表 ブレンドでは左外部結合(LEFT OUTER JOIN)のみだったり、Publishできなかった部分が改善。 併せて必要なテーブルのみSQLをDBで処理するのでパフォーマンスも改善されています。 45 ブレンド リレーションシップ

    スコープ ワークシート(一部) データソース(全体) 共有 Publish不可 Publish可 関係性 Primary / Secondary 全てのテーブルを平等に扱う パフォーマンス 実行するパソコンに依存 DBにSQLを発行 SQL LEFT OUTER JOINのみ INNER/OUTER/FULL使用可
  11. 抽出画面のオプション設定 (3/3) 物理テーブルの方がパフォーマンスはいいみたいですが、特別な理由が無い限りは論理テーブルで抽出します。 また、どちらを選んでもVizや集計結果には影響しません。 53 • 表の結合全てが等価結合 • 列のデータ型は同一 •

    パススルークエリを使用してない • 増分更新が使用されていない (選択できない) • 抽出フィルターが使用されていない (選択できない) • 上位Nやサンプリングが使用されていない (選択できない) •物理テーブルを選択できる条件 •Vizへの影響 • どちらを選択してもVizには影響しません (リレーションシップ・結合の情報はhyperにはない) • 保存されるテーブル数や形に違いはありますが、 Vizへの影響はありません どちらを選んでも見た目は同じ
  12. まとめ (中級者向け) 56 <JOIN(結合)ブレンド> なんか難しい… <リレーションシップ> 簡単 2020.2 <ブレンド> なんか難しい…

    ※しかし、Vizによって結合条件が変化す るので常にイメージを持って使う必要あり ※JOIN(結合)もブレンドも引き続き従来通り使えます ※しかし、もうブレンドは使う必要が無さそうです 難しかったら従来の方法を使おう
  13. お役立ちサイト 58 • 【TC19ブログ】Tableau新データモデリング (エクスチュア株式会社のページ) Tableauカンファレンス19体験レポートより、リレーションシップの詳細が分かりやすく記載されています。 • Data Model Enhancements

    Tableauカンファレンス19のデータモデルに関するセッション動画。デモも見れます。 • Tableauデータモデル (Tableauのページ) ボリュームはありますが、新しいデータモデルについて全ての内容が記載されています。 • Tableau抽出ヘルプ 抽出の条件も確認できます。