Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データの可視化ワークショップ #5 - 可視化のためのデータラングリング

データの可視化ワークショップ #5 - 可視化のためのデータラングリング

こちらはデータの可視化ワークショップ第5弾の「可視化のためのデータラングリング」のスライドとなります。

データの可視化をする時によく直面するデータの加工に関する問題を効率的に解決していく方法を紹介します。

1. 横長のデータ(ワイド型)を縦長のデータ(ロング型)に変換する
2. データタイプの変換
3. 表示する値の制限
4. 表計算を使って前の値との差を求める
5. フィルタ(集計関数)
6. 集計
7. 列を結合する
8. 計算を作成

Takato Shiroto

August 13, 2020
Tweet

More Decks by Takato Shiroto

Other Decks in Technology

Transcript

  1. 3 εϐʔΧʔ നށ ܟొ Customer Succes EXPLORATORY ུྺ େֶࡏֶதʹϑʔυϩεΛݮΒͨ͢ΊʹɺֶੜஂମΛ্ཱͪ͛୅දΛ ຿ΊΔɻͦͷޙɺϏδωεΛ஌ΔͨΊʹԽֶϝʔΧʔͷσϡϙϯͱ

    ϑʔυςοΫܥελʔτΞοϓͰӦۀͱϚʔέςΟϯάΛܦݧɻ ΞϓϦͷ੒௕ͷͨΊʹ͸σʔλαΠΤϯε͕ඞཁͩͱײ͡ɺΞϓϦʹ ಛԽͨ͠Ϣʔβʔͷߦಈ෼ੳπʔϧΛ։ൃ͢ΔاۀʹͯɺΞϓϦۀք ͷKPI෼ੳͳͲΛ୲౰͢Δɻ ݱࡏ͸Exploratory, Inc. ͰΧελϚʔαΫηεΛ୲౰͢Δ๣Βɺσʔ λͷՄࢹԽͱ୳ࡧతσʔλ෼ੳΛઐ໳ͱͯ͠σʔλαΠΤϯεͷීٴ ʹऔΓ૊Ήɻ @ShirotoTakato
  2. ࣮͸͜Ε͚ͩ஌͍ͬͯΕ͹େৎ෉ʂ • Year (೥) • Month (݄) • Day (೔)

    • Hour (࣌) • Minute (෼) • Second (ඵ) 46
  3. 83 ࠃ ೔෇ ࢮ๢ऀ਺ ৽نࢮ๢ऀ਺ US 2020/4/1 1,000 <NA> US

    2020/4/2 1,200 200 US 2020/4/3 1,300 100 1,200 - 1,000 = 200 ର৅ͷ஋ - લͷ஋ = ৽نࢮ๢ऀ਺ ৽نࢮ๢ऀ਺ͷٻΊํ 1,300 - 1,200 = 100
  4. 85 ࠃ ೔෇ ࢮ๢ऀ਺ lag(ࢮ๢ऀ਺) US 2020/4/1 1,000 <NA> US

    2020/4/2 1,200 1,000 US 2020/4/3 1,300 1,200 lag(ࢮ๢ऀ਺)
  5. 86 ࠃ ೔෇ ࢮ๢ऀ਺ lag(ࢮ๢ऀ਺) ৽نࢮ๢ऀ਺ US 2020/4/1 1,000 <NA>

    <NA> US 2020/4/2 1,200 1,000 200 US 2020/4/3 1,300 1,200 100 ৽نࢮ๢ऀ਺ = ࢮ๢ऀ਺ - lag(ࢮ๢ऀ਺)
  6. 92 σʔλʹ͸USҎ֎ʹ΋ଟ͘ͷࠃ͕͋Δ ࠃ ೔෇ ࢮ๢ऀ਺ US 2020/4/1 1000 US 2020/4/2

    1200 US 2020/4/3 1300 Japan 2020/4/1 100 Japan 2020/4/2 120
  7. 93 ͔͠͠ɺ͜ͷ··ͩͱUSͱJapanͷؒͰͷ৽نͷࢮ๢ऀ਺ΛٻΊͯ͠·͏ ࠃ ೔෇ ࢮ๢ऀ਺ lag(ࢮ๢ऀ਺) ৽نࢮ๢ऀ਺ US 2020/4/1 1000

    <NA> <NA> US 2020/4/2 1200 1000 200 US 2020/4/3 1300 1200 100 Japan 2020/4/1 100 1300 -1200 Japan 2020/4/2 120 100 20
  8. 94 ৽نͷࢮ๢ऀ਺͸ɺࠃΛލ͍ͩલ೔ͱൺ΂Δ͜ͱ͸Ͱ͖ͳ͍ɻ ࠃ ೔෇ ࢮ๢ऀ਺ lag(ࢮ๢ऀ਺) ৽نࢮ๢ऀ਺ US 2020/4/1 1000

    <NA> <NA> US 2020/4/2 1200 1000 200 US 2020/4/3 1300 1200 100 Japan 2020/4/1 100 <NA> <NA> Japan 2020/4/2 120 100 20
  9. 95 ࠃ͝ͱʹ෼͚ͯ৽نͷࢮ๢ऀ਺ΛٻΊ͍ͨ ࠃ ೔෇ ࢮ๢ऀ਺ US 2020/4/1 1000 US 2020/4/2

    1200 US 2020/4/3 1300 Japan 2020/4/1 100 Japan 2020/4/2 120 USͱJapanΛ෼͚ΔͨΊʹ ઢҾ͖͍ͨ͠
  10. 96 ࠃͰάϧʔϓԽ͢Δ ࠃ ೔෇ ࢮ๢ऀ਺ US 2020/4/1 1000 US 2020/4/2

    1200 US 2020/4/3 1300 Japan 2020/4/1 100 Japan 2020/4/2 120
  11. ࠃ ೔෇ ࢮ๢ऀ਺ lag(ࢮ๢ऀ਺) US 2020/4/1 1000 <NA> US 2020/4/2

    1200 1,000 US 2020/4/3 1300 1,200 Japan 2020/4/1 100 <NA> Japan 2020/4/2 120 100 lag(ࢮ๢ऀ਺)
  12. ࠃ ೔෇ ࢮ๢ऀ਺ lag(ࢮ๢ऀ਺) ৽نࢮ๢ऀ਺ US 2020/4/1 1000 <NA> <NA>

    US 2020/4/2 1200 1,000 200 US 2020/4/3 1300 1,200 100 Japan 2020/4/1 100 <NA> <NA> Japan 2020/4/2 120 100 20 ৽نࢮ๢ऀ਺ = ࢮ๢ऀ਺ - lag(ࢮ๢ऀ਺)
  13. 142 Country Year Deaths US 2020/4/1 100 US 2020/4/2 120

    US ɾɾɾ ɾɾɾ US 2020/6/13 2,000 ϑΟϧλΛ࢖ͬͯ࠷৽ͷ೔෇ͷΈΛ࢒͢
  14. 167 Country Year Population US 1960 2,000 US 1961 2,100

    US ɾɾɾ ɾɾɾ US 2018 3,200 ϑΟϧλΛ࢖ͬͯ࠷৽ͷ೥ͷΈΛ࢒͢
  15. 168 Country Year Population US 1960 2,000 US 1961 2,100

    US ɾɾɾ ɾɾɾ US 2018 3,200 ϑΟϧλΛ࢖ͬͯ࠷৽ͷ೥ͷΈΛ࢒͢
  16. 178 ݁߹ݩͷσʔλϑϨʔϜʹ݁߹ઌͷσʔλϑϨʔϜͷྻΛ௥ՃͰ͖Δɻ Country Deaths United States 200 Japan 20 China

    40 Country Population United States 3,200 Japan 1,200 China 13,000 Country Deaths Population United States 200 3,200 Japan 20 1,200 China 40 13,000 ݁߹ݩ ݁߹ઌ
  17. 220 • ୈ1ճɿ SaaSͷ࠷ॏཁKPI ͱͦͷՄࢹԽ Part 1 • ୈ2ճɿ SaaSͷ࠷ॏཁKPI

    ͱͦͷՄࢹԽ Part 2 • ୈ3ճɿ Τϯήʔδϝϯτ Part 1 - DAU/MAU • ୈ4ճɿΤϯήʔδϝϯτ Part 2 - ύϫʔϢʔβʔɾΧʔϒ • ୈ5ճɿ Τϯήʔδϝϯτ Part 3 - RFV • ୈ6ճɿίϗʔτ෼ੳ Part 1 - ϨΠϠʔɾέʔΩɾνϟʔτ • ୈ7ճɿίϗʔτ෼ੳ Part 2 - ੜଘ෼ੳ - 8/20(໦) • ୈ8ճɿ NPSͷܭࢉͱࣗ༝هड़ͷςΩετ෼ੳ SaaS ΞφϦςΟΫεɾϫʔΫγϣοϓ