Slide 1

Slide 1 text

The Art of Visualization (可視化について) Mikio Kubo

Slide 2

Slide 2 text

⼈間の認識のしやすさ 実験結果

Slide 3

Slide 3 text

No content

Slide 4

Slide 4 text

データの種類 • 連続数値データ ü 順序あり ü 順序なし • カテゴリカルデータ ü 順序データ (ordinal data): 離散数値データなど ü 名義データ (nominal data): 性別や⾊など • 時刻データ • 緯度・経度データ

Slide 5

Slide 5 text

1次元の数値データ • ヒストグラム(度数分布表) • 密度プロット

Slide 6

Slide 6 text

2次元の数値データ • 順序なし => 散布図 (Scatter) • 順序あり => 線プロット (Line)

Slide 7

Slide 7 text

3次元以上の数値データ • 散布図+点の⼤きさ • 散布図+点の⼤きさ+⾊調 + 順序あり(時系列)データ => アニメーション

Slide 8

Slide 8 text

より⾼次元のデータ • 並⾏座標図 • 次元削減(主成分分析,t-SNE)

Slide 9

Slide 9 text

余分な情報を除く(表も同様)

Slide 10

Slide 10 text

ナポレオンの⾏軍 (Sankey Graph) By Charles Minard (1781-1870) - see upload log, Public Domain, https://commons.wikimedia.org/w/index.php?curid=297925 撤退時の気温

Slide 11

Slide 11 text

クリミア戦争での死亡率 (Polar Area Graph) By Florence Nightingale - https://www.davidrumsey.com/luna/servlet/s/h6xid2, Public Domain, https://commons.wikimedia.org/w/index.php?curid=1474443 戦闘での 死亡者数 その他の 理由による 死亡者数 回避可能な 感染症による 死亡者数

Slide 12

Slide 12 text

アニメーションや対話 • 動的配送計画 https://youtu.be/qr6qAa-kXes • New York Times : Four Ways to Slice Obamaʼs 2013 Budget Proposal https://archive.nytimes.com/www.nytimes.com/interactive/2012/02/13/u s/politics/2013-budget-proposal-graphic.html? • 配送最適化 (メニューでMETRO IVを選択; Optimizationを押す) https://share.streamlit.io/scmopt/manual/scripts/app.py

Slide 13

Slide 13 text

Bad Visualizations https://badvisualisations.tumblr.com/

Slide 14

Slide 14 text

国別の⼥性の⾝⻑(棒グラフ) 何が悪いのか考えてみよう!

Slide 15

Slide 15 text

国別の⼥性の⾝⻑(棒グラフ) • 棒グラフのy軸が0で始まっていない • x軸の意味がない • 軸に単位を⼊れるべき • 棒でなく⼥性の絵にする意味がいない (⼈間は⾯積と勘違いして評価してしまう)

Slide 16

Slide 16 text

3D棒グラフ どう変える?

Slide 17

Slide 17 text

3D棒グラフ • 3次元の図は使うべきではない • ⾊とy軸が同じで,⽉を表す時系列 • ⾞種別の線グラフが良い

Slide 18

Slide 18 text

円グラフ 何が悪いのか考えてみよう!

Slide 19

Slide 19 text

円グラフ • そもそも円グラフは良くない (⼈間は⾯積や⾓度より ⻑さの認識能⼒が⾼い) • 上位5つ以外のラベルが⾒えない • 上位5つの違いもわかりにくい • 棒グラフが妥当 (上位以外はまとめる)