Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
数据可视化之复杂高维多元数据的可视化(上)
Search
yafei002
November 30, 2016
Technology
1
270
数据可视化之复杂高维多元数据的可视化(上)
《数据可视化》陈为 沈则潜 陶煜波. (2013) 第十二章上总结
yafei002
November 30, 2016
Tweet
Share
More Decks by yafei002
See All by yafei002
了解人工神经网络
yafei002
1
190
了解朴素贝叶斯
yafei002
1
210
了解K-Means算法
yafei002
1
190
了解KNN算法
yafei002
0
160
了解决策树和C4.5算法
yafei002
1
230
数据可视化之视觉感知与认知
yafei002
1
330
数据可视化之地理信息可视化
yafei002
1
310
数据可视化之层次和网络数据可视化(上)
yafei002
1
320
Data Visualization Introduction and History
yafei002
1
300
Other Decks in Technology
See All in Technology
How to Lead? Testimonial of a Lead Android Engineer
oleur
1
110
MapLibreとAmazon Location Service
dayjournal
1
190
いいたいことちゃんという
tkengo
0
230
「スニダン」開発組織の構造に込めた意図 ~組織作りはパッションや政治ではない!~
rinchsan
4
610
Android Target SDK 35 (Android 15) 対応の概要
akkie76
0
150
LayerXにおけるLLMプロダクト開発の今までとこれから
layerx
PRO
4
680
Além do else! Categorizando Pokemóns com Pattern Matching no JavaScript
wmsbill
0
710
Cypress or Playwright?
rainerhahnekamp
0
170
require(ESM)とECMAScript仕様
uhyo
4
970
家族アルバム みてねにおけるGrafana活用術 / Grafana Meetup Japan Vol.1 LT
isaoshimizu
1
1k
Azureの基本的な権限管理の勉強会
yhana
1
2.1k
Grafana x PagerDuty Better Together
jacopen
1
260
Featured
See All Featured
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
117
18k
We Have a Design System, Now What?
morganepeng
44
6.8k
Fontdeck: Realign not Redesign
paulrobertlloyd
76
4.9k
5 minutes of I Can Smell Your CMS
philhawksworth
199
19k
How to Ace a Technical Interview
jacobian
273
22k
jQuery: Nuts, Bolts and Bling
dougneiner
59
7.2k
Rails Girls Zürich Keynote
gr2m
91
13k
Design by the Numbers
sachag
274
18k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
155
14k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
660
120k
Debugging Ruby Performance
tmm1
70
11k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
222
21k
Transcript
复杂高维多元数据的可视化(上) 数据可视化 yafei002
更复杂的数据时代 移动互联网时代涌现无数复杂的数据 •三位时空数据 •视频影像数据 •地理信息数据 •传感器网络数据 •社交网络数据 •网络日志数据 •等 数据呈现的特点
•高维多元,统计和基本分析方法无法胜任 •数据复杂度大大增加 •数据的尺度大到超过了单机甚至小型集群处理能力的极限 •数据质量尤其其中的数据的不确定性无法避免 •数据快速动态变化,常以流式数据存在
高维多元数据 定义 •高维:数据具有多个独立属性 •多元:数据具有多个相关属性 可视化特点 传统的用不同的视觉编码表示不同属性的数据,在维度高 是不适用。 •视觉编码的种类有限 •过多或过于复杂的视觉编码会降低可视化的可读性 方法
空间映射、图标法、基于像素的可视化方法
空间映射法 散点矩阵 对传统散点图的扩展 •方法:对于N维数据,采用N^2个散点图逐一表示N个属 性之间的两两关系 •优势 • 符合人们使用直角坐标系的习惯 • 有效的揭示属性之间的关联
•局限 • 过多的散点图会占据有限的屏幕空间,降低可视化 的可读性 • 可以通过有限展示重要性较高的散点图缓解
空间映射法 表格透镜 对传统表格的扩展 •行为数据对象,列为属性 •将表格中的数值用水平横 条或点表示。横条或点占用 的空间较小。
空间映射法 平行坐标 每个坐标轴对应一 个属性,每个数据 对象对应于一条穿 过所有坐标轴的折 线
空间映射法 平行坐标
空间映射法 平行坐标+散点图
图标法 图标中的不同视觉元素被用来表示数据对象的不同属性 星型图(雷达图) 平行坐标的极坐标版本 •每个属性由一个坐标轴表示 •每个坐标轴上的值由该属性的值 与该属性最大值的比例表示 •折线连接所有坐标轴上的点,形 成一个星形区域 •星形区域的形状和大小反应了数
据对象的属性 •评价;紧凑;数据维度增加,但 总面积不变,人类对形状大小的 敏感使得可视化理解容易高效
图标法 Chernoff Faces •模拟人脸图标标识数据对象 •不同的属性映射为人脸不同的 部位和结构 •评价 • 人类的视觉和大脑擅长 人脸识别,能够观察脸
部的细微变化 • 人对脸部的各个部位特 征的感知度不同,根据 属性的优先级选择人脸 的映射部位
基于像素图的方法 像素图:每个像素代表一个属 性,颜色编码数据值。所有的矩 形按照一定的布局策略(如顺序 或螺旋布局)排列在二维空间上, 生成一整个像素块 单个像素作为可视化的基本显示单元
基于像素图的方法 像素柱状图:数据对象按照 选定的分割属性进行分类,不同 类的对象布局在不同的空间区域, 每一类按照两个排列顺序属性组 成的直角坐标系进行布局。像素 的颜色由对应的颜色属性的值决 定。
基于像素图的方法 像素柱状图
基于像素图的方法 马赛克图:空间剖分法展示 多元类别型数据的统计信息
马赛克图