Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
数据可视化之复杂高维多元数据的可视化(上)
Search
yafei002
November 30, 2016
Technology
1
290
数据可视化之复杂高维多元数据的可视化(上)
《数据可视化》陈为 沈则潜 陶煜波. (2013) 第十二章上总结
yafei002
November 30, 2016
Tweet
Share
More Decks by yafei002
See All by yafei002
了解人工神经网络
yafei002
1
210
了解朴素贝叶斯
yafei002
1
230
了解K-Means算法
yafei002
1
210
了解KNN算法
yafei002
0
170
了解决策树和C4.5算法
yafei002
1
260
数据可视化之视觉感知与认知
yafei002
1
380
数据可视化之地理信息可视化
yafei002
1
390
数据可视化之层次和网络数据可视化(上)
yafei002
1
660
Data Visualization Introduction and History
yafei002
1
320
Other Decks in Technology
See All in Technology
2025年 山梨の技術コミュニティを振り返る
yuukis
0
140
Scrum Guide Expansion Pack が示す現代プロダクト開発への補完的視点
sonjin
0
280
田舎で20年スクラム(後編):一個人が企業で長期戦アジャイルに挑む意味
chinmo
1
690
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
5
59k
業務の煩悩を祓うAI活用術108選 / AI 108 Usages
smartbank
9
19k
Keynoteから見るAWSの頭の中
nrinetcom
PRO
1
160
Cloud WAN MCP Serverから考える新しいネットワーク運用 / 20251228 Masaki Okuda
shift_evolve
PRO
0
130
Oracle Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
1
820
チームで安全にClaude Codeを利用するためのプラクティス / team-claude-code-practices
tomoki10
3
1.6k
20251225_たのしい出張報告&IgniteRecap!
ponponmikankan
0
110
#22 CA × atmaCup 3rd 1st Place Solution
yumizu
1
110
Claude Codeを使った情報整理術
knishioka
17
11k
Featured
See All Featured
The SEO identity crisis: Don't let AI make you average
varn
0
43
Statistics for Hackers
jakevdp
799
230k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
97
Rails Girls Zürich Keynote
gr2m
95
14k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
6.8k
For a Future-Friendly Web
brad_frost
180
10k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.1k
The agentic SEO stack - context over prompts
schlessera
0
580
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
30 Presentation Tips
portentint
PRO
1
180
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
7.9k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
Transcript
复杂高维多元数据的可视化(上) 数据可视化 yafei002
更复杂的数据时代 移动互联网时代涌现无数复杂的数据 •三位时空数据 •视频影像数据 •地理信息数据 •传感器网络数据 •社交网络数据 •网络日志数据 •等 数据呈现的特点
•高维多元,统计和基本分析方法无法胜任 •数据复杂度大大增加 •数据的尺度大到超过了单机甚至小型集群处理能力的极限 •数据质量尤其其中的数据的不确定性无法避免 •数据快速动态变化,常以流式数据存在
高维多元数据 定义 •高维:数据具有多个独立属性 •多元:数据具有多个相关属性 可视化特点 传统的用不同的视觉编码表示不同属性的数据,在维度高 是不适用。 •视觉编码的种类有限 •过多或过于复杂的视觉编码会降低可视化的可读性 方法
空间映射、图标法、基于像素的可视化方法
空间映射法 散点矩阵 对传统散点图的扩展 •方法:对于N维数据,采用N^2个散点图逐一表示N个属 性之间的两两关系 •优势 • 符合人们使用直角坐标系的习惯 • 有效的揭示属性之间的关联
•局限 • 过多的散点图会占据有限的屏幕空间,降低可视化 的可读性 • 可以通过有限展示重要性较高的散点图缓解
空间映射法 表格透镜 对传统表格的扩展 •行为数据对象,列为属性 •将表格中的数值用水平横 条或点表示。横条或点占用 的空间较小。
空间映射法 平行坐标 每个坐标轴对应一 个属性,每个数据 对象对应于一条穿 过所有坐标轴的折 线
空间映射法 平行坐标
空间映射法 平行坐标+散点图
图标法 图标中的不同视觉元素被用来表示数据对象的不同属性 星型图(雷达图) 平行坐标的极坐标版本 •每个属性由一个坐标轴表示 •每个坐标轴上的值由该属性的值 与该属性最大值的比例表示 •折线连接所有坐标轴上的点,形 成一个星形区域 •星形区域的形状和大小反应了数
据对象的属性 •评价;紧凑;数据维度增加,但 总面积不变,人类对形状大小的 敏感使得可视化理解容易高效
图标法 Chernoff Faces •模拟人脸图标标识数据对象 •不同的属性映射为人脸不同的 部位和结构 •评价 • 人类的视觉和大脑擅长 人脸识别,能够观察脸
部的细微变化 • 人对脸部的各个部位特 征的感知度不同,根据 属性的优先级选择人脸 的映射部位
基于像素图的方法 像素图:每个像素代表一个属 性,颜色编码数据值。所有的矩 形按照一定的布局策略(如顺序 或螺旋布局)排列在二维空间上, 生成一整个像素块 单个像素作为可视化的基本显示单元
基于像素图的方法 像素柱状图:数据对象按照 选定的分割属性进行分类,不同 类的对象布局在不同的空间区域, 每一类按照两个排列顺序属性组 成的直角坐标系进行布局。像素 的颜色由对应的颜色属性的值决 定。
基于像素图的方法 像素柱状图
基于像素图的方法 马赛克图:空间剖分法展示 多元类别型数据的统计信息
马赛克图