Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
数据可视化之复杂高维多元数据的可视化(上)
Search
yafei002
November 30, 2016
Technology
1
290
数据可视化之复杂高维多元数据的可视化(上)
《数据可视化》陈为 沈则潜 陶煜波. (2013) 第十二章上总结
yafei002
November 30, 2016
Tweet
Share
More Decks by yafei002
See All by yafei002
了解人工神经网络
yafei002
1
210
了解朴素贝叶斯
yafei002
1
230
了解K-Means算法
yafei002
1
210
了解KNN算法
yafei002
0
170
了解决策树和C4.5算法
yafei002
1
260
数据可视化之视觉感知与认知
yafei002
1
390
数据可视化之地理信息可视化
yafei002
1
390
数据可视化之层次和网络数据可视化(上)
yafei002
1
670
Data Visualization Introduction and History
yafei002
1
320
Other Decks in Technology
See All in Technology
Context Engineeringの取り組み
nutslove
0
380
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.6k
ECS障害を例に学ぶ、インシデント対応に備えたAIエージェントの育て方 / How to develop AI agents for incident response with ECS outage
iselegant
4
460
AI駆動開発を事業のコアに置く
tasukuonizawa
1
400
Oracle AI Database移行・アップグレード勉強会 - RAT活用編
oracle4engineer
PRO
0
110
1,000 にも届く AWS Organizations 組織のポリシー運用をちゃんとしたい、という話
kazzpapa3
0
200
22nd ACRi Webinar - ChipTip Technology Eric-san's slide
nao_sumikawa
0
100
ファインディの横断SREがTakumi byGMOと取り組む、セキュリティと開発スピードの両立
rvirus0817
1
1.7k
顧客との商談議事録をみんなで読んで顧客解像度を上げよう
shibayu36
0
340
Greatest Disaster Hits in Web Performance
guaca
0
300
Tebiki Engineering Team Deck
tebiki
0
24k
Claude Code for NOT Programming
kawaguti
PRO
1
110
Featured
See All Featured
Ruling the World: When Life Gets Gamed
codingconduct
0
150
WENDY [Excerpt]
tessaabrams
9
36k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
1
1.3k
Everyday Curiosity
cassininazir
0
130
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
590
The Limits of Empathy - UXLibs8
cassininazir
1
220
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
My Coaching Mixtape
mlcsv
0
52
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
0
140
The World Runs on Bad Software
bkeepers
PRO
72
12k
Unsuck your backbone
ammeep
671
58k
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
170
Transcript
复杂高维多元数据的可视化(上) 数据可视化 yafei002
更复杂的数据时代 移动互联网时代涌现无数复杂的数据 •三位时空数据 •视频影像数据 •地理信息数据 •传感器网络数据 •社交网络数据 •网络日志数据 •等 数据呈现的特点
•高维多元,统计和基本分析方法无法胜任 •数据复杂度大大增加 •数据的尺度大到超过了单机甚至小型集群处理能力的极限 •数据质量尤其其中的数据的不确定性无法避免 •数据快速动态变化,常以流式数据存在
高维多元数据 定义 •高维:数据具有多个独立属性 •多元:数据具有多个相关属性 可视化特点 传统的用不同的视觉编码表示不同属性的数据,在维度高 是不适用。 •视觉编码的种类有限 •过多或过于复杂的视觉编码会降低可视化的可读性 方法
空间映射、图标法、基于像素的可视化方法
空间映射法 散点矩阵 对传统散点图的扩展 •方法:对于N维数据,采用N^2个散点图逐一表示N个属 性之间的两两关系 •优势 • 符合人们使用直角坐标系的习惯 • 有效的揭示属性之间的关联
•局限 • 过多的散点图会占据有限的屏幕空间,降低可视化 的可读性 • 可以通过有限展示重要性较高的散点图缓解
空间映射法 表格透镜 对传统表格的扩展 •行为数据对象,列为属性 •将表格中的数值用水平横 条或点表示。横条或点占用 的空间较小。
空间映射法 平行坐标 每个坐标轴对应一 个属性,每个数据 对象对应于一条穿 过所有坐标轴的折 线
空间映射法 平行坐标
空间映射法 平行坐标+散点图
图标法 图标中的不同视觉元素被用来表示数据对象的不同属性 星型图(雷达图) 平行坐标的极坐标版本 •每个属性由一个坐标轴表示 •每个坐标轴上的值由该属性的值 与该属性最大值的比例表示 •折线连接所有坐标轴上的点,形 成一个星形区域 •星形区域的形状和大小反应了数
据对象的属性 •评价;紧凑;数据维度增加,但 总面积不变,人类对形状大小的 敏感使得可视化理解容易高效
图标法 Chernoff Faces •模拟人脸图标标识数据对象 •不同的属性映射为人脸不同的 部位和结构 •评价 • 人类的视觉和大脑擅长 人脸识别,能够观察脸
部的细微变化 • 人对脸部的各个部位特 征的感知度不同,根据 属性的优先级选择人脸 的映射部位
基于像素图的方法 像素图:每个像素代表一个属 性,颜色编码数据值。所有的矩 形按照一定的布局策略(如顺序 或螺旋布局)排列在二维空间上, 生成一整个像素块 单个像素作为可视化的基本显示单元
基于像素图的方法 像素柱状图:数据对象按照 选定的分割属性进行分类,不同 类的对象布局在不同的空间区域, 每一类按照两个排列顺序属性组 成的直角坐标系进行布局。像素 的颜色由对应的颜色属性的值决 定。
基于像素图的方法 像素柱状图
基于像素图的方法 马赛克图:空间剖分法展示 多元类别型数据的统计信息
马赛克图