数据工具
特性:维度,稀疏程度post
类型:结构化记录,图像,时间序列数据spa
种类:分类数据(Categorical),数值型/量化数据(Quantitative),离散、连续code
(min + max) / 2
Skewness = 0, 对称, Symmetricip
Skewness > 0, 均值大于众数, 正向倾斜, Positively skewnessci
Skewness < 0, 均值小于众数, 负向倾斜, Negatively skewnessit
Q0 = min, Q1 = 25%, Q2 = 50%(中位数), Q3 = 75%, Q5 = maxio
不一样的颜色 --- 不一样类别class
不一样的高度,宽度 --- 数量数据可视化
To describe whether there are relationships, patterns or trends between two numerical variables, 揭示两个变量之间是否存在关联
正相关,负相关,不相关
很难同时展现全部维度的数据
分层展现,树形结构
文本:标签,词云,大小颜色
图:结点的颜色,大小,边的粗细
p = 1 时 变成街区距离, p = 2 时变成欧式距离