《数据可视化基础》第五章:可视化数量(一)


如下部分是基于《Fundamentals of Data Visualization》学习笔记,要是有兴趣的话,能够直接看原版书籍: https://serialmentor.com/dataviz/





在许多状况下,咱们对某些数字的大小感兴趣。 例如,咱们可能但愿可视化不一样品牌汽车的总销量,或 生活在 不一样城市的总人数,或进行不一样运动的奥林匹克运动员的年龄。 在全部这些状况下,咱们都有 一组类别(例如,汽车,城市或运动品牌)以及每一个类别的定量值 咱们讲这种的数据类 型的可视化称为数量可视化。 对于这种的可视化,最基本的就是条形图以及各类变体的条形图,另外还有热图。

条形图


为了说明条形图,咱们使用2017年圣诞周末的电影票房来举例子。在这个数据当中,包含了每个电影的名称以及他们的总票房。web

对于这样的数据,咱们使用垂直的条形图来进行表示。对于每个电影,咱们绘制一个从0到具体数值的一个矩形(条形),利用这个矩形块来表明某一个数值。数据库



对于垂直的条形图而言,X轴对于每个条形的标注占据了很大的空间。这样就致使不一样的条之间会有很大的空白。为了解决的这个问题,不少人会把标注进行旋转。这样会减小之间的空间。可是不是很建议这么作,由于旋转的标注对于阅读而言是很麻烦的,另外的话,根据做者的经验,若是标签太长水平没法放下的话,旋转的效果也不是很好。微信

对于这种长标签,最好的解决办法仍是把X轴和Y轴调换。造成一个水平的条形图app



另外不管是垂直仍是水平的条形图,都须要注意排列的顺序。咱们在使用绘图软件进行绘图的时候,不少绘图软件的默认排序是基于标注的字母顺序来进行排序的。这个的顺序的话,虽然可行,可是会看着很很差看。因此若是是对于若是没有必定顺序的数据的话,最好仍是按照具体数值进行降序或者升序,例如👆的图。学习

以上的规则只是适用于没有天然排序的状况下,若是是有天然排序的话,必定要按照天然排序来进行排序的。例如,下图显示了按年龄段划分的美国年收入中位数。在这种状况下,应按年龄增长的顺序排列。若是这个时候,对年龄组按条形高度进行排序是没有意义的。flex

分组和堆叠的条形图


在上面的例子当中,咱们遇到的都是一个分类变量与其相关的变量变化。可是,咱们常常也会同时对两个分类变量的数据变化感兴趣。例如,美国人口普查局提供了按年龄和种族细分的收入中位数。这个时候,咱们可使用分组条形图来进行可视化。在分组的条形图当中,咱们把其中一个变量看成X轴标注,而后利用另一个分类变量来绘制多个条形。spa


对于分组的条形图,因为分组太多就容易致使混淆。这类的可视化,都是基于咱们想要讲述的内容来进行调整的。例如咱们是不一样年龄段的种族之间的差别感兴趣的话,可使用👆的图。若是是咱们对不一样种族之间的总体收入变化的话,那可使用下面的图。.net



上面的两种分组可视化,咱们是经过把两个分类变量映射到X轴和颜色标度上来实现的,还有另一种方式是利用一个分类变量来进行分面进而绘制多个条形图。两种可视化方式都对,只不过度面的好处是咱们不须要来花费额外的精力去解读具体的分组的变量是什么了。3d

相较于上面并排的条形图,还有一种分组的条形图是堆叠在一块儿的。这种堆叠的条形图对于想要说明总体变化的时候是有用的。orm


PS:👆显示的条形图没有明确的y轴。相反,在每一个条形中标注了其所表明的实际数值。每当一个图只显示少许数值时,将实际数字添加到图中是有意义的。这实质上增长了绘图传达的信息量,而没有增长太多视觉噪声,而且消除了对显式y轴的须要。


后记


上面咱们介绍了基本的条形的类型。可是对于条形图而言还有两个弊端:(i)若是咱们想要可视化的数据总体之间的差别没那么大,那应该怎么展现结果呢?(ii)对于分组的条形图,若是分组太多,要怎么办呢?针对这两个问题,咱们有二者候选的图形能够进行替代,咱们下期再讲哦!

往期推荐 《数据可视化基础》第四章:可视化图形推荐 《数据可视化基础》第三章:图形颜色如何选择 《数据可视化基础》第二章:坐标轴 《数据可视化基础》第一章:把数据放到图表上

本文分享自微信公众号 - 医学数据库百科(yxkygjx)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。