上一期我们介绍了很实用的散点图,通过点阵展现趋势、集群、模式以及相关性,把散乱的数据变得通俗易懂。但是如果在此基础上想展示更多的维度怎么办?
答案是气泡图表。难以置信,这种浪漫而自由的图表形式竟然可以轻松驾驭有2到4个维度的数据集的可视化工作,它是怎么样才能做到的呢?
气泡图与散点图相似,不同之处在于,气泡图允许在图表中额外加入一个表示大小的变量,而第四维度的数据则能够最终靠不同的颜色来表示(甚至在渐变中使用阴影来表示)。
另一种使用气泡元素的流行方法是使用气泡地图。在气泡地图中,x和y分别代表一个地理位置的经纬坐标。在不要求定位非常精确的情况下,气泡地图可以将数据的相对集中度完美地体现在地理背景中。
和散点图一样,气泡图的起源是未知的。1858年,法国土木工程师Charles Joseph Minard (著名的《拿破仑征俄战役图》作者)或首次将气泡地图和饼图组合起来,展示了法国牛贸易的情况。
Minard还在1859年通过气泡地图展示了欧洲主要港口和主要河流吨位的情况。
在下面的图中,每个气泡的面积代表了在该年龄段与同行领袖建立社交关系的人数所占的百分比,而图例代表了不同的年龄范围。从图中可看到,35-44岁的人们更倾向与精英人物社交,而这也为他们带来了更多的机会和有用建议。
展现三维数据的气泡图是我们最常见的气泡图的形式。下图中,x轴代表了2014年的四个财季,y轴代表了广告支出费用,销售额则通过气泡的大小来展现。能够正常的看到,跟着时间的推移,广告支出和销售额之间有明显的正相关性。
通过不一样的颜色和动态可以让气泡图展示更多维度的数据。比如瑞典研究人员Hans Rosling的“GapMinder”网站有这样一个动态气泡图。如下所示,图中X轴代表了人均收入,Y轴代表人均寿命,每个气泡代表一个国家,相同颜色的气泡属于同一地区(具体划分见下图右上方)。
随着年份数字的变化,5大地区、200个国家近200年的兴衰历程在短短40秒得到完美体现,世界大战、经济危机给各国带来的影响一目了然。用户还可以选定某些国家,这些国家的变化轨迹就会记录并显示出来,从而便于用户比较和研究特定国家的相关情况。
以上就是基本的气泡图介绍,其实镝数中还有非常多独特设计的气泡图。下面让我们大家一起来看一看吧!
还记得刚刚介绍的Gap Minder 网站的动态气泡图吗?镝数提供了与该案例类似的模型——动态分组气泡图。
数据的第一列为时间轴,第二、三列分别是数据的大类及其细分,具体体现为不一样的颜色和相同颜色的不同气泡;第四、五、六列则表示为气泡的X、Y值和气泡大小。
把二、三列数据设置为某地区和该地区的国家,四、五列分别设置为人口平均收入和年龄,最后一列设置为人口数量,就能轻松实现与之前的案例几乎相同的效果。
多轴气泡图需要三类变量:第一列是分类变量(表现为Y轴),第二列是时间变量(表现为X轴)、第三列是数值度量(表现为气泡半径)。一键可视化后能清楚反映数据的集中趋势。
针对多轴气泡图,横向可以比较每天不同时间段的数据情况,纵向则可以直接比较同一整点每天的数据变化。从上图中能够准确的看出,数据比较集中的时间段为下午12点到4点,尤其是周二和周三。
与多轴气泡图类似的还有打卡气泡图和钟形分布气泡图。这三种气泡图使用数据集的结构是完全相同的,但可视化效果略有区别。
通过这三个模板,我们大家可以很好地去了解人们观影习惯、公共场合人数流动情况、网站访问量变化趋势、活跃玩家的游戏习惯等情况。
交互聚合气泡图需要三个维度的数据,即分类变量(表现为不同的颜色)、标签(表现为不同的气泡)、数值变量(表现为气泡大小)。
分组变量的分组数不宜过多,3~10个分组为宜;数据的行数30~300为宜。否则气泡数量过多,会降低读者对气泡面积变化的敏感度。
从下图中我们大家可以看到,不同颜色代表了不同的国家,而相同颜色的不同气泡代表了不同的年份。气泡越大,说明该国家那年遭遇的次数越多。
镝数的这款气泡图最重要的是可以自由地动起来,用户都能够将图表切换为离散自由状态或分组聚合状态,实用的同时也很好玩。大家快来试试吧~
更多镝数使用问题请参看以下文章,如果仍有没有办法解决的问题,请发送邮件至或者直接在后台留言。