图说可视化,报表也能做得如此酷炫!
1、数据可视化概述
1.1、数据可视化的作用
数据可视化是指将数据通过图表的方式传递出来,让用户能够快速、准确地理解信息所要表达的内容,从而提高沟通效率。数据可视化的作用主要有:
1)传递更多的信息,一张图能够传递的信息可能需要长篇大论才能写清楚,如你要描述最近一年公司收入情况,那你就需要说明每个月收入是多少,同比、环比增幅是多少,收入最多、最少的是哪个月,同比、环比增幅最低、最高的是哪个月等,而你用图表表示则只需要一个柱状图和折线图的组合图表,就能准确表达上面的信息。
2)形象生动,便于理解,图表通过更简单的逻辑和视觉体验,能够让用户快速把握要点,就像前面的例子一样,通过图表,我们能够一眼看哪个月的收入最高,而不用将每个数字放到大脑中比较,半天都得不出结果。
随着大数据行业的发展,用户对数据可视化的要求越来越高,好的可视化能力能够使用户更快的理解所要表达的内容,更加形象生动。所谓“字不如表,表不如图”,图表的重要性可见一斑,在统计分析产品、用户画像等数据产品上,都需要具备优秀的数据可视化能力。现在常见的如“一图看懂XXX”等,都是用图表来传递信息,是典型的数据可视化成果。
而在企业生产经营过程中常常出现的报表,也不再是原本那样单一枯燥。就下图帆软报表FineReport的可视化来看,报表也可以做得如可视化信息图一样直观易懂。
接下来就来讲讲常见的可视化图表,如何做出酷炫的报表!
1.2、图表的分类
1)趋势类图表:通过图表反映事物发展趋势,能够一眼看清楚走向和大势,如随时间变化趋势,常见图表为柱形图、折线图、面积图。
2)对比类图表:通过对比发现不同事物间的差异和差距,从而总结事物特征,如某两个人的对比,一个更帅,一个更有钱,常见图表为双柱形图、双折线图、双条形图、双面积图、雷达图。
3)构成类图表:通过不同的面积大小、长短等反映事物的结构和组成,从而知道什么是主要的、什么是次要的,常见图表为饼图、圆环图、树状图、旭日图、瀑布图。
4)分布类图表:通过图表反映事物的分布、占比情况,从而知道事物的分布特征、不同维度间的关系等,常见图表为散点图、直方图、气泡图、词云、热力图。
5)地图类图表:通过地图反映事物地理分布情况或用户出行轨迹(地图其实可以算是分布的一种,因为其是一类很重要的可视化图表,所以单独列出),常见图表为全球地图、中国地图、省市地图、街道地图、地理热力图等。
当然,图表大多都不是单个独立存在的,而是各类图表组合在一起的,从而能够传递更多的信息,并能提供一种整合的视角,不用用户不断的对比多个图表,组合图表是现实中使用得更多的。如既要表达趋势又要表达构成,则可以使用堆积柱形图、百分比堆积柱形图、堆积条形图、百分比堆积条形图等;要同时体现绝对值和增长率,则可以使用柱形图和折线图的组合图形;要反映某个构成部分的组成,则可以使用复合饼图。
1.3、常用图表
如上所述,图表主要分为五类,常用的图表包括柱状图、折线图、饼图、散点图、雷达图等,以下为一些常见的图表。
1.3.1、柱状图
柱状图中还包括与其类似的条形图、瀑布图、直方图等,主要是为了反映事物的变化趋势、分布情况、规模情况等。
柱状图可以按照时间绘制,反映事物变化趋势,如某个指标最近一年变化趋势,也可以按照其它维度绘制,如区域、机型、版本等,反映事物的分布情况。
条形图是将柱状图垂直放置,整体跟柱状图差不多,但是换了一个视角。
瀑布图能够反映事物从开始到结束经历了什么过程,用于分解问题原因或事物构成因素特别好用,如上月收入是怎么变成本月收入的,就可以通过瀑布图分解每一个收入组成部分所做的贡献,找出哪一组成部分提升了收入,哪一组成部分降低了收入。
直方图反映事物的分布情况,可以看出事物主要集中在哪里,如查看付费用户付费金额分布等。
1.3.2、折线图
折线图是点和线连在一起的图表,可以反映事物发展趋势和分布情况,与柱状图相比,更适合代表增幅、增长值,而不太适合代表绝对值。
面积图就是在折线图下加上阴影面积,也主要是为了反映事物发展趋势和分布情况。
1.3.3、饼图
饼图是将一个圆饼分为几份,用来反映事物的构成情况,类似图表还包括环图、旭日图等。旭日图有多个圆环,可以直观的显示事物组成部分下一层次的构成情况,比如某个省分为几个市,每个市下面又有几个县、每个县下面又有几个镇,就是将事物层层分解。
1.3.4、散点图
散点图是事物两个维度的交叉分布情况,反映不同维度间的关系,如不同产品在市场占有率、预期增长率两个维度间的分布情况,很多二维矩阵就是通过散点图来实现的,以两个维度的平均值作为分割线,如常见的波士顿矩阵。通过散点图我们可以看出不同事物间是怎么交叉分布的,它们之间有什么关系,是正相关、负相关或随机分布。
类似的图表还有气泡图,气泡图还可以通过气泡面积的大小表示值的大小,相对于散点图来说多了一个维度,如前面不同产品的例子,气泡的大小可以代表各产品营收的多少。
1.3.5、雷达图
雷达图主要表达事物在各个维度上的分布情况,从而可以看出事物在什么地方强、什么地方弱。比如一个学生各个学科的得分,就可以通过雷达图清晰表达出来,用户能够一眼看出这个学生哪一科强、哪一科弱,又如一个产品在各个评价维度上的评分。
1.3.6、地图
地图可以形象的反映事物在地理上的分布情况以及人员迁徙情况,主要包括地理分布图(全球、全国、各省市等)、迁徙图、热力地图(省市、街道等)等。
1.3.7、树状图
树状图主要是为了反映事物的构成情况,相对于饼图的优点是,树状图可以更清晰的显示更多组成部分,比如饼图可能组成部分多于8个就显得很挤,而且占比小的就很不清晰,但是树状图却不会,它能够充分利用区域面积。
1.3.8、漏斗图
漏斗图主要用来反映关键流程各个环节转化情况,让用户能够一眼看清整个流程转化情况,如常见的电商购物转化流程,从浏览商品-添加进购物车-生成订单-支付订单-交易完成等一连串购买流程。下面是手游的转化漏斗图,通过分析各个步骤的转化率,能够发现问题所在,找准改进方向。
1.3.9、词云图
词云图是为了描述事物的主要特征,如一个人主要特征是什么,高、帅、富,或者其它,能够让人一眼看出一个事物的主要特征,越明显的特征越要突出显示。同时,还有象形的词云图,如轮廓是一个人、一只鸟等,用以反映事物主题,从而更加形象生动。
1.3.10、热力图
热力图主要是反映地理、点击热力分布情况,从而看出哪里是人群最多的地方、哪里是用户点击最多的地方等,可以反映用户出行习惯、使用习惯等。
1.3.11、组合图表
绝大多数图表都不是单独存在的,都是多类型的图表组合在一起的,这样才能够传递更多的信息,提供综合的视角。如我们想看到不同事物间的对比,则我们可以使用双柱图、双折线图、双雷达图、双环图等,可以清晰表达不同事物在不同维度上的对比情况。
1.4、图表配色
图表配色在数据可视化中是很重要的元素,有了合适的图表,还要有合适的的配色,才能让人看着舒服,就像你有一件很有范儿的衣服,还也必须有适合的颜色搭配。恰当的配色主要有两个作用:1)突出主题,让用户清晰知道图表主要想要表达的意思,如对重点内容用深色标注;2)让人看着舒服,整个图表色彩很和谐,不会让人感到突兀,如五颜六色的。
图表配色的原则主要有:
1)图表配色不能太花,一张图表超多七种颜色则不是很恰当,容易分散读者注意力,最好是同一色系的,可以通过调整透明度来设置)。
2)图表配色要重点突出,想要主要呈现的事物或指标用亮色呈现,其它次要事物或指标可以用更淡一些的颜色。
2、数据可视化工具
Excel
Excel应该是使用最广泛的可视化工具,包含基本所有常用的图表,新版Excel里面有地图、旭日图、瀑布图等。
上一篇: linux 下配置LAMP环境
推荐阅读