欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  资讯频道

数据可视化方法、工具、核心理念及需要警惕的深坑

程序员文章站 2022-05-14 15:52:03
...
大数据是当下最火爆的话题之一。随之而来的,是数据可视化技术的持续发展,它用来展现和阐释大规模的数据。但是数据可视化技术并非千篇一律。

数据可视化是展现数据的最强大机制之一,技术上的优势也为其创造了独特的实现方法。随着交互式的、独特的数据可视化方法逐渐走向最前沿,并且观众也越来越明白他们自己的喜好和厌恶,那些绘制简单饼状图的日子将一去不复返。

接下去我们将向你介绍数据可视化的重要性,不同的数据展现方式以及业界常用的工具。你也将会了解赢得数据可视化技巧背后的核心理念和你需要避免的错误。

数据可视化方法、工具、核心理念及需要警惕的深坑

从本文中你将会学到:1、数据可视化是什么;2、数据可视化为什么重要;3、存在哪些数据可视化方法;4、赢得数据可视化背后的关键理念;5、完成数据可视化时需要避免的深坑。

数据可视化是什么?

数据可视化是研究如何将数据以图片或图形的方式展现的科学。它主要专注于展现,以连贯和简短的形式把大量的信息展现出来。尽管数据可视化也能处理书面信息,它的重点还是用图片和图像的形式向观众传递信息。

此外,数据可视化技术在数据的用法上并不狭窄。它可以可视化各种信息——你可以向其它人传递你的理念和假设。如今甚至可以对数据可视化添加技术和选择交互式的可视化方法。

信息的视觉表达是一种古老的思维和经验的分享方式。例如,图表和地图就是一些早期数据可视化技术的重要例证。

数据可视化为什么重要?

如上所述,人类使用数据可视化技术已经很久了。图像和图表已被证明是一种用于交流和学习新信息的有效方法。 研究表明,80%的人能记住他们看到的,但只有20%的人记得怎么读!它甚至可以将思想和事件向后代延续。技术的发展进一步加强了数据可视化带给人们的机会。

也许,数据可视化最重要的好处是它能够帮助人们更快地掌握数据。你可以把一大堆数据浓缩到一张图表里,人们也能更快地抓住关键点。如果用书面形式,可能需要几小时来分析所有的数据和建立数据的联系。

此外,这种能展现大量数据的能力是数据可视化的另一个巨大优势。一张图表可能会突出显示多个方面,人们就能对数据形成不同的观点。这自然能为企业开辟新的商业之路。人们或许能从数据中发现一些意想不到的东西。

数据的可视化提高了解释信息的能力。要从大量的数据和信息中寻找关联不容易,但是图和图表可以在几秒钟内提供信息。一眼就能辨识出所需的信息。

以上所有都能加强人们在工作和学习的沟通和有效性。数据可视化普遍被认为是一种简单而有效的概括数据的方法,因此它可以提高人们分享信息和学习的方式。

下面的视频是优雅地展现数据的很好的一个例子:

视频链接:https://youtu.be/kv_uyUTx5Po

数据可视化的各种方法

技术的发展已导致 数据的爆炸。这反过来又增加了数据被展现的方式。通常来说,数据可视化主要分为两种不同的类型:探索(exploration)和解释(explanation)。探索类型可以帮助人们发现数据背后的故事,而解释类型把数据简单明了地解释给观众。

另外,有 不同的方法可用于创建这2种类型。最常见的数据可视化方法包括:
  • 2D area —— 这种方法使用地理空间数据可视化技术,往往与事件在某块特定区域的位置相关。2D area 数据可视化的一个例子包括点分布图,该图可以显示某个区域中的犯罪等信息。
  • Temporal —— 时间可视化是以线性方式展现数据。时间数据可视化的关键是有一个开始和一个结束的时间点。时间可视化的例子可以是一个连接的散点图,它可以展现诸如某一区域的温度等信息。
  • Multidimensional —— 您还可以通过多维方法将数据在两个或多个维度上展现。这是最常用的方法之一。多维可视化的一个例子是饼图,它可以展示如*支出之类的信息。
  • Hierarchical —— 层次法被用于呈现多组数据。这些数据的可视化通常在大群体内嵌套小的群体。层次化数据可视化的例子可以是一个树图,它可以展示如语言组团等的信息。
  • Network —— 数据也能以相互关联的网络形式被展现。这是另一种展现大量数据的常见方法。网络数据可视化方法的一个例子可以是冲积关系图,它可以展示如医疗行业的变化等信息。

以上给出了大量的选择,它不仅给我们提供了大量机会,同时也让我们为选择正确的方法感到头疼。

另外还有 很多数据可视化的工具。它们可以很容易地收集数据,也可以流线化数据的使用方式。

一些最常用的工具包括:
  • Google charts —— 谷歌的产品在数据行业是众所周知的,谷歌图表也是一个容易上手的工具,特别是对于初次使用的用户。
  • datawrapper —— 这是一个在线工具,它可以帮助你创建交互式数据可视化。
  • RAW—— RAW的好处包括它拥有大量现成的类型,让你可以清晰、便捷地展现信息。该平台是开源的,所以你可以提供自定义布局,或者使用其它的设计。
  • Infogram—— Infogram是另一款适合新手的工具。它允许用户创建不同的图表和Iinfographs,系统的使用也方便。

可用的工具远不止这些,你还能找到大量免费和付费的软件。最好多了解一些信息,以确保你所使用的软件与被可视化的数据最搭配。

赢取数据可视化背后的关键概念

见过数据可视化的人都知道设计有好坏之分。如果信息不是以正确的、恰当的方式呈现,则数据可视化的好处就很容易被抵消 —— 具体的项目需要定制的方法。

不管你的信息是什么,在利用数据可视化时有一些概念你需要牢记。以下是赢取数据可视化技术背后的关键概念集合。

了解听众

在展现数据之前,你需要做的第一件事就是了解谁将会看这些数据。了解你的听众是至关重要的,以便用正确的方法来展现数据。

虽然数据可视化通常是一种简化数据的方法,但观众对主题的知识层次千差万别,需要好好做准备。如果你是针对一群专业的听众,那么可以使用更多的专业方法和专业术语来解释数据。然而,对于相同的数据,普通听众可能需要更为通俗的方法来解释。

同样,知道听众对你的数据有何期望也非常重要。你需要知道他们想要从数据中获得什么关键点,以及你展示数据的主要目的是什么。此外,还需要记住你展现数据的目的是什么。

足够理解数据

除了掌握目标受众外,你还需要对数据了如指掌。若是不正确地理解数据,则很有可能不能把信息有效地传达给听众。

然而你也无法顾及数据所包含的所有信息,所以要能够提取关键的信息,并条理清晰地展现它们。你还需要确保从数据中得到的关联信息是正确而不是虚构的 —— 决不能用错误的数据做可视化!

如果你正确地理解了数据及其关联,则可以从信息中得到独特而有趣的数据关联。

讲述一个故事

数据可视化还应该描绘出一个故事。你一定不希望这些数据只是以一组信息的方式来展现,而是能传递出数据使用背后的信息。这可以是不同的描述性介绍,或是为观众呈现一幅特定的图像。

编造一个故事往往意味着观众从数据中获得更多的洞察力。它可以帮助观众了解新的关联和更深入的信息。

事实上,数据可视化技术是一个出色的讲故事工具。“一图胜千言”这句话一点都不错,你应该发挥它的这项优势。通过数据来讲故事并不困难,因为你可以把颜色、字体和演示文稿都作为讲故事手法的一部分。

为了使数据可视化成功地融入故事,上述提到的理解数据则是至关重要的一点。

保持简洁

近年来,数据可视化的发展很快,正如上面所示,涌现出很多工具和系统供人们使用。能接触不同的独特方法并不意味着都要用到它们。而且,大量的数据也不意味着所有的信息都是必不可少的。

总之,保持你的数据可视化方法简单明了。不必刻意地使用过多的数据或使用过多的技巧。

如果从讲故事的角度来看,必须明白你所展现的每一个元素都是故事必不可少的一部分。如果数据或元素,如某些事物的图片,对故事的情节无关紧要,那么就不应该把它加入进来。

数据展示中包含太多的元素实际上会破坏最终的成品,与数据脱节。要记住数据可视化的核心之处就是能在一瞬间呈现大量的数据。如果可视化显得很费劲,那么你就要回头看看是否使用了错误的数据演示或包含了太多的信息。

合理区分展现平台

最后,赢取数据可视化技术也要了解技术方面。人们现在通过各种不同的平台查看和访问信息,这一点必须牢记。就像需要知道目标受众一样,你也需要考虑人们查看数据可视化的方式。

你的可视化结果要能轻松适应多种平台,如移动设备,平板电脑或计算机。如果你的用户只通过手机浏览数据,那么适用于移动端的展现方法自然会对你更有帮助,而不是针对笔记本的方法。

除了考虑平台的界面选项外,还需要考虑可访问性(accessibility)问题。如果数据可视化允许视觉欠佳的人进行适当的放大和缩小,可以大大提高用户体验。你也可以考虑为色盲人群提供不同颜色选项。 可访问性旨在提高用户体验,确保数据可视化可对所有人适用。

数据可视化需要避免的大错误

尽管以上关键方法能帮你生成赢取数据可视化的策略,还有一些常见误区要时刻警惕。

错误的信息

如上所述,数据的错误是观众最厌恶的东西。你必须确保那些正在看你的数据的人获取到的是正确的数据。确保人们可以直接使用你图表里的数据,而不必再次确认数据正确性,这是你的职责。

不完整的信息

除了保证信息正确之外,还要呈现完整的数据。人们必须能在其中找到相关信息,不能使用数据可视化来欺骗或展现不完整的信息。

数据可视化能够而且应该讲述一个故事,但故事需要包含完整和正确的信息,而不是只展示你认为合适的数据。

过于简化数据

尽管要确保数据是以简单的方式展现,这并不意味着你应该简化它。首先,你需要记住观众是谁 —— 对专业人士不要使用通俗和过于简化的语言。而如果是普通的观众,就不要用专业术语来填充文字。

但除此之外,若是你未能清晰地展现数据,也就不能期望听众能清楚地了解它们之间的关系。不能因为对你来说链接似乎很明显了,就省略部分信息 —— 记住观众只能看到你所展示的这部分数据,而不是你所使用的完整数据集!
不恰当的可视化

在展现数据时,你需要仔细思考数据展现的方式。如字体,颜色和图像之类的属性很总要。例如,如果展示由特定疾病而导致死亡的信息时,使用鲜艳的色彩和令人愉快的图像似乎不协调。

不适当的可视化也包括使用的技术使得数据难以查看和理解。例如,你可能用泡泡来代表部门内不同的消费水平,但如果泡泡的尺寸差异不合适,会导致误判和不准确的。

遗漏标注

过度简化也可能导致缺乏标注。当你提供数据时,很容易假设观众已经知道图像的每一个方面代表什么。但添加简单的注释可以提高用户体验,并确保观众明白数据中的所有数据点。

举一个例子,你可能用一个图表来展示企业在过去十年自行车的销量。如果数据图表中有一个大的起伏,用注释解释一下这个突变背后的原因,能确保观众掌握这一额外的信息。

后记

希望上文已经向你解释了数据可视化重要性的基本内容。许多不同的方法和程序可以帮助你以一种独特而引人注目的方式展现数据。

需要明白的是,在所有这些酷和古怪方法之下,数据可视化的根本还是立足于数据 —— 你需要找到一种能正确、清楚、简洁地勾勒信息的方法。当你找到了正确的公式,数据可视化不仅信息丰富,而且变得赏心悦目了。

原文链接:Big Data , Winning Data Visualisation Techniques(译者/赵屹华 审核/刘翔宇、朱正贵 责编/ 周建丁)

译者简介:赵屹华,计算广告工程师@搜狗,前生物医学工程师,关注推荐算法、机器学习领域。