欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

数据可视化

程序员文章站 2022-04-29 15:42:49
...

在确定数据可视化为自己研究主题之初,我经常上网搜寻相关资料。但是初期的收集经常是杂乱无章,缺乏系统规划的。以至于我产生了三个困扰我的问题,分别是: 1. 信息可视化与数据可视化,到底有什么区别?或者说infographics 与visualization之间有何区别?

在确定数据可视化为自己研究主题之初,我经常上网搜寻相关资料。但是初期的收集经常是杂乱无章,缺乏系统规划的。以至于我产生了三个困扰我的问题,分别是:

1. 信息可视化与数据可视化,到底有什么区别?或者说infographics 与visualization之间有何区别?

2.data visualization就是数据挖掘之后的用于显示结果的统计图吗?

3.曾经在知乎上看见某资深程序员直言,数据可视化在国内除了折腾一下社交网络外,没什么好做的,是这样吗?

今年4月以来,我终于有时间仔细研究相关问题。阅读大量文献资料,尤其是购买了几本专著,如《数据之美》、《可视化数据》、《数据可视化之美》、《鲜活的数据》、《数据可视化实战:使用D3设计交互式图表》以及一系列数据挖掘相关的案例及算法书。但最给我有开阔视野、醍醐灌顶之功效的书,还是这本浙大陈为教授等人编著的大数据丛书:数据可视化。本来国内可视化领域的专著就极少,市面上基本是国外翻译书的天下。而我得说这是我目前看过的,最系统,最专业的,涵盖全面的教材。首先,分类明确,结构清晰;其次用例翔实,资料丰富,2013年编著所以资料很新,且每章都有参考文献,最后还有一大堆资料连接,简直是论文宝典;最后,全彩印刷,效果一级棒。之前困扰我的问题,现在我都有了明确的答案:

1. 最好的理解是,数据可视化包含信息可视化。信息可视化是数据可视化的一个研究分支。可视化是普适性的,而信息图是具体的。可视化是不因为内容而改变的,而信息图则和内容本身有着紧密的联系。于是乎,数据可视化被划分了三个分支,分别是科学可视化,信息可视化,可视分析学。这种分类也被诸多权威人士所认可,恰好对应着三个国际会议:IEEE conference on scientific visualization (SciVis),IEEE conference on Information visualization(infoVis),IEEE conference on visual analyticsscience and technology(VAST).

2.本来数据挖掘与可视化就是密不可分的。智能数据分析所产生的的知识与人类所掌握的知识正是导致新的知识发现的根源。而表达、分析与检验这些差异必须用到人脑智能,必经之路是用视觉感知为通道。故而这里涉及到数据可视化的另一个分支:可视分析学(Visual Analytics)。不论从何种数据分析-可视化模型,都在可视化与数据挖掘之间构造了一个循环——互相影响的螺旋形上升的循环,最终目的是在其中获取知识。故而数据可视化绝不仅仅是用于显示结果的统计图,而是结合在整合数据分析过程中的不断迭代的一份子,是与用户交互的必经之路。并且其形式远超基本统计图型。

3. 显然社交网络只是一个数据可视化可以结合的研究点。事实上数据可视化是普适的,几乎可以跟任何学科集合。简单的罗列我感兴趣的方面:文本分析,地理信息位置,数字生活可视化。

当然,这本书偏向于理论。对于只是恰巧要做相关开发而寻找参考的人,或者想做平面设计案例分析的人,或者想做数据挖掘案例分析的人,这本书的帮助就不大。我恰恰是可视化案例没少看,动手实践也没少做,缺的就是这些理论和各种资料。我的最终目的是写论文。所以这本书对我而言就是涵盖全面地理论用书,非常实用。

这段时间我专门整理了一个思维导图:以陈教授的这本数据可视化为基础,结合其他一些我找到的资料,花了1周绘制。这个思维导图相当大,所以这里就放连接吧。你可以直接到这个网站上交互式地浏览信息。本身这个思维导图就是一个不错的交互式可视化软件,非常好用,值得推荐。5月6日的一次内部分享活动中我就数据可视化一口气讲了3个半小时,没有用PPT,而是用这个mind42思维导图。个人感觉效果还是不错的,达到了我想要的概览+细节的主题模式。

http://mind42.com/public/06a0db6b-522e-4f59-9a4e-684a09149eb9