欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  互联网

大数据是不是泡沫?

程序员文章站 2022-10-03 12:25:09
提要:目前大数据的火热程度可见不一般,大数据真的创造如此高的价值吗?或者说创造价值的范围有那么广吗?以置于在很多三线城市的运营商都在做大数据项目。实践经验中发现,实际投入成本远远大于其中收益。还是说有...

提要:目前大数据的火热程度可见不一般,大数据真的创造如此高的价值吗?或者说创造价值的范围有那么广吗?以置于在很多三线城市的运营商都在做大数据项目。实践经验中发现,实际投入成本远远大于其中收益。还是说有非直观的,隐性的价值?

如果是泡沫,还能持续多久,破灭后会是一翻什么行业景象?

来自知乎网友何明璐的解答:

这个问题要分布对待,里面有泡沫,但是也有实实在在取得业务价值的案例。那这个问题如何来诊断和分析。

我们看到,对于大数据这个概念没有出来之前,其实对于大型电商平台,电信运营商,包括大的金融行业已经在做类似大数据方面的事情,以解决海量异构数据下的实时性问题。这些都有明确的业务场景驱动,用传统的一些技术解决起来困难,针对这些有明确业务场景驱动的项目本身并没有太多的泡沫。可以看到的是大型的电商平台,运营商或金融机构立项或研究做的,解决内部大数据场景下问题的的项目,基本还是有实际的业务参考价值。

大数据是不是泡沫?

还有一种就是完全是迎合大数据概念的,本身就不存在需要大数据的业务场景,由于大数据炒的火热,原来存在的各种应用都冠以大数据的名头。但是当仔细分析后发现一个是本身不存在大数据标准的业务场景,一个是我们提出的目标本身就是虚拟的并不是真实客户需要的目标。对于这类项目存在极大的泡沫。

来自VC Kevin Sure的回答:

有一定泡沫.

大数据是不是泡沫?

Michael Jordan(不是打篮球那个)的答案

先说说他讨论这个问题的资格。作为IEEE fellow,伯克利的Jordan教授是机器学习世界范围内最被尊敬的专家之一,在2013年还被邀请在美国国家研究委员会对相关领域的报告里作序总结。

这里有全文:Machine-Learning Maestro Michael Jordan on the Delusions of Big Data and Other Huge Engineering Efforts

他观点的骨架:

1. 目前的大数据给出的结果可靠性太低,如果急于应用到实际中,就好比是土木工程都没学好就开始造桥,结果只能造出“豆腐渣工程”。

  • 一大波“false positive”(假阳性)正在接近,因为数据增长的速度不够支撑我们把大数据到处乱用的欲望
  • 作为一个科学,不够严谨(原文是“没有error bar”)。不像造桥的土木工程,经过多年的积累,明确地能告诉我们什么样的情况可以造,什么不可以。而大数据没有。

2. 目前在computer vision领域进展还很小

  • 只能在非常有限的范围内识别,比如人脸识别这样非常具体的引用(虽然这个不是直接说大数据,但是可以看出,作者认为真正做到万物都sensor还很远,大数据的采集能力终究还是有限的)

3. neural network根本和人脑的neural network不是一回儿事,我们对大脑的理解根本没到可以引用到计算机科学的程度

  • 现在deep learning所采用的back propagation技巧,明显不是大脑的运作方式
  • network的结构都完全不同,什么对数据的模糊性处理已经达到人脑的境界云云,主要是媒体扯谈

对他观点的总结:

有些媒体为了让公众容易理解打了些比方,但是这种比方造成了太多误解,进而造成了太多hype(夸张的大肆宣传)。大数据还是一个没有足够严谨程度的科学,可能有一定的概率做出一些有用的预测,但是使用不当,过分过早地依赖,则会造成灾难性的后果。

很多时候大家过早对一个技术爆发热情,寄希望她可以改变世界,如果短时间没有成果,有可能热情一下子转冷又觉得这是个错误,加速抽离给这个技术的资源。显然Michael很担心现在公众对这个技术的热情,并不是基于对这个技术的理解,从而有可能会经历这样的态度转变。但是他认为这个领域是现实存在的,很多重要的应用,假以时日,是会创造价值的。但是现在很多媒体宣传,甚至投资行为,都是泡沫。

最后他觉得,如果他有10亿美元,一定会投入到natural language processing里面去。毕竟这是人机互动很重要的一个方面。