欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  互联网

分析:大数据尚处于早期应用阶段

程序员文章站 2022-03-14 18:42:54
社交媒体针对大数据主题的聊天次数激增,DataSift是密切跟踪有关大数据炒作主题的厂商之一,通过分析Twitter数据确定未来发展趋势。DataSift的Tim Barker提供的下列信息表涵盖了2...

社交媒体针对大数据主题的聊天次数激增,DataSift是密切跟踪有关大数据炒作主题的厂商之一,通过分析Twitter数据确定未来发展趋势。DataSift的Tim Barker提供的下列信息表涵盖了2012年全年提及大数据的所有Twitter信息分析结果。

该分析透露的主要信息是,世界仍在了解大数据,这或意味着我们还处于早期应用阶段,而非炒作周期巅峰。下面是部分重大分析结果的大致纲要:

·2012年第二季度与第一季度相比,有关大数据的Twitter信息几乎持平,但在第三季度和第四季度,有关大数据的Twitter信息激增25%。

·72%的Twitter信息包含链接,表明对话内容主要是分享信息源。

·2012年分享最多的文章主要是对大数据主题解释、探索或神话揭秘。

·Hadoop保证了Apache是关注度最高的厂商,MongoDB开发者10gen位居第二。

·IBM的主动式内容营销战略无疑助力该公司超越惠普、Teradata、甲骨文和ECM的受关注度。

·Splunk通过IPO提高知名度。相反,惠普与Autonomy交恶在有关大数据的Twitter信息中给自己带来的负面影响最大。

·鉴于Cloudera在大数据市场上的卓越表现,日本偏向于构建自有解决方案。

·Splunk在美国表现突出,DataSift在英国做得风生水起,SAP在德国颇有威望,IBM在法国口碑很高。

DataSift坚持自己是欧洲最大的Hadoop集群。DataSift声称存储的每条Twitter信息中平均有72个数据项与大数据有关,每天存储4TB数据。在对2012年与大数据相关的Twitter信息分析中,DataSift发现与逾200万条交互信息相关的作者不足100万人;高峰期每小时发出3000条Twitter信息,几乎每秒钟发出一条。但与DataSift每秒监测逾8000条Twitter信息相比,有关大数据的Twitter信息只是沧海之一粟。