欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  互联网

大数据仍处于发展初期

程序员文章站 2022-05-16 15:33:45
  2012年,如果说有一个概念比云计算还要火热,那无疑就是大数据。大数据应用广泛,尤其是随着互联网、移动互联网以及各种传感网络的兴起,数据爆炸最符合当下的特征。如何从数据分析中发现价值...

  2012年,如果说有一个概念比云计算还要火热,那无疑就是大数据。大数据应用广泛,尤其是随着互联网、移动互联网以及各种传感网络的兴起,数据爆炸最符合当下的特征。如何从数据分析中发现价值,来指导企业的日常业务决策?大数据将给出答案。近日,*精诚集团云中心暨Etu品牌负责人蒋居裕接受记者采访时表示,目前大数据还处于发展的初期,整个亚洲地区落后于美国,而美国谈大数据也仅仅有4、5年的时间。

  剖解大数据

  在中国谈大数据,更多的停留在数据的采集、存储和处理层面,还缺乏真正的数据分析和洞察应用案例。蒋居裕表示,大数据市场要进入比较稳健的成长期,需要完成从项目市场进到方案市场的跨越,乐观来看或许2014年可以跨越,或者更晚。从亚洲地区来看,真正做大数据计算工作的应用、项目数量都还非常少。

  剖解大数据的价值和前景,就必须对大数据的定义和内涵有一个清晰的了解。目前企业管理软件所涉及到的结构化的数据只占到传统企业里面所有数据的15%,剩下的85%来源于广泛存在于企业内各种信息活动、电子商务、物联网、或是外界社交网络等领域中的半结构化与非结构化数据,这才需要用到这种大数据的处理平台做进一步的分析。

  一般来说,通过三个“V”可以更准确的解读大数据:第一个V是Volume,一定要大到某种程度;第二个V是Velocity,只有实时性,才可以去展现最新的数据分析效益;第三个V是Variety,讲的是多重的数据格式或数据结构。这三个V合在一起,可以画一个三角线,每一个运用场景都可以在这三个轴上画一个椭圆,不同的厂商可能画出的椭圆形状不太一样,这些都是属于大数据要去分析处理的范畴。

  不过,蒋居裕认为,目前行业里对大数据的理解存在多重误区,比如大数据不是存储技术,一定是存储和处理同时发生的;二是大数据起源于互联网,但并非仅适用于互联网领域,在任何一个行业都极具应用价值;三是大数据不只是BI,传统BI擅长处理结构化数据,对于半结构化及非结构化数据的解决能力并不佳。不走出这些误区的困扰,很容易在大数据中迷失。

  Hadoop一体机

  由于大多数的行业及企业对大数据的需求并不清楚,因此推动大数据应用的落地,仅靠单一项目的形式,很难实现快速的普及和应用。大数据一体机Etu Appliance的出现,能够为企业提供从软件、硬件到数据分析、处理的一体化的解决方案,标准的产品化的形式更能促进大数据的应用。因此,在今年年中,精诚集团云中心正式在亚洲推出了Etu品牌大数据产品,为各个应用场景提供大数据的解决方案。

  作为Hadoop的一站式产品,Etu Appliance之所以被称为“Appliance”,是因为这是款一体机产品,既不是硬件,也不是软件,而是软硬结合、高度优化的设备。Etu Appliance的用户不需要具备很高的Hadoop技术,就能够快速部署,计算和存储一体,十分钟之内能够部署100个节点。这大大缩短了企业应用大数据的周期。

  而最小的Etu Appliance集群架构包括一个主节点,两个工作节点。数据和任务都是运行在工作节点上的,主节点负责调度整个集群的资源分配。当数据量越来越大,当前架构和容量无法处理的时候,只需加一个工作节点,在已经运行的集群不停机的情况下可以直接扩容,最多可以扩容2000台左右的规模。与市场中诸如甲骨文、IBM的大数据一体机产品比,Etu有更好的灵活性,是专门定制的产品,而Oracle产品的通用性缺乏灵活度。

  大数据应用

  电商由于对大数据的分析更为迫切,数据也多集中在非结构化的数据层面,因此,是大数据应用需求最明显的领域。Etu知意图就此也发布了精准推荐系统Etu Recommender,这是基于大数据一体机的技术,利用分布式云计算优势,采集大量的用户行为日志,并针对不同的用户产生个性化的推荐,从数据采集、分析、到结果集的呈现完全自动化,不需市场人员介入,完全是基于用户浏览及购买的真实行为产生推荐,同时,基于大数据一体机横向扩容的特性,电商用户可以随着流量的成长,随时扩充系统的计算与存储能力。

  据悉,这一产品已在国内的电商领域应用。蒋居裕向记者透露,除了电商领域外,现在运营商可以利用这些大数据处理来进行非常多的工作,比如说他们想要知道通过3G移动网络到底这些用户,不管用的手机还是用的iPad这种平板电脑,到底都去了哪些地方,看了哪些信息?这个对运营商来讲可以做后续的增值服务。 对于网络或电信设备的优化,设备是比较昂贵的,如果能够优化,在一定程度上可以去节省运营商的成本。所以这些东西其实都是大数据本身可以去发挥价值的地方。

  另外像金融行业可能是拿来做风险管理,银行可以根据信用的额度透过大数据处理分析,能够对用户制定额度。再有像法规部分,在不同国家不同监理单位有不同监理需求,这些都可以从大数据里面获得,当有一定风险产生的时候,用户如何去佐证自己并没有违反,必须要提取证据。 除此外,大数据在医药、制造等各个行业都有广泛的应用场景,只不过现在处于发展的早期,企业对大数据的应用还未进入规模性投入阶段。

  目前,大数据的技术和解决方案越来越多,但在用户端似乎是一种不温不火的局面。究竟是什么阻止了大数据的应用推进?对此,蒋居裕认为,主要有三点导致了这一现状,一是行业内缺乏成功的应用案例的指引;二是企业对大数据IT技术存在陌生感,不像互联网公司勇敢尝试新技术,这样的技术,通常有几年的时间去验证、考验这个技术是否最终能商业化,现在正处于早期阶段;三是人才缺口大,大数据的人才生态还不完善。