大数据时代的上海机遇 新环境为新产业所逼
培养“数据科学家”正当时
据统计,当今世界在24小时之内,就可以产生出相当于16.8亿张DVD容量的数据;产生2940亿封电子邮件,相当于全美国在2年中产生的纸质邮件。人类至今获得的全部数据,有90%是在过去两年产生的。
从数据海洋中寻找有价值的信息和应用,提高数据资源挖掘利用效率的新技术显得尤为迫切。相比于大数据产业的热门,对于数据学科的一些基础研究却乏人问津。有必要建立一个专门的学科,可以叫数据科学或数据学,它为许多学科和领域的大数据研究提供基础理论和方法,在此基础上,再逐步形成细分领域的数据学,如:生物信息学、气象数据学、金融数据学、地理数据学,等等。
大数据产业需要一批善于融合多学科知识的人才:既能立足于信息科学,探索大数据的获娶存储、处理、挖掘等创新技术与方法,也能从管理的角度探讨大数据对于现代企业生产管理和商务运营决策等带来的变革和冲击。多年来,有识之士一直建议,上海应加快跨学科人才的培养。此类人才不仅精通技术,更懂得如何将技术应用于商业决策。如果培养“数据科学家”的提议得到落实,将是上海创新人才培养模式的一个契机。
数据分享利用需要立法
如果说“干草垛”效应的解决之道,还能依靠新技术的研究、跨学科人才的培养来解决;那么合理规范使用大数据,更会倒逼互联网法律规范的完善。以前数据的保存有时效性,过了规定的时间,数据自然会销毁。但在大数据时代,数据即使在A公司被销毁,也有可能继续留存于B公司的数据库中。换言之,数据会一直保留着,使用界限也随之模糊,从而造成更可怕的潜在威胁。
大数据价值的体现,离不开共享,但由于相当一部分数据涉及普通人隐私,因此数据的使用,尤其是商业使用,应该有权益边界。比如,数据收集原本应该告知客户其商业目的,但大数据时代来临后,挖掘出的数据很可能转换为其他的应用。上海交大媒体与设计学院教师、新媒体专家魏武挥举例,目前相当一部分个人数据,已经掌握在不同机构、公司手中。
市科委信息技术处正酝酿组建大数据产业联盟。据相关负责人介绍,联盟中大多数成员仍以科技企业为主,越来越多的业内人士正在形成共识:对数据分享利用设定法律约束,已刻不容缓。中国互联网协会法律专家胡钢律师认为,对于商业机构来说,数据的保存、共享,应当遵循“最少、够用”标准;从社会的角度来说,互联网法律法规重要性凸显,急需做出相应的调整。只有多管齐下,才能应对隐私问题的挑战。
密切关注大数据的潜在风险
大数据的突然“大热”,也令不少IT企业跃跃欲试,但理性些看,大数据产业的成熟,离不开“分步走”战略。商业数据处理与分析公司邓韩贝中国区商务总监李焕民认为,企业对自己内部拥有的数据做前期整合与应用,例如在企业内建立数据仓库等,满足企业通用性决策的需求。走出企业,做企业内外部数据的融合与分析。比方说,对一家银行来讲,由于信用卡支付涉及到不同行业的零售商或品牌,只是分析自有的信用卡数据,很可能无法完全理解客户的真实需求,这就需要整合不同商家的信息进行分析。成为一家以数据驱动的、以顾客为中心的新型公司,这会涉及到管理思路的变革。
思考得更远一点,越是热门的新产业、新概念,越是需要我们用理性和谨慎态度对待。在一些业内人士看来,大数据并非无往不利的商业利器。随着我们掌握的数据越来越多,可以发现的、统计上显著的相关关系也越来越多。这些相关关系中,有很多是没有实际意义的,在真正解决问题时很可能将人引入歧途。
我们不能过分倚重大数据的作用,忽视了人脑所擅长的理解力和因果判断能力。一项正确、伟大的决策,不仅依赖于冷冰冰的数字分析,同样也依靠决策者的经验、直觉——这些恰恰是数据所无能为力的。在积极推动大数据产业的同时,我们仍需要一批清醒的建言者和智库,他们时刻关注着大数据潜在的风险,并提醒决策者,不要把“鸡蛋”全部放在大数据一个“篮子”里,除了大数据之外,还有一些思路和方法同样具有价值。
下一篇: RabbitMQ 消息中间件搭建详解