方滨兴:大数据不能包治百病
大数据擅长锦上添花而不是雪中送炭,如果企业该做的事情没做好,别指望大数据能帮忙。
美国奥巴马*发布“大数据研究和发展倡议”,率先在全球启动了大数据国家战略。我国拥有不亚于国外数据量的大数据,需求也非常明确和迫切,启动大数据战略有良好基矗中国工程院院士、北京邮电大学[微博]校长方滨兴在接受《中国经济和信息化》记者采访时表示,大数据无所不在,不是几个大企业就能垄断得了的,国内大数据公司有良好的产业前景。
CEI:中国的大数据战略,企业、*和研究机构该扮演什么角色?
方滨兴:大数据战略在本质上应该是“需求牵引、效益驱动、技术支撑”,是三位一体的战略。在战略中,企业、*和研究机构的定位各有侧重。
对于企业而言,已经具备超大数据量的企业和行业,目前是有条件利用大数据资源的,他们需要做的是根据行业需求,真正发掘大数据的增值需求,开发企业、行业大数据产品和应用解决方案,解决自己的实际问题。我国的大型互联网企业,比如百度[微博]、腾讯、淘宝,大型通信企业,比如中国移动[微博]、中国联通[微博](3.65,0.01,0.27%)、华为等,都已经开始了这一尝试。在这个过程中,企业必然会面临一些技术挑战、管理问题,可以借助研究机构和*的作用,企业还可以通过研究院的形式,建立产业联盟,提升研究能力。腾讯、华为、华大基因、宇龙、金蝶[微博]等16个单位已经发起成立深圳大数据产学研联盟就是一个例子。
对于*而言,有两个方面的作用。第一个方面,与企业类似,可以从社会管理角度,发掘潜在的公共需求并加以推动,利用大数据技术做些实在的事。比如提高*公共服务质量、疏导城市交通、改善流动人口管理、均衡社会福利分配、突发应急与社会维稳等。同时,*还可以开放不涉及秘密与个人隐私的社会管理数据和工作数据,一方面增加透明度,另一方面鼓励社会利用这些资源开展更多增值服务。第二个方面,*对大数据提供必要的政策保障和政策引导,以*立项支持的方式,加强大数据共性技术的研发,加强关系国家利益行业的大数据应用研发,尤其是企业不适合应对或不足以应对的行业,如国防安全等。
对于研究机构而言,基本作用也可以归纳为两个层面。第一个层面,在关键技术和应用研发上,发现新理论、新方法,辅助企业、*探索大数据工程技术应用的方向与途径。当前的主要方式是参研*、企业的科研项目和工程应用,科技部、工业和信息化部等部委,以及大型企业的大数据技术课题和项目。第二个层面,是科学研究层面,大数据引起了科技界对科学研究方法论的重新审视,正在引发科学研究思维与方法的一场革命。有科学家把“大数据时代”称为人类科学研究的“第四范式”时代,基于大数据的分析和挖掘,“让数据说话,让各行业、整个社会的大数据说话”,在这个基础上发现隐藏在大数据背后统一的理论、实验和模拟规律。
CEI:有人说美国科技发展的动力在大企业,而中国则集中在*,你认为中国发展大数据战略的主要动力是什么?
方滨兴:必须承认,大公司的确在美国科技发展、文明进步进程中发挥了巨大作用。但是在大数据战略方面,美国也不仅仅依靠企业。作为大数据战略的主推国,美国*积极参与、大力推动大数据发展。奥巴马*发布“大数据研究和发展倡议”,联邦*的多个部门国家科学基金、国家卫生研究院、能源部、国防部、国防部高级研究计划局、地质勘探局等都在部署研究项目、加大投资。
对于中国发展大数据战略,我们认为应该是企业、*和研究机构的合力行为。大数据战略需要“数据到位+应用明确+手段成熟”的三位一体的战略。三个条件缺一不可。在这一战略中,企业、*和研究机构的定位各有侧重,以企业为主、*为辅。这是与大数据的应用牵引本质相符的。
CEI:有人说当前大数据市场正在被国外公司抢占,你怎么看?我们怎么培育自己的大数据分析公司?
方滨兴:我不完全同意当前大数据市场正在被国外公司抢占的说法,虽然国外的公司,诸如Google、Amazon等公司的大数据技术起步稍早,但总体而言,目前在大数据技术上,国内外基本处于同步启动的状况。大数据发展的关键要素一是要拥有足够多的大数据,二是要有迫切且明确的大数据研究需求推动,三是要有一定的技术积累和成熟度。在这三个方面,尤其前两者,谁拥有主动权,谁在大数据市场就有主动权。
目前,国内像阿里巴巴[微博]、淘宝、百度、新浪、腾讯等互联网公司,华为、中国移动、中国电信[微博]、中国联通等通信公司,华大基因等生物公司都拥有不亚于国外企业数据量的大数据,需求也非常明确和迫切,国内的大数据分析有良好的基矗中国科研机构和企业,可借助*的支持和导向,共同攻克大数据分析关键技术的难关,并建立相应实用系统。可以这样说,在大数据时代,大数据产业特征决定了必须协作共享。大数据无所不在,不是几个大企业就能垄断得了的,国内大数据分析公司有良好的发展机遇和前景。
CEI:你认为在中国掀起一场数据开放运动的话,应当从哪些领域切入?
方滨兴:2012年在瑞士达沃斯举行的“世界经济论坛”上,大数据成为主题之一,数据已经成为一种新的经济资产类别。论坛上明确指出,通过利用大数据技术,使得美国零售业每年可增加产业价值3000亿美元,增加净利润60%;在制造业中,可以减少开发和组装成本50%;在全球个人位置数据中,可增加服务提供者收益1000亿美元,欧洲公共部门管理可增加产业价值2.5亿欧元。可以看出,大数据会给各行各业带来极大好处。至于首先从哪些领域发展,我的观点是,哪个应用领域需求最迫切,积累的大数据最到位,技术积累最成熟,哪个应用领域就会最先发展。
在经济、物流和信息利用领域,大数据可以分为两类:一类来自与人类社会有关的数据,特别是互联网和经济活动产生的数据,这部分数据与企业经济活动和信息利用联系最紧密,增长也最快。互联网反映的是人的活动,应该首先充分利用该类数据分析挖掘与经济活动和信息利用领域相关的信息与知识。另一类来自物理世界,通过传感器、科学观测获取,比如生物数据、脑科学数据、气象数据、野外环境保护数据、卫星遥感数据等。这类数据首先推动科学领域信息利用技术发展,促进科学技术进步,继而推动经济的发展。
除了上述两类数据之外,大数据中还存在着地理信息和位置信息数据,是社会活动和物理世界两类数据的融合。这种数据的规模是相当大的,是未来一个新的经济增长点,而且能带动物理空间和社会网络领域的数据产业飞速发展。地理信息是国家信息基础设施的一部分,电子政务、电子商务、智能交通、智能物流等行业应用,都离不开地理信息。*对地理信息这种公共资源应该分层管理,除了涉及国防和国家安全的信息需要保密外,其他基础信息都要免费或以较低成本提供给企业和民众,基于基础信息上的各种应用服务,应该大量放开,让企业去做,进而推进经济、物流和信息利用行业的进一步发展。
CEI:大数据应用是否存在安全问题?如果存在如何解决?
方滨兴:我认为大数据应用是存在安全问题的,除了传统的物理安全、网络安全、数据安全和内容安全之外,还面临着新的隐私保护和信任安全等问题。无论是对于个人、用户还是国家,都不希望隐私、情报、信息因为大数据泄露,被第三方获取,这需要进行隐私保护和信任管理。对于企业而言,这需要对个人信息汇总形成相应的决策以更好地服务于网民,形成矛和盾的关系。例如,央视“3·15”晚会揭发网络服务商通过cookie获取用户的隐私,而事实上网络服务商就是想通过cookie获得用户的上网习惯,通过分析用户行为轨迹向用户推送更贴切的服务,由此形成隐私与服务的冲突。
从信息防护角度即隐私保护的角度来看,无论是产业、用户,还是国家,都不愿意看到大数据围绕着网络信息大爆炸的应用而危害到国家、社会、个人安全。要做到这点,就需要明确哪些信息不能被深度分析,需要研究如何做到不被分析。同时,还需要围绕数据使用安全,围绕社会意识形态等各方面,推出相应的技术和政策、法律约束手段,保障产业健康发展,保障国家、社会、个人的安全。
CEI:目前的大数据概念是否有被炒作嫌疑?
方滨兴:首先,大数据概念肯定存在被炒作的情况。这也是所有新兴创新技术在产生发展之初都必须经历的过程。Gartner IT研究与顾问咨询公司把一个完整的技术成熟周期分为五个时期:技术萌芽期、期望膨胀期、泡沫化的谷底期、稳步爬升的光明期、实质生产的高峰期。在《2012~2013年技术曲线成熟度报告》中,Gartner把大数据放在了期望膨胀期,这也说明目前各国、各行业一定会存在对大数据、大数据分析过度期望,甚至“炒作”的行为。
其次,对于真正的创新技术,舆论的炒作与否不会从本质上改变技术自身的发展。因此,面对大数据,拥有数据的企业和部门,应该保持冷静深刻的思考:大数据技术中究竟哪些技术是可以成熟应用的,价值又是自身商业所需要的。如果是真正的需求,是真正需要攻克的技术,就应该花功夫去研发和应用。只有这样,企业才可能从大数据中发现比以往“数据处理”预期更大的价值,从而提升企业的竞争力。
对企业而言,大数据不是包治百病的良药,目前大多数企业与大数据技术可能并无多大关系。企业应该围绕企业目标,用好已有的数据资源。如果该做的事情没做好,别指望大数据能帮忙,信息技术更擅长的是锦上添花而不是雪中送炭。此外,有条件利用大数据资源的企业需要运筹帷幄,以需求、效益为导向,大数据资源用得好会有高效益,但利用成本也很高,企业不仅要有大数据来源还要有人才和技术处理能力,需要充分利用*、科研机构的力量。
上一篇: golang的基础语法和常用开发工具详解
下一篇: C# 发送电子邮件源码片段