欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  互联网

北京海量数据挖掘产业发展研究

程序员文章站 2023-10-11 11:25:08
  长风联盟   北京是中国软件(600536)产业的中心,产业规模居全国首位。尽管如此,北京的数据挖掘产业发展与中国数据产业类似,仍停留在初级阶段。北京拥有大量从事数据挖掘的国...

  长风联盟

  北京是中国软件(600536)产业的中心,产业规模居全国首位。尽管如此,北京的数据挖掘产业发展与中国数据产业类似,仍停留在初级阶段。北京拥有大量从事数据挖掘的国内外企业和单位,分布在理论算法研究、软件工具、咨询服务、集成开发等产业链各个环节。相比较而言,产业链上游市场主要被国外企业占据,国内企业主要处于产业链的末端。SAS、SPSS、SAP、Oracle、Teredata、微软和IBM等企业都把北京作为辐射中国的核心;而国内企业像神州数码、太极、中科软、华迪、拓尔思(300229)等主要提供系统集成服务,产品和工具提供商数量较少,规模较小,影响力与国外企业相比有一定差距。

  北京海量数据挖掘产业发展难点分析

  用户数据挖掘工具使用能力弱

  目前用户普遍存在的问题是,数据掌握者与数据挖掘结果需求者往往不是同一人,由此造成掌握企业数据的人不知道数据有什么用,而需要数据挖掘结果的人却不知道从何处得到这些结果,因而在决策中处于被动的局面。用户数据挖掘工具使用能力弱,造成企业数据与数据挖掘结果的集成问题突出。

  用户缺乏能够执行数据挖掘的复合型人才

  从目前电信、金融行业的人才结构来看,主导建设数据挖掘系统的大多是工科出身,业务不熟悉,对于数学领域中的统计学也都较为生疏。因此这种复合型人才的缺乏也在很大程度上造成了我国数据挖掘市场的不成熟。

  数据源的可靠性问题

  数据源是整个数据挖掘过程的源头,如果源头的数据不能保证可靠、可信和科学,那么挖掘得到的信息也就不可靠。因此,如果数据源的问题不解决,数据挖掘就是纸上谈兵。

  北京发展海量数据挖掘产业的优劣势分析

  北京发展海量数据挖掘产业的优势

  一是数据挖掘产业结构完整。完整的数据挖掘产业链条包括算法提供方、产品和工具提供商、系统集成商、咨询公司和企业用户。北京是中国软件产业的中心,其海量数据挖掘产业结构相对完整。

  二是有较为成熟的理论和技术。北京有较为成熟的海量数据挖掘理论和技术,拥有北大SAS 数据挖掘卓越中心、中国科大博纳数据挖掘中心等专业研究机构;拥有中科院计算所MSMiner多策略数据挖掘平台、人大金仓SmartBI系列产品、TRS BigData等海量数据挖掘产业有代表性的产品。

  三是数据资源丰富,企业、政务机关集聚,数据的质量和数量都占有优势。

  四是信息化基础设施完善。北京信息化基础设施完善,对各种资讯和数据的获取较为便利,信息化基础设施的不断完善带动了海量数据挖掘产业的发展。

  五是建设“智慧北京”对海量数据挖掘产业的拉动。今年3月,北京市经信委发布了《智慧北京行动纲要》。“智慧北京”的建设对北京数据挖掘产业发展提供了非常好的外在契机。

  北京发展海量数据挖掘产业的劣势

  一是国内外数据挖掘企业发展不均衡。北京数据挖掘市场蓄势待发、蕴藏着商机,但国内外数据挖掘企业发展不平衡,国内企业缺乏核心竞争力;目前北京高端数据挖掘和商业智能服务市场已被国际大厂商占据,国内企业难以形成规模效应与外企抗衡;国内从事数据挖掘的企业起步较晚,缺乏足够的专业人力资源。此外,国外大型厂商通过收购、价格战、外包合作等形式削弱了国内数据挖掘企业的整体竞争力。北京呈现出的这种国外企业、本土企业发展不均衡的产业格局是发展海量数据挖掘产业的最大劣势。

  二是北京的软件产业人力成本高。数据挖掘产业是典型的人才密集型和知识密集型产业,产业的发展对人力资源的依赖很大。从企业运营的角度看,北京的软件人才普遍成本较高,这主要是人力资源缺乏所引起的,人才的供不应求导致高成本。

  三是北京的数据资源分散。虽然北京的数据资源丰富,但分布比较分散,往往跨行业跨区域存在。如何将各种分散的数据资源整合起来,避免有价值数据的丢弃,让它们得到充分、有效的利用,这是北京数据挖掘产业今后发展的重要问题,需要更先进、更强大的工具出现。

  北京数据挖掘产业发展建议

  一是立足示范应用,快速形成市场。以示范应用拉动产业发展是实现北京市数据挖掘产业深入发展的必然选择。鼓励数据挖掘软件研发公司就相关产品与客户签署合作协议,并进行示范合作。这样不仅可以帮助客户提高数据挖掘工具的使用能力,利用数据挖掘技术为相关决策做支撑,还可以使数据挖掘软件研发公司获得相对可靠、科学的数据源,并就应用情况和应用场地建立软件研发基地,推动市场形成和产业发展。

  二是打造龙头企业,培育产业集群。加快打造龙头企业是北京实现产业聚集的首要任务。龙头企业肩负开拓市场、汇聚人才、创新科技、带动产业集群发展的重任,*应该从金融、财政、税收等方面对重点龙头企业进行政策扶持,使其带动数据挖掘产业的健康发展。

  三是鼓励技术研发,提升创新能力。大力支持中小创新型企业是北京市突破数据挖掘应用与市场发展的重要环节。数据挖掘应用中还存在诸多的技术瓶颈,而中小企业是技术创新中最有活力的元素,推动软件创新向数据挖掘领域倾斜,大力引进并支持海外留学人员在北京创办企业,有助于突破数据挖掘应用中的关键技术与核心技术,以及自主创新能力的全面提升。