关于数据分析_管理者的4个常规错误 OracleRedisMongoDBSybase
程序员文章站
2022-03-26 13:31:10
...
全文连接http://click.aliyun.com/m/22761/
0?wx_fmt=jpeg
◆ ◆ ◆
导读
有关数据和数据分析的高谈阔论比比皆是。不断有人告诫各大公司要规划恰当战略来收集分析大数据,并警告不这么做可能带来的不良后果。像《华尔街日报》近日就提到公司享有客户数据这样一个大宝藏,却大都不知道该如何利用。本文将探讨其中缘由。有公司尝试从巨大的数据中获取实际可用的信息,通过与他们合作,我们归纳了管理者在数据应用上的四个常规错误。
◆ ◆ ◆
错误一:没有理解融合的概念
阻碍大数据发挥价值的第一大挑战就是兼容性和融合性。大数据的一个主要特点是其来源多样。然而,如果数据形式不相同,或难以整合,则其来源的多样性将使公司难以削减开支,也无法为客户创造价值。例如,在我们和一个合作项目中,该公司拥有丰富的数据,记录客户的交易量和忠诚度,以及专门的在线浏览行为数据,但是鲜少交叉检索这两类数据来判断某种浏览行为即为交易达成的前兆。面对这种挑战,公司创建了“数据湖”来容纳大量非结构性数据。但是,这些公司能够加以利用的数据目前都显得杂乱无章,只不过是一些以文本,也就是说,当这些数据只是普通的二进制数字时,要将它们井然有序地存储起来非常困难。要将来源不同的它们整合起来更是难上加难。
◆ ◆ ◆
错误二:没有认识到非结构化数据的局限性
阻碍大数据发挥价值的第二大挑战是其非结构化的特性。对文本数据的挖掘已经有了特别的进展,其语境和技术所带来的认识与结构化数据类似,只是其它形式的数据如视频仍不易于分析。举个例子,虽然拥有最先进的人脸识别软件,有关当局仍然无法从大量视频中识别出波士顿马拉松爆炸案中的两名嫌疑人,因为该软件尚在处理从不同角度拍摄的嫌疑人的照片。
虽然从非结构性数据获取信息面临挑战,但是各公司在利用这些数据初步提升分析已有数据的速度和精确度上取得了显著成绩。比如,在石油和天然气勘探中,人们就用大数据来优化正在进行的操作,以及针对地震钻井的数据分析。尽管他们所使用的数据在速度、种类和体积上都有可能增加,最终这些数据还是用于同一个目的。总之,一开始就希望通过利用非结构性数据形成新的研究假设是站不住脚的,除非各公司通过“实践”有了这种专业能力,能利用非结构性数据优化某个问题答案。
◆ ◆ ◆
错误三:以为关联分析意义重大
第三大挑战——我们认为是阻碍大数据价值的最重要的影响因素——是观测数据的大量重叠使其因果关系难以明确。大规模数据集往往包含众多相似或完全一致的信息,直接导致错误的关联分析,误导管理者的决策
全文链接http://click.aliyun.com/m/22761/
0?wx_fmt=jpeg
◆ ◆ ◆
导读
有关数据和数据分析的高谈阔论比比皆是。不断有人告诫各大公司要规划恰当战略来收集分析大数据,并警告不这么做可能带来的不良后果。像《华尔街日报》近日就提到公司享有客户数据这样一个大宝藏,却大都不知道该如何利用。本文将探讨其中缘由。有公司尝试从巨大的数据中获取实际可用的信息,通过与他们合作,我们归纳了管理者在数据应用上的四个常规错误。
◆ ◆ ◆
错误一:没有理解融合的概念
阻碍大数据发挥价值的第一大挑战就是兼容性和融合性。大数据的一个主要特点是其来源多样。然而,如果数据形式不相同,或难以整合,则其来源的多样性将使公司难以削减开支,也无法为客户创造价值。例如,在我们和一个合作项目中,该公司拥有丰富的数据,记录客户的交易量和忠诚度,以及专门的在线浏览行为数据,但是鲜少交叉检索这两类数据来判断某种浏览行为即为交易达成的前兆。面对这种挑战,公司创建了“数据湖”来容纳大量非结构性数据。但是,这些公司能够加以利用的数据目前都显得杂乱无章,只不过是一些以文本,也就是说,当这些数据只是普通的二进制数字时,要将它们井然有序地存储起来非常困难。要将来源不同的它们整合起来更是难上加难。
◆ ◆ ◆
错误二:没有认识到非结构化数据的局限性
阻碍大数据发挥价值的第二大挑战是其非结构化的特性。对文本数据的挖掘已经有了特别的进展,其语境和技术所带来的认识与结构化数据类似,只是其它形式的数据如视频仍不易于分析。举个例子,虽然拥有最先进的人脸识别软件,有关当局仍然无法从大量视频中识别出波士顿马拉松爆炸案中的两名嫌疑人,因为该软件尚在处理从不同角度拍摄的嫌疑人的照片。
虽然从非结构性数据获取信息面临挑战,但是各公司在利用这些数据初步提升分析已有数据的速度和精确度上取得了显著成绩。比如,在石油和天然气勘探中,人们就用大数据来优化正在进行的操作,以及针对地震钻井的数据分析。尽管他们所使用的数据在速度、种类和体积上都有可能增加,最终这些数据还是用于同一个目的。总之,一开始就希望通过利用非结构性数据形成新的研究假设是站不住脚的,除非各公司通过“实践”有了这种专业能力,能利用非结构性数据优化某个问题答案。
◆ ◆ ◆
错误三:以为关联分析意义重大
第三大挑战——我们认为是阻碍大数据价值的最重要的影响因素——是观测数据的大量重叠使其因果关系难以明确。大规模数据集往往包含众多相似或完全一致的信息,直接导致错误的关联分析,误导管理者的决策
全文链接http://click.aliyun.com/m/22761/
上一篇: java监控守护linux程序运行
下一篇: java监控守护linux程序运行