数据是资产而非成本 看福特汽车如何拥抱大数据
福特汽车已经在利用大数据分析的强势,内部指导公司改进企业业绩。福特通过海量加工数据及汽车内部的详细输出数据,探索最佳工艺指标,改进或帮助改变其业务模式。
福特研究与先进工程预测分析(Predictive Analytics for Ford Research and Advanced Engineering)技术领导迈克尔·卡瓦雷塔(Michael Cavaretta)领导福特多个数据分析项目,打破公司内部数据孤岛,最好地定义福特最有成效的数据集。
福特已成功聚合了客户反馈信息,借助所有内部数据,预测福特该如何利用技术新特性最大程度改进汽车。
卡瓦雷塔是近日在美国加州纽波特比奇市召开的开放组织大会专家组成员之一,作为开放组织大会的一名贡献者,福特的发言稿标题是“大数据——当今我们需要拥抱的转型”。卡瓦雷塔在文中解释了通过有效深挖更多类型的数据,大数据该如何培育企业转型,并进一步提高工艺、质量控制和客户满意度。
我们从Interarbor Solutions首席分析师德纳·加德纳(Dana Gardner)编辑过的访谈录中节选出一部分与大家分享:
问:现在获得的这些数据及数据分析与5年前有何不同?
答:最大不同之处是存储和处理能力的廉价有效性。数年前,人们专注于对用于长期分析的存储数据集进行过滤。现在我们的观念已发生巨变,我们尽可能多存储数据,并利用存储优势改进企业流程。
态度发生巨大转变
问:我们是如何做到这一步的?支持效益的流程是什么?
支持效益的流程是企业态度发生巨大转变,尤其是大企业内部IT部门的态度。我们的新理念是,IT部门不需要花费大量时间筛选需要存储的数据,无需担忧与之相关的成本及数据作为资产的其它事项。能够存储数据、追溯数据并从中获得不同见解,这就是价值。当然,这些都源于廉价存储及我们能够访问平行处理机器与伟大的软件。
我喜欢向人们谈论大数据提供的各种可能性,我经常说,我还未遇到过有人给我提供过多数据的情况,你们可以使用所有信息,然后回答各种问题,因为你们不用担忧遗漏了什么。你们拥有一切数据。
你可以提100个问题,每一个问题只使用了数据中极小一部分。那些问题或许会用到数据中的不同部分,极小的一部分,但即使是极小的一部分,也都是完全不同的。如果你这样考虑“我们将回答20个重要问题,只需保留这部分数据就行了”,那么你就会遗漏很多信息,也就无法获得任何价值。”
“我们是聚合信息的大拥护者,坚信即使没有达到大数据规模的数据集也有很大价值,大家不用深挖数据、不用获得更详细的信息,只是拓展数据宽度即可,将之扩大到其它内部数据集、连接不同业务领域、并扩大至外部数据集。”
“大多数时候,你能够获得的数据或许只有数十万或数百万记录,但假以时日,加入不同信息,并对信息不断补充后,就能够获得大数据集的规模。”
内部顾问
问:你肯定首先会查看内部数据,同时也会查看适量外部数据。或许你会较多描述自己的组织及你的工作,为何内部关注对你如此重要?
答:我是福特汽车研究与先进工程领域一个较大部门的一名成员,我们这一部门有30人,我们的工作是内部顾问,类似于凯捷咨询(Capgemini)或Ernst & Young,不同之处是我们工作的部门是福特汽车一个内属部门。从企业观点看,我们负责外出寻找不同机遇,带回先进技术。因此,我们一直在关注统计建模及机器学习领域,我早在15年前就说过我们的工作性质。
这次我们得到大量承诺,通过与不同企业客户交谈后,他们都表示“我们真心希望拥抱大数据”。我们看了他们拥有的数据集并表示:“如果我们也拥有这些数据,情况岂不更好?因此,现在我们只需等6个月或一年时间就能够拥有那些数据。”
从这点看,这些新技术正在改变格局。我们手握救火工具后,就可以说再也不用担忧什么了。一切尽在掌控中,我们能够记录下所有数据,无需担忧记录的数据是否支持该分析,因为分析的基础就是大数据,这就是大数据技术的最大好处。
真正的价值主张发生彻底改变源于公司内部将工作派放至基层分析师,这些基层分析师对透过数据驱动的观点看问题非常感兴趣。从我首次接触数据分析至现在,最大改变发生在艾伦·穆拉里(Alan Mulally)加盟福特,极大推动了数据驱动决策理念。
艾伦·穆拉里加盟福特之前,那些密切关注内部数据的人们对我们颇感兴趣;之后,管理层和高层领导及副总裁提出大量问题,内容如下:“我们拥有所有这些数据资产,我们应该从中获得更多东西。”最近数年,这一战略愿景已发生巨变。
问:像汽车这样主流产品生命周期中的总反馈循环是否尽在掌控之中?我们是否已掌控数据反馈,或者说大数据还只是停留在理论层面上?我们能否完全驾驭大数据并将之发展为一门科学?
答:理论上完全可行,现在我们要解决的问题是大数据的实际操作及实践性。即使在谈论存储了大量数据的新型先进技术和工艺时,我们谈论的仍是大量数据,仍是需要分析的大量数据,我们需要大量数据确保自己完成适当的数据整合。
问:尽管我认为大数据有发展潜力、有理论支持,但通过多个来源获得数据仍是一项繁重的工作。因此,你从车辆中获得一切信息简直太奇妙了。如果你要把通过多个来源获得的数据与内部数据整合的话,是与调查数据整合,还是与制造数据或质量数据整合?你首先希望做的是什么?我们不可能同时做所有事情。
答:最高价值
我们的观点一直是:投资回报(ROI)最高领域,然后开始圈定主流数据集的一部分,进行深入分析。适当整合数据后,对技术人员确实颇有价值。
问:显然,最高价值的内涵颇为丰富,但我认为从历史观点及环境观点看待最高价值更有意义。我正在考虑部分早期质量巨头如Deming及部分质量措施如六标准差(Six Sigma),这些是否有异曲同工之妙?我们谈论的主题是持续了五、六十年的质量措施的延续呢,还是与之有着本质差别?
答:这确实是一个很有趣的问题。从分析数据、适当使用数据的观点看,我认为数据确实有着悠久的历史,多年前福特就是Deming及六标准差的大追随者。
其差别就是,尽管现在分析数据时无需担忧数据的获得,但在收集数据时做得好,就可能获得正确的数据,这非常有益。这需要你有耐心,通过研究别人的模式不断积累丰富的经验。当然,凡事都是一分为二的,其弊端就是你收集的大量数据可能与你的研究对象呈伪相关关系,或没有任何意义。
这就要求我们专业知识过硬,尤其是对制造工厂作出改变进行发言之际。我们最好认真调查后,能够与有着20年经验的人交流意见。你可以说“这是我们在数据中发现的关系,是否与你的直觉相符?”我们需要多此一举。
问:物联网概念如何影响你们收集大数据,你们又是如何将物联网概念应用到你们组织内部分析的?
答:这是一个巨大领域,无论从制造工程内部RFID标签等内部流程看,还是从工厂外部看,或通过车辆本身生成的所有信息来看,这都是一个巨大领域。
福特Energi汽车每小时产生25GB数据,近期销售200万辆汽车产生的数据量可想而知,其中蕴含着巨大机遇,向第三方开发者开放部分系统也存在一些意义重大的机遇。OpenXC就是我们计划添加至研究与先进技术项目的一项计划。
大量传感器
我们的车辆产生大量数据,汽车上添加大量传感器和处理器,车内信息、车辆与手机之间的通信信息及车辆之间的通信信息都会生成数据。
密歇根大学运输研究所(University of Michigan Transportation Research Institute)负责车辆与家庭系统之间通信信息研究,让家庭系统知道你在回家的路上,如果是冬季,家庭系统就会提高家中温度;若是夏季,家庭系统就会降低家中温度。
无论是从企业观点看,还是从环境自然特性观点来看,此处生成的数据量可能是无价值的信息,但在彼处就可能价值不菲。
问:就福特而言,汽车通常产生的数据量有多大?平均水平如何?
答:根据获得的最新信息,福特Energi汽车每小时产生25GB数据。不同车辆产生的数据量也不同,主要取决于车辆上安装的传感器和处理器数量。但我们面临的关键不是当前状态,而是未来。
车辆产生的信息量中,大多数只是内部信息。问题是多少信息被送回用于分析,并找出不同模式?查看外部传感器、温度、湿度时,分析信息就格外有意义。你知道雨刷何时启动并获取该信息后,也能够将之与外部数据源整合。这是一个很有意义的领域。
问:你对贵部门的技能目标是什么?你认为能够通过哪些方式提升贵部门技能?
答:我们部门的技能目标,尤其是我们团队的技能目标是精通计算机科学、统计和部门老式工程领域的知识。我们通过培训实现这一目标。除了聘请部分关键人员外,我们这个团队的实质就是一个内部开发团队。
定向培训
我们拥有的最大优势就是能够走出去接受定向培训。开源环境下存在大工具,我们能够以相对较低的成本和风险获取目标知识,进行大量试验,这就是我们推动技术向前发展的方式。
通过与开放组织交谈,为我把不同理念的人聚集到一起提供了一个机会。我们已经摒弃了“生成的数据有可能解决设想的问题,从而存储数据”的理念,我们现在的理念是“获取一切数据,将担忧先抛在脑后,将来我们会发现其价值。”
视数据为资产而非成本,这一思维非常重要。你甚至需要花费一些钱,起初在没有稳定投资回报的情况下可能会有一些风险。然后加入获得的信息并进行存储,数据存储方式很重要,不仅高层数据科学家能够访问并提供价值,对数据感兴趣的所有人都能够访问。这些都是非常重要的成分。
你如何获得一个大数据项目?如何获得企业能够开发但在传统商业智能(BI)框架下没有存储的信息?如何将该信息连接到BI系统,如何为整合数据提供价值。这些都是仍有大量工作待做的非常重要的领域。
有大量公司,尤其是大企业在关注其数据资产,考虑如何将数据资产转化为赚钱途径,这些企业不仅把数据资产视为提高效率的手段,还视为一条新的营收流。
问:那些希望视数据资产为新营收流的企业开始行动了,你们将如何行动?
我们肯定是试验项目和概念验证的最大践行者,会通过行动开发路线图。意识到工作的艰巨性,领悟成本可能略高,一开始不会有投资回报。
但我们必须接受挑战。从搞些试验项目着手,等试验项目由试验性质变为能够提供真正企业价值的项目后,就是我们开始关注正式领域和正式IT流程的时候了,但我们必须现在就开始行动。
上一篇: 雨中的格桑花
下一篇: Cisco管理的35个常见问题及解答