大数据扬威 微软研究院准确预测奥斯卡
北京时间2月25日中午,美国当地时间2月24日晚间,第85届奥斯卡颁奖礼在洛杉矶杜比剧院落下帷幕。2013年,24座奥斯卡小金人最终将花落谁家呢?
最终结果出炉:本-阿弗莱克执导的《逃离德黑兰》获得包括最佳影片在内的3项大奖,李安作品《少年派的奇幻漂流》获得最佳导演、摄影、视觉效果、配乐等4项大奖。丹尼尔-戴-刘易斯凭借《林肯》第三次问鼎最佳男主角称号,23岁的詹妮弗-劳伦斯以《乌云背后的幸福线》获得最佳女主角奖。奥斯卡小金人花落谁家?微软研究院早知道
作为电影从业人员,能够获得一座“奥斯卡小金人”——电影届的最高荣誉自然是无比开心的事情。不过,也有团队因为几乎100%的预测出“第85届奥斯卡大奖”的名单而欣喜若狂,同时备受网友关注。“第85届奥斯卡大奖”的名单
早在2月19日,微软研究院David Rothschild带领的团队通过对入围影片相关数据分析,就已经预测出2013年各项奥斯卡大奖的最终归属,成功命中除最佳导演奖(华裔导演李安获得)外的13项大奖!这一成果,让网友们大呼“大数据预测,太神奇啦!”
那么,David Rothschild是何许人也?他的团队又是进行了什么样的数据分析步骤,让他们成功预测第85届各项奥斯卡大奖的最终归属呢?下面为您一一揭晓。
85届奥斯卡大奖预测方法
David Rothschild是何许人也呢?据了解,微软研究院的David Rothschild博士是微软纽约研究院的一名经济学家,2002年本科毕业于美国布朗大学,2011年获沃顿商学院应用经济学博士学位。
由David Rothschild带领的分析团队,不仅预测2013年各项奥斯卡大奖的最终归非常的准确,而且早在2012年美国总统选举中,David Rothschild就曾使用一个通用的数据驱动型模型,准确预测了美国50个州和哥伦比亚特区共计51个选区中50个地区的选举结果,准确性高于98%。本届奥斯卡颁奖典礼,David Rothschild只是延续了“辉煌”的战绩而已。
微软研究院的David Rothschild博士
David Rothschild在2013年奥斯卡颁奖典礼之前,就曾表示:“我预测奥斯卡金像奖得主的方法与预测其它事情的方法完全相同,其中包括政治。”并且,他也指出:“科学是相同的,但证明哪些数据最有用却存在千差万别。”另外一个问题是,微软研究院由David Rothschild带领的分析团队,都做了哪些数据分析步骤,让他们能够做出这么准确的预测呢?
微软研究院的David Rothschild博士预测奥斯卡获奖名单(图片来源于weibo.com/msra)
David Rothschild指出分析步骤:“首先关注最有效的数据,然后创建不受任何特别年份结果干扰的统计模型,所有模型都根据历史数据进行测试、校正,我们在建模时很有耐心,确保模型能够正确预测外样本结果,而不仅仅是过去发生的结果。我们创建的模型是用来预测未来的,而不是预测过去的。”并且,对不同类型的数据,David Rothschild表示:“我通常关注四个不同类型的数据:投票数据、预测市场数据、基本数据和用户产生的数据。在预测政治时,我采用基础数据如过去的选举结果、义务和经济风向标。通过基础数据建立一个基准,然后转向预测市场数据和投票数据,因为这两个类型的数据吸收并包含了更多选举信息。2012年总统大选预测时,我使用了少量用户产生的数据,但Xbox Live数据对补充重大事件实时分析起了关键作用。”
而在David Rothschild的分析团队预测奥斯卡金像奖花落谁家时不需要投票数据,基本票房回报和电影评级数据也不统计在内。
“我更关注的是预测市场数据,这是主要因素,同时采用部分用户产生的数据,这有助于理解电影内部和不同类别之间的相关度,例如影片《林肯》会赢得多少个奖项?”David Rothschild说。
David Rothschild分析团队的目的就是利用微软的大数据技术和产品改变我们的预测方式和速度。总结起来,David Rothschild会这样表示:“每当我关注一个新领域,我都会认真考虑一些关键事情,确保自己的预测更有意义。首先,我会确定最中肯的预测。其次,我的所有预测结果会实时更新。最后,我借助特定领域的历史数据建模,然后通过不断升级模型确保预测的准确度。”
当然,David Rothschild也表示,以上这一系列预测方法,只是初步预测的结果,并非100%。85届奥斯卡颁奖典礼上揭晓的获奖名单,也验证了David Rothschild的以上说法。
不过,预测命中13项获奖名单仍然让网友,对于微软的大数据技术和产品开始刮目相看了。
准备预测奥斯卡的秘密武器
上一页David Rothschild谈到了预测要经过的几个步骤和方法。据了解,David Rothschild团队能够准确预测奥斯卡大奖结果,还有一个秘密武器的帮忙。David Rothschild与微软团队合作开发了一款Excel应用——Oscars Ballot Predictor(奥斯卡投票预测器),一个后缀为.xltx的文件,该应用为所有24个类别的奥斯卡奖项提供实时预测。
奥斯卡投票预测器下载
保持.xltx文件
.xltx文件属性
大数据分析的商业价值无可限量
操作该Excel应用起来也很简单,从predictwise.com下载并打开预测建模,单击一个提名并记录您的投票,查看提名和预测24个奥斯卡大奖。
预测投票结果
奥斯卡投票预测器操作界面
感兴趣的网友可以访问Office Store下载:The Oscars Ballot Predictor,并且可以尝试对于其他赛事的预测投票。例如,2012-2013赛季NBA季后赛总冠军是哪支球队?目前从预测的结果来看,迈阿密热火队的夺冠命中率最高35.5%。其他赛事的预测投票
小结:从微软研究院可以几乎100%地预测奥斯卡小金人的归属问题来看,社会上还有很多行业的数据,我们都可以通过较为完善的建模,进行快速的数据处理和分析,并且让这一分析结果用于商业用途。编者相信,这也是微软研究院团队展示Office 2013中这一工具的真正目的。虽然,大数据分析不一定能够提供100%的准确预测和分析。但是,编者相信,如果微软将这一先进的分析工具用于商业用户时,比相对于一堆堆干巴巴、杂乱无章的大数据,企业负责人将更加容易理出思绪来。特别是在针对公司战略或合作,企业负责热需要做出决策,在举棋不定之时,如果通过这个数据分析工具帮助企业做出综合的分析。那么,给出的结果,将会对企业负责人来说,是一个非常好的借鉴和参考。
下一篇: 1号店董事长于刚:大数据时代的电子商务