谷歌利用大数据来对抗流感
冬天来临,世界许多地方都出现了流感症状。据美国疾病控制管理中心称,美国29个周及纽约都发出了流感高爆发预警,其他的9个州也出现了轻微流感病例。
在世界范围内监控流感病情的最好方法一直没有定论,但谷歌声称其创新性方案——利用聚合搜索数据对流感进行跟踪,可达到接近实时的效率。Google Flu Trends网站并不是第一次出现,它在2008年就已经作为谷歌的社会福利项目面世,但对企业和*来说它是一个发掘大数据潜在价值的优秀范例。
为何要用网络搜索查询更能追踪世界范围内的流感病情?毕竟这已经是全球健康部门如CDC正在做的事。谷歌的回答是:没错,但Google Flu Trends通过对聚合搜索的结果进行分析,可以比这些机构更快速地侦测到疾病的爆发。
而且,尽管卫生报告每周都得到更新,
但报告仅限于单个国家。Google Flu Trends却有着几近涵盖全球的视角:它在任何人们使用Google搜索的地点收集数据。更重要的是,由于它是每日更新的,因而它向人们传递更即时的消息。
Google.org是这样解释搜索查询和流感流行之间的关系的:“我们发现搜索流感有关的话题的人数和事实上拥有流感症状的人数之间存在着紧密的联系。当然,并不是所有搜索‘流感’的人都事实上患病,但当所有流感有关的搜索查询加到一起,我们就可以得到一套新的评估模式。”
通过对查询总数和来自于传统流感监测系统的数据进行比较,Google发现流感有关的搜索查询(毫不令人惊奇地)在流感季节很普遍。并且通过计算这些查询的数量,Google可以进而估计在使用Google搜索引擎的世界各个地方流感的活动情况。
Google通过比较现有的来自搜索数据的估计和某一特定地区官方历史上的流行性感冒信息,来判定流感活动的等级——强烈,高,适中,低或者最校例如,在2013年1月8日,它将美国的流感活动等级列为“强烈”,这项判定与CDC(Centers for Disease Control,美国疾病防控中心)的报告一致。CDC报告声称国家的大部分地区还在爆发严重的流感疫情。
Flu Trends使用来自Google服务器日志上的IP地址信息来判定用户的查询来源。Google不将Flu Trends定位为一项传统的卫生机构数据的替代品,正相反,Google把它作为一项可以帮助公共卫生官员早期侦测疾病爆发的补充物,并且希望能够限制疾病感染的人数。例如,在2008年1月,Google的Flu Trends侦测到美国大西洋沿岸中部地区流感的活动显著增加。
作为比较,两周后的CDC发布的报告仍未显示该项增加。
传统的疾病监控报告通常来自医生和卫生专家。他们是优秀的人口数据来源,而这些数据,卫生当局无法从搜索查询中获得。
当前,Flu Trends的触角还未达到真正的遍及全球。Google向世界上超过25个国家提供流行性感冒评估,涵盖南北美,欧洲,澳洲和部分亚洲地区。然而,它不包括面向中国、印度、印度尼西亚、中东和大部分非洲地区(除南非之外)的流行性感冒评估。
当然,大部分搜索用户不希望他们每次(可能)生病都遭到Google跟踪。这个搜索巨头通过对每周查询进行聚合匿名统计来解决这些隐私担忧。