欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  互联网

大数据不靠谱?当Google流感趋势出错

程序员文章站 2022-11-27 09:29:07
今年的流感季比往年更早,形势也更严重。在与传统的流感监测数据比较之后,根据互联网流感搜索实时更新的Google流感趋势被发现明显高估了流感峰值水平。专家认为,Google需要改进它的算法,此事彰显基于...

今年的流感季比往年更早,形势也更严重。在与传统的流感监测数据比较之后,根据互联网流感搜索实时更新的Google流感趋势被发现明显高估了流感峰值水平。专家认为,Google需要改进它的算法,此事彰显基于社交网络数据挖掘的流感跟踪将不是替代而只能补充传统的流行病监测网络。

传统流感监测依赖于全国医生的流感症状患者报告。2008年发布的Google流感趋势则是根据对流感相关关键词搜索的数据挖掘,过去几年确实表现卓越,结果也相当精确。但Google流感趋势使用的模型必须每年进行调整,科学家指出基于搜索有太多的噪音影响了它的精度,他们正在开发噪音较少的替代跟踪方法,例如基于Twitter的流感跟踪只包含真正病人的帖子,而不是转载的流感新闻报道。