大数据“接地气”,百度绘春运迁徙图
昨天19点前8小时显示的百度迁徙图表,北京列迁出榜第一,上海列第二。
大数据,是当下最热门的科技术语之一,但它究竟有啥用,一直是普通公众乃至决策部门关心的问题。去年9月,*政治局集体学习走进中关村,“教员”百度CEO李彦宏在讲解这个问题时提到,大数据仍在研发中,还不那么“接地气”,将来能改变很多事情,他还举例说,大数据能监测公共事件,带动社会管理创新。
不到半年后,百度在大数据“接地气”的应用上作出尝试,播报春运人口迁徙实况的网站“百度迁徙”日前上线:一张中国地图上,犹如蛛网一样闪光的线路将各个城市连接,实时展现无数个体的旅途。该项目相关负责人昨日告诉晨报记者,这一公益性项目尚在初期,通过分析手机网民定位信息将人群迁徙可视化,让网友更直观地体验春运,春运后还将挖掘这些大数据的“价值”,希望能够帮助*部门科学决策。
能从网站看到什么?
迁出、迁入热点城市人流量一目了然,昨日上海出发至少2成去安徽
中国春运是世界最大规模的周期性人口迁徙,今年春运客运量预计将超过36亿人次,当下正是春运高峰期,每天都有数亿人次奔波于全国各个城市。那么,哪些线路最热、哪些城市的人口流动性最大?对于这些复杂宏大的问题,网友今年可以通过一个取名“百度迁徙”的网站轻易直观地感受到。
25日晚上线的“百度迁徙”首次将春运客流轨迹以大数据可视化方式呈现。晨报记者昨日傍晚打开该网站发现,一张中国地图上,每个城市被小点标出,密密麻麻的蓝色线条将他们连接形成一张网络,亮度越高说明人流经过越多。
记者浏览发现,从1月16日春运首日零点起,至用户登录时刻的人群迁徙动态都能呈现,数据以1小时为周期更新,反映的是选择时间点前8小时内的迁徙情况。此外,网友还能查看各个时间段的10大“迁入热市”、“迁出热市”以及“最热线路”,而输入城市名后,还能查看该城市人群的主要迁入来源、迁出目的地,橙色的线代表迁入人流量,而黄色的线表示迁出人流量。
以昨日17点前的8小时为例,统计数据显示,昨天白天从上海回家的民众2成以上目的地是安徽。至昨日19时前的8小时,记者浏览发现,北京位列迁出地首位,上海列第二位。
春节前,主要客流从大城市流向各地的趋势符合大众常识,“百度迁徙”显示的情况也基本遵循这一规律,10条“最热线路”中9条是从北京、上海、天津前往二三线城市,唯独成都前往北京线路例外。现实情况也印证“百度迁徙”,成都铁路局表示,春运首日至24日晚期间,成都直达北京旅客人数同比增幅超过60%。
这种与过去不一样的现象是如何产生的呢?央视报道指出,大数据目前还不能具体分析乘车人的具体身份,但成都火车站一线员工发现,今年出发的人群中多了不少老人面孔,他们很多都是准备去儿女打工的城市过年,“逆向迁徙”过年模式在增多。
春运迁徙图怎样“画”成?
大数据来自手机网民定位信息
据介绍,能够实现可视化直播春运,春运人口迁徙密集、我国手机渗透率高是大背景。“百度迁徙”项目的大数据,实际上来自于手机网民的定位服务信息。相关统计报告显示,截至2013年12月,我国手机网民达到5亿。
“在人群迁徙过程中,通讯是最基本的需求之一,手机网民和春运回家的人群是高度重合的,完全可以代表迁徙人群。”百度LBS(地理位置服务)技术总监顾维灏解释说,LBS开放平台聚集了超过40万的开发者,为数10万款应用软件提供定位服务,已覆盖数亿部手机,约占手机网民使用设备总量的8成。
“比如打车软件,用户每使用一次打车,就会有很多定位请求,这些都通过百度的后台来进行,这类软件有十几万,加起来就是很庞大的数字。”百度品牌沟通总监徐继业补充说,去年8月的统计显示,百度地图每日接受35亿次定位请求,也就是每秒4万余次,这个数字到现在还有大幅增长。正是有了上亿的数据量基础,百度才有可能实现全面、准确、即时反映人口迁徙状况。
下一步还能做什么?
挖掘数据价值,希望能给*决策提供帮助
目前,“百度迁徙”只能反映已经发生迁徙的情况,在网友看来更多的是一种“新鲜感”,它能有什么具体应用呢?
徐继业对此表示,目前呈现给大家的只是LBS的本身数据,给公众一个可视化的图像。“未来我们能够把这方面做得更好,把人群更加精确的定位,比如年龄层次,结合起来就能产生更多的数据,在迁徙的可视化上,展现一个更全面的图景。”
“另一方面,不仅要在展现数据上做得更好,更重要的是挖掘这些数据的价值。”该项目相关负责人告诉记者,今年春运结束以后,他们会开始数据挖掘工作,进一步分析这些数据,并且通过今后第二年、第三年的数据积累,最终让这些大数据发挥作用,未来能够服务于*部门科学决策,赋予社会学等科学研究以新的观察视角和方法工具。
该负责人向记者举例说:“现在的春运安排,从哪天开始到哪天结束,是根据交通部门多年约定俗成的规律安排,实际情况是否发生变化很难说,通过我们的数据分析,再和交通部门(售票信息)、*管理部门的数据结合起来看,说不定就会有新的发现。”
去年9月30日,*政治局集体学习走进中关村,“教员”百度CEO李彦宏在给*等政治局常委讲解这个问题时就指出,大数据仍在研发中,还不那么“接地气”,将来能改变很多事情。
李彦宏还指出,大数据在两个方面表现出最重要的价值,一是促进信息消费,加快经济转型升级;二是关注社会民生(例如提前预测旅游热点、监测公共事件),带动社会管理创新。4个月后,李彦宏和百度已经悄然把“课堂”上讲的第二点价值带到实践尝试中。
与此同时,**在“课堂”结束后也持续关注互联网行业变革带来的新产业、新经济。去年10月31日国务院总理*主持召开了他就任总理以来由专家学者和企业家代表参加的第三次经济形势座谈会时,就邀请另一位互联网“大佬”马云,并称赞他创造了“双十一”这个消费时点。就在1月17日举行的今年首次总理座谈会上,腾讯公司马化腾、小米公司雷军这两位知名互联网企业负责人再度成为座上宾。
[专家观点]
“百度迁徙”是一项有价值的创新,通过百度人口迁徙数据研究春运人口流向,可为交通部门的政策和服务提供参考,其开放后,也可以为普通百姓、企业提供生活、生产的参考,具有很大的社会价值。
——中国传媒大学调查统计研究所所长沈浩
[新闻延伸]
定位信息是否存安全隐忧?
数据只对应手机设备,不对应个体
随着大数据分析、云计算技术在生活中逐渐普及,一些隐忧也开始显现。去年底,淘宝网推出“生活圈”服务,哪里的“土豪”最多,哪里的人最爱买马桶,哪里的人最爱买方便面,哪所大学的人均消费水平最高,一目了然,引发有关隐私保护问题的讨论。此外,去年底,数家酒店开房记录的泄露,也带来数据安全方面的顾虑。
“百度迁徙”是否也会有这方面问题呢?对此,该项目相关负责人向记者解释说,手机定位数据对应的只是几亿部手机的设备本身,并不与使用者个体对应,它们在海量数据库中只是以一串代码呈现,任何人通过代码都不可能得知手机使用者的信息。
“手机设备使用者的年龄、性格、喜好,这些被称作 ‘用户画像’,‘百度迁徙’目前并没有做这方面的开发工作。 ”该负责人同时强调,作为一家依靠搜索引擎起步的高科技企业,数据的保护从一开始就至关重要。 “对外,我们有非常完善的安全和保护技术;对内,任何数据的使用都有严格流程,遵守相关法律。数据的安全性是有保障的。 ”
此外,该负责人强调,“百度迁徙”从立项开始就定位于公益性项目,目前也没有商业化方面的尝试和计划。
上一篇: 不一样的设计思路
下一篇: 科普:俄太空机器人“何许人也”