此页面上的内容需要较新版本的 Adobe Flash Player。

获取 Adobe Flash Player

大数据

面对武汉疫情,这是大数据能贡献的力量
作者:   来源:虎嗅APP   日期:2020-01-23
    这几天,我们周围很多全媒体平台的记者,已赶赴武汉新型冠状病毒感染肺炎的发源地,进行一线采访报道,他们的行动力与精神令人由衷敬佩。

    而作为科技媒体,我们一直在想,是不是也能从技术角度出发,为这场必定会十分艰苦的战斗贡献一些绵薄之力。

    在虎嗅今日与多家大型数据科技公司进行沟通后,其中,百度向虎嗅提供了一个关于“全国春运人员迁徙热力图”城市数据的链接。

    虽然这听起来与病毒疫情没一毛钱关系,但是我们还是从百度迁徙地图的城市大数据中发现了一些有用的东西:

    如果你输入“武汉”这个城市,从1月10日正值春运大幕拉开,到1月22日春运第一阶段高潮将要落下的时间点,从武汉(起始地)流向全国各地的城市客流量排名,与各地新型肺炎病例被发现的数量与时间早晚,有着一定的正相关关系。

    1月15日从武汉流向全国各城市分布图,图片来自“百度地图慧眼”

    百度告诉虎嗅,这个春运期间的人口流向图,主要是基于下载了百度地图app的用户地理位置数据以及用户自愿提供上传的信息,并结合大数据分析和挖掘等技术总结描绘出的(由于下载基数较为可观,因此我们认为这些数据具备一定的可信度)。

    此外,百度也对用户关心的数据隐私问题做了补充性解释,分析所用的数据皆为脱敏数据,所有处理各环节均不涉及个体隐私 。

    我们输入了从1月10日到1月22日不同的时间点,发现这12天以来,从武汉出发人员流向最多的地点基本是武汉周边区域,也就是湖北省内的其他城市,这些城市排名在十几天内基本没有太大变动。

    特别是黄冈与孝感市,是过去十天平均从武汉流出人口汇集最多的两个城市。与之相对应的是,截止发稿,除了武汉,黄冈成为全国第二个“暂时关闭城铁站与火车站离市通道”的城市。

    而一出湖北省,流动人口虽然像天女散花般飘向全国33个省市,但一二线城市及省会城市仍然是武汉流出人口最主要的聚集地。

    譬如以下是在1月10日到15日期间,从武汉流入人口最多的外省城市。其中,长沙市、北京市、重庆市、上海市、深圳市等比较靠前。

    截图来自百度地图慧眼

    值得注意的是,广东(深圳等)、上海与北京也是公开通报武汉新型肺炎病例最早,除湖北以外病例最多的地区,而其他省会城市也均陆续发现并通报病例(浙江、湖南、四川、安徽是目前发现病例最多的省份)。

    数据来自人民日报23日0时消息

    当然,除了人员流动,各地病例发现率肯定有其他因素干扰,譬如医疗水平、各地卫生部门及群众的重视程度、各地应急响应程度等等。但令人疑惑的是,从1月10日到1月15日的平均数来看,北上广并不是武汉流出人口汇集最多的地区。

    而1月15日~1月22日的武汉流出人口去向则更为明显:

    四川省(特别是成都)、河南省(特别是信阳、郑州、驻马店)的部分城市以及重庆市在排名中十分显眼,平均流入比率要高于北上广。众所周知,四川省与河南省是对外输送劳动力的大省。

    此外,这个时间段,也是安徽与江西省部分城市打工人士的集中返乡时间。

    截图来自百度地图慧眼

    当然,大数据不可尽信(再次提醒,只做相关参考),但我们还是希望能引起地方相关机构以及普通民众的重视。

    此外,就在今天下午,四川移动也利用网络大数据,协助四川省内相关部门进行武汉肺炎舆论监控,通过移动用户数据来分析从武汉进入四川各地的人口数量。

    从1月10日到20日,流入四川的武汉用户共5.9万,其中成都地区人口最多,为2.2万。这与百度地图提供的数据有一定吻合度。

    数据来自“快文信息”

    近日,香港大学新发传染性疾病国家重点实验室主任管轶在接受财新采访时表示,春运回乡大潮将要结束,大部分人在过去十几天,已经把病毒带去了全国各地,甚至过年期间还会有更多处于潜伏期的病例被发现。

    假如真如其所说已经错过了“黄金防控期”,那么接下来抗击新型病毒的战役,就更需要各地区政府、人民以及产业界的协同力量——机构及时发现并上报病例,普通发热民众自发去医院检查,各地企业有资源出资源,有技术出技术,合力抑制地区性感染持续爆发。

    值得称赞的是,作为科技公司,百度、腾讯等企业今日根据卫健委发布的官方数据,上线了针对北京、上海、武汉、成都等城市的“发热门诊地图”,普通用户可以直接查找附近所有发热门诊的医疗机构。

    图片来自百度地图

    从技术角度来看,有关部门和技术公司如果能够利用不同维度的海量数据信息,譬如地图数据、航空数据、移动通信数据、电商消费数据等等,进行综合建模和分析,是能够做出针对疫情的重大合理决策判断的。

    当然,这一切的前提是用户同意公开,企业愿意共享相关数据。

    作为科技媒体,我们也在此呼吁,希望有科技产业界人士,更多科技以及大数据公司参与进来,至少可以通过一些技术以及数据层面的判断与思考,为抑制疫情的再次扩散贡献些许力量。