以“数”制“疫”——大数据推动疫情防控
2020年开年之际,新型冠状病毒带来的肺炎疫情汹涌而至。相对于2003年的SARS疫情,十余年间,新一代信息技术迅猛发展,人类社会已进入大数据时代。面对新型冠状病毒肺炎威胁,我们具备了大数据这一技术手段。城市管理者也在新型智慧城市建设的过程中获取了很多疫情防控和城市管理的经验。
大数据技术对于疫情预防、溯源、治疗、追踪,以及城市管理、物流、信息发布、问题解答,乃至病毒基因测序等方面都存在很高的价值。本文将对大数据应对疫情防控的常见手段、面临问题和措施建议进行简要分析,并重点介绍利用城市大数据平台推动疫情防控的未来发展方向。
一、大数据推动疫情防控的常见手段
面对汹涌而来的突发公共卫生事件,面对多方来源的海量数据,如何联合政企单位科学运用大数据技术,为公众提供更完整、连续、准确、及时的防疫信息,为专家提供追溯疾病源头的方法,为决策者提供传染病发展的趋势,是大数据应用于防疫的三大重要任务。
(一)大数据可以分析“涉疫”人员流动轨迹
通过集成电信运营商、互联网公司、交通部门等单位的信息,大数据可以分析出人员流动轨迹。具体来说,利用数据分析、数据挖掘等技术,一方面可以通过手机信令等包含地理位置和时间戳信息的数据分析绘制病患的行动轨迹;另一方面,根据病患确诊日期前一段时间的行动轨迹和同行时间较长的伴随人员,大数据可以推断出病患密切接触者。综合分析确诊病患、疑似病患和相关接触者的行动轨迹,可以准确刻画跨地域漫入、漫出的不同类别人员的流动情况。既为精准施治提供有力指导,也为预测高危地区和潜在高危地区提供有力依据。
(二)大数据可以追溯传染病源头
利用人工智能、深度学习等新兴技术,联合出行轨迹流动信息、社交信息、消费数据、暴露接触史等大量数据进行科学建模,可以根据病患确诊顺序和密切接触人员等信息定位时空碰撞点,进而有望推算出疾病传播路径,为传染病溯源分析提供理论依据。
(三)大数据可以预测疫情发展态势
通过高危人群,即确诊病患和病患密切接触者的运动情况,结合疫情新增确诊、疑似、死亡、治愈的病例数,借助传播动力学模型、动态感染模型、回归模型等大数据模型和技术,不仅可以分析展示发病热力分布和密切接触者的风险热力分布,还可以预测疫情峰值拐点等重要信息。根据预测的疫情发展态势,卫生部门可以针对发病热力分布,对重点区域强化卫生措施;依据风险热力分布,对可能扩散的区域提前陈设防疫防控资源,避免出现二次爆发、局部爆发和多点爆发。同时,疫情发展趋势预测对于政府部门确定复工时间、出台公共管理和促进经济发展的措施都将起到很重要的作用。无论对决策者还是普通人,心中有“数”,才能提前陈设,防患未然。
二、大数据应用于疫情防控面临的问题
虽然大数据在精准防疫和决策支持方面可以发挥重大作用,但从我国此次应对新型冠状病毒肺炎疫情来看,仍有很大空间值得挖掘和提升。为了进一步推动大数据助力疫情防控,以下三个问题亟需得到解决。
一是数据采集手段原始,质量较低。一些政府部门和基层组织在采集疫情相关数据仍然采用手工作坊式的人海战术。在采集时通常采用手工填表、打电话等方式,这既给基层工作人员增加负担,也无法保证数据的真实性。例如,在采集患者个人信息时,由于没有区分所留手机号为病患或病患家属,可能导致运营商系统核验存在大量身份证号与手机号不一致的结果,这为后续数据分析的准确性和真实性造成不小困难。
二是数据流转存在隐私泄露的风险。相关人员在上报原始数据由于没有加密,遭到了不同程度的泄露,这给被泄露人的生活带来极大不便,不仅有来自陌生人的无端骚扰,甚至会发生地域歧视和人身威胁。为应对新型冠状病毒的防疫需求,有关部门第一时间制作了隐去个人隐私信息的确诊患者相同行程查询工具,但在原始数据上报过程中,数据还是遭到了不同程度泄露。例如,中国地质大学(武汉校区)大一学生吴某乘坐高铁从武汉返回老家,1月24日晚,她在家庭微信群中看到一份“武汉回宁都人员数据表”的表格。除她自己外,还有四、五百人的个人信息被曝光,包括身份证号码,电话号码,具体家庭住址,列车信息等内容。
三是跨地区、跨层级、跨部门的数据流转难以实现。大数据的核心在于互联互通。针对个人的行为分析,手机信令仅能提供较为粗糙的移动轨迹,对区域性分析结果影响较小,但对于轨迹精确度要求高的防疫场景,则需要更多例如火车、飞机、共享单车、网约车、搜索引擎、社交媒体等更多维度跨层级和跨领域的信息。目前,不同企业和政府部门的数据呈现“孤岛”形态,数据亟需高效整合,才能更好应用于疫情治理。
三、增强大数据防疫的策略与建议
基于以上提出的问题,面对不断蔓延的疫情形势,建议有关部门在以下三个方面进行改进和强化。
一是提升采集手段,强化数据校验。要通过各种技术手段,避免数据低效采集。例如,各地疾控部门对于患者的流行病学调查,除了通过对患者直接的调查采访外,还应从有关部门采集患者的手机信令数据、交通出行数据、甚至是微信、支付宝等基于位置服务的数据(LBS数据)。这些数据的准确度往往比手工采集要高得多。此外,还需要进行多方数据校验,从源头上提高数据质量,为后续的数据分析奠定良好基础。
二是保护病患隐私,加强安全规范。越是紧急状态,越需要加强对数据隐私的保护,否则会引发公众不必要的猜测和恐慌。政府机构在信息发布中,应坚守两个原则:一是脱敏原则,发布内容要“经过处理无法识别特定个人且不能复原”;二是非必要不公开原则,发布内容应限于与疾病传播和公众防疫相关,例如日本厚生省拒绝发布患者的国籍数据就体现了这一原则。政府部门在进行数据收集时,也应按照最小化原则收集数据,并在数据流转、使用等各环节设计数据防攻击、防泄露、防窃取等安全防护技术手段,也可以运用安全多方计算、同态加密等数据流通技术,在法律法规赋予的权限内平衡个人信息保护需求和社会公共利益。
三是打破数据“孤岛”,高效运转数据。对于政府部门来说,当前亟需打通各环节数据“孤岛”,综合卫生、通信、交通、公安、人口、气象等多维度数据,进行更加深入的综合分析计算。同时,在进行疫情态势分析预测时,也应不断根据更新的数据调整和优化模型与算法,提升预测模型和算法的准确性。
四、未来城市疫情防控的利器——城市大数据平台
回望此次疫情防控的信息化举措,我们有很多经验值得总结,也有很多教训需要整改。尽管我们有很多城市不断在加强智慧城市建设,但此次突发的公共卫生事件,是检验一个城市真正“智慧化水平”的一次大考。
目前城市的基层管理长期靠突击式、运动式执法,管理治标不治本。对此,还应加强智慧城市建设,设立城市大数据平台,甚至推广数字孪生城市这一概念。
在智慧城市建设初级阶段,由于技术能力、标准框架、顶层设计不成熟,大多数城市重建设而轻应用,数据“聚而不通、通而不用”的情况比比皆是。
然而,在疫情防控的严峻局面下,精确详实的数据归集和实时准确的信息发布显得尤为重要。因此,搭建城市大数据平台的重要性不言而喻。
城市大数据平台就是采集与城市运行相关的信息,进行集中存储,经过数据治理等环节建立的一个城市数据综合处理中枢,并提供城市数据应用服务[1]。
城市大数据平台可以强化跨部门、跨行业的组织统筹力度,提升信息资源整合水平,全面加快城市信息资源的有序汇聚,深度共享、关联分析、高效利用,为政府、企业和市民提供跨层级、跨地域、跨部门、跨业务的协同服务,最大程度地展现城市“智慧”。
数字孪生城市将基于大数据集成和大数据分析实现高效的协同治理。城市基础数据、政府服务业务数据、医疗、交通等实时动态数据,加入地理实体,而地理实体又加载到城市信息模型(CIM),形成实体、模型、数据一体化。这样的全局数据汇总的城市指挥中枢,能使城市的指挥者从全局的视角洞察城市的运行态势和运行规律,在疫情防控等方面不会因数据而“捉襟见肘”。通过城市特征的抽取,管理者能及时掌握包括疫情防控在内的多种公共管理数据,综合各个角度分析疫情发展动态,便于有的放矢、精准施策[2]。这都是未来各地政府提升包括防控疫情在内的社会治理能力的关键方向。
面对这场疫情风暴,各级地方政府迎来治理能力的大考。大数据技术方法在其中,发挥出了关键作用但仍然有提升空间。福祸相倚、危中有机,如能深刻总结经验教训,充分运用大数据技术实现政府决策科学化、社会治理精准化、公共服务高效化,必然将更好地保障人民群众获得感、幸福感、安全感。
[1] 《城市大数据平台白皮书》,中国信息通信研究院,2019年6月。
[2] 《从新冠疫情看智慧城市建设的重要性》,肖鹏,2020年2月。
作者简介
闫树,理学博士,中国信息通信研究院云计算与大数据研究所大数据与区块链研究部高级工程师。主要研究领域:大数据、数据流通。
联系方式:yanshu@caict.ac.cn
刘思源,现就职于中国信息通信研究院云计算与大数据研究所大数据与区块链研究部,从事大数据技术研究。
联系方式:liusiyuan@caict.ac.cn
来源:通信世界