媒体监测和推荐平台

特别报道

当前位置:首页 > 特别报道 > 详细内容

利用社交媒体大数据,助力公共卫生应急管理

习近平总书记在《求是》刊发文章《全面提高依法防控依法治理能力 健全国家公共卫生应急管理体系》,明确提出,鼓励运用大数据、人工智能、云计算等数字技术,在疫情监测分析、病毒溯源、防控救治、资源调配等方面更好发挥支撑作用。

新媒体时代,尤其是社交媒体的迅猛发展,其传播的简洁、即时与交互功能集聚了数量巨大的用户,用户在社交媒体上生成的内容,是人类日常生活的附属产品,较为真实地反映了用户的行为特征。

社交媒体大数据在公共卫生应急管理中发挥的信息预测功能包含两个层面:

一是社交平台蕴含着大量疫病监测和早期预警潜在而有用的信息。利用社交媒体大数据进行疫情监测,进行信息排查和预警,可以实现早发现,从而为早诊断,早治疗打下基础,真正贯彻习近平总书记提出的“预防为主的卫生与健康工作方针,将预防关口前移,避免小病酿成大疫”。

二是社交媒体也是用户情绪、态度和看法的汇集地,不乏用户对自己关心或利益密切相关的事件所表达的观点和意见。尤其对于突发疫情来说,其中蕴含丰富的民意和民情,利用社交媒体大数据可以进行舆情研判,进而制定引导舆论的策略和措施,切实践行习近平总书记在疫情期间多次做出的“要加强舆论引导”的重要指示。

社交媒体助力重大突发疫情监测的优势在于用户对自我健康状况的高度掌握,具体表现为公众主动参与社交网络中的健康信息获取与分享,而这种行为又促使他们更积极地参与健康数据管理。社交媒体所呈现的健康大数据不仅是无数公众量化自我的结果,还呈现了数据生产者为健康大数据定义的关系性与社会性。

技术的发展让基于网络的媒体信息越来越丰富,早在2009年,Jeremy Ginsberg 等人就利用网络搜索数据监测流感的流行,利用搜索词使用频率所构建的模型可以提前预测每周流感病例的发生情况;Kathy Lee等人利用Twitter 上的数据建立实时的疾病监测系统,系统不仅可以用于对季节性流行病如流感的爆发进行早期预警,同时还可以监测不同类型的癌症病患者分布特征等;Michael S. Deiner等人对Twitter、播客等平台的帖子进行数据分析,发现了过敏性和传染性结膜炎的季节性趋势。

2020年,城市数据团通过已掌握的疾病传播特征和人口迁徙数据,对新冠肺炎的传播路径和范围进行预测,以此来判断出疫情的重灾区、潜在疫区和疫情高风险地区,从而实现分级管控。

社交媒体大数据助力重大突发疫情的舆情监测的优势在于,社交媒体已经深嵌于人们的日常生活,社交媒体中网民的凝聚力发挥越来越大的作用。通过社交媒体的大数据监测,可以通过研究社交媒体用户在疫情话题传播过程中的行为分析网民的舆论倾向性。遗憾的是,受学科壁垒及社交大数据搜集能力所限,迄今而至,公共卫生大数据的研究难以在一般研究机构开展,研究设想与实践之间仍然存在着较为明显的脱节。

早在2010年,广东省公共卫生舆情监测平台就以TRS( 文本检索系统)技术为基础的,利用自动搜索平台,建立了字典库和网页库,形成了自动集成和人工辅助相结合的舆情监测平台,用于跟踪公共卫生事件发展动态和发现突发公共卫生事件、重点事件媒体跟踪和开展风险评估。但需要注意的是,这个平台的利用度并不高。从目前可以看到的公开数据显示,该平台监测到的公共卫生事件比例很低,不到20%——这与WHO预测成功率90%以上有着巨大差异,WHO参与调查的几乎所有暴发疫情信息都是首先从这些信息中获得的。

网络技术的进步正日益塑造着公共卫生的未来。伴随着医疗类社交媒体走入人们视野,移动终端的健康大数据逐渐走向社交场景,公众更主动地进行医疗健康信息搜索与发布。

一方面,互联网让用户更及时、直接地搜索与个人相关公共卫生信息,使得网络搜索查询成为区域内集体健康状态的表征。另一方面,用户可以在网络上发布或讨论个人的健康状况、疾病问题和疾病治疗,这些由用户生成的内容正迅速成为发现、报告、处理公共卫生事件的重要信息源。应该说,每一个“个体”在互联网上的传播内容,与医疗数据结合,共同建构了当下公共卫生事件的走向。

社交媒体大数据的公共卫生预测有其独特优势,首先是它的即时性和成本效益,其次是社交平台允许本地化和个性化信息,能延展相关信息收集的外延,具有更精细的时间和空间分辨率,从而实现更准确的预测。我们要充分发挥其优势,通过多数据源的社交媒体抓取及机器人学习、分析,可以更全面、更准确地监测重大疫情的形成和发展,排查公共卫生事件。同时,在数据分析的基础上,结合重要的相关现实数据,如地区文化、居民生活方式等,才能在早期完成预测、发现和评估事件发生的机率和发展趋势,进行舆情研判,从而为政府部门在面对重大疫情等突发公共卫生事件中提供及时的预警,为防控政策提供重要参考。

来源:广州日报