媒体监测和推荐平台

大数据

当前位置:首页 > 大数据 > 详细内容

数据归集须关注“四个陷阱”

政务数据归集是消除“信息孤岛”、拔掉“数据烟囱”的关键之举,也是支撑各部门业务流程再造、简化办理环节、精简办事材料的基础工程。在一些领域,只要数据归集到位,应用开发到位,数据归集的确“一归就灵”,立马就能显现出再造流程的巨大威力。但随着实践的深入,数据归集存在的一些深层次问题也逐渐浮出水面,制约着“数据灵药”更深更广发挥作用。从烟台百日会战的实践看,主要有“四个陷阱”:

数据源头陷阱。数据要参与流程再造,准确全面是基础。但由于历史的原因,各级各部门信息化水平参差不齐,导致数据源头残缺不全,对全面有效的梳理数据造成了很大的困扰。有的数据不全面,缺少部分关键数据;有的数据不准确,存在明显失真;有的数据更新不及时,数据时有时无。还有,一些与企业群众密切相关的重要历史数据,仍以纸质或其他非结构化的方式存储,没有及时电子化,影响了数据的共享应用。另外,还值得关注的是,在一些基层执法部门,仍有不少的行政行为特别是监管行为根本没有实现信息化,停留在手工执法阶段。这些信息缺失,连基本的信息公开都不能实现,更别说把数据应用于信用建设、流程再造等更深领域。

数据碎片陷阱。数据要在流程再造中发挥作用,首先要使数据的结构化,让数据彼此之间产生联系,发生关系,进而输出需要的结果。然而,在数据归集中,很多部门产生的数据大多以碎片为主,离结构化应用相去甚远。比如,一个人的婚姻状态是房产、公积金等领域办事的基本数据,而要判断一个人的婚姻状态,既需要民政婚姻登记的数据,也需要法院审判领域的数据。然而,法院审判领域属涉密系统,地方数据部门根本无权归集,这就造成婚姻的状态的判断只能是碎片化的归集,碎片化的输出,最终留给应用部门自行判断。所以,很多的数据在实际应用中,多是用于简单的查询核验,服务于单一业务场景,仅仅是发生了“物理变化”,没有产生“化学反应”,大数据的叠加倍增效应未能显现。

数据地域陷阱。当今世界,是一个流动的世界。一个人往往会跨地域就业,一个企业往往要跨区域经营。这些个人或企业的历史数据,要实现顺利归集,就需要一个更高层级的部门来实施。所以,当一个层级比较低的部门来实施数据归集时,只能偏于一隅,取得零碎化的数据片段,而不能用数据来给法人和个人准确画像。仍以婚姻数据为例,一个地市级政府,查询婚姻数据时,只能查询到在本地婚姻登记机关进行登记的人员信息,查不到地区之外进行登记的数据。即使将来通过接口形式可以查询全省的数据,也无法查询到省外数据。另外,有一些人员在婚姻登记时提供的证件时士兵证、军官证、护照等,在业务系统查询时都无法返回结果,给数据的进一步整理加工造成很大障碍。

数据体制陷阱。目前普遍存在事权在市县,数据在省级甚至国家部委的情况。多数部门数据都在省级及以上集中存储,有的甚至是国家级系统,下级部门只有业务系统的使用权,并没有系统管理权,只能录入数据,不能导出数据。这就造成下级政府数据归集时,获取数据只能去上级主管部门申请回传数据,获取难度很大。如果对应省级部门的支持力度不够,很容易出现进度缓慢,甚至会无法推动。还有一点,数据归集往往要改造相应的系统,建设相应的传输工具,而层级较低的部门大多使用的国家、省垂直的系统,没有改变系统的权限,无法顺利实施。

以上数据归集的“四个陷阱”,虽然是局部问题,但严重影响数据的严肃性、准确性,客观也制约了数据的深层次应用。各级各部门特别是市县数据管理部门在实施数据归集过程中,要高度重视这些问题,切实加以解决。

一是要加快完善本地数据。由于各部门信息化程度参差不齐,部分领域很多重要数据仍以纸质形式存储。特别是本次机构改革,一些部门职能、人员变动较大,一些宝贵数据面临丢失问题。各级各部门要全面推进历史数据电子化工作,完善历史数据,力争使数据源头全面、准确。

二是加强与上级数据部门的沟通。数据管理体制的障碍,造成需求和供给不匹配,数据的有效供给不足。市县政府要加强与上级数据管理部门的同协调,推动国家、省级数据向市级返还,让数据在各地真正落地。

三是以应用为导向,加强数据清洗比对。市县搞数据归集,切忌大而全,而是要以应用为导向,部门需要什么数据就归集什么数据,什么数据有用就治理什么数据。可选取市民和企业重点关注的领域,一个领域一个领域归集,一个领域一个领域的应用,使数据归集实实在在发挥应用的作用。