媒体监测和推荐平台

名家讲坛

当前位置:首页 > 名家讲坛 > 详细内容

杨冰之:数据体系构建思考与实践

11月28-29日,由中国社会科学院信息化研究中心和北京国脉互联信息顾问有限公司联合举办的“2018智慧中国年会”在北京隆重召开,以“数据赋能 智慧中国”为主题,共有来自全国部委、省、市、区县电子政务、智慧城市、大数据主管领导、行业专家、企业代表、主流媒体千余人参会。

本文系国脉董事长、首席架构师、首席研究员杨冰之先生于11月29日在“2018智慧中国年会”分论坛--“政府数据体系与一体化平台建设研讨会”上的演讲。

12月28日,我们在这里讲述了关于智慧城市的内容,今天我想与大家分享下个人对政府数据体系建设的看法。首先,感谢大家的坚持,昨天的会议举取得了圆满成功,希望我们今天有更多的思想、观点和成功的实践案例来进行分享。今天的主要话题是“数据体系构建思考与实践”,特别强调政务数据体系概念。

一、2018:政务大数据进入攻坚阶段

第一,2018年政务大数据进入一个攻坚阶段。在这个攻坚阶段,主要有三个关键词:①大事件。2018年发生了众多关于政务大数据的大事件,以国务院的文件为例,今年国务院出台的关于政务数据的文件数量之多、速度之快、要求之高都是前所未有的,对各地提供了巨大支持,也带来了巨大压力,各地也相应出台了很多政策来执行和贯彻国务院的政策。李克强总理在今年常务会上,一半以上的讲话内容都在强调政务大数据和营商环境相关的话题,可见国家高层的重视程度之高。②大平台。昨天国脉颁布了一些奖项,主要是关于各地都在做的大平台,如上海“一网通办”、广东“粤省事”、浙江“最多跑一次”。③大应用。大应用越来越多,尤其是基于网上办事的大应用。

第二,政务大数据正在登台唱大戏。纵观2018年全年,作为政府相关领导经常讨论的话题,部分地区在最近一年讨论政务大数据的会议少则一百场,多则两百场。

第三,对数据与业务进行深度改革,包括营商环境在内的大量的业务也在进行整合。在数据、管理体系方面有很多挑战,这意味着大数据局、大数据管理中心等大部分信息中心从一个“技术支撑部门”变成“管理协调机构”。

第四,人与数据的关系更加紧密。很多人开始关心数据、需要数据、改造数据、建设数据。所以“互联网+政务服务”在2018年突飞猛进、风起云涌、波澜壮阔。

二、理解大数据的三个关键词

要理解政府数据体系,我想大家要理解三个词:数据体系、数据治理和数据服务。

(一)数据体系

只有理解数据体系,才能看见事情的逻辑和趋势、构建数据架构、厘清数据关系、提升数据治理能力。数据体系的核心是数据基因,是把网络、系统、数据、业务、数据库、数据表、信息项、数据元、目录、标准以及部门职责、产品方案等进行有机关联的数据单位。我们要从宏观、中观、微观把各个要素有机地进行联系,数据体系的核心是内在一致性。数据基因就是这样一个标准化的数据单位,没有数据基因,我们很难理解数据体系。为什么我们在做数据汇集时发现加工很难、成本很高,因为很多内在体系、系统基础架构、表的字段、信息口径等不一致,所以数据处理难度非常大。单个系统运行没有问题,一旦两个、三个系统跨数据连接使用就会出现很多问题,当一百个系统在一起运行时就很难解决问题。

所以,现在很多地方都在想办法使数据高效流通。目前主要做法是构建数据共享交换平台,但在数据共享交换平台中交换的数据,应该从数据质量、数据逻辑、数据标准上保持一致,保证系统间的交换。由于每套系统都是一套语言体系,不同语言体系汇聚在一起时,数据就无法理解。为解决这个问题,我们在做的数据治理,就要制订一套完善的数据标准。

(二)数据治理

我相信,在数据汇聚后,数据治理在明年或后年会成为一个热词。数据治理有三个关键点:

1、角色与职责。数据来了怎么办?如果没有很强的数据治理手段,即使有了数据,也会存在大数据不敢用、不会用的问题。对于数据治理,我上次讲过一点,就是角色与职责问题,在数据治理过程中会有多个角色,在座的每个人都有不同角色,市长、书记、主管中心、大数据局及政府机构各部门角色都不一样,如何理清每个角色的过程、职责等要素是个重要的问题。

2、流程与规则。数据治理、数据价值的核心在于流动。数据的特点是越用越多、越用越好,使用数据就会有数据流动,数据的流动是有规则的,必须要用规则理清数据流动涉及的环节、人、基础数据以及什么样的情况下用数据规范起来。为此,需要建立健全的数据流动规则。

3、质量与效果。数据治理可以提高数据的质量和效果,其核心是提高数据的流动性。

(三)数据服务

数据不是拿来看的,而是拿来用的,数据要产生价值、提供服务。而数据服务也有三组关键词:利益与价值、对象与需求、方法与工具。做好数据服务的核心是数据商业模型。在数据服务与数据质量维护上,要做好数据体系与整体架构,再深化数据治理,最终做好数据服务,形成一种数据资产,达到“为数据资产赋值、为数据治理赋权、为数据服务赋能”。

三、数据体系:全局认知和构建数据世界的新框架

数据体系到底是什么?需要进行全局地认知、构建数据世界新框架。数据体系的要素,包括总体、技术层面、业务层面和管理体系层面;数据体系的一些相关词,包括数据流、数据湖、数据仓、数据线,甚至是数据大脑,都特别强调数据体系与这些词的关联;数据体系放大看,要与技术体系、服务体系、业务体系、组织体系、文化价值体系协同发展,数据体系要以技术体系作支撑;做好数据体系,需要健全的机制和严格的质量。

首先,改革要先从服务体系开始。不管是“最多跑一次”,还是“一网通办”都是在服务体系方面进行改革。在做好服务体系后,又会衍生一个问题,如何用一流服务体系打造业务体系?随着业务体系的不断优化,部分部门在进行组织体系改造,而做好业务体系的前提是做好组织体系。有很多人对数据体系的认知是静止、片面、表层和单向的。做好数据体系的关键是做好文化价值体系,要对数据定义、功能、数据和人的关系、现实世界和数据世界的关系进行清楚地定位。这是个不断循环的逻辑,把数据体系关联起来。

第二,很多人对数据体系的认识仍停留在技术导向和业务导向的认知中。很多人是以业务为导向,认为数据体系是服务于业务的,这句话还缺乏成熟的思考,数据体系、数据建设不仅是业务导向,还应该是动态、全面、深度、多维的;要以数据为导向,遵循数据逻辑,而非遵循业务逻辑,因为只有用数据的逻辑才能改造业务逻辑、改造业务体系,最终实现用数据逻辑来改造我们的组织体系。

第三,过去的数据体系是机械运动体系,是单系统、单应用的体系。现在我们要把这些性能关联起来,构建数据生命体系,复杂、关联的体系。字段与字段、系统与系统、表与表之间以及软件、硬件、数据、机构、业务都要做到有机关联,最终形成动态、灵活、演化的大数据生态体系。我曾讲过“数据如水”,从城市水资源管理体系进行思考,要源头治水,尽量不要有脏东西流进来,如果脏水进来要进行处理,把脏水变成优质水,过程要管水、调水,我们水放哪里去,最后一个是龙头放水。我们怎么帮部门治水,过程管理和控制怎么做到管好、存好、用好,这是一个较为复杂的过程。

如何用数据世界看待现实世界?这是一个解构、重构、创新、优化、一体化的构建过程,要把数据体系、业务体系、组织体系协调管理起来,建立数据指挥调度平台;把标准、规则、流程建立起来,把数据逻辑、业务逻辑及如何实现数据最小颗粒度、标准化关联和责任体系管理起来;为了管理好数据,还要把目录、标签、清晰应用、主题服务管理起来。

四、数据体系--复杂体系需要数据大脑

数据体系需要数据大脑作为支撑。如图所示,我们理解数据体系有大量业务体系数据,包括来自物联网的数据和来自互联网的数据。数据指挥控制系统具有采集、汇聚、加工、应用、服务等功能,以省市为例,要做好接口和其他各项工作,建立标准规则、目录规则、交换规则、加工规则,把数据元、目录体系、事项与业务体系关联起来;在数据指挥控制系统中,还要把公共支撑体系建立起来,公共支撑体系发挥的作用是指令、监控、考核、评估,主要包含目录体系、交换共享、清晰比对校验、计算加工、接口库、可视化和安全保障七大方面。

在采集、汇聚中,要把部门库、基础库、主题库按部门层级建立起来;加工要进行清洗、比对、计算;应用要进行开放、建模、可视化;服务在页面端、移动端有安全标准、数据资源标准、业务体系标准、目录标准等四个标准。要把规则在系统运用中体现出来,把数据指挥控制系统各自的数据做到有机关联和内部一体化,保障数据一致性。

以数据指挥中心为核心,数据大脑的职能就是对数据进行指令、对系统进行监控、考核数据角色,主要做的是赋权、汇聚、提供、制定等功能:①赋权(角色体系),在数据体系中主要发挥四个角色作用,管理者、提供者、需求者、运维者;②汇聚(存储体系),如省级与市级之间基础库、主题库、部门库等数据的联通;③提供(公共功能支撑体系),为数据做整合加工、清洗比对、交换共享等;④制定(规则体系),包括数据标准、交换共享规则、目录规则、加工规则等。

五、数据体系的技术架构

大部分数据体系的技术架构,只是做技术的拼装,没有把技术之间的要素进行有机关联。这里要注意,指挥控制中心平台能通过各种结构、规则有机关联各个系统,和过去的技术体系架构最大的差异是,整个技术体系架构也是个生命体,像人一样,要用大脑,而不是物理、机械地的东西。

通过这个新的技术架构,我们真正能形成采集、汇聚、融合、治理、开发、维护一体化的长效机制。现在看到的体系和过去的体系是完全不一样的,绝对不是各个系统简单地拼装、关联,而是一个生命体。构建一站式数据资源管理与服务平台,全面管控数据质量,提升数据资源规范化管理能力,改善传统政府部门数据信息不共享导致的“数据烟囱、信息孤岛”现象,从根本上发挥出政府数据的最大价值,打破公共数据孤岛,完成政府大数据融合。

六、数据体系工作推进图

以省级为例,首先,明职责,组建工作小组、明确人员职责、建立工作制度;第二是摸家底,要把家里的网站、系统等统计清楚;第三是建目录,制定目录编制标准,建设数据资源普查系统,开展数据资源填报,数据资源核实、确认,编制省级数据资源目录;第四是梳理事项,建设事项管理系统,梳理省市县三级事项,进行省市县事项标准化建设,包括事项“一数一源”建设和百项高频事项试点;第五是建立数据库,数据资源分类建设,根据目录,进行数据归集、清洗、比对、入库;第六是促进服务提升,包括数据目录服务、交换共享服务、数据开放服务、决策分析服务、绩效考核服务。

通过资产清单、全量目录、归集目录做到数据可知,通过数据标准、清洗比对、数据入库做好数据可管,从交换、共享、开放、决策四个方面做好数据可用。

七、地方政府创新服务:激情与冲动

新一轮数字化大潮、数字政府时代来临,数据驱动倒逼管理型政府转变成服务型、平台型政府,以建设人民满意的服务型政府为目标,大数据时代的政府治理关系正面临解构与重构。对于我们软件公司/数据公司/咨询公司来说,最大的挑战是什么?作为一个咨询公司最大的挑战是取名字,像“最多跑一次”、“不见面办事”、山东的“一次办好”、河南提出的“一次办妥”,还有深圳“秒批”等。是否有比“最多跑一次”更好一点的名称?不仅朗朗上口还要形象,就只有几个字区分开来?名字是非常重要的。作为一家咨询公司,实际上我们都很焦虑,各个地方都在竞赛,都要进行创新,我们有着很强的紧迫感。

八、营商环境:政府服务质量的试金石

很巧的是11月28日国脉发布《2018首届中国营商环境评估报告》,下午李克强总理就在国务院会议中强调营商环境。那么如何快速地提高营商环境?我们需要从数据优化、流程优化、组织优化来实现,做到现代化、规范化、重视激励机制建设;做到共同愿景,达到标准化、数据化、知识体系和流程化;做到效率与质量的统一、进行组织转型。

九、数据驱动政府服务创新的动力体系与制约因素

数据驱动政府服务创新的动力因素是一场成本、效率与质量之间的持久竞赛,还体现在地方竞争力上,主要表现为对资源的争夺。但问题也很多,我主要提出四个问题:①数据问题,数据的质量、规则、流动性问题;②制度问题,机制、规则和部门角色相关;③能力问题,数据应用和场景应用方面的能力问题;④意识问题,包括权利意识、责任意识、风险意识和奖惩意识。

十、数据与服务的关系:一体两面

数据和服务的关系是一体两面。数据和服务是一体的,数据就是服务,数据支撑、衍生、优化服务,数据流与服务流进行融合,通过创新可以提高数据的流动性;数据和服务是两面的,要用数据优化整合流程优化、用数据替代物质材料、用数据流代替人工流。这里遇到的挑战主要是通用与个性、公平与效率、动力与压力、规范与创新、成本与质量之间的问题。

十一、服务创新无止境--老年证的故事

最后强调一下服务的境界问题,这里以老年证为例:①境界一,用系统动态管理和服务社区老人,这是数据可知;②境界二,到点为老人主动发送老年证,也就是一位老人到了七十岁自动为他快递一张卡,要主动服务;③境界三,其他系统按身份证为老人自动服务;④经济饿死,让老人刷脸或指纹就可享受服务。给老人发个身份证、服务证不能说明服务质量,这是远远不够的,服务是无止境的。

所以我们这里提出了老年证如何管、如何发、如何用的场景,但有个挑战是本地的老人可享受服务,外地的老人如何享受均等的服务?还有其他的应用场景,包括之前的工作历史、健康情况、语言、生活习惯的需要等。

创新永无止境,转型永不止步。我们要进一步认清政府在数据世界的作用和角色;洞察技术持续进步的推动,满足人性需求;在政务工作中,应该借鉴学习非政府机构,尤其是一些网络企业的创新服务;未来面向数字政府建设,应加快内部组织改造,实现治理能力与治理体系现代化。

附:国脉,是领先的大数据治理和数字政府专业提供商。创新提出“软件+咨询+平台+数据+创新业务”五位一体服务模型,拥有数据基因和水巢DIPS两大系列几十项软件产品,长期为中国智慧城市、智慧政府和智慧企业提供专业咨询规划和数据服务,广泛服务于信息中心、大数据局、行政服务中心等政府客户、中央企业和金融机构。自2004年成立以来,已在全国七大区域设立20余家分支机构、5大技术研发基地,服务客户2000余家,执行项目5000余个,连续多年开展中国政府网站、智慧城市、互联网+政务、营商环境等公益评估评选活动。被业界誉为中国信息化民间智库知名品牌、电子政务优选咨询机构,国内首倡智慧政府理念,首创智慧城市、数据治理、互联网+政务评价体系,首推数据资产普查、全口径数据资源目录、数据元标准化、数源确认与供需对接、最多跑一次事项梳理、营商通等产品,信息资源编目、公共数据普查等业务全国占有率和影响力名居榜首。