今年年初,贵阳在大数据领域又有一项新进展——政府数据开放平台正式上线运行。虽然不是全国最早的政府数据开放平台,但贵阳政府数据开放平台的搭建过程,却为政府的数据资源开放共享平台建设如何突破瓶颈,提供了一条新思路。
数据开放挑战
解读贵阳案例前,先来看看政府数据资源开放共享的瓶颈。
目前大数据领域已经形成一个共识,在中国当下所存储的数据中,中央政府各部门、地方政府以及履行公共服务职能的机构与企业所占据的1/3数据,是所有信息当中质量最高的,这是由政府社会管理职能所决定的。这部分数据的开放,不仅能够有效提升社会运行效率,还能激发出巨大的商业价值。
国家已经充分意识到大数据的价值和政务数据开放的重要性,并推出了一系列的政策举措。2015年9月,国务院发布了《促进大数据发展行动纲要》(以下简称纲要),首次在国家层面提出了“公共数据资源开放”的概念,将政府数据开放列为了中国大数据发展的十大关键工程。与此同时,纲要还明确了要在2017年底前形成跨部门数据资源共享共用格局,2018年底前建成国家政府数据统一开放平台。
从实际情况来看,在国家战略的推动下,政府数据开放共享已经成为社会共识,各级政府在规划社会经济发展的蓝图中,都将大数据战略放在了极为重要的层面。目前,全国已经有23个省市出台了74项与大数据发展相关的政策,上海、北京、广州、贵州等10余个省市建设了专门的政府数据开放网站和平台。
虽然取得了一定成绩,但挑战也显而易见。
最显著的是建设国家政府数据开放平台的人力和时间成本。北大软件研究所曾经对神州数码、中软、东软等有资质的信息系统开发厂商进行过调研,得出的结论是一个孤岛式的政府信息系统要将它开放共享,人力成本一般是1000人/天。如果放大到全国至少10万个以上政府信息系统,全部开放共享则至少需要1亿人/天。
再进一步的调研结论是,以纲要提出的“2018年底前建成国家政府数据统一开放平台”为时间节点,如果要利用1亿人/天的人力成本实现政府数据开放,需要20万名中高端软件工程师。且不说现有中高端软件工程师数量紧俏,即使是普通的软件开发人员,我国每年也还有30万-40万的缺口。
时间和人才问题只是表面的困难,当前更深层次的挑战在于,由于长期以来,政府各政务部门根据自身职能自行主导建立各类职能系统,缺乏统一规划和数据核准,致使政务数据源分散、数据相对割裂、数据格式各异、应用及服务碎片化,无法准确掌握全局数据资产状况。
这就导致在进行政府数据资产化梳理工作中,往往需上级单位统筹下属各委办局,通过行政命令方式协调各单位信息部门、职能部门以及不同的系统开发厂家高度配合,进行人工数据分析、匹配及整合。协调难度大、成本高、耗时耗力、难以推进且数据实时性较低、可用性不高。
甚至随着数据资产的价值逐渐得到认可,某些政府部门和公共机构把自己掌握和获取的数据作为自己利益和权力的一部分,看成是私有财产不愿共享开放,搞部门保护,导致各个部门之间的数据融合难度进一步加大。
除了这些主观因素之外,政府数据开放共享过程中,同样还涉及到诸多客观存在的实质性的问题,特别是相关法律问题,比如隐私保护问题、信息安全问题以及各个部门信息立法的问题,等等。
换一种思路
作为全国大数据产业发展的先行城市,贵阳同样也面临这些打破信息孤岛实现数据开放领域的时间和人力成本挑战以及沟通协调难题,但从2016年底开始梳理政府各部门的数据资源目录,到2017年初政府数据开放平台上线,短短一个月时间,就完成了首批634个数据集以及101个API(程序编程接口)资源的开放工作,基本涵盖贵阳市级所有政府部门及相关直属事业单位共50余个部门,进度和速度可谓惊人。
贵阳市解决上述诸多挑战一个重要的思路,就是与其纠结这些难以绕开的挑战,不如回归到技术层面,从网络层面将此前各个信息孤岛的网络体系变成开放自适应的体系。
以数据开放贡献第一步所需要的数据资源目录梳理和对接为例,2016年12月,贵阳市启动燕云DAAS实现政府数据资产化解决方案在贵阳市政府试点应用,建立贵阳市政府数据资源目录管理与服务系统,对住建局、人社局、卫计委、工商局、公安局5家试点单位进行政府数据资源目录梳理及纳入系统。
整个过程通过3个工作组,合计5人,用5天时间就完成了5家试点单位共计19个系统836个功能数据项梳理,生成“委办局-业务系统-功能数据项清单”,并对其中162个主要业务功能数据项进行API接口生成。
因为是从技术层面用自动化的网络分析工具完成整个生成过程,所以不需要政务信息系统的原开发商的完全配合,不需要业务人员配合完成数据与系统的匹配、也不需要政府部门导出数据库核心数据,只需要业务部门授权系统界面账户密码访问权限,就能通过生成的API接口活化生成数据目录、数据字典并纳入数据目录管理与服务系统,再通过可视化系统对外提供政府数据资源的目录查询功能及数据资源管理功能。
更为通俗的解释,即相当于在获得许可的前提下,给各个政务部门和相关单位的数据库接入一根管道,在保证安全的基础上,利用这根管道跨部门获取所需数据,进而生成数据资源目录。
从贵阳的实践来看,这种“索引管道式”的数据共享交换方法,不仅绕开了各类障碍,还解决了现阶段全量政府数据资源目录梳理过程中“有什么、在哪里”的问题,为下一步数据清洗加工脱敏脱密和数据开放共享奠定一定的基础。
当然,贵阳的这种技术解决思路想要实施,仍然有一个重要前提,即地方政府部门的观念转化和决策推动,这又回到了问题的根本,改革的一大难点在于思想观念的转变。贵阳能够走出这一步,其他一些地方政府,是否有勇气和决心去挖掘这样一座座沉睡的数据矿山?
原文链接:http://www.lwinst.com/cjgjzk201707/3994.htm?from=message&isappinstalled=0