划重点:
l 在“大数据、共享、开放”的主题背景下,如何让数据从封闭、孤立的应用系统中“流动”起来,打造以 “提升政府治理与公共服务能力”目标的政务数据资源“管网”,因特睿应用全球领先的自主创新“管网技术”成功地支撑政务用户实现“跨层级、跨部门、跨系统”的数据与应用资源集成共享工作。
2 颠覆了传统的信息孤岛资源开放以数据库为着眼点的思路,开辟了新的数据集成、融合模式,在“数据接口的重建、重组、重生”上,实现数据应用能力、业务能力的扩展和创新。
3 源自北大软件所17年的技术积累,因特睿在全球范围内独创的基于软件体系结构重建技术的燕云DaaS平台,可以在“无需源代码、无需数据库权限、无需数据字典、无需原系统开发商配合”的情况下,实现多源异构系统的互联互通和数据共享融合。
4 政务信息资源目录建设的超高速度——“7天、5个委办局、19个系统、836个功能项、158个数据接口”,燕云DaaS可以帮助用户减少超过90%的项目沟通协调时间,缩短50%左右的项目开发实施周期,支撑用户以高效与高速的方式完成政务信息资源目录工作。
背景概述:
2015年9月5日国务院印发的《促进大数据发展行动纲要》(以下简称“纲要”)主要任务第一条就是加快政府数据开放共享,推动资源整合,提升治理能力。
纲要针对“数据开放”做了详细的表述,其中就有“制定公共机构数据开放计划,落实数据开放和维护责任,推进公共机构数据资源统一汇聚和集中向社会开放,提升政府数据开放共享标准化程度,优先推动信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境、安监、金融、质量、统计、气象、海洋、企业登记监管等民生保障服务相关领域的政府数据集向社会开放。”
数据开放的本质往往不是政府开放数据库,而是政府开放数据的服务能力,是通过业务场景分析后识别出来的可共享数据服务能力,这两者区别相当大。归根结底,开放数据的建设是需要从一个生态建设的层面来思考的。
对于大数据产业链条上的所有“玩家”来说,数据流通与数据共享、开放意味着可获得更多的数据资源,同时,开放政府数据能全面促进企业发展,带动就业,开辟新战场和激活经济发展的活力。数据开放的重要性不言而喻,它是整个中国大数据“火箭”的助推器。那么数据流通与数据共享、开放工作在发展过程中遇到哪些问题?是否可以通过技术手段来加快和促进数据共享与开放的进程?
带着这个问题,36大数据近期走访了北京一家专门做数据开放、数据流通产品和解决方案的创新企业——北京因特睿软件有限公司(以下简称因特睿),并专访了这家公司的联合创始人兼CEO张颖博士。
下面是详细的专访内容:
36大数据:欢迎因特睿CEO&联合创始人张颖博士,我们想问一下,在Big data landscape图上,燕云DaaS所处的位置在哪里?有没有对标的国外产品?
张颖博士:我个人认为这个大数据全景图并没有真实地反应大数据的全景。即便如此,因特睿的旗舰产品燕云Daas(Data as a Service)可位于Data Source和Infrastructure中。站在燕云DaaS可将任意IT系统API化而提供数据的角度,燕云DaaS可视为Data Source。站在燕云DaaS作为数据和功能的“管网”的角度,可放在Infrastructure中。当然,我们自己更希望燕云DaaS作为大数据的基础设施而广泛存在。
36大数据:在刚刚结束的2017第七届中国智慧城市大会上,您获得了“中国智慧城市杰出贡献人物”并被聘请为智慧城市规划委员会专家,我们想问一下,对于智慧城市的建设,燕云DaaS有什么特别的贡献?
张颖博士:智慧城市是信息技术推动下城市建设的必然产物,是工业化、城市化、信息化的深度融合的体现,需要将信息技术、信息资源融合到城市建设过程中,才能更好地满足城市建设发展的需要。
我国信息化建设30多年以来,各个城市、单位、部门都积累了大量IT系统,有做业务的、有用于办公的,种类繁多且在持续可靠地运行着,这些系统中产生了大量宝贵的数据资源。但由于历史、技术、开发团队缺失、协调不畅等原因,这些信息系统却成为一个个的信息孤岛,它们中蕴含的信息资源不能很好地融合、共享和交互。
打破信息孤岛,除了建设制度、标准、规范以外,亟需强有力的技术手段。燕云DaaS就是技术上主动突破信息孤岛壁垒的一把利器,它能在“无需源代码、无需数据库权限、无需数据字典、无需原系统开发商配合”条件下,将源系统所提供的业务功能和数据开放为接口(也就是常说的API,Application Programming Interface),为系统之间的互联互操作、多源数据汇聚提供强有力的支撑,是真正意义上的基于业务层面实现数据、功能整合,无缝集成、资源汇聚的工具和平台。
36大数据:燕云DaaS产品的应用情况如何?它最常见的应用场景是什么样?这些客户都有什么特点?
张颖博士:燕云DaaS可以提供非常独特的能力——将所有运行在内存中的系统功能和数据进行API化,从而帮助我们的用户和合作伙伴以高效和高速的方式实现多源、异构系统的互联互通和数据共享融合,对A/S、B/S、C/S的应用系统架构全都可以支持,对各种编程开发语言类型和操作系统环境也都可以适用,平均可以为用户减少超过90%的项目沟通协调时间,缩短50%左右的项目开发实施周期。
推出仅1年时间,燕云DaaS已经在212个项目的302个系统中得到应用,成为多家特一级、一级企业的合作对象,市场反响非常强烈。可以说燕云DaaS是一个兼容并蓄、推陈出新的产品。它有强大的整合能力,所以恰到时机地弥补了大数据时代数据从产生到流转,从流转到消费过程中所存在的断层。
也正是因为强大的功能,燕云DaaS的应用场景极为广泛,在政府领域涵盖“政务信息资源目录”建设、“一号一窗一网”建设、“智慧城市”建设、社区“网格化”建设、不动产登记、“金字工程”等多种场景,在企业市场,也涵盖了财税、办公、生产制造、销售、客户服务等多种场景的应用。
36大数据:燕云DaaS产品在技术上的最大创新点是什么?
张颖博士:燕云DaaS产品基于北大提出的运行时体系结构重建技术,通过计算反射和内存分析,能够快速安全地重建出给定系统的业务数据访问接口。无需原开发商配合、无需系统源代码、也无需数据库开放,即可实现数据实时获取、精准融合和无缝集成。这种技术颠覆了传统的信息孤岛资源开放以数据库为着眼点的思路,开辟了新的数据集成、融合模式,在“数据接口的重建、重组、重生”上,实现数据应用能力、业务能力的扩展和创新。
36大数据:我们了解到,因特睿刚刚完成了支持贵阳大数据共享平台,建立数据目录的项目,可以详细和我们说一下这个项目吗?因特睿是如何完成的?
张颖博士:贵阳作为首个国家大数据综合试验区的桥头堡,在大数据开放共享建设中一直走在全国的前列。数据目录体系构建,是建设数据共享交换平台的基础。传统的方法是从底层数据库、数据表、数据字典着眼,由业务人员、开发商、IT技术人员等多方面配合,靠人工将数据库表与业务系统功能进行比对、查找,形成数据目录清单,此方法不仅耗时、耗力还容易出错,而且要求梳理者不仅对业务熟悉,还要对系统逻辑及数据结构、数据字典熟,否则就有可能梳理不出来。
由于燕云DaaS的独特技术特点,我们反其道而行,从业务应用层面着眼梳理数据目录。不直接从数据库入手,而是从业务系统使用者的角度,生成数据访问接口,同时完成数据字典梳理,一举两得。需要协调部门少,生成数据访问接口之后再通过配置与设置支持数据项的分级分类、一数一源、多源校核的清洗,以及脱敏脱密。
我来讲几个数字:我们在梳理试点工作中,仅一周时间,在无原系统开发商配合、无需数据库开放、缺乏数据字典的前提下,成功完成住建、人社等5家单位19个系统836个功能项的梳理,形成162个数据目录字典,以数据接口——也就是API作为载体,生成政府各业务系统的数据台账,并可按需、实时、准确、完整地获取相应原业务系统的数据,成效十分惊人。
36大数据:燕云DaaS主要解决是数据流转、数据开放的问题,数据开放过程中最大的难题在于“数据安全”,燕云DaaS是如何去解决这个问题的?
张颖博士:“数据安全”是一个重要并且复杂的问题,也是客户最关心的问题之一。
燕云DaaS在对给定系统生成API以及支撑API运行的过程中,会完全遵循原始系统的安全访问体系,同时,根据对数据的产生、传送和消费这样一个完整生命周期进行纵向拆解,又横向地将安全问题划分为物理层、传输层、应用层三个层面的问题,通过这种网格化的划分方法,燕云DaaS搭建起了一个分级、分层的立体安全防护体系。并且分别针对体系内的各个环节和层面进行了多样化的安全加固和管控。
36大数据:燕云DaaS和爬虫软件有什么不同?区别是什么?
张颖博士:燕云DaaS与爬虫技术有根本的区别,主要有如下几点:
首先,适配范围的区别:传统爬虫,只能从B/S结构的简单Web页面抓取数据,对于复杂B/S系统、C/S系统,以及App等就无能为力,燕云DaaS则能很好地适配这些类型的系统。
其次,读写能力的区别:燕云DaaS不仅可以生成给定系统的“读”接口,还可以根据用户的授权生成“写”接口。而爬虫通常只能读取数据。
第三,时效性区别:爬虫技术通常是定期爬取数据,而通过燕云DaaS提供的API,则可以实时程序化地获取给定系统提供的数据。
第四,内容格式区别:爬虫爬取的都是原始数据,通常要二次加工才能使用。而燕云DaaS提供的API可以按照客户需求进行规整化,且内容可直接过滤清洗而得到最终呈现。
最后,架构区别:燕云DaaS以微服务的方式独立运行于业务应用之外,且不会像爬虫一样对所有页面都去爬取,因而对原始系统服务器的压力也会小很多。
36大数据:大家都比较喜欢听故事,我们想问一下,当初因特睿做燕云DaaS产品的初衷是什么?有没有比较有意思的小故事?
张颖博士:燕云DaaS技术最早可以溯源到2000年由我导师梅宏院士与北航怀进鹏院士、南京大学吕建院士等一起提出的一种互联网软件新范型——网构软件,研究的就是当互联网越来越成为“一台计算机”,其上的软件系统将发生怎样的变化。我们针对互联网软件内部结构和外部架构、运行支撑平台等进行了深入探索,并研究了网构软件的自主性、演化性、协同性、多态性和反应性等特性和机理。网构软件已连续获得国家973计划支持,并取得了多项突破,包括北大PKUAS应用服务器这样一个具有完整自主知识产权,且支撑了金蝶、东方通、中创等中间件大厂旗舰产品的成果。当互联网成为“一台计算机”,其上软件中的数据和功能必须要能互联互通,因此,燕云DaaS将网构软件的研究成果发扬光大,致力于“让天下没有不能被联通的系统,没有不可被共享的数据”。
36大数据:之前36大数据报道了燕云DaaS后,红杉资本、达成创投这样顶级的投资机构也分别问过我们,想问一下目前因特睿的经营情况,近期有没有融资需求?
张颖博士:2016年是因特睿燕云DaaS正式推广的第一年。围绕“互联网+政务服务”、“数据开放共享”、“社区网格化管理”等关键场景,完成了产品研发、配套方案的设计、典型实例验证等工作。在政务、公检法、教育、电力等行业,分别取得了灯塔项目。积累了深圳坪山新区、武汉硚口区、北京西城区、贵阳大数据委、深圳政法委、南方电网等重要客户,同时与神州数码、武汉力龙、复旦天翼、浪潮、易华录、特立惠、中油瑞飞等重要合作伙伴建立起了长期合作关系,并取得了不错的成绩。
展望2017年,公司将继续加强市场推广的力度,打造“互联网+政务服务”及“数据开放共享”的最优解决方案。当然,因特睿的目标并不限于此。我们是围绕API而开展工作的,拥有将任意资源转化为API的能力,这就是“API经济”所倡导的源头能力,因此,因特睿将会立足已有的市场,面向“API经济”,稳扎稳打,做大做强。
公司于2015年末完成了Pre-A轮融资。公司对于下一轮融资的态度是开放的,希望在2017年完成A轮融资,以支撑技术与产品核心优势的持续积累及市场的培育和发展,目前正在跟一些主流的投资机构在接洽中。
36大数据:如何看待大数据产业2016年的发展?对于2017年你有什么展望?
张颖博士:这个问题很大。我觉得不要去谈大数据,而就谈数据,就谈信息化。云计算的基础设施和数据的开放共享都在2016年进一步推动了信息化建设。然而以大数据为标签的新型信息化要真正看到效果,还有很长的路要走。现在动辄谈有多少数据,谈数据交易、谈区块链这些热词,我个人认为不是一个良性的发展状态。大数据还要看应用。从数据应用的角度,可以将大数据发展分为:描述性、预测性、指导性三个阶段。描述性阶段关注“发生了什么”,并呈现事物的发展历程;预测性阶段关注“可能发生什么”,呈现事物的发展趋势;指导性阶段关注“选择做什么”,呈现不同决策的后果。
如果我们不能知道已经发生了什么,就要去做出可能发生什么、甚至要做什么的判断,肯定是不现实的。因此,我个人认为大数据产业需要从实际需求出发,从落地应用出发。像“数据资源目录”、像“单一窗口”这样一个个服务老百姓的应用做起来了,大量老百姓用起来了,数据不断积累起来,数据反馈应用改进,反馈上层决策,帮助老百姓更快、更好地在日常生活中作出选择了,又进一步让更多人用起来了,大数据典型应用也就成了。当有越来越多的大数据典型应用被越来越多的人用起来时,大数据产业也就成了。
对2017年,我希望大数据发展能更落地一些。我们因特睿作为“数据管网技术”这样一个基础设施提供商,会继续踏实地帮助应用集成商从蕴含丰富数据的各式IT系统中汇集数据、实现系统互通,从而助力他们在应用层面更快更好地创造出价值,让老百姓真正享受到数据的便利、享受到信息化的便利。
关于张颖博士
张颖博士,北京因特睿软件有限公司联合创始人兼CEO。曾获得教育部高等学校科技进步一等奖、中国计算机学会优秀博士论文奖,并入选中国科协首批"青年人才托举工程"。率领因特睿团队研发“燕云IaaS”和“燕云DaaS”系列产品,以API为核心,突破系统之间功能互联互通、数据共享融合机制。其中,燕云IaaS是市场上率先具备x86服务器和非x86小型机异构管理能力、也是首个具备智能终端资源管理能力的私有云管理系统,被联想集团和方正集团OEM成官方产品。燕云DaaS已成功服务于深圳坪山新区一门式综合受理平台、武汉硚口区互联网+政务服务体系信息化服务等多个大型项目,有效带动大数据生态建设,高效推进了大数据应用的真正落地。
原文链接:http://www.36dsj.com/archives/76166