2017年@@2月@@15日国脉发布了数据@@基因@@系统@@@@@@,旨在为政府@@建立数据@@管理体系提供便捷@@、可靠的工具支撑@@,帮助政府@@梳理@@数据@@资产清单@@、统一数据@@口径@@、建立数据@@标准@@、定位@@数据@@资源@@、分析资源关系@@、设计管理模型@@,从而更加有效的提升数据@@资产管理能级@@,实现数据@@@@驱动服务创新@@。

 
  那么该如何理解数据@@基因@@@@@@@@?数据@@基因@@系统@@@@能解决哪些问题@@@@?价值究竟在哪里@@?本文从概念到问题再到实际应用场景@@,为大家详细介绍数据@@基因@@系统@@@@@@。
 
  如何理解数据@@基因@@@@?
 
  DIKW体系认为数据@@@@(Data)、信息@@(Information)、知识@@(Knowledge)和智慧@@(Wisdom)之间是层层递进的关系@@,从数据@@里挖到信息@@@@,从信息@@里得到知识@@@@,从知识@@里获取智慧@@。
 
表@@1.数据@@、信息@@、知识@@、智慧四者比较@@
 
  在这个金字塔体系中@@,我们认为数据@@基因@@位@@于数据@@层和信息@@层@@,它赋予数据@@特定的含义@@,与数据@@一起构成了我们认知信息@@的基础@@。
 
图@@1.数据@@基因@@在@@DIKW体系中的位@@置@@
 
  实际上@@,我们认为数据@@基因@@系统@@@@是管理系统@@的系统@@@@,从业务出发@@,到应用系统@@@@@@、再到数据@@库@@@@、数据@@表@@@@,甚至到驱动服务@@,是数据@@大管家@@,实现从管网络@@、系统@@到管数据@@的跃迁@@。
 
  解决哪些问题@@?
 

       · 缺乏完整@@、统一的信息@@资源体系@@

 
  目前各个地方开展信息@@资源目录体系建设工作@@,往往存在部门提供什么梳理@@什么@@,部门中很少存在某个人员完全掌握该部门信息@@资源@@,需不同科室之间进行调研@@、梳理@@,通常存在不清楚自己部门到底有哪些@@、不清楚其他部门有哪些信息@@资源@@,缺乏完整@@、统一的信息@@资源体系@@。
 

      · 应用系统@@@@建设分散@@、数据@@关系混杂@@

 
  各级地方政府@@和部门在开展信息@@化建设时往往各自为政@@,各自建设应用系统@@@@@@,没有构建统一的基础信息@@平台@@@@,形成了许多信息@@孤岛@@。由于缺乏统一的信息@@系统@@建设标准@@,造成各个信息@@系统@@的数据@@口径不一致@@,系统@@、数据@@之间的关系不清楚@@,使整个信息@@系统@@构架中数据@@的采集@@、存储@@、交换@@、加工@@、利用等各部分间不能循环互动@@,系统@@中的数据@@无法有效共享@@,造成了信息@@资源利用率低@@。
 

         · 数据@@不一致@@、不准确@@

 
  在以数据@@交换@@共享时@@,遇到的最大问题就是数据@@不一致@@和不准确@@@@,举几个实际例子@@:
 
  1、某系统@@个人信息@@的姓名是@@20位@@,另一系统@@的姓名是@@30位@@,在数据@@同步的时候就会出现无法同步的问题@@;
 
  2、一个系统@@数字@@@@0代表@@男@@、数字@@1代码女@@、数字@@2是未知@@,另一个系统@@字母@@@@M代表@@男@@、字母@@F代码女@@,这是一个代码不一致问题@@;
 
  3、在不同系统@@中存在@@“机构名称@@”、“单位@@名称@@”、“公司名称@@”,不知道是否为同一个含义@@;
 
  4、如果是同一个企业@@,某个系统@@里面编码是@@0001,另一个系统@@里是@@0002,其实代表@@的是同一条数据@@@@。
 

      · 数据@@标准管理框架缺失@@

 
  目前很多部门的应用系统@@@@一般是建立在数据@@仓库或基础数据@@库@@基础上@@,数据@@积累已有一定的规模@@。但由于缺乏统一的数据@@标准规范@@,同时缺乏数据@@基于业务的理解@@,导致新建或改造升级的系统@@建设缺乏标准先行的原则@@,难以实现数据@@@@标准@@“循序渐进@@、不断完善@@”的要求@@。
 
  数据@@基因@@系统@@@@的价值在哪里@@?

      · 快速建立信息@@资源体系@@
 
  数据@@基因@@系统@@@@对比筛选出城市核心业务部门的核心业务的信息@@资源建立整个信息@@资源体系建设的模板库@@,通过模板库城市各单位@@可直接查阅相关数据@@元@@、信息@@资源模板@@,以直接沿用或是自定义修改的方式对模板进行选择性的编目@@,达到各部门政务@@信息@@资源快速梳理@@@@、信息@@资源体系快速架构的目标@@。

图@@2.模板设计@@
 

          · 建立数据@@资产地图@@@@

 
  数据@@基因@@系统@@@@通过对城市机房@@@@、服务器@@、应用系统@@@@、数据@@库@@等数据@@资产的梳理@@@@,建立部门数据@@资产清单@@,通过系统@@建立之间的相互关系@@,理清楚系统@@与系统@@之间@@、系统@@与数据@@库@@@@、表@@之间@@、数据@@与数据@@之间的关系@@,实现数据@@@@-数据@@表@@@@-数据@@库@@-应用系统@@@@-服务器@@-机房@@(云@@)的关系展现@@,建立部门数据@@资产地图@@@@。

图@@3.资源关系分析@@
 

      · 辅助数据@@质量问题分析@@

 
  通过数据@@基因@@系统@@@@数据@@元池的建立@@,梳理@@分析各部门@@、各应用系统@@@@中出现的相同的@@、近义的数据@@字段@@,通过分析其频率@@、数据@@定义及数据@@相互之间关系@@(数据@@来源@@@@、数据@@流向等@@),了解各应用系统@@@@之间数据@@标准体系的建设情况@@,辅助数据@@质量问题分析@@。

图@@4.数据@@元关系分析@@
 

      · 辅助数据@@标准的落地@@

 
  通过对各部门@@、各应用系统@@@@数据@@元池的清洗比对@@,筛选出各部门共性@@、关键的主数据@@@@,建立涉及核心数据@@的标准字段池@@,对字段的命名@@、格式@@、长度等属性进行规范@@,依托标准数据@@元池进行信息@@资源信息@@项的编目@@,严格控制新增字段@@,实现共性数据@@元的统一标准规范@@,推动数据@@规范的落地执行@@,建立数据@@模型标准化定义映射@@,推进数据@@标准化规范的落地实施@@。

图@@5.数据@@元池管理@@
 

      · 辅助系统@@开发运维@@

 
  数据@@基因@@系统@@@@提供相关数据@@库@@@@、基础库@@、主题的模型设计功能@@,实现不同系统@@建设需求@@、应用场景下@@,通过标准数据@@元池@@、信息@@资源的组合构建应用模型@@,围绕构建的模型可以实现快速构建应用系统@@@@数据@@表@@@@结构设计@@。当各部门新增需求或者系统@@上线维护后提出修改时@@,可通过数据@@基因@@系统@@@@查看@@现有系统@@的结构@@,设计新的数据@@结构或修改数据@@结构来辅助系统@@开发运维@@@@。

图@@6.模型设计服务@@
 
  总结@@
 
  目前随着政务@@大数据@@@@的发展@@,政府@@对数据@@标准化管理的需求正日益增加@@,未来数据@@基因@@系统@@@@将是连接业务@@、数据@@、系统@@与服务的核心基础设施@@,可扩展的数据@@基因@@系统@@@@将能够产生更多@@更有价值的应用场景@@。

作者@@:国脉信息@@资源研发中心副主任@@ 王路燕@@
责任编辑@@:admin