点击上方图片链接回看@@年@@会视频@@ 

11月@@26-27日@@,由中国社会科学院信息化研究中心@@、北京@@国脉互联信息顾问有限公司@@、舟山国脉集团有限公司联合主办的年@@度改革创新研讨盛会@@(第@@16年@@)——“2020智慧中国年@@会@@”在北京@@召开@@,以@@“十四@@五@@前瞻与智治社会建设@@”为主题@@,共有来自全国部委@@、省@@、市@@、区县电子政务@@、智慧城市@@@@、大数据@@主管领导@@、行业@@专家@@、企业代表@@、主流媒体千余人参会@@。

本文系国脉集团产品经理@@钟乙乔@@于@@11月@@26日@@下午在@@“2020智慧中国年@@会@@”上的@@“新基建赋能数字社会@@——数字经济篇@@”分论坛上的@@演讲@@,演讲主题为@@“数据@@母体@@-数字基建@@底座@@”,内容通过现场速记整理@@@@,未经本人审核@@。

钟乙乔@@.jpg

「国脉集团产品经理@@ 钟乙乔@@」

 

<--------------------以@@下为演讲内容@@------------------>

各位领导@@、各位嘉宾@@,大家下午好@@,我是网脉科技@@产品经理钟乙乔@@@@,前面各位领导@@讲了关于数字新基建的一@@些看法@@、思路和运行方式@@,作为数字经济的一@@个@@底层@@,接下来我给大家介绍数据@@母体@@@@——数字基建@@底座@@。

一@@、建设背景@@

(一@@)数据@@治理@@的难点@@痛点@@

在数字新基建的发展环境下@@,我们长期关注@@数据@@治理@@这个@@重要关注@@点@@。只有做好数据@@治理@@才能把新基建的最基层工作做好@@,数据@@治理@@的难点@@、痛点主要体现在以@@下几方面@@。

一@@是数据@@标准化@@低@@,很多业务公司@@、技术公司在创建一@@些数据@@库或者一@@些表字段时@@,对于字段的规范@@、长度和类型都没有做到极致的标准化@@@@。

二@@是数据@@交换@@成本高@@,正因为数据@@不标准@@,这些问题就导致做数据@@交换@@的时候成本比较大@@。比如实际项目需要外部接口或者底层数据@@去交换@@的时候@@,就要花大量的时间和人力做对接@@,甚至完成对接以@@后的结果并不是非常理想@@。

三@@是底层数据@@重视程度低@@,业务数据@@的基础库和数据@@元池存在着缺失@@。

四@@是跨行业@@数据@@融合@@困难@@,发生跨业务数据@@融合@@时非常困难@@。数据@@之间无法完成精准的供需匹配@@。

这些都导致多网并存@@、信息孤岛@@、二@@次@@录入@@、数据@@壁垒的现象存在@@。

(二@@)数据@@标准化@@影响数据@@应用质量@@

在规划方面@@,很多大型项目在开展的前期缺乏数据@@规划@@,缺乏系统性的框架结构@@@@;

在标准依据方面@@,数据@@标准的依据标准都是不一@@的@@,有些使用了国家@@标准@@,有些使用了行业@@标准@@,有些甚至没有使用任何标准@@,这导致了数据@@定义各异@@;

在应用方面@@,我们对于业务字段和技术字段会产生一@@些歧义@@,同样的字段名称在不同的业务和技术体系@@当中代表的意思不同@@,可能造成逻辑关系脱节现象@@。

所以@@要做好数据@@标准化@@@@,做好字段的标准化@@@@,对象定义的标准化@@@@,代码的标准化@@@@,还有业务指标的标准化@@等@@@@。

(三@@)统一@@规范的数据@@元是数据@@标准化@@的基础@@

数据@@元是数据@@的@@最小的单元@@,它的质量好坏直接影响对语义的认知@@,在我们的数据@@传递@@、流通@@、交换@@、融合@@、共享当中@@,它都是最底层的@@、最基础的要求@@,数据@@元是数据@@的@@“底层建筑@@”、在数据@@体系@@中具有基础地位@@,数据@@母体@@是新基建的底层@@。

(四@@)政策要求做好数据@@化标准工作@@

近年@@来@@,国家@@及地方相关政府主管部门接踵发布各自领域数据@@元标准和数据@@元目录@@,如国家@@标准化@@委员会@@《电子政务数据@@元标准@@》、北京@@《法人基础信息数据@@元目录规范@@》、安徽@@《公共信息用信息数据@@元目录@@》、辽宁@@《渔业信息化基础数据@@元@@》、湖南@@《地名数据@@元规范@@》等@@。

二@@、数据@@母体@@

(一@@)产品概念@@

数据@@母体@@是基于公共数据@@元@@与电子政务主题词的数据@@治理@@综合服务@@平台@@@@。它提供高质量标准化@@的服务@@@@,为数据@@治理@@与数据@@质量再造提供综合性解决方案@@,构建全球数据@@体系@@的语言词典@@——数据@@元字典@@。

数据@@母体@@主要从@@“软件@@、数据@@、咨询@@、服务@@”四@@个@@方面为数据@@治理@@提供服务@@@@。软件@@方面@@,我们有数据@@治理@@的综合服务@@平台@@@@、数据@@标准发源地和数据@@质量标准检测场@@、标准化@@数据@@的加工工具@@、原始数据@@质量的诊断工具@@;数据@@方面@@,收录了国家@@出台的标准文件@@,收录了电子政务主题词@@、公共数据@@元@@,还有标准术语@@和标准分类等@@@@,为数据@@治理@@提供一@@套标准政务数据@@设施@@,为异构数据@@间的共享@@、转换@@、互操作@@、质量管理@@、内容加工与服务@@等@@提供基础@@;咨询@@方面@@,当用户有需求@@,我们从行业@@领域@@、时间维度为用户去梳理应该涉及的最基层的标准@@,还包含一@@些指标评估等@@的咨询@@服务@@@@;服务@@方面@@,我们提供数据@@服务@@和产品服务@@@@,也可以@@数据@@@@+产品组合的方式来做好数据@@治理@@@@。

(二@@)框架结构@@

数据@@母体@@框架@@.png

框架结构@@图@@

产品框架结构@@主要分为数据@@来源@@@@、存储层@@、功能层及应用场景@@@@。其中数据@@来源@@主要为国家@@标准文件@@、行业@@标准文件及其他@@;存储层@@包含公共数据@@元@@池@@、电子政务主题词库@@、数据@@模型库及标准数据@@元池@@;功能层主要包含池库定制@@、数据@@比对@@、数据@@清洗@@、数据@@元关联@@分析@@、标准设计@@、模型应用等@@功能@@;主要的应用场景@@包含标准查询@@、数据@@建模@@@@、质量分析及数据@@检测@@。

(三@@)运行逻辑@@

运行逻辑@@是依托@@于数据@@母体@@当中的数据@@@@,经过清晰比对@@,把标准数据@@存入到公共数据@@元@@池当中@@,通过对数据@@的定义和业务的定义来对应用场景@@做设定@@,构建数据@@模型@@。再将这些数据@@分层分级分类@@,形成数据@@集市@@以@@供用户按需选择@@。另一@@方面@@,通过规则配置对用户原有数据@@进行质量检测@@,将结果生成诊断的报告@@,附加咨询@@梳理服务@@给出对原有数据@@情况的整改建议@@。

实例@@:在政务大厅或者网上办事的时候@@,有些材料会写来源@@渠道是共享还是自备@@,共享和自备的前提是底层数据@@要统一@@和规范@@,也就是说大家所获取到的材料名称必须与实际数据@@库里的数据@@名称一@@致@@,不能出现歧义@@,不然数据@@无法共享@@。

(二@@)产品优势@@

1.数据@@量全@@:目前已收录国家@@发布的标准文件@@1764份@@,公共数据@@元@@372883条@@,范畴目录@@190个@@、范畴表政务主题词@@24151个@@,行业@@主题词@@16180个@@,标准术语@@1909个@@、分类编码@@@@1304个@@,区划地址@@63895个@@(部分细化到省@@市@@县区街道楼道@@)。

2.颗粒度细@@:收录的数据@@细化到了数据@@元标识符@@、数据@@元类型@@、数据@@元表示@@、标准文件标准号@@@@、版本@@(年@@代@@)号@@、ICS编码@@、CCS编码@@、发布机构@@。

3.自定义配置@@:数据@@维度@@、领域可配置@@、数据@@模型可配置@@、清洗规则可配置@@、诊断报告可配置@@。

(三@@)应用场景@@

1.快速建模@@生成数据@@元基础库@@。基于场景需求定制@@,特别是各地政府对数据@@元采集@@、整理@@、建库的规划需求@@,通过标准数据@@元组合@@,可快速建模@@形成法人@@、船舶等@@各行业@@数据@@元基础库@@。

2.辅助构建标准核心数据@@元池@@。核心数据@@元池建立@@,是各地政府信息资源@@标准化@@的基础@@。根据实际需求@@,梳理出核心数据@@元@@,并通过数据@@元清洗@@比对@@、标准化@@处理和智能标注@@关联@@@@,构建标准的核心数据@@元池@@。

3.行业@@数据@@元评估清洗标准化@@@@。助力提升数据@@元质量@@、规范数据@@交换@@底层@@。

4.事项梳理标准数据@@表单建设@@。平台@@支持标准数据@@元自由组合@@、关联@@、建模@@,可协助快速创建和生成标准数据@@表单@@,且数据@@元标准规范统一@@@@,也有助于@@“多表合一@@@@”,提升事项梳理效率和标准化@@程度@@。

5.软件@@质量问题与标准化@@检测@@。借助相关数据@@元标准@@、体系@@、方法@@,可在一@@定程度上辅助软件@@系统在研制和维护过程中形成适用于各领域系统数据@@质量问题的高效预防措施和最佳解决方案@@。

6.基于数据@@服务@@创建应用模型@@。通过大数据@@分析应用@@、自定义报表@@,实现数据@@的可视化展示@@;通过组织画像@@、个@@人画像等@@数据@@多维度分析@@,清晰了解业务对象的现状与需求@@。

三@@、产品价值@@

(一@@)全要素建立数据@@资源体系@@@@

“数据@@母体@@”支持海量数据@@元存储@@,用户可根据需要批量导入数据@@元到其专项数据@@库或系统@@,对其数据@@元资产进行存储@@,并利用平台@@提供的数据@@元目录@@、数据@@元资产统计@@、数据@@元清洗@@、数据@@元校验@@、智能关联@@等@@模块@@,有效管控数据@@元@@。

(二@@)全阶段推进数据@@标准落地@@

“数据@@母体@@”收录千余份@@涵盖国际@@、国家@@、地区@@、行业@@权威的数据@@元及数据@@元值域的标准规范@@、数据@@字典等@@@@,并持续扩充@@,借助数据@@元标准化@@处理@@,推动数据@@元标准落地@@;用户对数据@@元标准的选择@@、反馈@@,也有助于@@各行业@@数据@@元标准的优化改造@@,并进一@@步提升数据@@元@@“上层建筑@@”数据@@、信息资源@@、事项等@@的标准化@@@@。

(三@@)全流程提升数据@@质量@@

依托@@“数据@@母体@@”,对数据@@元进行标准化@@检测评估和可视化统计分析等@@@@,有助于从数据@@元层面排查@@、追溯和定位数据@@质量问题发生的症结所在@@,包括数据@@元名称同义重复@@、值域格式不规范@@、数据@@元与其值域不关联@@等@@@@;基于问题有针对性地对数据@@元进行清洗比对@@@@、标准化@@、智能标注@@关联@@等@@@@,可有效提升数据@@元及数据@@质量@@。

(四@@)全方面打造共享开放应用@@

“数据@@母体@@”支持数据@@元消费者@@、提供者@@、服务@@者@@、运营者等@@注@@册入驻@@,并提供丰富的@@API和多样化数据@@采集方式@@,实现数据@@元产业链内外各类资源不断集聚@@;平台@@用户基于交易和支付系统@@,可进行数据@@元相关资源与服务@@流通@@@@,促进数据@@元资源应用变现与服务@@创新@@。

四@@、核心服务@@@@

(一@@)数据@@元质量检测服务@@@@

利用数据@@母体@@@@,根据预先配置的规则@@、算法和度量指标等@@@@,对客户拥有的数据@@元资产进行在线质量检测@@,包括数据@@元同义重复@@、标准化@@程度等@@@@,并可视化呈现检测结果@@;同时根据客户需要@@,可由专业咨询@@人员提供深度数据@@元质量检测评估分析报告与相关改进@@、优化方案等@@服务@@@@。

(二@@)数据@@元池库定制服务@@@@

根据客户需求@@,通过标准数据@@元选取组合@@、清洗比对@@、智能标注@@关联@@及数据@@元目录编制@@、模型创建等@@@@,快速构建各种领域@@、行业@@、主题的标准数据@@元基础库@@、核心数据@@元池和核心数据@@字典@@,且支持通过@@API开放相关数据@@库授权服务@@@@。

(三@@)数据@@元建模@@服务@@@@

提供大量数据@@元模板@@,用户可自主选购自己需要的标准数据@@元模板@@;当标准数据@@元模板无法满足需求时@@,用户可借助数据@@元公共服务@@平台@@@@、以@@标准字段自定义创建契合自身业务需求和业务应用的数据@@元模型@@。

(四@@)数据@@元在线标准设计@@服务@@@@

针对不同行业@@@@、不同主体@@@@,基于现有权威国际@@/国家@@/地区@@/行业@@数据@@元标准和标准数据@@元@@,结合实际应用场景@@@@、行业@@特色和客户需求@@,在线设计@@、整理@@、编目@@、编制符合需求的各种领域@@/行业@@、主题的数据@@元标准@@;提供数据@@元标准导出@@、整理@@成符合相关格式规范的数据@@元标准文件等@@服务@@@@.

五@@、应用案例@@

数据@@母体@@已经在多省@@市@@@@,多个@@地区@@@@,项目上实际应用@@。

浙江省@@@@—— “最多跑一@@次@@@@”全省@@事项数据@@串梳理@@

深圳市@@@@——政务信息资源@@目录白皮书@@(2017)及核心数据@@字典项目@@

浙江省@@@@——全省@@核心标准数据@@元池建设@@

海南省@@@@——法人库@@、人口库基础数据@@元@@\扩展数据@@元信息梳理@@

公安部@@——大数据@@时代基础信息采集录入规范研究@@

南宁市@@@@——政务信息资源@@目录梳理服务@@项目@@

舟山市@@@@——舟山市@@@@民生基础信息数据@@标准和交换@@规范编制@@

上海徐汇区@@——政务信息资源@@目录体系@@建设@@

北京@@西城区@@——大数据@@资源目录梳理服务@@项目@@

佛山三@@水区@@——政务信息资源@@资产清单梳理@@

···

数据@@母体@@产品今天就介绍到这里@@,谢谢大家@@。



走进@@“2020智慧中国年@@会@@”

2020智慧中国年@@会@@新闻专场@@

image.png

扫描二@@维码@@直接进入@@


注@@:获取更多@@会议资讯及嘉宾演讲资料@@,欢迎登录@@“2020智慧中国年@@会@@官网@@”,或关注@@@@“国脉数字智库@@”公众号@@@@。

image.png

责任编辑@@:hongqiong