摘要@@:大数据@@时代的来临为我国社会信用@@体系建设提出了新的发展要求@@, 顺应时代潮流@@, 构建全国统一@@的信用@@信息数据平台@@是必然趋势@@, 据此@@提出了公共信用@@信息数据归集@@应遵循的一@@般性原则@@。运用实证法对@@“苏州市@@公共信用@@信息基础数据库和@@服务平台@@@@”建设实践进行了分析@@。肯定了信用@@信息平台@@取得的现实性成果@@, 同时@@分析了数据归集@@与共享@@中存在@@的质量问题@@, 从技术和@@制度层面论述了提高数据质量的对策@@, 并展望了大数据@@视角下数据归集@@的新思路@@。

  随着云计算等@@现代新兴信息技术的广泛深入应用@@, 大数据@@ (big data) 吸引了越来越多的关注@@@@, 其应用领域也逐渐融入到社会的各行各业@@, 带来了一@@个崭新的大数据@@时代@@。在@@征信领域中@@, 数据是其业务开展的基本资料@@, 通过大数据@@的相关技术可以将各种数据进行采集@@@@、分类@@、整理@@、加工@@从而形成信息产品@@, 并在@@必要时提供给用户使用@@, 提高了征信服务的质量和@@工作效率@@。为应对大数据@@潮流@@, 江苏省政府@@下发了@@《江苏省大数据@@发展行动计划@@》, 明确规定在@@信用@@大数据@@方面@@, 实现信用@@信息归集@@、交换的全覆盖@@。苏州市@@也积极响应政策@@, 调整优化网络结构@@, 完善功能@@, 建成@@“一@@网三@@库一@@平台@@@@”的架构@@, 持续实施信用@@信息@@“提质扩面@@”工程@@, 提高数据归集@@质量和@@效率@@, 积极推进@@“互联网@@+信用@@”, “以用促进@@”, 完善服务平台@@@@。然而@@, 由于我国征信行业发展较晚@@, 尚处于起步阶段@@, 还有诸多问题待解决@@。

  本文基于各省市@@出台的相关信用@@信息管理条例@@, 首先提出了信用@@信息数据归集@@应遵循的一@@般性原则@@, 然后从数据归集@@的质量问题出发@@, 通过一@@个典型的信息共享@@平台@@实例@@——“苏州市@@公共信用@@信息基础数据库和@@服务平台@@@@”的建设实践@@, 分析数据归集@@与共享@@中存在@@的问题@@, 从技术和@@制度层面研究提高数据归集@@质量的对策和@@方法@@, 以期为信用@@信息系统建设和@@信息服务水平提升提供参考@@。

  一@@、公共信用@@信息数据归集@@的原则@@

  目前@@, 虽然各级地方政府@@都陆续出台相关信用@@信息管理条例@@, 例如@@《湖北省社会信用@@信息管理条例@@》《威海市@@公共信用@@信息管理办法@@》《深圳市@@公共信用@@信息管理办法@@》等@@相关文件@@, 都从法律上肯定了信用@@信息的重要性@@;然而@@, 对于数据归集@@@@, 大多数条例仅仅是提及@@, 深层次@@的归纳总结尚不明确@@, 各地在@@归集数据时没有统一@@标准规范@@, 从而导致各种数据丢失@@@@、失真等@@现象@@。据此@@, 从各省市@@颁布的条例@@、办法中总结出数据归集@@应遵循的一@@般性原则@@。

  第一@@@@, 共享@@性原则@@。为深入贯彻落实@@“创新@@、协调@@、绿色@@、开放@@、共享@@”的发展理念@@, 政府@@各部门归集形成的公共信用@@信息原则上应予以共享@@@@, 涉及国家秘密和@@安全的@@, 应按相关法律法规执行@@。公共信用@@信息按共享@@类型可以分为无条件共享@@@@ (即可提供给所有部门以及社会群体使用的信息@@) 、有条件共享@@@@ (即可提供给相关社会群体共享@@使用或仅能够部分提供给所有社会群体共享@@使用的信用@@信息@@) 和@@不予共享@@@@ (即不宜提供给其他部门共享@@使用的信用@@信息@@) 三@@种类型@@。各部门业务信息系统原则上通过国家电子政务@@@@内网或国家电子政务@@@@外网承载@@, 通过共享@@平台@@与其他政务@@部门共享@@交换@@数据@@, 并加快建设本地共享@@平台@@以进行数据对接@@。共享@@平台@@牵头部@@门应该建立完善的信用@@信息资源目录分类@@@@、采集@@、共享@@交换@@、平台@@对接@@、网络安全保障等@@方面的标准@@, 形成完善的公共信用@@信息资源共享@@标准体系@@。

  第二@@@@, 安全性原则@@。为保护数据的内向性和@@机密性@@, 维护国家利益和@@社会秩序@@, 保护数据形成者自@@身的合法权益@@, 在@@信用@@信息数据归集@@的过程中必须重视数据的安全性@@, 特别是在@@网络环境下@@, 数据的安全性问题更应引起人们的关注@@@@。安全性原则@@应包括以下具体内容@@:一@@是要求相关部门统筹建立公共信用@@信息数据归集@@管理机制和@@评价机制@@, 各部门和@@数据归集@@平台@@管理单位应加强@@对信用@@信息归集@@、使用等@@全过程的身份鉴别@@、授权管理和@@安全保障@@, 确保归集数据的安全@@。二@@是各社会主体@@在@@利用信用@@信息时要保护商业秘密和@@个人隐私不受侵害@@, 同时@@, 应当注意维护数据形成单位与个人的合法利益@@, 尊重他们提出的对部分涉及商业秘密和@@个人隐私信息的限制利用的意见@@。

  第三@@@@, 准确@@性原则@@。数据的准确@@性在@@归集过程中是至关重要的@@, 只有归集准确@@的数据才能实现各系统的无缝对接以及平台@@之间的互通互享@@, 从而实现系统的实时@@和@@动态更新@@, 以满足各社会主体@@查询利用的需要@@。所以@@, 必须确保所归集的数据与本部门所掌握数据的一@@致性@@, 同时@@, 应按照国家信息资源相关标准进行信息资源的采集@@@@、存储@@、交换和@@共享@@工作@@, 坚持@@“一@@数一@@源@@”、多元校核@@, 统筹建设公共信用@@信息资源目录体系和@@共享@@交换@@体系@@。归集其元数据@@, 根据标准元数据定义消除@@数据项的歧义性@@, 从根本上保证数据的原始记录性@@, 统筹规划@@, 合理归集@@。

  上述三@@大原则分别从不同的方面保证了数据的准确@@性和@@安全性@@, 优化了数据归集@@的质量@@, 在@@一@@定程度上有利于归集工作的顺利开展@@。另外@@, 公共信用@@信息归集应实行目录管理@@, 公共信用@@信息的项目内容@@、公开属性@@、更新频率@@、使用权限@@、数据格式@@、归集程序@@、归集路径@@、归集时限@@、披露方式等@@要素应由信用@@信息目录规定@@, 从而确保信息的准确@@性和@@安全性@@。

  二@@、案例简介@@——苏州市@@公共信用@@信息基础数据库和@@服务平台@@@@

  自@@2003年@@起@@, 苏州市@@就着手建设征信平台@@@@@@, 成立市@@社会信用@@体系建设领导小组并于@@同年@@颁布了@@@@《苏州市@@企业@@信用@@管理办法@@》, 整个项目围绕信用@@制度@@、征信平台@@@@、行业信用@@建设@@、信用@@服务市@@场培育@@、企业@@信用@@管理等@@目标强力推进@@。2012年@@, 市@@公共信用@@基础数据库和@@服务平台@@系统建设正式拉开序幕@@, 并于@@2014年@@成立了市@@公共信用@@信息中心@@。此后@@, 整个信用@@服务平台@@的运作已逐渐成熟并形成了@@自@@己的架构@@模式@@@@。

  (一@@) “一@@网三@@库一@@平台@@@@”的架构@@模式@@

  目前@@, 苏州市@@公共信用@@信息服务平台@@已形成了@@以@@“一@@网三@@库一@@平台@@@@”为核心的架构@@模式@@@@。具体包括@@:一@@个目标@@ (一@@网三@@库一@@平台@@@@) , 两级模式@@ (市@@、县@@两级@@) , 四@@层结构@@ (对外服务层@@、业务功能层@@、基础设施层@@、系统软件层@@) , 五@@大模块@@ (部门前置机子系统@@、数据交换接口系统@@、中心数据处理系统@@、中心业务管理系统@@、信息服务及生成信息产品系统@@) , 六大安全措施@@ (安全管理制度@@、应用安全@@、数据安全@@、物理安全@@、系统安全及网络安全@@) 。五@@大模块@@相辅相成@@, 共同致力于一@@个目标@@@@, 使信用@@信息数据安全@@@@、风险防范@@、技术和@@管理得到了良好的配合@@ (参见图@@@@1) 。

图@@1 公共信用@@信息服务平台@@架构@@

  (二@@) 平台@@与数据库的对接@@

  目前@@, 苏州市@@公共信用@@信息服务平台@@已与包括@@市@@教育局@@、市@@人民法院@@@@、市@@工商局@@、水利局等@@@@39家成员单位的业务系统@@、4县@@6区的前置平台@@对接@@@@, 与包括@@“诚信南京@@”“信用@@无锡@@”“诚信姑苏@@”等@@22家地方信用@@平台@@相链接@@。企业@@信用@@基础数据库收录了@@100多万家企业@@数据@@, 数据总量达@@5000万条@@, 个人信用@@数据库达@@2000多万条@@@@, 形成了@@8个大类数据@@, 总数据达@@7000多万条@@@@。苏州公共信用@@信息服务大厅的运转日渐成熟@@。与此同时@@@@, 由企业@@提供强有力的技术支持@@来维护平台@@的日常运行@@@@, 企业@@、政府@@各部门以及用户三@@方共同围绕服务平台@@这个中心来进行相关的数据交接@@、运行@@, 从而最终生成信用@@产品@@, 方便了公民对个人信用@@信息的查阅@@。同时@@, 实现了静态的信用@@主体@@基础信息与动态的各类监管执法信息相互关联和@@有机统一@@@@@@ (参见图@@@@2) 。

图@@2 公共信用@@信息平台@@运行@@@@

  (三@@) 信用@@产品的推出@@

  目前@@, 该平台@@主要以提供信用@@报告为主@@。据统计@@, 截至@@2017年@@6月已产生了大约@@3328份信用@@报告@@, 为各企事业单位的信用@@评估做出了极大贡献@@。随着平台@@运行@@日渐成熟@@, 各种信用@@产品也将陆续推出@@。除信用@@报告之外@@, 还产生了基于信用@@报告的信用@@咨询@@服务以及信用@@评价方法等@@@@28类专项服务@@。既方便了公民对信用@@信息的查阅@@, 又促使平台@@不断改进技术方法@@, 推陈出新@@。

  诚然@@, 苏州市@@公共信用@@信息服务平台@@自@@运行@@以来@@, 取得的成效尤为可观@@, 也给其他省市@@征信平台@@@@建设以借鉴意义@@。然而@@, 其中@@依然存在@@@@一@@些亟待解决的问题@@, 尤其是在@@数据归集@@方面值得深思@@。

  三@@、公共信用@@信息数据归集@@的现存问题@@

  信用@@信息系统数据归集@@的信息主要是获得相应资质或受到相应处罚的市@@场主体@@的信息@@, 具体分为基本信息@@、行政许可资质信息和@@违法违规信息等@@三@@大类@@。通过对苏州市@@公共信用@@信息基础数据库的调研发现@@, 在@@公共信用@@信息的数据归集@@和@@共享@@方面还存在@@信息孤岛@@@@、信息安全@@、数据归集@@标准等@@方面的问题@@。

  (一@@) “信息孤岛@@”依然存在@@@@

  所谓的@@“信息孤岛@@”, 是指相互之间在@@功能上不关联互助@@、信息不能共享@@互换以及信息与业务流程和@@应用相互脱节的计算机应用系统@@。大体可分为数据孤岛@@、业务孤岛@@、管控孤岛@@、系统孤岛四@@种类型@@。其中@@, 在@@征信行业中数据孤岛现象比较严重@@, 它存在@@于所有需要进行信用@@信息数据共享@@和@@交换的系统之间@@。不同部门间的数据信息不能共享@@@@, 采集@@、整理@@、交换的数据不能进行交流@@, 数据出现脱节@@, 即产生信息孤岛@@@@。

  征信服务平台@@中@@“信息孤岛@@”的产生主要是技术层面的问题@@。例如@@, 许多垂直管理政府@@部门@@ (如工商@@、法院@@、税务@@、银行等@@@@) 的信用@@信息都采用数据集中交换模式集中统一@@存储@@和@@共享@@@@, 这就导致有些数据不能及时归集到信用@@服务平台@@的信息系统@@, 而出现严重的数据脱节现象@@。另外@@, 数据从分散到集中再到应用必须经过采集@@@@、转换@@、筛选@@、加工@@、交换等@@数据处理和@@交换过程@@。任何一@@个过程的数据处理质量得不到保证@@, 数据中心的数据质量就难以得到保证@@, 而信息的共享@@服务完全有赖于数据中心的数据@@。因此@@, 在@@数据归集@@过程中@@, 其质量依赖于供需双方分别保证@@。

  另外@@, 由于信用@@信息中有些属于敏感信息@@, 所以@@在@@归集过程中也会出现数据孤岛问题@@, 尤其是在@@涉及到隐私权的问题上@@。例如@@, 在@@归集公安对个人的处罚@@、交通处罚等@@信用@@信息时@@, 为保护个人隐私@@, 许多相关信用@@信息都不会归集到信用@@服务系统中@@。导致数据归集@@情况不能满足日益增长的查询@@、应用需求@@。这也是导致@@“信息孤岛@@”现象的一@@个重要因素@@。

  (二@@) 信息的安全性仍待加强@@@@

  信息安全@@是使数据处于安全不被威胁的状态@@, 避免数据被恶意访问@@、泄露@@、丢失@@, 保证它的真实准确@@@@、可读性@@。征信信息系统中的信息安全@@主要表现在@@信息的保密性@@、完整性@@、准确@@性以及可用性@@。

  以苏州市@@信用@@信息服务平台@@为例@@, 其数据归集@@主要包括两种形式@@。一@@是数据库直连@@, 工商等@@中央垂直管理的政府@@部门采取的就是这种形式@@。这种形式采用的是数据库对数据库的模式@@, 各个数据库之间都有安全的物理隔离措施@@, 通过专线进行输送@@。只要前期的数据采集@@没有质量问题@@, 那么归集之后的数据就可以是准确@@的且安全可靠的@@;另一@@种是通过@@“诚信苏州@@”网站进行及时报送@@。而这种模式就可能出现人为的失误@@, 因为所有的数据信息都是人工录入网页@@, 再由网站进行数据报送@@, 这就直接导致数据的安全性@@、准确@@性得不到保证@@, 存在@@泄密@@、错报@@、漏报的可能性@@, 严重影响业务活动的质量和@@效率@@。

  (三@@) 数据归集@@的标准尚未统一@@@@

  由于不同的政府@@部门采用不同的数据存储@@格式@@, 在@@传输过程中采用不同的数据接口@@、不同的接口参数@@, 导致归集之后的数据格式@@各异@@。例如@@, 目前@@苏州信用@@平台@@收录的行政许可大约有@@60.5万余条@@, 但同样是行政许可@@, 在@@“日期@@”的标注上@@, 有的许可文件有明确的发证日期@@和@@生效日期@@@@, 而有的只是有发证日期@@@@, 或者有的文件只是有使用日期@@@@。在@@日期@@格式上没有做到很好的统一@@@@。再如@@, 在@@行政处罚上@@, 有罚款@@、责令改正和@@罚款@@、限期整改以及吊销执照等@@几种方式@@, 然而@@处罚的力度和@@具体的实施范围没有做到统一@@标准@@。此外@@, 除了行政许可和@@行政处罚@@, 其他方面的数据归集@@还没有相应的数据标准和@@数据库接口参数@@, 归集来的数据依然是杂乱无章的@@。数据归集@@的标准不统一@@必然会影响信息的共享@@@@, 公共信用@@信息归集的标准亟待统一@@@@。

  四@@、大数据@@视角下公共信用@@信息数据归集@@的策略@@

  大数据@@的快速发展加速了技术变革@@, 使得数据归集@@更加自@@动化@@、准确@@化和@@及时化@@。同时@@又对公共信用@@信息数据归集@@提出了新的发展要求@@。为适应大数据@@的背景@@, 必须建立科学的信用@@信息归集机制@@, 实现静态的信用@@主体@@基础信息与动态的各类监管执法信息相互关联@@、有机统一@@@@, 以达到整合各类信息资源@@, 消除@@“信息孤岛@@”, 确保归集的数据完整@@、准确@@、及时以及动态更新@@。

  (一@@) “顶层设计@@”深化公共信用@@信息服务@@

  顶层设计@@就是要从制度@@、法律法规上进行完善@@, 建立相关的数据归集@@方面的法律法规@@。国际上信用@@体系比较完善的国家@@, 都十分重视信用@@的立法@@。在@@信用@@体系最发达的美国@@, 颁布了@@《公平信用@@报告法@@》等@@16部信用@@管理法律@@。我们应借鉴美国的经验@@, 制定信用@@管理相关的法律法规@@, 建立信用@@信息征集和@@使用的长效机制@@。2017年@@6月颁布的@@《网络安全法@@》就为公共信用@@信息数据归集@@提供了法律保障@@。除此之外@@, 还应尽快出台@@《个人信息保护法@@》《征信法@@》等@@完善信息安全@@@@、数据管理等@@方面的法律法规@@, 确保公共信用@@信息数据的规范性和@@准确@@性@@。同时@@, 通过整体规划使横纵打通@@。一@@方面推动全国信用@@信息平台@@与地方信用@@信息平台@@@@“纵向@@”互联互通@@, 实现信用@@数据的跨区交换共享@@@@@@;另一@@方面推动信用@@信息共享@@平台@@与部门或行业信息平台@@@@“横向@@”交换共享@@@@, 实现信用@@数据的跨行业交换共享@@@@@@, 打破数据孤岛现象@@。

  (二@@) 打通数据标准@@, 消除@@歧义性@@

  打通数据标准@@, 即以统一@@的社会信用@@代码为基础@@, 建立全国统一@@的公共信用@@信息目录标准@@、系统建设标准@@、信息安全@@技术标准和@@信用@@行业服务标准@@。最重要的是定义标准元数据@@, 消除@@数据的歧义性@@。为了提高信息系统的数据质量@@, 首先需定义数据资源的标准元数据@@。以苏州市@@信用@@信息服务平台@@为例@@, 目前@@主要是统一@@社会代码@@、统一@@格式@@, 以及定义标准元数据目录@@, 以消除@@不同部门数据之间的歧义性@@。同时@@, 在@@定义具体数据项属性时@@, 含义一@@定要描述清晰@@, 不能存在@@异义性@@, 这是提高系统数据质量的基础@@。通过标准元数据的定义@@, 首先可以消除@@各数据项的歧义性@@, 规范信息存储@@和@@展现格式@@;其次@@@@, 可以用标准元数据作为基准对归集数据进行校验@@@@、转换@@和@@对比@@, 以形成初步@@“干净@@”的数据集@@。

  (三@@) 完善信息安全@@基础设施@@

  完善信息安全@@基础设施@@, 首先就要完善物理隔离措施@@, 即加强@@网络的建设@@, 优化网络架构@@, 加强@@CA (certificate authority, 认证机构@@) 和@@RA (registration authority, 注册机构@@) 两种管理实体建设@@。目前@@, 苏州已建成@@@@“一@@网三@@库一@@平台@@@@”的网络架构@@, 应该在@@此基础上更加完善系统@@, 实现数据归集@@与系统升级同步进行@@, 推动数据库更新与时俱进@@。同时@@, 还应注意与政务@@网等@@进行物理隔离@@, 实行专人负责制@@, 加强@@信息的安全基础设施建设@@。

  (四@@) 引进先进的数据处理技术@@

  大数据@@根植于云计算技术@@, 利用云计算强大的数据处理能力@@, 可以为挖掘大数据@@丰富的信息提供强有力的工具@@。利用云计算技术@@、数据挖掘技术等@@先进的数据处理技术@@, 实现信用@@数据的自@@动化@@、批量化归集@@, 对数据进行智能化@@、精准化的比对@@、清洗@@和@@更新@@, 确保信用@@数据准确@@@@、实时@@、全面@@。目前@@, 苏州市@@信用@@平台@@主要是采用基础的数据处理技术@@, 利用系统技术自@@动完成对数据的去重@@@@、纠正逻辑错误@@、规范格式以及数据应用等@@的处理@@。可以在@@此基础上引入国外相关方面的数据处理工具@@, 例如@@Hadoop等@@, 用高传输率来访问应用程序的数据@@, 正适合那些有着超大数据@@集的应用程序@@, 不仅可以提高工作效率@@, 更能在@@数据源头对数据质量进行精准的把握@@。

  (五@@) 加强@@相关人员的技能培训@@

  数据归集@@工作对专业人员有着严格的要求@@, 不仅涉及到专业技术@@, 还对信息的安全性@@、保密性等@@有一@@定的要求@@。如果数据归集@@不及时@@, 归集到的数据不完整@@、标准不统一@@等@@不仅会影响到相关信用@@产品的质量@@, 而且还会降低工作人员的效率@@, 徒增不必要的麻烦@@。加强@@对信用@@信息数据归集@@方面的人员培训@@, 是提高工作效率@@、完善工作质量的必然要求@@。尤其是要加强@@银行等@@@@重点行业@@, 以及政府@@@@、事业单位等@@的专业技术人员@@、金融从业人员等@@重点人群的各类专业技术培训和@@职业道德培训@@, 进而实现信用@@大数据@@的高效利用和@@充分共享@@@@。

  五@@、结语@@

  综上所述@@, 解决公共信用@@信息数据归集@@问题@@, 提高信用@@信息服务质量@@, 除了要加强@@数据质量保障的制度建设@@、人才建设@@, 更要立足于自@@身@@, 采用科学@@、先进的技术手段@@, 在@@最大程度上对数据进行筛选@@@@、去重@@、清洗@@、校验@@, 从整体上把握数据质量@@, 在@@实践中找到完善平台@@数据质量的方法和@@原则@@。在@@统一@@代码@@、统一@@标准的基础上将归集的数据制成电子地图@@以做大数据@@分析处理@@, 从而挖掘有用的信用@@信息@@, 打造出更多@@的信用@@产品@@, 实现信用@@产品服务的常态化@@。

  大数据@@的相关技术有着广阔的发展前景@@, 借助于这些先进技术@@, 未来公共信用@@信息数据归集@@会朝着更加自@@动化@@、智能化的方向发展@@。各国政府@@@@、自@@然人@@、法人及社会团体对信用@@信息产品的要求越来越高@@, 而在@@大数据@@背景下利用云计算@@、数据挖掘等@@先进技术对信用@@信息服务进行管理@@, 可提高公共服务保障水平@@, 增强政府@@与公民之间直接的双向互动和@@交流@@, 从而实现公共信用@@信息的充分共享@@以及信用@@产品服务的常态化@@。

责任编辑@@:qinpeng