随着互联@@网@@技术@@、云计算@@、物联网等信息技术的@@快速发展@@, 电子政务@@也向着大数据@@方向发展开来@@, 整合@@、互联@@、共享@@、重构@@、高效将成为政务@@大数据@@@@发展的@@趋势@@。

  但政务@@大数据@@@@的@@开放共享@@在提升办事效率@@、辅助政府@@决策的@@同时@@, 也面临着数据@@安全@@问题@@, 考验着数据@@治理@@能力@@。复旦大学国际关系与公共事务学院副教授@@、数字与移动治理实验室主任郑磊告诉本刊记者@@, 政务@@数据@@@@开放后的@@关键问题是对这些@@数据@@的@@利用@@和再利用@@@@, 目前政府@@的@@数据@@治理@@能力还有待提高@@。

  数据@@开放不等于简单的@@信息公开@@

  《中国电子政务@@发展报告@@@@ (2017) 》 (以下简称@@《报告@@》) 指出@@, 政务@@大数据@@@@的@@来源@@不同于其他行业和领域的@@大数据@@@@, 有其独特的@@含义和价值@@。数据@@来源@@多样复杂@@, 政务@@大数据@@@@来源@@大致可包含以下四类@@:第一是业务数据@@@@, 是政府@@在权力行使过程中采集和产生的@@数据@@@@, 特征是价值密度大@@、以架构化数据@@为主@@;第二是社会化数据@@@@, 是银行@@、水电@@、交通等企业@@、公民在社会活动中产生的@@数据@@@@, 特征是相对集中@@、体量大@@、价值密度中等@@;第三@@是@@互联@@网@@数据@@@@, 是在互联@@网@@上活动时产生的@@数据@@@@, 部分反映社会活动状况@@, 特征是数据@@分散@@、体量大@@、结构多样@@;第四是物联网数据@@@@, 是通过互联@@网@@设备采集获得的@@气象@@、环境@@、影像等数据@@@@, 特征是体量大@@@@、高增长@@、噪声大@@。

  大容量@@、多类型的@@政务@@数据@@@@面临着复杂的@@开放共享@@问题@@。

  香港大学法律学院博士后研究员陈咏熙指出@@@@@@, 政府@@数据@@开放共享@@不同于简单的@@政府@@信息公开@@。从价值取向上看@@, 前者是用@@数据@@驱动来改善经济@@、政务@@、社会服务@@, 后者是通过保障公民知情权来促进民主监督@@;从数据@@量上看@@, 前者是大规模的@@数据@@化@@, 后者主要是纸面信息和少量电子化@@;从数据@@处理流程上看@@, 前者是多向且动态流转的@@@@, 后者是单向且相对静态@@;从数据@@处理能力上看@@, 前者是基于大数据@@运算能力的@@普及化@@, 后者主要取决于个人的@@处理能力@@。

  郑磊也认为@@, 开放数据@@跟传统的@@信息公开有所不同@@。世界银行对开放数据@@的@@定义是@@, 数据@@可以被任何人出于任何目的@@自由地利用@@和再利用@@@@。完整的@@@@、可机读@@、一手的@@@@、非歧视@@、及时的@@@@、非专属性@@、可获取@@、免授权是开放数据@@具有的@@主要特征@@。“它特别强调的@@一点是数据@@开放之后的@@利用@@和再利用@@@@, 而不仅仅是开放之后被别人知情@@。而且开放的@@是海量的@@@@、电子化的@@数据@@@@, 而不仅是开放一些文件那么简单@@。”郑磊说@@。

  《报告@@》指出@@, 政务@@大数据@@@@在开放@@、共享@@和应用@@中主要面临四方面挑战@@, 需要建设者重点关注@@@@。

  一是平台@@服务能力的@@挑战@@。通过构建不同类型数据@@融合的@@大数据@@平台@@@@, 支撑数据@@统一存储@@、统一管理@@、构建多样化应用@@@@, 但随之而来需要面对几种典型问题@@, 首先@@利用@@同一个大数据@@平台@@支撑不同部门@@、不同的@@应用@@系统构建各自的@@大数据@@应用@@@@@@, 如何能避免应用@@对平台@@资源调用@@的@@冲突@@;在构建了融合的@@大数据@@平台@@后@@, 如何在共享@@数据@@资产的@@同时@@, 保证数据@@权属@@的@@完整性@@, 有效避免数据@@资产的@@泄露@@。

  二是数据@@处理能力的@@挑战@@。随着政务@@大数据@@@@的@@增加@@, 各类新的@@数据@@类型层出不穷@@, 对数据@@处理能力提出越来越高的@@要求@@。一方面@@, 随着政务@@相关数据@@来源@@范围的@@扩大@@, 以及音视频内容的@@增长@@, 每天都会有海量的@@增量数据@@生成@@, 对这些@@数据@@及时进行抽取@@、转换@@、加载的@@批量处理@@, 将面临巨大挑战@@。另一方面@@@@, 对数据@@的@@实时处理能力要求越来越高@@, 乐动安卓app 即办件比例的@@提升@@, 信用@@体系对外即时响应服务的@@扩展等@@, 都要求对各类数据@@及时进行有效性验证@@。

  三是@@, 数据@@安全@@的@@挑战@@。大数据@@的@@安全与传统信息安全相比变得更加复杂@@, 主要有三个方面@@:首先@@, 大量数据@@汇集@@, 其中包括大量@@乐动安卓app 数据@@、用@@户信息@@、个人的@@隐私和各种行为的@@细节记录@@, 这些@@数据@@的@@集中存储增加了数据@@泄露风险@@;其次@@@@, 因为一些敏感数据@@的@@所有权和使用@@权并没有被明确界定@@, 很多基于大数据@@的@@分析需要考虑到其中涉及的@@个体隐私问题@@;再次@@@@, 大数据@@对数据@@完整性@@、可用@@性和秘密性带来挑战@@, 在防止数据@@丢失@@、被盗取@@、被滥用@@和被破坏上存在一定的@@技术难度@@。

  四是数据@@融合共享@@的@@挑战@@。数据@@的@@海量增长伴随着有用@@信息的@@不足@@, 想用@@的@@@@、能用@@的@@数据@@无处可寻@@, 可用@@的@@@@、可信的@@数据@@极端匮乏@@, 政务@@领域的@@海量数据@@多处于@@“休眠@@”状态@@, 真正用@@于提升业务效率@@、改变业务流程@@、变革业务发展的@@应用@@并不多@@。有些职能部门对数据@@的@@共享@@开放消极被动@@, 有些部门基于风险的@@考虑不愿将业务数据@@拿出来与其他部门共享@@@@, 有些部门限于信息壁垒和标准缺失无法共享@@开放@@。

  数据@@开放与隐私保护产生冲突@@

  在政务@@大数据@@@@开放的@@过程中@@, 最受人们关注@@的@@就是隐私问题@@。陈咏熙指出@@@@, 海量的@@个人信息正在进入政府@@数据@@@@, 这些@@信息有可能被第三@@方再利用@@@@, 而非个人信息经大数据@@挖掘@@、剖析也转化为个人信息@@, 这些@@问题使得政府@@数据@@开放可能与个人隐私保护产生冲突@@。

  据陈咏熙介绍@@, 香港曾经出现过一款名为@@“起你底@@”的@@App, 就引发了有关数据@@开放和隐私保护的@@争议@@。

  “起你底@@”是香港数据@@库公司@@GDI2012年@@推出的@@一款软件@@, 软件录入逾@@200万宗法庭审讯纪录资料@@, 使用@@者只要下载软件@@, 输入所查之人的@@中文或@@英文姓名@@, 便可查阅这个软件从司法机构@@、破产管理署@@、公司注册处等不同渠道收集到的@@市民诉讼@@、破产及公司董事资料@@, 有的@@连身份证号码@@、住址等都可查到@@。

  公司表示@@, 有关诉讼的@@资料都是由公开渠道及合法途径取得@@, 所有数据@@及记录的@@内容均无篡改@@。但有市民认为@@, 此举却随时侵犯个人私隐@@@@, 对被查阅人士造成不公平@@, 加上同名同姓的@@人甚多@@, 所得数据@@未必准确@@。香港个人资料@@私隐@@专员公署@@2012年@@接获了@@12宗市民针对@@“起你底@@”的@@投诉及@@60宗查询@@。

  公署对此@@介入调查后认为@@, 软件收集已公开于公共领域的@@零碎个人数据@@@@, 经整合@@后给人作审查用@@途及商业用@@途@@, 明显偏离数据@@公开原意@@, 于是与@@2013年@@7月@@31日发出执行通知@@, 要求停止程序继续披露其持有的@@个人数据@@@@。陈咏熙指出@@@@, 公署认为公诸于众的@@个人数据@@仍受@@《个人资料@@ (私隐@@) 条例@@》等香港现行的@@法律法规的@@保护@@, 因此@@“起你底@@”App严重侵犯个人私隐@@@@。首先@@, App违背了一系列数据@@保障原则@@, 比如个人数据@@的@@使用@@@@, 必须与数据@@最初收集的@@目的@@相同或@@直接相关@@, 除非事先取得数据@@主体@@的@@同意@@;数据@@准确无误@@;数据@@主体@@有权查阅其数据@@并更正不准确者@@。其次@@@@, 影响了曾经犯事者自新的@@机会@@。第三@@, 违反了数据@@主体@@对数据@@私隐@@的@@合理期待@@。

  但公署的@@决定也引起了一些反对意见@@。有资讯业界人士认为@@, 如果说对公共领域内的@@个人信息进行再利用@@得出新的@@结论@@, 属于背离了信息使用@@的@@最初目的@@@@, 那么就是斩断了大数据@@应用@@@@的@@关键一环@@。

  这一案例中反映出的@@大数据@@开放应用@@与传统信息保护制约的@@冲突值得人们深思@@。陈咏熙指出@@@@, 从全球来看@@, 协调公开与隐私问题主要有两种模式@@, 一种是以美国为代表的@@偏向信息公开的@@模式@@, 一种是以欧盟为代表的@@偏向隐私保护的@@模式@@。但在大数据@@时代@@, 这两种模式已经开始出现趋同@@。不少国家开始认识到政府@@数据@@开放对隐私的@@冲击是全面而严峻的@@@@, 不再强调@@“公开优先@@”或@@“隐私优先@@”的@@静态原则@@, 而是倾向于对个案具体问题具体分析@@, 细究利用@@信息的@@目的@@@@, 尤其是特定的@@再利用@@是否正当等@@。不过到底怎样才是最佳的@@解决方案@@, 各国还都在探索之中@@。

  政府@@数据@@治理@@能力还跟不上@@

  在郑磊看来@@, 政府@@在数据@@开放过程中@@, 除了在隐私保护这样的@@问题上缺少法律法规和政策指引@@, 还存在不少挑战@@。通过对一些地方政府@@数据@@开放和应用@@情况的@@调研@@, 他发现@@, 政府@@不仅是数据@@开放的@@意愿不强烈@@, 更重要的@@是数据@@治理@@的@@能力跟不上@@。

  一方面@@, 目前很多政府@@部门不愿意开放数据@@@@, 主要是怕开放后出现安全问题被追责@@。郑磊指出@@@@, 数据@@开放后确实可能面临各方面安全风险@@。开放数据@@本身涉及国家机密@@、商业机密和个人隐私@@;被关联分析后泄露国家安全@@、商业机密和个人隐私@@;被滥用@@损害公共利益或@@第三@@方利益@@;数据@@质量@@有问题被利用@@后也会造成损失@@。因此@@, 政府@@还是存在@@“多做多错@@、少做少错@@”这样的@@想法@@, 并且认为数据@@是部门资源@@, 不愿意对外开放@@。

  另一方面@@@@, 有些政府@@部门还不具备数据@@开放的@@能力@@。原因有缺乏体制机制支撑@@;主管部门不明确@@, 职能繁杂@@、职责交叉@@;组织与人员能力建设@@、经费保障@@、技术基础设施跟不上等@@。

  郑磊强调@@, 最重要是数据@@治理@@能力跟不上@@。最突出的@@问题就是数据@@碎片化很严重@@, 散落在各个部门@@, 没有整理起来@@。除此之外@@, 数据@@共用@@共享@@@@、数据@@权属@@、数据@@采集@@、数据@@编目@@、数据@@标准@@、数据@@质量@@、数据@@安全@@等@@, 都是数据@@治理@@的@@重要内容@@。而目前还很少有政府@@部门能形成较为完善的@@数据@@治理@@体系@@, 这导致政务@@大数据@@@@并不能得到很好的@@利用@@@@。

  由复旦大学和提升政府@@治理能力大数据@@应用@@@@技术国家工程实验室联合发布的@@@@《中国地方政府@@数据@@开放平台@@报告@@@@ (2017) 》指出@@, 目前各地开放数据@@平台@@上线的@@数据@@集@@在数量上已成规模@@, 多个地方的@@数据@@集@@总数已突破或@@接近@@1000, 但其中能真正符合完整的@@@@@@、原始的@@@@、可机读@@的@@@@、非专属的@@@@、以接口形式提供等开放数据@@标准@@的@@数据@@集@@仍然偏少@@。不符合标准要求的@@所谓@@“数据@@集@@”却比比皆是@@, 或@@为加工归总后的@@统计报表@@, 或@@为非结构化@@、不可机读@@的@@@@文本内容@@, 或@@为拆分后或@@未整合@@的@@单行数据@@@@, 甚至还有数据@@集@@名称下面不存在可获取@@的@@数据@@集@@@@。这些@@“数据@@集@@”无法被利用@@@@, 更不可能产生价值@@, 将会使数据@@开放最终流于形式@@。

  对此@@, 郑磊对政府@@部门提出的@@建议是@@, 政策法规方面@@, 完善法律法规政策@@, 明确开放与保护的@@边界@@, 制定开放数据@@标准@@@@, 规范开放数据@@利用@@和流通@@;管理组织方面@@, 明确主管部门@@、制定管理制度@@、分级分类差异化管理@@、事中前后全过程管理@@、开展内部和第三@@方风险评估@@、建立预警机制@@、制定应急预案@@、建立动态纠错机制@@、开放社会评议举报@@、明确责任追究与免责@@;数据@@与技术方面@@, 要注重提升整体数据@@治理@@水平@@、开放平数据@@安全@@防护体系@@、数据@@脱敏@@、防范数据@@间相互关联产生的@@风险@@、开放数据@@的@@质量控制@@、对已开放数据@@的@@长期监测@@。

  上述报告@@也建议@@, 对主管部门加强有关开放数据@@基本知识的@@培训@@, 厘清概念@@, 达成共识@@;然后基于开放数据@@的@@基本原则和标准@@, 从数据@@利用@@者的@@视角和需求出发@@, 开放完整的@@@@@@、原始的@@@@、可机读@@的@@@@、非专属的@@@@、结构化的@@@@、高价值的@@数据@@集@@@@, 并配备实用@@详实的@@元数据@@条目@@, 帮助用@@户用@@好数据@@@@、用@@对数据@@@@。物尽其用@@@@, 数尽其利@@, 只有开放真正能被@@“用@@”起来的@@数据@@才能创造价值@@。

责任编辑@@:qinpeng