编者按@@:数据开放和@@数据获取渠道@@开放@@,是否@@与隐私@@保护@@、伦理@@道德间存在@@矛盾@@,如何处理几者间的@@关系@@?作者@@分别访问了盖茨基金会@@、斯坦福大学@@@@、印第安纳大学@@@@,对研究之前是否@@需要进行伦理@@审查@@进行咨询@@@@,但均未给出正面回应或者@@直接拒绝回答此类问题@@,说明在@@数据开放下@@,隐私@@保护和@@伦理@@道德现状堪忧@@。在@@大数据@@时代@@,只注重大数据@@开放发展@@,不注重大数据@@安全保护@@,将会给世界带来一场灾难@@;数据开放与保护@@,就像是处在@@天平的@@两端@@,两者同等重要@@、缺一不可@@,必须辩证看待@@,在@@开放中保护@@,在@@保护中开放@@。

  在@@这星期内@@,我的@@收件箱并没有充斥着来自出版商@@、大学@@、基金会和@@非盈利组织发布的@@最新数据开放和@@数据获取渠道@@规划的@@大量公告@@。这一发现很奇妙@@,世界上的@@研究成果可以开放阅读@@、重复使用和@@复制@@,但到目前为止研究的@@焦点几乎都在@@研究的@@最终结果上@@,而应该首先进行什么研究的@@初步伦理@@审查@@仍然是保密的@@@@。这是否@@意味着我们在@@@@“开放数据@@”和@@“数据获取渠道@@”的@@同时应该增加@@“伦理@@开放@@”?

  当谈到@@“大数据@@”研究时@@,很多人认为同行评审流程和@@机构伦理@@审查@@流程@@(伦理@@委员会或学术用语@@“IRB”)确保了创新与伦理@@道德之间的@@适当平衡@@,但正如我去年@@发现的@@一样@@,即使在@@受人瞩目的@@道德讨论后@@,例如@@在@@脸谱网和@@和@@康奈尔大学@@以及@@美国国家学术出版社一起合作的@@情绪研究中@@,脸谱网几乎没有做出任何改变@@,而后两者也没有做出任何改变或仅在@@事后做出的@@微小改变@@。

  我们所生活的@@世界很多@@“大数据@@”研究都是秘密进行的@@@@,直到它们发布或泄露那一刻@@,导致泄露的@@主要原因是由于@@技术团队以意想不到的@@方式使用数据@@,频繁地突破隐私@@和@@伦理@@的@@界限@@。许多人来自没有任何伦理@@研究@@历史的@@领域@@,这些领域的@@期刊或者@@资助者@@,包括联邦资助机构大部分都采取不干预政策@@,让研究人员自己检查或直接免除@@对整个领域的@@伦理@@审查@@@@,因为隐私@@和@@伦理@@研究@@不是该领域以前研究的@@重点@@,或因关注@@伦理@@研究@@对@@“拒绝扩展他们的@@@@(伦理@@)范围@@,以涵盖社会和@@行为科学@@”的@@研究人员来说是不公平的@@@@。

  一名心理学家管理着一批自愿参加测试的@@人@@,他们都参与了研究报告@@,心理学家通过一系列的@@协议来评估他们的@@各种心理特征和@@缺陷@@,他们的@@名字和@@特点以及@@照片可能永远无法出现在@@文学作品上@@,不能让世人都看到@@。然而@@,计算机科学家收集了数以百万计的@@不知情的@@人的@@@@Facebook资料@@(包括儿童@@),并通过一套情感挖掘算法来分析@@,以估计高度敏感的@@情绪状态@@,如抑郁症会怎么做@@,并将结果作为公共数据@@发布@@,其中包括每个人的@@真实姓名@@、他们大致的@@家庭住址和@@模糊的@@照片@@,以上这些他们都没有与伦理@@审查@@者进行交流@@,并且这些数据@@在@@全世界已共享数百万次@@了@@。数据集只有受到媒体和@@知名度高的@@伦理@@学家的@@关注@@才有公开讨论的@@可能@@(即使最终被取消了@@),可能导致有无数的@@备份并在@@镜像网站@@上出现@@,让这些数据@@最终产生更多@@的@@数据集和@@出版物@@。

  这就是今天我们生活的@@研究伦理@@的@@世界@@:对结果的@@不懈关注@@和@@我们可以做些什么@@,这些决定都是秘密进行的@@@@,而不是公开坦率的@@讨论作为一个社会的@@人应该做些什么@@。也许是社会管理者下意识地决定将伦理@@和@@隐私@@排除@@在@@研究要考虑的@@因素之外@@,但这些决定应该在@@公开场合进行@@,并成为公开记录的@@一部分@@,而不是秘密进行只有少数人知道@@。

  去年@@12月份@@,盖茨基金会给我发送了一封电子邮件@@,庆祝他们开放获取内容政策的@@全面启动@@,“要求所有已发表的@@基金资助的@@研究都是免费的@@@@、立即可获取的@@@@,基础数据有权重复使用@@——没有例外@@”,一个月后@@,“所有由基金会资助的@@研究包括基础数据都必须完全开放@@,并可自由@@、立即访问@@。”

  盖茨基金履行了开放获取渠道的@@承诺@@,特别是@@它要求数据集可以公开使用@@,这些行为都值得赞扬@@。然而@@当问道基金会是否@@会有类似的@@要求@@@@,即公开其项目@@的@@伦理@@研究@@审查@@或者@@是否@@会考虑这一要求时@@,基金会回答说@@“其为开放获取渠道的@@努力@@,不是为了解决这些问题@@”,而是@@“为一个普遍的@@问题@@,我们的@@资助人要对他们的@@项目@@负责@@。”他们有望根据所有适用的@@法律和@@道德标准来管理他们的@@项目@@@@,包括获得适用于该项目@@的@@同意和@@批准@@@@。

  简而言之@@,盖茨基金会对开放性@@研究的@@重心停留在@@研究资金的@@输出上@@,而这项研究的@@伦理@@和@@理由被排在@@首位@@,在@@此过程中提出@@的@@任何问题仍然是研究人员自己的@@责任@@,基金会没有兴趣使该过程更加透明或开放@@。一个给定的@@项目@@是否@@接受过任何伦理@@道德审查@@@@?由于@@使用公共数据@@@@,无需对其方法@@或问题进行进一步审查@@@@,因此@@也可以正式免除@@其伦理@@审查@@@@?这个项目@@是否@@已审查@@过@@,得到一致的@@支持@@,没有任何顾虑@@?或者@@这个项目@@经历了一年多的@@辩论@@,有相当多的@@异议@@,或者@@研究人员是否@@去向他们大学@@法律系的@@求助@@,免去进一步审查@@的@@办法@@?在@@我探究伦理@@学研究的@@过程中@@,我发现在@@这几种情形下有相对应的@@几个例子@@。然而@@,公众和@@其他研究人员永远不会知道一项研究是如何进行的@@@@——他们只会在@@杂志上看到一篇文章@@,和@@一篇新闻稿@@,用以宣传这项研究的@@惊人之处@@。关于这项研究是否@@应该发生的@@争论几乎完全是秘密进行的@@@@,甚至连学者们都无法知晓@@。

  接触了研究@@“大数据@@”相关的@@几所主要大学@@@@,产生了一种大体一致的@@观点@@@@,都一致认为伦理@@研究@@不应该公开@@。我向@@哥伦比亚大学@@询问@@:是否@@要求教师和@@工作人员在@@开展研究伦理@@审查@@之前提交大量使用过的@@在@@线数据集如社交媒体@@、浏览的@@网页@@,尤其是对那些从事在@@社交媒体中收集用户个人信息的@@工作@@,为了研究工作是否@@允许其研究人员蓄意违反服务条款@@或者@@从盗窃的@@犯罪数据中获得所需数据@@,如使用偷来的@@医疗记录@@。一位发言人向我介绍了他们的@@@@IRB网站@@,但是@@当被问到这些具体问题时@@,该大学@@表示@@,他们正式拒绝回答任何问题@@。当像哥伦比亚一样享有声誉的@@机构@@,在@@“大数据@@”研究中投入近@@1亿美元时@@,决定正式拒绝发表看法@@,而不是讨论如何确保其研究中的@@道德行为@@,它充分说明了当今@@“大数据@@”中伦理@@研究@@的@@现状@@。

  同样@@的@@问题斯坦福大学@@@@给了一个相对详细的@@回答@@,提及了人类学研究政策@@,并指出@@“包含个人身份信息@@”的@@“公开可使用@@”数据需要@@IRB审查@@,但事实上@@可能并不总是如此@@。 一位发言人指出@@“对于@@来自如社交媒体的@@外部大数据@@的@@研究@@,学校可能需要先与提供原始数据的@@机构达成协议@@。”执行协议的@@过程将包括隐私@@审查@@@@,以确定该大学@@是否@@能够接受数据的@@所有权@@,在@@数据移交给大学@@进行研究之前@@,这些数据@@必须符合所有的@@隐私@@法和@@其要求@@。为了做研究大学@@将@@“拥有@@”这些数据@@,但如果@@无法核实数据的@@来源@@@@,他们将不会接受这些数据@@@@。当我问道有教员用网络爬虫程序收集自己的@@数据档案@@,而不是获取现有商业数据集这种情况时@@,大学@@发言人说@@道@@:我们无法做出评论@@,因为这类研究是否@@批准@@将取决于具体情况@@,需要进一步评估@@。当问道某个教师违反商业网站@@使用条款的@@具体案例时@@,她说@@“我们有政策规定@@,禁止教师如你所述那样进行研究@@”,并指着他们的@@研究手册给我看@@。然而@@,我还问到@@,斯坦福大学@@@@教员在@@被雇佣前就已经出版了的@@文章@@,是否@@同样@@适用斯坦福大学@@@@的@@研究方面规定@@,她回答我说@@,如果@@教师没有提交包括研究细节的@@审查@@@@,学校是无法对此作出回应的@@@@,但上述提到的@@政策仍将保持不变@@。

  尽管学校对伦理@@细节很关注@@@@,但当问及某个已通过伦理@@审查@@的@@项目@@@@,斯坦福大学@@@@是否@@允许公众和@@其他研究人员对此进行再次@@审核@@,看研究员是如何对他们的@@项目@@进行伦理@@论证@@,发言人说@@“我们不支持公共访问@@。”在@@许多情况下@@,发布某项研究草案还为时过早@@,因为研究的@@目标是确定一个研究是否@@有效@@。我们也对赞助的@@研究进行调查@@,但赞助商通常需要保密@@。如果@@涉及到关于伦理@@道德的@@问题@@,那么伦理@@审查@@可以由@@ IRB提出@@、或审查@@人员或专家小组提出@@@@。

  像大多数大型研究机构一样@@,斯坦福大学@@@@进行了大量外部资助的@@研究@@,但值得注意的@@是@@,斯坦福大学@@@@的@@立场是@@,这种伦理@@研究@@必须远离公众视野@@,就像资助机构在@@内部进行研究一样@@。简而言之@@,像脸谱网这样的@@公司不管用自己的@@研究人员进行研究或者@@否雇用斯坦福大学@@@@进行研究@@,在@@这两种情况下伦理@@研究@@都是秘密进行的@@@@@@。学术界的@@透明似乎暂时阻止了道德透明化@@。

  对印第安那大学@@的@@采访在@@该问题上没有多大帮助@@。我向@@项目@@负责人问及美国国家科学基金会资助的@@近一百万美元的@@@@“揭示真相@@”项目@@,以及@@关于他批准@@的@@@@ IRB 关于该项目@@的@@伦理@@提案@@副本@@,和@@他如何处理他的@@社交媒体分析平台@@的@@一些伦理@@问题时@@,他表示他的@@项目@@已获得@@IRB批准@@,但他拒绝提供@@IRB的@@批准@@或与此项目@@有关的@@任何细节的@@副本@@,相反@@,他把我介绍给了印第安纳大学@@@@研究院的@@副院长@@,后者又把我介绍给了传播系的@@副主任@@,但最终我的@@问题也没有得到回应@@。一份看似是@@NSF提案@@的@@副本@@被发布到了学校其中的@@一个教职工网站@@@@,全文都没有提到@@“伦理@@”这个词@@,“隐私@@”只提到过一次@@@@,在@@涉及隐私@@问题的@@背景下@@,让伦理@@研究@@进展变得更加困难@@,“在@@收集数据和@@大量相关数据的@@问题上@@,与隐私@@有关的@@困难阻碍了更快的@@进展@@。”由于@@“揭示真相@@”项目@@是由美国国家科学基金会用纳税人的@@钱资助的@@@@,我向@@NSF咨询@@是否@@可以提供一份@@NSF批准@@这一项目@@的@@副本@@。一位发言人回应说@@,国家科学基金会只有在@@@@《信息自由法案@@》要求之后才会提供这些文件@@,并且它保留对此类访问收取费用的@@权利@@@@。

  当有人要求审查@@网上的@@隐私@@和@@个人信息是如何通过联邦政府@@资助的@@一个公立大学@@的@@项目@@来处理的@@@@ ,负责监督这个项目@@的@@教员拒绝提供这些资料@@的@@获取渠道@@,学校也没有对我提出@@的@@多个请求做出回应@@,用纳税人资金支持该项目@@的@@联邦资助机构说允许审查@@这些材料的@@唯一方法@@是通过@@《自由信息法案@@》的@@要求@@,它保留对此类访问收取费用的@@权利@@。同样@@,我向@@获得美国国际开发署奖项@@(这一奖项涉及大量在@@外网下载资料@@的@@资料@@@@,这些资料@@可能会违反其使用条款@@,和@@公布个人资料@@的@@可能性@@)的@@两个纽约大学@@的@@研究员咨询@@@@,想要看@@IRB 提案@@的@@副本@@,以便了解@@ IRB 是如何审查@@这类项目@@的@@@@,对此他们也没有做过多的@@回应@@,纽约大学@@公共事务系副主任对重复的@@请求也没有做出回应@@。

  总之@@,研究员们似乎非常不愿意分享@@他们工作中关于伦理@@考虑的@@任何信息@@,他们把伦理@@道德看做是需要克服的@@一部分障碍@@,而不是必须遵守的@@道德准则@@。

  去年@@六月我第一篇关于数字伦理@@的@@文章想要从哈佛大学@@获得相关的@@意见@@,但多次@@尝试均以失败告终@@,而这一次@@学校响应速度如此之快@@。一位发言人澄清说@@,对于@@某些研究@@,除@@IRB批准@@外@@,还需要院长对此审核@@。该大学@@最初指出@@,对于@@特别敏感的@@研究@@,比如使用被盗数据@@,“我们不太可能批准@@这样的@@使用@@,特别是@@如果@@数据是非法获得的@@可能会导致个人身份泄露@@。”然而@@,当被要求对最近@@一份出版物中使用非法数据进行评论时@@,发言人说@@,这项研究已获得哈佛@@IRB和@@“院长审查@@@@(Provostial Review)”程序的@@批准@@@@,在@@使用非法发布的@@数据@@(如盗窃数据@@)的@@情况下@@,将会受到严格的@@审查@@@@,数据的@@来源@@也会受到严格的@@审查@@@@,怎样获得和@@从哪里获得这些数据@@都是它是否@@被批准@@的@@主要因素@@。 我们一般认为公共领域的@@信息公众是可以使用的@@@@(例如@@通过媒体@@,公共网站@@@@,报纸等@@)。

  然而@@,与其他大学@@一样@@,当被问及公众或相关的@@学术研究员需要一份哈佛大学@@关于伦理@@道德审查@@的@@副本需要的@@流程时@@,该发言人回应说她不记得有这样的@@请求@@,但是@@“如果@@收到这样的@@请求@@ 我们当然会做出回应@@。”然后@@,她又对@@IRB的@@提议进行了阐述@@,其中包括了调查人员试图证明的@@假说@@、实验过程@@/方法@@、用于保护私人信息的@@过程@@(例如@@,他们在@@发表前如何去除@@可识别的@@信息@@);以及@@数据安全措施@@。这些信息的@@披露对研究人员@@(例如@@,其未公开的@@方法@@被公开后@@,会有潜在@@的@@知识产权损失@@)或研究对象@@(例如@@,公开去除@@身份识别的@@方法@@和@@数据安全措施将会增加未经授权的@@访问或识别的@@可能性@@)都是有害的@@@@。这就是为什么在@@@@《信息自由法案@@》下发布的@@文件被大量修改的@@原因之一@@。她还指出@@,“IRB的@@批准@@包括@@IRB和@@研究人员之间的@@@@、对批准@@内容的@@澄清或细节的@@多次@@交流@@”,并且发布这样的@@批准@@信息需要相当大的@@努力来掩盖@@IRB审查@@者的@@身份@@。

  因此@@,与斯坦福大学@@@@相似@@,哈佛大学@@引用了对其研究中伦理@@审查@@秘密进行的@@必要性@@,以保护研究人员不受外部影响@@。从这个观点@@来看@@,研究人员在@@他们发表内容前会害怕别人@@“剽窃@@”或窃取他们的@@想法@@,目前尚不清楚为什么在@@研究发表后不少评论仍然不能公开发布@@,特别是@@IRB认为是伦理@@和@@隐私@@的@@部分@@。

  更让人觉得苦恼的@@是@@,发表的@@文献通常强调的@@是成功的@@研究@@,而学术研究的@@本质意味着@@,对于@@给定的@@数据集@@,许多问题可能无法达到可发表的@@要求@@@@。这意味着@@,每一天@@,学术研究人员都会问一些我们永远不会听到的@@数据问题@@,因为他们没有得到研究人员认为可以发表的@@东西或者@@是没有期刊接受并出版@@。

  更重要的@@是@@,研究受到道德上的@@困扰@@,期刊拒绝发表认为这种研究是不道德的@@@@,它可能永远不会被发表@@,这意味着@@更广泛的@@研究团体和@@公众将永远不会知道这一点@@。

  然而@@,也许在@@@@“大数据@@”研究中免于伦理@@审查@@最常见的@@方法@@是@@“公共数据@@”豁免@@,对于@@“公共数据@@”很多大学@@不需要@@IRB审查@@或利用快速审查@@的@@方法@@@@,如果@@研究中利用了公众普遍可用的@@数据集@@,则可以在@@第一阶段对伦理@@审查@@进行豁免@@@@。在@@这种情况下@@,如果@@工作完全依赖于可以在@@网上找到的@@已有数据@@,IRB通常会免除@@其余的@@研究@@,包括方法@@和@@隐私@@问题@@。

  最近@@,我偶然发现了梅隆基金会向滑铁卢大学@@提供资金的@@新闻稿@@,以资助对网络档案的@@大规模研究@@,其中至少有两个一起合作的@@研究机构有使用大型网络档案的@@研究历史@@。在@@电子邮件中@@,研究人员强调了他们为研究收集的@@网络档案资料@@的@@数量@@,并且他们对拥有@@大量网络档案数据的@@组织感兴趣@@,以使用他们正在@@开发的@@新平台@@@@。

  当被问及他们开发的@@软件工具是否@@有助于分析网络档案时@@,是否@@包含了任何隐私@@或其他伦理@@方面的@@考虑@@,例如@@,允许禁止对某些隐私@@进行查询@@,或使用人口特征的@@数据集进行警告或禁用可能引起隐私@@问题的@@查询@@,研究人员回答说@@,他们的@@工具只是传统的@@分析工具@@,专注于尽可能多的@@提出@@问题@@,而不是回避询问是否@@有的@@问题不应该问@@(事实上@@,印第安纳大学@@@@的@@@@NSF-funded Twitter 分析平台@@的@@确如此@@)。

  最近@@,我偶然发现了梅隆基金会向滑铁卢大学@@提供资金的@@新闻稿@@,以资助对网络档案的@@大规模研究@@,其中至少有两个一起合作的@@研究机构有使用大型网络档案内容的@@研究历史@@。在@@电子邮件中@@,研究人员强调了他们为研究收集的@@网络档案数量@@,并且他们对拥有@@大量网络档案数据的@@组织感兴趣@@,以使用他们正在@@开发的@@新平台@@@@。

  尽管多次@@向研究员询问@@,是否@@梅隆基金资助的@@项目@@或其他网络档案研究员已经进行了正式的@@机构伦理@@审查@@@@,如对于@@@@IRB审查@@,项目@@负责人拒绝回答@@,而只表示他们的@@工作是@@“完全符合滑铁卢大学@@的@@所有道德准则和@@政策@@”。一位大学@@发言人随后澄清说@@,“是否@@需要道德审查@@取决于项目@@@@”,“总的@@来说@@,我知道公众可以合法获取的@@信息@@,受到法律保护的@@信息@@,如果@@隐私@@需求不合理@@,就不需要道德审查@@@@。”

  鉴于大学@@发言人的@@澄清@@,网络档案研究可能并不需要伦理@@审查@@@@ ,加上研究人员坚决拒绝确认他的@@工作是否@@曾经过伦理@@审查@@@@,目前尚不清楚是否@@真的@@有独立的@@伦理@@审查@@@@。特别是@@研究人员先前的@@工作已经详细分析了@@GeoCities 网站@@的@@历史档案@@,包括对社区领袖等这样特定的@@个人进行分析@@。这项工作还涉及检查网站@@的@@视觉内容@@。由于@@GeoCities网站@@可以并且确实包含了相当多的@@个人识别信息@@,包括个人全名@@、照片和@@许多其他细节@@,目前尚不清楚这种研究多大程度上受同行伦理@@审查@@的@@影响@@,以及@@用于证明其合理性的@@具体论证@@,以确保此类研究不会造成不必要的@@隐私@@担忧@@。研究人员拒绝回答他们的@@@@GeoCities工作是否@@受到了@@IRB或其他伦理@@机构的@@审查@@@@,只说明他们原来的@@工作申明内容@@,即他们的@@工作是与大学@@政策相结合的@@@@。

  梅隆大学@@拨款的@@让感兴趣的@@研究人员聚集在@@一起@@,共同创建工具并对大型网络档案进行分析@@。他们最近@@的@@一次@@活动是上个月在@@大英图书馆@@举办的@@@@,其中包括了两个与英国相关的@@数据集@@:“UK Government Web Archive ——2010英国大选数据收集@@”,以及@@“UK Government Web Archive ——公众调查@@、皇家委员会@@、审查@@和@@调查数据@@。”当我向@@大英图书馆@@询问如何处理其网络档案内容研究的@@伦理@@审查@@时@@,一位发言人向我介绍了他们的@@@@研究政策@@,尤其是他们的@@良好实践规范指南@@。这些指导方针规定@@:“图书馆应承担主要责任@@,确保在@@其作为牵头研究组织的@@项目@@和@@合作中保持道德操守@@”。由其他研究组织牵头的@@合作项目@@主要由该组织的@@伦理@@研究@@政策和@@程序来监管@@。然而@@,大英图书馆@@的@@工作人员必须确保这些程序涵盖项目@@涉及到的@@各方面伦理@@道德@@。该政策还要求@@“在@@许多类似的@@情况下@@@@,该项目@@将由合作伙伴组织牵头@@,此时该项目@@主要通过牵头组织的@@公司治理和@@伦理@@研究@@流程进行管理@@。图书馆不希望做重复工作@@。在@@一些研究合作中@@,相关的@@伦理@@研究@@问题可能由牵头研究机构和@@@@/或参与该项目@@的@@其他机构或赞助商来解决@@。不过@@,在@@这种情况下@@,参与该项目@@的@@大英图书馆@@工作人员继续参考这一实践守则是非常必要的@@@@。特别是@@对于@@由外部合作伙伴的@@政策和@@程序管理的@@项目@@@@,大英图书馆@@的@@工作人员必须确保这些程序涵盖项目@@涉及到的@@所有伦理@@道德@@。”“此外@@,根据这些伦理@@审查@@的@@项目@@的@@一般清单@@,“研究是否@@涉及与直接可识别的@@与人类主题相关的@@数据的@@使用或创建@@?”以及@@“研究是否@@需要特别关注@@知识产权或版权方面的@@问题@@?”

  当问及这些伦理@@审查@@是否@@适用于档案馆中提供的@@两份英国数据集时@@,该图书馆的@@发言人表示@@,图书馆无法对此发表评论@@。滑铁卢大学@@也组织了这次@@活动@@,我向@@他们咨询@@@@,是否@@要求参加者事先提交他们拟议的@@项目@@以进行伦理@@审查@@@@,特别是@@涉及英国的@@两个数据集的@@项目@@是否@@要提交给大英图书馆@@进行审查@@@@,研究人员最初答复说@@,大英图书馆@@没有提供任何可供获取的@@数据@@。当我指出一条信息与此说法似乎相矛盾@@,该条信息表明可用的@@英国数据集中至少有一个属于@@“大英图书馆@@”,对此研究人员拒绝进一步发表评论@@,而是@@将我带回了大英图书馆@@和@@国家档案馆@@。他们也没有对使用其他数据集的@@项目@@是否@@受到任何形式的@@道德审查@@或对或者@@对他们提出@@的@@问题的@@限制进行发表任何看法@@。

  当我再次@@询问时@@,大英图书馆@@表示对此他们无法发表任何看法@@,这意味着@@他们完全不清楚在@@这个数据集中图书馆的@@数据是否@@可用@@,项目@@涉及到的@@数据是否@@会受到图书馆理论的@@审查@@@@,如果@@受到伦理@@审查@@@@,那么数据集要如何应对这些要求@@,或是否@@任何形式的@@道德审查@@都适用于在@@该事件中执行的@@项目@@@@。

  梅隆基金会作为数字人文社会科学研究的@@首要资助机构@@,在@@与其他基金机构的@@反应保持一致的@@同时@@,梅隆基金未能在@@道德和@@隐私@@领域发挥领导作用@@,而它却为这类数据挖掘项目@@提供了一个独特而有力的@@声音@@。

  事实上@@,在@@我与之交谈过的@@机构和@@研究人员中@@,只有一名就职于一所重点大学@@商学院的@@研究人员向我提供了他的@@@@IRB提案@@,并第一时间回复了我的@@电子邮件@@。他的@@文章被大量引用@@,他非常渴望尽量多的@@讨论伦理@@@@,并且形成了最终形式@@,很明显@@,虽然他和@@他的@@@@IRB提案@@在@@伦理@@和@@隐私@@考虑中放弃了一些思想@@ ,但他们为重视伦理@@道德感到自豪@@。奇怪的@@是@@,他的@@回应是独立的@@@@,因为与我互动过的@@其他研究人员一直是回避@@、敌对的@@@@,或者@@根本没有回应多次@@有关其工作的@@伦理@@考虑的@@更多@@信息的@@请求@@,或者@@根本没有回答我对他们工作中的@@伦理@@审查@@问题的@@反复请求@@,而另外一个实际上并没有提供他们的@@@@IRB提案@@的@@副本@@ ,虽然迄今为止我没有说过的@@大学@@对其伦理@@审查@@有一个开放的@@政策@@,但资助机构似乎对这个话题和@@主要期刊都没有兴趣@@,或将其留给研究人员自己审查@@@@,或者@@由于@@他们领域有历史要求@@,有明确的@@反对伦理@@审查@@的@@政策@@。

  把这些结合在@@一起@@,所有这一切都强调开放数据@@和@@获取渠道是使公民和@@研究人员更容易获得学术界成果和@@实现数据反复使用的@@新时代@@,是实现时代转型的@@巨大进步@@,但是@@,当讨论伦理@@研究@@和@@隐私@@方面的@@问题时@@,这种透明度和@@开放性@@的@@渴望似乎突然终结了@@。大学@@和@@研究员个人@@要自己决定什么是道德的@@@@,或者@@他们甚至相信道德或隐私@@考量应该在@@他们的@@工作中占有一席之地@@,大学@@根本不想谈道德或坚定地认为道德审查@@必须以秘密的@@方式进行@@,而资助机构和@@出版商寻找其他途径或对此根本没有兴趣@@。研究内容@@、出版物和@@数据集的@@最终输出@@,是学术成功的@@指标@@,它确定了其创造者的@@任期@@、晋升@@、名誉和@@声望@@,而大学@@和@@资助者则获得了他们所支持的@@所有工作带来的@@回报@@。一个到处是发表的@@文章和@@创新的@@新数据集是大学@@实验室研究非常成功的@@标志@@,而一份填满@@IRB伦理@@审查@@批准@@和@@@@IRB关于伦理@@审查@@提案@@的@@详细页面@@以及@@每个出版物或数据集如何保护隐私@@和@@遵守普遍接受的@@道德考虑的@@详细理由@@,远远不太可能吸引名利和@@财富@@,更有可能出现法律@@,道德或其他麻烦和@@负面新闻@@,正如其他研究人员和@@公众对该机构道德观念的@@质疑@@。总而言之@@,从研究人员到大学@@到出版商再到资助者的@@学术生态系统都宁可以另一种方式来关注@@可以做的@@事情@@,而不是应该做什么@@。如果@@,作为一个社会成员我们聚在@@一起@@,认为伦理@@道德和@@隐私@@在@@现代大数据@@研究中没有地位可言@@,是过时概念@@,那么这是一个大家一起研究讨论后的@@民主决定@@,而不是少数几个对他们正在@@进行的@@研究或伦理@@审查@@@@、隐私@@知之甚少的@@人秘密决定的@@@@。

  最后@@,学术界必须决定@@,是否@@“开放性@@”和@@“透明性@@”仅适用于@@ 学术机构的@@最终研究结果@@、研究员个人@@,很多领域没有进行伦理@@审查@@的@@历史@@,完全有权决定什么是伦理@@和@@道德行为和@@在@@数字社会允许有多少隐私@@保留@@,或者@@,如果@@我们把@@“伦理@@开放@@”加在@@开放数据@@和@@获取渠道上@@,开放大学@@公开讨论@@“大数据@@”研究的@@未来应该是什么样的@@@@。

  译自@@:Kalev Leetaru《Should Open Access And Open Data Come With Open Ethics?》

责任编辑@@:lihui