Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

张倩 路雪 李泽南参与

解释权条款剥夺深度学习合法性:「最严数据隐私条例」GDPR今日生效

《欧盟一般数据保护条例》(General Data Protection Regulation,GDPR)是有关数据隐私的重要新规,它取代了执行 20 余年之久的《欧盟个人资料保护指令》,被认为是对人工智能商业应用方式的一次彻底整改。2018 年 5 月 25 日,在人们的关注之下,GDPR 这一「史上最严隐私条例」终于在欧盟全面实行。

在一些人工智能学者看来,GDPR 的主要条款将摧毁大量数据的价值,而其有关「解释权(right to explanation)」的内容则会让迄今为止出现的大量深度学习应用成为非法。

GDPR 的内容条款:https://www.eugdpr.org/

你肯定听说过 Facebook 和「剑桥分析」公司最近的信息泄露丑闻,以及马克·扎克伯格关于 Facebook 响应《欧盟一般数据保护条例》而在全球范围内做出改变的声明。如果你还没注意到欧洲的举动,那美国参议员 Brian Schatz 的声明可能会让你大吃一惊,他说到:「所有技术平台都应该采用欧盟(数据保护)的做法」,尽管 45 % 的美国公民认为政府对工商业的监管已经「太多」。

GDPR 确实是一件大事。2018 年 5 月 25 日,该条例成为欧盟法律的一部分,它将改善欧盟公民的数据保护情况,这些公民不仅与欧洲的公司有关,还与世界各地的公司有交集。换句话说,无论你的公司是否位于欧盟,只要你的客户或用户中有欧盟国家公民,并且处理他们的数据,GDPR 就会对你的业务产生非常重要的影响。

收到 Email 了?过去几天,大大小小的科技公司正争相推出新版数据隐私条款。

目前看来,许多公司还没来得及处理这一问题,这或许意味着它们正面临着高达 2000 万欧元的罚款——亦或是全球年销售额的 4%,以较大值为准。来自凯捷咨询的调查显示:85%的企业表示他们还没有准备好应对新的法律,其中更有四分之一的公司表示他们将不会在今年年底前做好准备。

另一方面,欧洲数据监管机构已经表示他们将认真对待合规。「从我们的数据中赚钱的公司需要承担更多的责任。」欧洲高级司法官员 Vera Jourova 在本周四表示。据了解,一些隐私权拥护者已经准备对 Facebook、WhatsApp、Instagram 和谷歌等大公司提起诉讼,指控他们违反新规。

在新的规定下,各公司仍然可以正常为客户提供服务,向人们发送电子邮件,并收集和存储他们的数据。公司只需确保他们有这样做的「合法基础」,并尊重希望删除其数据的人的意愿。如果公司未能证明他们一直在正确处理数据,没有在发现安全漏洞 72 小时内及时提出报告,或保存数据的时间超过了必要的期限,都将面临欧盟的处罚。

过去,欧洲监管机构对不遵守规则的大型科技公司一直采取强硬态度。欧盟已经给谷歌开出了总计 24 亿欧元(约合 27 亿美元)的反垄断罚款,并因在 WhatsApp 收购案中误导官员而对 Facebook 罚款 1.1 亿欧元(约合 1.22 亿美元)。

早些时候,GDPR 即将实施引起了很多人工智能学界人士的关注。1 月 28 日,《终极算法》作者、华盛顿大学教授 Pedro Domingos 在社交网络中说道:「自 5 月 25 日起,欧盟将会要求所有算法解释其输出原理,这意味着深度学习成为非法的方式。」

近日,Pedro Domingos 在 Medium 上撰文描述了他对 GDPR 实施的看法:

5 月 25 日,欧盟《一般数据保护条例》(GDPR)生效,该条例旨在通过对数据利用进行严格限制,来终止目前的数字世界乱象。GDPR 不仅影响科技公司,还将影响到所有处理客户数据的公司,也就是说,所有公司。它将影响全世界的数据使用,而不仅仅是在欧洲,将二者脱离开来并不符合实际。GDPR 还被认为是美国及其他国家和地区的榜样。

GDPR 的一项主要条款规定,数据仅可以出于最初收集目的而被使用,且需要用户的明确许可。这将摧毁大量(即使不是最多)数据价值,因为最重要的突破,从 X 光到青霉素,通常来自于对数据意料之外的使用。GDPR 在科研方面有例外情况,不过它仍然有可能成为创新的重要障碍,阻止了有利于客户、且不损害其隐私的数据利用形式。例如,技术公司每天进行数千次实验来提升网站。要求得到每位用户的明确许可会阻碍这些实验的进行,除非许可被给予一般领域。

GDPR 创造了一项新的权利「解释权」(right to explanation),要求每个制定决策的算法必须能够证明决策的正确性。这看起来很合理:谁不想要一个解释呢?比如一份癌症诊断结果。但是这有可能造成严重后果,因为通常要在准确率和可解释性之间进行权衡。我宁愿被一个具备 90% 准确率、但不提供解释的算法来诊断疾病,也不愿被一个只有 80% 的准确率、但是提供解释的算法进行疾病诊断。不同的人会在不同情况下做出不同选择。为什么政府要强制每个人做出同样的选择呢?

GDPR 的另一项权利是「被遗忘权」(right to be forgotten)。例如,用户可以要求谷歌不根据搜索结果记录相关信息。但是一个人的被遗忘权侵犯了所有人的被记住权。在欧洲的情况中,决定什么应该被遗忘的是谷歌。这真的就是我们想要的吗?如果决定权掌握在政府手中,他们还能够抵挡住诱惑,不用它作为审查的挡箭牌吗?

GDPR 的一些条款争议较少。比如可移植性(portability),即在平台之间轻松移动数据,这对数字经济的发展至关重要。但是现在尚不明确 GDPR 实施早期阶段对此是如何规定的,GDPR 无法分辨用户数据和企业数据。对我来说把相册或音乐 iCloud 移动到谷歌云端是一回事,但个人与企业互动记录按要求移动或删除是另一回事。这些记录属于公司最重要的实例属性,通常也是其价值所在。使用户拥有自己的互动记录是更好的做法,用户可以在自己愿意的时候使用这些记录。

造成所有这些问题的根本原因是,GDPR 解决的是一个基本上不存在的问题。如果以抽象的方式询问人们关心隐私的程度,他们自然会说自己非常关心隐私。但是当他们在隐私和个性化之间做出具体的权衡时,隐私的隐含价值是非常低的。与数据窃取相比,我们中有多少人受过数据共享的伤害?Cambridge Analytica 使用 Facebook 数据很容易刺痛人们的神经,但没有证据表明它成功地影响了选举结果。GDPR 假设公司不能自我监管,但他们能做到,因为公司害怕客户抵制。例如,Facebook 在 Cambridge Analytica 丑闻之前很久就吸取了一些教训。

而且反常的是,鉴于人们越来越担心权力集中在少数大型科技公司手中,GDPR 将给小型科技公司带来或多或少的负担,使初创企业的生存和发展更加艰难,直到它们能够挑战谷歌和 Facebook 这些大公司。欧洲应该更多地利用初创企业。

欧洲人喜欢把美国人想象成先开枪后提问的牛仔。但在数字经济方面,欧洲监管机构是非常敏感的,颁布 GDPR 就是在搬起石头砸自己的脚。美国应对此表示哀悼,并对类似 GDPR 的监管敬而远之。 

参考内容:https://medium.com/@pedromdd/how-not-to-regulate-the-data-economy-b4b4bdb0f78a

产业深度学习欧盟Pedro Domingos
1
暂无评论
暂无评论~