Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

盈君撰文四月编辑

最为轰动的AI公司数据泄露案:客户含600多家执法机构,30亿人脸数据库远超FBI

本周四,此前因侵犯用户隐私而被推上风口浪尖的人工智能初创公司Clearview AI被黑,平台上超过2000家客户数据暴露在黑客的野心下,其中不乏美国移民局、司法部、FBI等重要执法机构。 Clearview AI数据库中涵盖了约30亿张人脸数据,仅靠一张脸部照片,就可以检索出全网所有的相关图片,包括照片的地址链接。但是,关于更具体的个人信息数据集,诸如姓名、联系方式和家庭住址,Clearview AI还没有向C端公众开放。

2 月 27 日(本周四),成立于 2016 年面部识别应用服务公司 Clearview AI 向美国福克斯新闻网证实,公司所有的客户列表、账户数量以及客户进行的相关搜索数据遭遇了未经授权的入侵。

2 月 28 日,Clearview AI 律师 Tor Ekeland 表示,公司的系统跟网络并没有受到破坏,目前已修复了相关漏洞,并保证类似事件不会再次发生。根据 Clearview AI 声明,黑客入侵者获得了未经授权的客户访问列表,其客户包括美国执法机构。

目前,苹果已禁用 Clearview AI 的开发者帐户与其 iOS 应用程序,称其违反了该科技巨头与企业开发者协议的条款。

根据 BuzzFeed 披露,Clearview AI 的面部识别应用客户包括了美国移民局、司法部、银行,FBI,ICE,梅西百货,沃尔玛、NBA、阿拉伯联合酋长国的主权财富基金等 2228 多家机构和公司;此外还有更多的私人公司正在通过 30 天免费试用来测试该技术。

这其中至少有 600 家美国执法机构使用了 Clearview AI 最新的面部识别系统,数据涵盖了 Facebook、Instagram、Twitter 和 YouTube 等社交媒体平台上抓取的超过 30 亿张照片,来完善自家的数据库资源。

Clearview AI所拥有的数据量级已远远超过了美国联邦政府或者任何一家硅谷巨头的数据体量,即使像FBI这样的机构,其数据库也仅仅是收集了4.11 亿张照片。

图片来源:纽约时报

单从应用的角度来看,Clearview AI所具有的能力与服务潜力非常巨大。如抗议游行、暴动中个别激进分子的身份识别,寻找街上偶遇到的心仪对象等,不仅可以搜出他们的名字,甚至还能知道住所、工作单位和社交关系网络,可谓细思极快!

比如,只需一张照片就能从 30 亿张图像中锁定你的姓名、联系方式和家庭住址,Clearview AI 基于自身的面部识别系统和数据库协助 FBI 在内的数百家美国执法机构用面部识别技术抓捕罪犯。

一 早有前科

2020 年刚刚过去两个月,这家创办了四年的公司就上了两次热搜。一次是 1 月份因侵犯隐私权引发争议,另一次就是此次数据被黑引发了极大的关注。

今年 1 月,Clearview AI 因随意抓取网上照片引发争议。据《纽约时报》当时的调查显示,Clearview AI 允许执法机构使用其识别技术将未知面孔的照片与人们的在线图像进行匹配,从而搜寻潜在罪犯。随即,Twitter 向 Clearview AI 发出了一封勒令停止通知函。

仅靠一张脸部照片,Clearview AI就可以检索出全网所有的相关图片,包括照片的地址链接。但是,关于更具体的个人信息数据集,诸如姓名、联系方式和家庭住址,Clearview AI还没有向C端公众开放。

2 月 5 日,YouTube 向 Clearview AI 发出了一封勒令停止通知函,要求这家公司停止从其视频中收集人脸,并删除已经收集的数据。2 月 7,Facebook 向人脸识别公司 Clearview AI 发出了一封勒令停止通知函,要求其停止从 Facebook 和 Instagram 上获取数据。

Clearview AI 的做法违反了数据科技公司的服务条款,在这些公司不知情的情况下获取了用户数据,因此得罪了一干科技巨头。

两个月的时间里,Clearview AI 已收到来自微软、Google、YouTube、Venmo、LinkedIn 和 Twitter 的停止与禁止公函。还将面临 500 万美元的集体诉讼索赔。

二 600多家执法机构在用的「爆款」如何炼成?

月初,Clearview AI 创始人兼首席执行官 Hoan Ton-That 在接受采访时并没有表现出太多对其技术的担忧。

他想以「最好的意图建立一家伟大的美国公司」,并表示不会将产品出售给伊朗、俄罗斯或中国。Hoan Ton-That 认为这项技术正在挽救孩子,解决犯罪问题。

Clearview AI首席执行官Hoan Ton接受CBS采访,图源 | CBS视频截图

这位越南裔澳大利亚人三次创业、自学 AI,想建立一家「伟大的美国公司」。

2016 年,Hoan Ton-That 和 60 多岁、时任纽约市市长 Rudolph W.Giuliani 助手的 Richard Schwartz 合作,着手研究面部识别工具,这就是 Clearview AI 雏形。

2019 年,Clearview AI 开始向美国的执法机构推广其服务,借助 30 天免费试用鼓励警察购买。

2019 年 2 月,印第安纳州警察局对 Clearview AI 的应用工具进行测试,仅用 20 分钟就通过围观群众拍摄的视频找到了犯罪嫌疑人的社交网站,解决了这起打架斗殴事件。

2019 年底,Clearview AI 爆火,被私家侦探广泛使用。新泽西州克利夫顿的一名侦探甚至在邮件中敦促老板购买这款软件,因为它「能够在几秒钟内识别出嫌疑人」。

Clearview 数据库的规模让执法部门使用的其他数据库相形见绌,据《纽约时报》,Clearview AI 的应用已被包括联邦调查局和美国国土安全局在内的 600 多家执法机构使用,包括加拿大皇家骑警在内的一些执法部门也在使用,该公司声称其技术在识别个人身份方面的准确率达到 99.6%。

目前,Clearview AI 已经渗透到联邦政府的多个部门。美国司法部的多个部门在使用 Clearview AI 的产品,政府组织名单中包括美国特勤局的多个办公室(搜索次数约为 5600 个),禁毒署(约 2000 次搜寻);酒、烟、火器和炸药局(搜索超过 2100)和 FBI(至少 20 个不同的总部外办事处进行了 5700 次搜索)。目前,这些机构的发言人对此事要么拒绝置评,要么未回应置评请求。

执法部门认可、私家侦探力荐,成为「爆款」之后的 Clearview AI 也招致了数据黑色产业链的关注,这一过程花了不到半年的时间,轰然变天的速度出乎意料。

三 越「火」越危险,细思极恐的数据黑色产业链

据了解,Clearview AI 所具有的能力与服务潜力非常巨大。如抗议游行、暴动中个别激进分子的身份识别,人肉路上遇到的心仪对象等。一张照片不仅可以搜出他们的名字,甚至还能知道住所、工作单位和社交关系网络。

Clearview AI 拥有 30 亿人脸数据,一旦数据隐私泄露将带来无法估量的损失。事实上,层出不穷的数据泄露事件对个人、企业、社会的都是一种巨大的威胁。

在我国,仅 2017 年在黑市上被泄露的个人信息就高达 65 亿条次,由数据泄露而衍生出来的黑灰色产业链年获利已超百亿元。买卖公民个人隐私数据为小贷公司的「套路贷」犯罪、暴力催收大开方便之门。

2018 年 3 月曝光的 Facebook 数据泄露事件中,有 5000 万用户的个人资料,一直被用作向其精准投放政治广告的重要参考,而这些人占据着美国选民人数的四分之一。同年,万豪发布公告称旗下酒店喜达屋 5 亿房客信息被泄露;社交平台陌陌的 3000 万用户数据在暗网被销售;问答网站鼻祖 Quora 的 1 亿用户数据被窃……

2019 年 2 月,国内专注于安防领域的人工智能企业深网视界超过 250 万人的数据被非法获取,680 万条数据疑似泄露,包括身份证信息、人脸识别图像及图像拍摄地点等。

2019 年 5 月,一名自称 GnosticPlayers 的黑客声称窃取了澳大利亚网站 Canva 的 1.39 亿用户数据,包括用户姓名、用户名、电子邮件地址、城市国家信息。

2019 年 9 月,17 万条「人脸数据」在国内的网上被公开兜售,涵盖 2000 人的肖像,每个人约有 50 到 100 张照片,每张照片还搭配有一份数据文件,除了人脸位置的信息外,还有人脸的 106 处关键点,如眼睛、耳朵、鼻子、嘴、眉毛等的轮廓信息等。数据中还能提供人物性别、表情情绪、颜值、是否戴眼镜等信息。

2019 年 12 月 4 日,一个包括 27 亿个电子邮件地址的 Elasticsearch 数据库泄露,其中 10 亿个密码都是以简单的明文存储。据悉,大多数被盗邮件域名来自中国邮件提供商,涵盖腾讯、新浪、搜狐和网易等。

动辄亿级,数据内容极其详细,此类触目惊心的数据隐私泄露事件一直在发生。

据统计,在所有的数据泄露事件中,科技行业因其信息化、数字化程度最高,颗粒度更细、价值更大,发生的数据泄露事件最多,占比为 37%。其次分别是政府机构、金融和医疗机构。

对于任何规模的公司来说,网络安全都不是小事,受众多执法部门青睐的 AI 公司更是如此。

四 合法合规获取数据将成为行业大势

Clearview AI 此次数据的泄露,将数据风险和数据隐私的讨论再次推上风口浪尖。长期以来,数据面临着三种风险:黑客攻击、明文存储使得数据可以轻易被复制、越权访问带来数据泄露问题。

对于侵犯用户隐私权,Clearview AI 声称拥有对公共信息的美国宪法第一修正案权利,并将其做法与 Google.com 搜索引擎进行参照比较,但这一说法并没有得到广泛「买账」。

据路透社报道,加拿大当局正在对 Clearview AI 进行调查判断其是否违反用户隐私法。在美国伊利诺伊州,Clearview AI 被诉讼指控侵犯了州居民的隐私权。新泽西州这样的部分美国地区甚至还颁布了州禁令,禁止执法机构使用 Clearview AI 的应用工具服务。

技术用于执法、维护社会正常秩序自然是好的,但一旦被黑产盯上后果便不堪设想。涉及用户隐私的问题需要企业自身强化数据管理、保护数据隐私,同时,法律法规的颁布施行也有利于遏制数据泄露的频频发生。

目前,我国「两高」司法已经对公民隐私数据问题有了解释:泄露用户通信内容五百条即可入罪。等级保护法以及有公民隐私数据的企业必须过等保安检的规定也对公民数据隐私问题有了法律层面的保护。

数据有价值,管理、技术有漏洞,数据就会有泄露的可能。目前侵犯用户隐私的行为受到越来越多的诟病,合法合规的获取数据也将成为行业大势,同时,日后更加完善的法律法规也有利于遏制数据泄露的频频发生。

产业数据泄露AI数据库
相关数据
Microsoft机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
网易机构

网易成立于1997年6月24日,是中国领先的互联网技术公司,为用户提供免费邮箱、游戏、搜索引擎服务,开设新闻、娱乐、体育等30多个内容频道,及博客、视频、论坛等互动交流,网聚人的力量。

https://www.163.com/
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

数据管理技术

数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程,其目的在于充分有效地发挥数据的作用。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

腾讯机构

腾讯,1998年11月诞生于中国深圳,是一家以互联网为基础的科技与文化公司。我们的使命是“通过互联网服务提升人类生活品质”。腾讯秉承着 “一切以用户价值为依归”的经营理念,为亿万网民提供优质的互联网综合服务。 腾讯的战略目标是“连接一切”,我们长期致力于社交平台与数字内容两大核心业务:一方面通过微信与QQ等社交平台,实现人与人、服务及设备的智慧连接;另一方面为数以亿计的用户提供优质的新闻、视频、游戏、音乐、文学、动漫、影业等数字内容产品及相关服务。我们还积极推动金融科技的发展,通过普及移动支付等技术能力,为智慧交通、智慧零售、智慧城市等领域提供有力支持。

http://www.tencent.com/
相关技术
暂无评论
暂无评论~