五大线索追问:网传的“250万条人脸数据泄露案”被误读了多少?

应该还要有误读信息的纠正与声讨,事件利益方的梳理和追问,以及基于关键线索的真相探寻和反思。

上周,2019年2月13日(美国西部时间),海外博主Victor Gevers在个人社交网站Twitter上曝出国内名为“SenseNet”的人工智能安防公司发生大规模数据库泄露——超过250万条的个人数据可被获取,680万条记录泄露。

随后的两天里,Victor Gevers连发数条Twitter,追踪泄露事件的更多细节和进展。他在2月13日晚间表示,SenseNets公司的数据库由于防火墙的“保护”,已经无法访问。

消息迅速传开。

哥伦比亚广播集团(CBS)旗下的CNET、ZDNet等媒体先后对该事件进行报道,Victor 接受了CNET采访并转发了相关报道。他在接受采访时表示,曾在去年7月向该公司存在“开放的数据库”发出过警告,但这家公司并未作出回应。

2月14日中午,国内的“微博安全应急响应中心”官方微博转发CNET上述报道,并附上了中文摘要与该篇报道的原文链接。

很快,国内媒体报道迅速跟进。

基于“微博安全应急响应中心”的消息,“大规模人脸信息数据泄露”的国内报道甚喧尘上,目前百度上搜索相关词条已达到190万。

与此同时,涉事利益方——“SenseNet”(深网视界)公司背后的重要股东——安防上市公司东方网力、人工智能独角兽公司商汤科技也被曝出,尽管商汤科技在2018年11月已经撤资。

截至发稿前,深网视界的官网已经无法访问,深网视界、东方网力仍没有对外进行确切的解释和声明,商汤科技则对外进行了“无责”声明。

一、被误读的关键信息

作为引爆业界对于安防敏感数据讨论与关注的标志性事件,“深网视界的数据库泄露”事件尤为值得进一步探讨和深究,而不仅仅是作为博眼球的噱头新闻。

首先,该事件的特殊背景在于:发生地点在中国境内,属于中国互联网管辖范围内的IP;但基于该事件的最核心信源仅仅是个人社交网站的消息和两篇海外报道,所以,考证该事件中的细节与关键表述成为解读的第一步。

颇为遗憾的是,基于机器之心的进一步核实,我们发现由于中英文表述差异、国内官方组织的错误翻译、以及海外博主极具主观意愿的描述等原因,导致在该事件的不断传播中关键信息已经被误读和曲解。

在质疑相关信息之前,有必要对该事件发现人Victor Gevers的个人背景进行补充介绍,以佐证其公开陈述的有效性和它所带有的个人色彩。

在个人Twitter页面,Victor Gevers在个人介绍一栏说道,一名黑客,主导/参与了5453起漏洞事件的披露,目前为GDI基金会的研究员。

结合Victor的LinkedIn主页信息,我们发现,VictorGevers除了是GDI基金会的一名经验老道的安全研究员,其本人还是荷兰GDI基金会的联合发起人以及主席。

基于公开信息,GDI基金会是一个致力于维护网络信息安全的非营利性组织,近年来参与发布了多起安全事件报告,包括AWS S3云服务平台安全到Jenkins、Eternal Blue事件以及GitHub报告等。

此外,Victor Gevers目前还供职于荷兰国家政府,曾任职IT安全架构师,目前为创新部门经理。

质疑一:信息披露错误

在Victor Gevers的个人页面,在2月13日关于“深网视界的数据泄露”事件的第二条Twitter中介绍了数据库泄露的具体情况,包括数据规模和数量、数据类型、数据中所包含的信息,其表述为:

This database contains over 2.565.724 recordsof people with personal information like ID card number (issue & expiredate, sex, nation, address, birthday, passphoto, employer and which locationswith trackers they have passed in the last 24 hours which is about 6.680.348records

数据库包含2,565,724条以上的个人信息记录,涉及身份证号码、签发和到期的时间、性别、国家、地址、生日、护照照片、雇主以及基于摄像头所记录的过去24小时内经过的地点信息,约6,680,348条记录。

(passphoto 并无确切的中文翻译,比较接近的解释为护照照片)

在CNET的报道中,泄露的数据表述为:

The database contained more than 2.5 millionrecords on people, including their ID card number, their address, birthday, andlocations where SenseNets' facial recognition has spotted them.

数据库包含了250多万条个人信息记录,包括他们的身份证号码、地址、生日以及基于SenseNet面部识别技术所追踪到的他们的位置。

需要指出的是,上述的个人和媒体表述中,数据库所泄露的数据信息均未涉及到“人脸识别图像”。

然而,“微博安全应急响应中心”在14日转发CNET的报道并附上的新闻摘要中却出现了“人脸识别图像”信息的描述,尚不知该中心是否有其他信息佐证该条信息。

但从其摘要末尾附上的新闻链条看来,更多是基于CNET新闻附上的摘要,却在翻译过程中添油加醋,导致翻译错误。

随后,基于国内为数不多的信源之一——“微博安全应急响应中心”微博——的相关报道席卷而来,而在这些报道中,泄露的信息描述中无一例外都包括了“人脸识别图像”信息,部分报道还将其作为标题信息。

可以说,“微博安全应急响应中心”所转载的该条微博在一定程度上对后续的国内相关媒体的报道造成了明显误导。

质疑二:陈述过于主观

在Victor Gevers的个人页面,关于“深网视界的数据泄露”的第一条Twitter中,Victor以十分武断和绝对的口吻说道:

“Andtheir(SenseNet’s) business IP andmillions of records of people tracking data is fully accessible to anyone.”

即,他们的业务IP和数百万人跟踪数据的记录可供任何人访问。

“fully accessible to anyone”,直接该漏洞的高危性推向了我们使用互联网公民中的任何一个。

但是根据Victor展示的页面截图显示,该页面的左栏白色界面处显示为网站源代码,右栏黑色界面为数据库代码。

一位技术公司CTO向机器之心解释,普通用户可通过浏览器能查看到网站的前端代码,即关于页面信息的代码;而要查看到网站后端的源代码需要攻破网站漏洞,一般用户无法查看。从Twitter上的截图可以看到,黑客是通过攻破网站漏洞,通过服务器权限访问后端数据库

换句话说,“可供任何人访问”,仅仅对具备解译代码技能的程序员而言,属于夸张并强调的说法,并非指普通的互联网用户可以直接通过网站访问到这些数据。

而在相关新闻报道中,不加解释和引述,直接将这句话放到报道或标题中有失准确性,错误地造成对于该事件的过度恐慌。

二、利益方的背后

1、深网视界

据国家工商信息显示,“SenseNets”为深圳市深网视界科技有限公司的注册商标,该公司成立于2015年9月,在深圳市市场监督管理局南山局登记成立。

据其公司官方微信介绍,深网视界由东方网力科技股份有限公司控股。公司定位在“AI+安防”,拥有基于深度学习的视频智能分析算法的核心技术,专注于深度学习人脸识别、人群分析以及人体检测当中的应用。

在国家工商信息页面中,深网视界的经营范围包括,技术开发、技术转让、技术咨询、技术推广、技术咨询、技术服务、技术推广;计算机系统服务;销售软件、安全技术防范产品;计算机系统集成、图形图像识别和处理系统的设计;安防电子产品及其辅助设备、智能硬件电子产品、计算机软硬件的技术开发与销售;经营进出口业务。(标红信息为2018年1月信息变更后新增项目)

在产品方面,面向视频监控领域,深网视界布局有人脸识别系统、人群分析系统、目标行人追踪系统三大产品线,具体来看包括人脸实时布控分析、人群滞留分布分析、人群密度分布分析、目标人员点位轨迹分析、目标人员点位频率分析等。

更早以前,在2017年杭州·云栖大会上,深网视界曾推出嵌入式人脸识别设备,即位于边缘侧的视频分析盒子等硬件端产品,但近年来主要以视频分析系统为主。

团队方面,深网视界的研发人员对外宣传为,主要来源于香港中文大学、清华大学的深度学习机器视觉专家。

算法方面,由商汤科技、香港中文大学研发团队提供算法支撑,面向智能视频分析的应用进行深度的研发;来自东方网力及其他业界领先企业资深的软硬件工程师,做面向安防行业产品的深度开发。

市场营销体系方面,深网视界基于东方网力在公安业务叫的市场营销体系,已经覆盖全国27个地市的销售网络。

目前,深网视界完成两轮融资,最新一轮融资A+轮的完成时间是2017年7月,投资方东方网力,金额未透露。A轮融资在2016年12月完成,投资方为中南文化,投资额2000万人民币。

2、和商汤的关系

根据历史工商信息显示,深网视界的股东在2018年7月20日进行过一次变更:占比35.83%的股东之一北京商汤科技开发有限公司撤回4597万出资,其他两大股东“东方网力”和“宁波梅山保税港区深网投资管理合伙企业(有限合伙)”出资额基本保持不变,分别为出资4703万,占比70.16%;出资2000万,占比29.84%。

与之对应地,在东方网力2018年半年度报告中针对该事件也有所表述:公司于2018年4月24日通过了《关于控股子公司减资的议案》,同意公司控股子公司深网视界将其注册资本由目前的12,830万元减少至6,703万元,股东北京市商汤科技开发有限公司减资4,597万元,减资后不再持有深网视界股份。

即在2018年7月20日后,商汤科技不再持有深网视界的股份。与此同时,深网视界的注册资本也由 1.283 亿元变更为 6703 万元。

关于该事件的采访,商汤科技机器之心表示:

  • 深圳市深网视界科技有限公司目前与商汤科技无关联关系。
  • 此次深网视界涉及数据泄露的产品并未由商汤提供。
  • 作为一家AI平台公司,商汤为客户提供处理数据的工具,即AI算法及技术,商汤自身并不占有客户数据。

但关于为何在2018年7月从深网视界全额撤资,商汤科技并未对外做出回应。

3、和东方网力关系

根据东方网力2018年半年度报告显示,深网视界是东方网力重要的非全资子公司,主要在视频监控领域提供智能分析产品和服务。工商信息显示,目前东方网力持股70.16%,是深网视界的控股股东。

据公开资料,东方网力专注于安防行业,是国内领先的视频管理平台与安防人工智能平台的提供商。公司产品及解决方案广泛应用于公安、交通、智慧社区、教育、医疗、金融、司法、能源等领域,并连续多年荣获“中国安防十大民族品牌”。

据东方网力2018年中报介绍,深网视界致力于发展成拥有计算机视觉深度学习原创技术的领先安防产品提供商,同时在人群智能分析、人体 Re-ID(检索)、人脸识别、模糊图像处理软件产品等方面进行技术开发与销售。

根据财报显示,深网视界近两年的净利润均为负值,2018年上半年净利润为负569.25万元;2017年净利润为负2042.95万元。

截至2月25日,东方网力A股市值为94.51亿。

三、关键点追问

以上,我们已经缕清事件的基本信息,并核实了关键表述。

据东方网力和深网视界仅有的对外回应来看,“目前已经知道报道事件,但具体信息和深网视界的进度一样,也在调查中。”以及在每日经济新闻问及是否会就上述事件发布公告时,工作人员表示,“最终调查结论还未出,目前还不清楚,要根据调查结果判断是否披露相关公告。”

在等待调查结果的同时,机器之心联系到了国内数名相关高校实验室-公安系统合作项目研究员、知名安防AI公司工程师、安全工程师、以及公安系统人员探讨,追问安防数据库泄露事件的诸多环节和问题。

(基于受访当事人意愿和委托,采访中涉及到人名和公司/机构名称暂不公开。)

1、泄露的数据性质

不同于互联网领域常涉及的用户行为数据,比如购买、浏览、阅读、点击等数据,这次事件中泄露的是涉及到我们个人最底层的身份数据,属于敏感型数据。

根据智库百科显示,敏感数据又称隐私数据,常见的有姓名、身份证号码、住址、电话、银行账号、邮箱、密码、医疗信息、教育背景等。

这些与个人生活、工作密切相关的信息受到不同行业和政府数据隐私法规的管制。如果负责存储和发布这些信息的企业或政府无法保证数据隐私,他们就会面临严重的财务、法律或问责风险,同时在用户信任方面蒙受巨大损失。

(来源 《敏感数据的定义模型与现实悖论:基于92个国家隐私相关法规以及200个数据泄露案例的分析》,《新闻界》2017年第6期2-10,17共10页·王敏。)

公安部张某认为:报道中提到的身份信息是比人脸照片更敏感的信息。

2、数据从何而来?

攻破网站漏洞所访问到的数据均属于敏感数据级别,从数据的归属权来看,它们显然不应当属于一家从事安防视频监控系统的商业公司。

那么这些数据从何而来呢?

某高校实验室-公安系统合作项目研究员 李某认为:

涉及到ID数据,即身份证信息,大概率来讲是从公安系统流出的。因为安防工程一旦涉及到公安系统合作,不可避免地需要访问身份信息数据。但是基于不同项目和不同公司,公安开放的权限不尽相同。

例如,我们实验室与公安系统某单位的一次合作中研发人脸比对算法,公安系统对数据管理非常谨慎、科学,他们允许我们访问一定体量的身份数据,约为100万个ID。

但是,我们公司只有访问数据的权限,并不允许读取其原始数据,仅将这部分数据作为黑盒子处理。

黑盒子处理的逻辑在于——你可以在我们的数据库上进行训练,但你没有权限将我的数据直接拷走,你也不会知道我的数据具体是什么。对于公安系统来说,其风险处于高度可控状态。

考虑到本事件中的SenseNet,作为东方网力和商汤(此前)的子公司,包括宣传上提到的港中文和清华背景等头衔,那么获取到公安部门的数据访问权并不是件难事。

某国内知名安防AI公司工程师 吴某表示:

关于我们的身份数据还有一类非正常来源,即酒店、银行等各种需要进行身份验证的部门或者平台。

比如,酒店办理入住时需要采集人脸信息进行身份数据的比对,他们就可能缓存用户的身份信息。该类信息可在部分地下市场流通并进行购买。

       2.1 获取这些数据是否合法合规?

某高校实验室-公安系统合作项目研究员 李某认为:

身份数据流通面有多种。但人脸与身份信息匹配的数据只有在公安数据库才可以获得。

这些公司获取身份数据的途径大多是合法合规,因为公安或者政府作为甲方有必要提供相关数据的访问权限。

比如,某市政府/公安委托A公司做人脸比对系统,那么作为甲方,某市公安需要给到足够量的真实数据作为AI公司的进行模型训练的样本,因为这样才能保证训练处来的模型是准确度高、可用的。

但双方在签订合同时,政府/公安通常会要求这些数据必须严格保密。

从合作的甲乙方关系来看,这样授权数据的使用和访问当然是合情合理的。但问题的关键是,公安/政府可能并不知晓安防公司对于这些敏感数据的保护意识如此之薄弱。

尽管这些AI算法已经签署了数据保密和防护等相关协议,但他们大部分仍然是互联网思维主导的公司,所以对于敏感数据的严肃性,背后的责任和风险有时意识不足,对保护这些数据的措施也不够安全、稳妥。

       2.2 公安系统开放数据的必要性?

某高校实验室-公安系统合作项目研究员 李某认为:

从公安的角度来看,将身份和人脸数据开放给乙方,即做人脸识别的AI公司有利有弊:

一方面,直接开放很方便,否则公安需要针对该类数据专门建一套专用读取的接口以供模型训练,双方交互、协同办公也比较繁琐。

另一个更重要的原因在于,AI公司在训练过程中为了优化算法,常常需要针对算法出错的案例或样本进行人工筛查和分析,如果公安不把数据直接开放出来,AI公司实际上没有切实有效的办法进行改善。

所以,最后很多安防系统项目协商的情况是——“你把数据开放给我们,我们会保证这些数据的安全然后”。

但是,或许一些安防系统公司还搞不清楚这句承诺背后的分量,他们更看重的是“把数据开放给我们,便于项目推进”。

3、泄露的数据库是如何被访问的?

根据报道,网站本身并不是将数据开源,而是被黑客攻破漏洞。

某高校实验室-公安系统合作项目研究员 李某认为:

目前据我所知,与大部分IT公司一样, AI算法公司的办公内网通常是允许员工在技术管控下、从外部网络间接访问的,内外网之间并没有进行物理隔绝。但这些技术管控措施,若不严格遵守,仍然存在一定的数据泄漏风险。

比如,我们实验室一同学在某互联网公司实习,他为了方便曾经只用了一条命令就直接将该公司某项目代码发送到个人电脑上进行调试,还好被及时发现并没有对这家公司造成商业层面的损失。

这个案例中,如果不是实习生拷贝代码用作研究,而是黑客或其他恶意行为的盗取,后果恐怕难以估计。对于AI公司来讲,其商业数据库的商业及安全价值甚至更加重要。因为一般公司自有的数据库都进行过特征值的标注,光是标注的投入金额就不少,在数十万到百万级别;这还不包括数据本身的稀缺性和独特性等价值。

所以如果要给这件事定义实际上就是一件非常严重的数据安全漏洞问题,由此暴露出AI公司在数据监控层面的缺位,尤其面向具体员工。

外部黑客想要突破公司防火墙或其它安全管控限制有时是很容易的事。实际上,不光是SenseNet的数据库可被攻破,其他AI安防公司的数据库同样具备这种可能性。只是这家公司规模较小,安全防护工作更弱。

       3.1 数据是否真的能够“被所有人轻易访问”?

安全工程师 王某:

很有可能是黑客检测到该公司的数据库的IP,然后破解这个IP,最终发现了这背后的数据集。

           3.2 为什么攻击官网就能够获取到公司的数据库

安全工程师 王某:

他们使用的是MongoDB一类的NoSQL数据库。此前,数据库已经被证明非常不安全,一般公司的敏感数据不可能存储在MongoDB上。

根据Victor Gevers发布的内容得知,此次事件涉及到深网视界的一个MongoDB数据库。该数据库体积超过3.5G,涉及公民信息超过250万条。

本次事件涉及到的漏洞为MongoDB未授权访问,该漏洞成因主要是开启MongoDB服务时不添加任何参数时,默认是没有权限验证的,登录的用户可以通过默认端口无需密码对数据库任意操作(增删改高危动作)而且可以远程访问数据库

数据库服务外,该服务器还开放了web服务,web服务提供的功能有人证核验系统。该服务目前也已经无法访问。

MongoDB数据库易被攻击早就不是新闻。“MongoDB启示录”事件始于2016年12月底,并持续到2017年的头几个月。2017年MongoDB数据库遭大规模勒索攻击,被劫持26000多台服务器,其中规模最大的一组超过22000台。

另外,由于MongoDB是开源的数据库,那么从黑客的角度,对于该数据库的漏洞和安全性肯定是十分熟悉好上手的,更容易被攻破。

一般来说,敏感数据的管理采用商用专业公司的数据库,比如Oracle DB等。

           3.3  反查官网域名所在的服务器是阿里云的,说明这家公司的运维不安全?

安全工程师 王某认为:

这种推测并不合理。阿里云将网站的所有权限开放给甲方,即公司,并不存在问题。但黑客是通过公司的权限而获取到的数据,已经与服务商公司没有关系,不能就此来说明阿里云不安全。

4、如何理解“基于摄像头捕捉到的过去24小时内经过的地点信息”?

某高校实验室-公安系统合作项目研究员 李某认为:

这类方案可以理解为两种情况,一类是地点信息对应临时注册的行人身份,如甲乙丙丁等“伪”身份ID;另一类是地点信息对应着确切的行人身份,如王姜及其身份证号。其中,第一种是当前研究、应用上较为火热的行人再识别;第二种则需要将行人再识别进一步与人脸比对结合起来,更为系统,安防应用价值也更高。

目前,部署第二种的难度更大,也较少应用。

一个重要的原因是,大部分用于捕捉、监视行人的相机通常很难对人脸进行清晰成像。既能捕捉到全身信息又能清晰捕获人脸信息的高清相机是这几年才推出的设备,实际应用中尚未大规模部署。

除了相机硬件能力外,第二种还依赖非合作条件下的人脸识别技术:在行人没有特意配合相机成像的条件下,检测人脸并完成人脸比对, 识别行人的身份。目前非合作条件下的人脸识别技术是不够成熟的。

笔者认为(这个太敏感,我不敢说这样的话,你来说吧),即使是公安能够获取到我们的“过去24小时内经过的摄像头的位置信息”也存在一定争议:即公安系统是否有权限监视我们每个人的生活轨迹,每天经过了哪些地点;相比身份信息只是为了维护治安的必要信息,一直以来都有登记在册,但后者的监控已经很有可能触犯到我们的隐私权。

这次泄露的该类数据,很大可能是深网视界获得公安的权限,或者还没有获得允许,通过其他方式获取到的数据。这类数据泄露所存在的隐患在于,如果攻击者掌握了某人的位置信息和运动轨迹,可以轻而易举实施各种犯罪。

       4.1 要获取与身份信息匹配的位置数据难度有多大,为什么?

某高校实验室-公安系统合作项目研究员 李某认为:

目前,从公安系统来讲,他们尚未存在相关的切实需求,所以CV公司大多也没有推动这方案的系统方案。通常,在需要验证个人身份的场合通常采用卡口相机,需要进行人的主动验证合作,即请接受检查,你必须看着我的摄像头,最常见的比如机场安检口。

该类方案的落地需要面临挑战包括三个方面:

一是原来硬件性能不够支持非配合场景下的身份验证;

二是,要广泛部署高清晰度、广场视角的相机,从系统的布设要求下,投入成本较大,并且需要大量部署;

三是,尽管部署完成,在非合作场景下需要进行人脸识别,技术的挑战也非常大。

因为在卡口位置,我们能够控制其拍摄的角度和环境,比如说俯仰角度控制在15度范围内;如果这些限制条件都无法实现,比如说俯仰角度如果超过40度,那么可以断定其误检率、匹配错误率都会非常高。

所以无论是从业务本身需求,还是到硬件功能,都属于比较少见的业务。

          4.2 在深网视界的对外业务介绍中提到“目标行人追踪系统”,即Re-ID系统,这与上述提到的“过去24小时内经过的摄像头的位置信息”有何异同?

某高校实验室-公安系统合作项目研究员 李某认为:

可以推断,该类信息很大可能性是用来做行人再识别,即Re-ID。

通常Re-ID数据并不需要标注个人身份,即不需要和其身份证信息和身份证号对应起来,只需要标注成临时注册的伪行人代号,比如甲乙丙丁就行。

如果泄露的信息是能将身份信息和位置信息对应起来的,那就不仅仅是我们所说的Re-ID。

Re-ID主要采用基于深度学习的行人检测和行人特征匹配这两大核心技术,实现对多个点位摄像机的行人进行检测、识别、特定目标的追踪与轨迹分析等功能。

系统对各个点位的摄像机视频中出现的行人进行检测,对这些行人的特征提取,然后进行聚类分析,识别和分析出这些行人图像里面:

1) 哪些图像是同一个人、包含有多少人、这些行人在各个点位上出现的频率;

2) 在输入目标行人图像到系统后,系统在各个点位上进行实时的布控,出现目标行人立即报警,并自动分析目标在各个点位出现的运动轨迹。

5、如何能够提升安防领域中敏感数据的安全性?

某高校实验室-公安系统合作项目研究员 李某认为:

要杜绝此类事件,我认为最行之有效的方式就是物理隔绝。比如,据我了解,华为等公司就采用了这样严苛的数据管控措施,这种情况下,员工则无法远程从内网拷贝数据,因为其内部服务器和外部网络没有连接。

此外,如果需要拷贝资料,针对资料的安全级别和机密性都会严格审核;通常如果员工要拷贝简单的代码或者模型,都需要层层审批,并且采用刻盘等方式完成。

那么,基于上述多层严格的数据保护措施,基本能够杜绝因为内部员工不小心或者外部黑客恶意攻击而导致的数据外流。

知名人脸识别公司数据分析负责人 常某认为:

我们公司目前的现状是,有一个运维团队所属的安全团队,会紧跟业界追踪安全漏洞,及时打补丁,做防范。

这只是常规公司的被动做法。但是,很多数据AI公司是连这个都做不到的。

我认为,像我们这种大体量的公司,必须要成立专门的安全研究团队,主动针对算法、业务、系统三个层面做攻防实验,主动参与漏洞的发现和修复过程,而不是等外界的一般性系统漏洞公布。

实际上,不止于安防,还有有比安防更敏感的,比如金融、准入、支付等领域,都是极高安全性的场景。比如我们做人脸门锁,如果很轻易被黑客攻击了,那根本就是对你核心业务和技术的否定。

如果我们的业务就是做生物识别,却居然没有专业研究安全的人去进行攻击防御的研究,这太说不过去了。人脸作为身份识别的技术,本身代表的是一种权限认证,就涉及到安全,这是业务层面的安全。

不过,如果连系统层面的安全都不能做到,业务层面的安全就更不用提了。

四、结语

透过对事件抽丝剥茧式的追问和考证,安防数据俨然一把双刃剑,展现出鲜明的两面性。

一方面,智慧安防属于智慧城市的一部分,监控安防系统在打击犯罪贩子、寻找走失人员,划定事件责任时,为公安治理和城市居民的工作生活带来保障。

但另一方面,基于人工智能深度学习数据分析系统无法回避数据的共享和流通问题。在这个背景下,忽视数据安全,尤其是泛安防场景中涉及到敏感数据的安全将引发定时炸弹式的高危性问题——一家中小体量的安防公司即可引发数百万条个人信息、数千万条位置信息的泄露,这将威胁我们每个公民的个人生产生活、公司和国家的安全,形成的危害和波及的范围如同神经网络一样辐射开来。

刚刚翻篇的2018年,Facebook因为史上最严重数据泄露事件——超过5000万用户数据被第三方机构剑桥分析公司(CambridgeAnalytica)用来建立用户模型,导致公司损失数亿美元;今年,GDPR最严数据法案已经在欧盟地区落地;而前不久,京东金融后台监控用户数据事件揭开了中国数据盗用问题的冰山一角……

在采访的过程中,数位经验丰富的安防从业者都感慨,相比传统老牌的IT公司,新一代互联网公司对于用户数据的态度过于懈怠,而继承互联网基因的人工智能公司对于敏感数据的意识也只是有过之而无不及。

“如果当代的AI公司再套用互联网的方式来管理AI数据、管控研发系统,而不是在公司整体的管理意识上建立数据背后的法律和责任意识,迟早是要吃亏的!”

产业安防数据
相关数据
AWS机构

亚马逊网络服务系统(英语:Amazon Web Services,缩写为AWS),由亚马逊公司所创建的云计算平台,提供许多远程Web服务。Amazon EC2与Amazon S3都架构在这个平台上。在2002年7月首次公开运作,提供其他网站及客户端(client-side)的服务。截至2007年7月,亚马逊公司宣称已经有330,000名开发者,曾经登录过这项服务。

相关技术
华为机构

华为成立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。华为的主要业务分布在无线、网络、软件、服务器、云计算、人工智能与大数据、安全、智能终端等领域,发布了5G端到端解决方案、智简网络、软件平台、面向行业的云解决方案、EI企业智能平台、新一代FusionServer V5服务器、HUAWEI Mate等系列智能手机、麒麟系列AI芯片等产品。目前华为拥有18万员工,36所联合创新中心,14所研究院/所/室,业务遍及170多个国家和地区。

http://www.huawei.com/cn
商汤科技机构

商汤科技成立于 2014 年,专注于计算机视觉和深度学习的原创技术,是中国领先的人工智能头部公司,估值超过 45 亿美金。以「坚持原创,让 AI 引领人类进步」为使命,商汤科技建立了国内顶级的自主研发的深度学习超算中心,并成为中国一流的人工智能算法供应商。商汤科技不仅在技术实力上领跑行业,商业营收亦领先同行业,在多个垂直领域的市场占有率居首位。目前,商汤科技已与国内外多个行业的 400 多家领军企业建立合作,包括 Qualcomm、英伟达、本田、中国移动、银联、万达、苏宁、海航、中央网信办、华为、小米、OPPO、vivo、微博、科大讯飞等知名企业及政府机构,涵盖安防、金融、智能手机、移动互联网、汽车、智慧零售、机器人等诸多行业,为其提供基于人脸识别、图像识别、视频分析、无人驾驶、医疗影像识别等技术的完整解决方案。

www.sensetime.com
京东金融机构

京东金融集团于2013年10月开始独立运营,至今已建立起十大业务板块——企业金融、消费金融、财富管理、支付、众筹众创、保险、证券、农村金融、金融科技、海外事业,实现了公司金融和消费者金融的双重布局,并实现了国际化。截至目前,京东金融累计为800万线上线下商户,3.6亿个人用户提供支付和金融服务。京东金融目前是在全球范围内为白领、中产阶级提供金融服务最多的科技公司,也是覆盖中国农村范围最广,服务农民数量最多的金融科技公司,是全球金融科技领域增速最快的公司之一。京东金融集团依托京东体系内数亿用户以及数十万合作伙伴所积累的电商数据、金融数据以及各类第三方数据,利用人工智能、生物识别、云计算、区块链等新兴科技,开发出风险量化模型体系、精准营销模型体系、智能投顾模型体系以及用户洞察模型体系等诸多前沿应用模型体系,并应用于金融场景之中。其中,京东金融风控体系利用深度学习、图计算、生物探针等人工智能技术,已实现无人工审核授信和放款,逾期率和资损水平低于行业平均值50%以上。此外,京东金融还实现了智能风控能力的输出,帮助银行在信贷审核上效率提高10倍以上,客单成本降低70%以上。京东金融频频获得国际学术界的肯定。包括,企业金融服务能力享誉全球,是目前唯一荣获《经济学人》旗下欧洲金融颁发的“全球卓越司库奖”的中资企业。信贷风控荣获《亚洲银行家》信贷风控技术实施奖,是中国区唯一获得此奖项的科技公司。智能风控实验室利用RNN循环神经网络算法进行用户行为路径学习,反欺诈准确率超过目前市场平均水平3倍以上,该算法发表在世界顶级机器学习学术会议之一PKDD2017上,成为世界级的科研成果。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据管理技术

数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程,其目的在于充分有效地发挥数据的作用。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

聚类分析技术

聚类分析(CA)是一种典型的无监督学习方法,这种方法是根据对象的特点将它们分成不同的组。K-均值是应用最广泛的聚类方法,其它方法还包括 k-Medoids、分层聚类和 DBSCAN。期望最大化法(EM)也是聚类分析的一种解决方案。聚类分析在数据挖掘、市场调研、异常值检测等许多领域都有应用。另外,降维技术也是一类类似于聚类分析的无监督学习方法,其典型的代表有主成分分析(PCA)、线性判别分析和 Isomap。

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

阿里云机构

阿里云创立于2009年,是全球领先的云计算及人工智能科技公司,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。 阿里云服务着制造、金融、政务、交通、医疗、电信、能源等众多领域的领军企业,包括中国联通、12306、中石化、中石油、飞利浦、华大基因等大型企业客户,以及微博、知乎、锤子科技等明星互联网公司。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行纪录。 阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。 2014年,阿里云曾帮助用户抵御全球互联网史上最大的DDoS攻击,峰值流量达到每秒453.8Gb 。在Sort Benchmark 2016 排序竞赛 CloudSort项目中,阿里云以1.44$/TB的排序花费打破了AWS保持的4.51$/TB纪录。在Sort Benchmark 2015,阿里云利用自研的分布式计算平台ODPS,377秒完成100TB数据排序,刷新了Apache Spark 1406秒的世界纪录。 2018年9月22日,2018杭州·云栖大会上阿里云宣布成立全球交付中心。

https://www.aliyun.com/about?spm=5176.12825654.7y9jhqsfz.76.e9392c4afbC15r
百度机构

百度(纳斯达克:BIDU),全球最大的中文搜索引擎、最大的中文网站。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于 2000年1月1日在中关村创建了百度公司。 “百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。 百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://home.baidu.com/
京东机构

京东(股票代码:JD),中国自营式电商企业,创始人刘强东担任京东集团董事局主席兼首席执行官。旗下设有京东商城、京东金融、拍拍网、京东智能、O2O及海外事业部等。2013年正式获得虚拟运营商牌照。2014年5月在美国纳斯达克证券交易所正式挂牌上市。 2016年6月与沃尔玛达成深度战略合作,1号店并入京东。

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

5G技术

第五代移动通信系统(5th generation mobile networks),简称5G,是4G系统后的延伸。美国时间2018年6月13日,圣地牙哥3GPP会议订下第一个国际5G标准。由于物理波段的限制,5G 的网络也将会与其他通信技术并用,包含长距离的其他传统电信波段。

暂无评论
暂无评论~