Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

数据治理迫在眉睫,隐私计算发展正当时

2022年3月1日,《互联网信息服务算法推荐管理规定》(以下简称《规定》)正式施行。在《网络安全法》《数据安全法》《个人信息保护法》等上位法基础上,《规定》将算法监管纳入网络综合治理体系,有效保障了消费者的知情权、公平交易权和自主权利。

近年来,虽然数据的流通和共享为社会发展创造了巨大价值,但人们对互联网企业的信任也日益走低,认为巨头们在收集海量数据的同时,正“暗地里”侵犯用户隐私权。

在此背景下,隐私计算作为一种在保护数据安全的同时兼顾行业应用与发展的新型技术,也获得了越来越多的关注。

1、隐私计算火了

从20世纪80年代多方安全计算提出至今,隐私计算相关技术发展已经将近半个世纪。2021年以来,在技术、政策、资本等多种因素的催化下,隐私计算行业开启加速发展模式。

相比于传统数据保密方法,隐私计算最大的亮点是使数据在各个环节中“可用不可见”,通过实现数据的物理分散、逻辑集中,在确保数据安全隐私性的同时,挖掘数据价值、促进价值流通。

2019年,Gartner首次将隐私计算列为处于启动期的关键技术。2020年,Gartner又将隐私计算列为2021年企业机构九大重要战略科技之一,并预测隐私计算将迅速得到落地应用,预计到2025年应用范围将覆盖全球一半的大型企业机构。

虽然隐私计算原理模型早已存在,但是运算速率一直是影响其可用性的关键因素,这与算法类型、数据规模、数据特征、软硬件环境、服务器性能、网络带宽、硬件加速等多种因素相关。

近年来,国内外隐私计算技术不断发展成熟,运算速率不能同日而语。根据调研,隐私计算计算速度慢的耗时达到明文计算的上百倍,而速度最快的耗时是明文计算的3—5倍,目前这一速度在很多场景已经达到初步可用。性能的提升,是隐私计算商业化落地的关键因素。

另外,政策对市场的推动作用也特别明显。随着相关法律政策对于信息保护的要求越来越高,对于数据泄露数据安全问题的追责也越来越更加严格。

2020年4月,中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》,将数据列为生产要素,明确指出了市场化改革的内容和方向。2021年11月1日,《中华人民共和国个人信息保护法》正式施行,该法律明确要求个人信息处理者需要对个人信息采取相应的加密、去标识等安全技术措施,防止个人信息泄露、篡改和丢失。在此背景下,隐私计算作为一种在保护数据安全的同时兼顾行业应用与发展的新型技术,也获得了越来越多的关注。

同时,隐私计算技术巨大的市场前景也让我们对它充满了想象。据微众银行与毕马威联合发布的《2021隐私计算行业研究报告》数据显示,隐私计算国内市场将达到空前规模,三年后技术服务营收有望触达100-200亿人民币空间,甚至将撬动千亿级数据平台运营收入空间。

2、MPC、TEE、FL三足鼎立

在隐私计算赛道里,各大公司选择的技术路线并不相同。目前,实现隐私计算主要有三种技术路线:可信执行环境、多方安全计算、联邦学习。

多方安全计算(Secure Multi-Party Computation,MPC)是20世纪80年底由姚期智等人提出,是一种基于密码学,数据所有者在数据不出本地数据库的情况下进行协同计算,输出计算结果,并保障任何一方无法获得计算结果之外的其他信息的技术。

例如,在百万富翁问题中,两名富翁可以各自加密自己的财产状况X和Y作为输入,通过特定的算法,双方可以得到可信的X和Y的比较结果,但无法获知对方的财产情况。

安全多方计算的局限性有:效率较低;无法保证参与方输入的真实性。无法阻止参与方恶意构造输入,并从结果推测其他人的输入。

可信执行环境(TrustedExecution Environment,TEE)是Global Platform在2010年提出的一种隐私计算概念,是指在硬件或者软件环境中,划归一个独立的区域,让系统的其他进程无法访问,而只有经过授权的访问才能允许通过。硬件可信执行环境是目前最主要的路径,但其基础变成需要硬件方的支持,存在一定的门槛。软件可信执行环境目前应用较少,还需要一定验证。

联邦学习(Federated Learning,FL)是三者中最晚出现的技术路线,在2016年由Google率先提出。联邦学习是一种打破数据孤岛、释放AI应用潜能的分布式机器学习技术,能够让各参与方在不披露底层数据和底层数据加密(混淆)形态的前提下,通过交换加密的机器学习中间结果实现联合建模。联邦学习算力成本低,类似于边缘计算,但通信成本高,并存在由此导致的通信安全问题。

目前看来,无论哪种方法都涉及到大量的对现有计算算法和软件架构的重构,以及更高的通信成本和计算成本,还不存在一种通用的方法能解决所有场景的隐私计算问题。

据东方证券研报认为,隐私计算有许多底层技术可供选择,而隐私计算的实现可能需要多种技术融合应用。现阶段MPC、TEE与联邦学习三种技术商用化进程领先,短期内这一技术趋势会被延续。长期来看,MPC、联邦学习需要隐私计算供应商长期积累有效数据并迭代、优化算法,而TEE需要在此基础上对于底层芯片做出优化设计。

综合而言,TEE对于供应商的软硬件全栈能力要求极高,现阶段中国厂商仅互联网头部厂商可以实现。出于成本考虑,MPC与联邦学习的应用占比或将增加。

3、应用落地进行时

从整体发展情况看,隐私计算在经历了2019年的技术普及和市场教育阶段,2020年的大规模概念验证和试点部署阶段之后,于2021年开始进入真正尝试规模化应用的阶段。不仅隐私计算的优秀落地场景与案例越来越多,相关技术服务商更容易接到订单。在未来3-5年,行业有望迎来爆发式增长。

当前隐私计算技术主要应用在金融、医疗、政务、互联网、通信等领域,主要的应用场景有金融风控、医疗健康、精准营销、身份验证等等。

以金融领域为例,隐私计算在反洗钱和智能风控等方面大有用武之地。据富数科技合伙人、高级总监黄奉孝介绍,银行存款用户数量庞大,但是单纯依赖行内的客户数据,很难圈出对购买理财感兴趣的用户。一般的操作都是通过API或者离线库的方式采购第三方数据公司的标签,API查询动作很大程度上会对银行客户ID隐私造成威胁。“这就是问题根源!隐私计算可以从技术上保证这类业务的隐私数据安全性。”

医疗行业的数据共享与流通需求是隐私计算的另一个关注重点。医疗数据较为敏感,并且基于医疗数据的各项科学研究通常需要大量样本,单一数据源的数据量很难满足海量的数据需求,而数据共享过程中又会带来隐私泄露的风险。

隐私计算能够有效助力医学影像识别、疾病筛查、AI辅助诊疗、智能问诊咨询等。例如多家医疗机构可以通过横向联邦学习联合构建目标检测模型,用于辅助通过医疗图像的疾病检查(如肺部X光片检查等)。

在抗击新冠肺炎疫情的过程中,隐私计算助力实现了全球范围内的疫情数据共享,基于多方安全计算等技术实现了允许用户在不公布己方数据的前提下,联合其他科研人员协同进行病例样本基因组的联合分析并共享结果,实现了对病毒流行病学情况的实时追踪和对未来毒株演化的预测。

除了金融、医疗行业,隐私计算还能被广泛应用于高校科研、农业、运输物流、房地产经纪、旅游等诸多场景。

《腾讯隐私计算白皮书2021》显示,隐私计算虽然已经开始在不同行业初步应用,但是受限于计算复杂度、多方交互效率、模型性能等问题,大部分的应用场景均聚焦于少量数据的支持,对海量数据场景的支持能力还有待提升。

4、各路玩家跑马圈地

隐私计算生态的建立需要供应商掌握优秀的算法与丰富的数据资源。互联网大厂、深耕垂直场景的初创企业以及产业内头部企业具备这两种资源,为其成功布局隐私计算提供了可能。

从2018年开始,阿里巴巴、百度、腾讯、京东、蚂蚁等各互联网巨头凭借自己在技术领域的积累,纷纷推出了各自的隐私计算产品,形成了跨业务、多团队、强支撑的发展态势。而作为大规模数据资源拥有者的电信运营商,中国联通、中国电信、中国移动等也已相继入局隐私计算。此外,华控清交、富数科技、矩阵元、数牍科技、锘崴科技、光之树科技、零知识科技等一批专注于隐私计算产品化的初创企业也不断涌现。

零壹智库研究报告显示,截至2021年8月,中国已经有超过1700家公司参与了隐私计算专利申请,其中专利申请数量最多的3家公司分别是蚂蚁集团(1195件)、华为(365件)和阿里巴巴(258件)。

据锘崴科技创始人王爽观察,隐私计算领域包括了“隐私计算+”和“+隐私计算”两种类型公司。“隐私计算+”有底层的隐私计算平台赋能不同隐私计算领域,“+隐私计算”有非常垂直深入的行业资源再加入隐私计算。两者各有优势,一个偏重技术,一个偏重解决方案,都可以找到成功案例,甚至“隐私计算+”公司也可以服务于“+隐私计算”公司。

随着商业落地的加速,国内隐私计算企业对人才的需求也在迅速扩张:一方面是因业务客户数量迅猛增长所需要的服务人员缺口,包括销售、解决方案、交付团队等角色;二是隐私计算技术产品的快速升级迭代所需要的技术人员缺口,包括算法、工程等角色。

常春藤资本创始合伙人翁吉义在一次行业论坛上表示,隐私计算行业蕴含大机会,全球范围内都是全新的增量市场,有成长出多家独角兽的可能。目前,隐私计算尚无真正意义上的杀手级应用,远未到分出胜负的时候,因而发展潜力巨大。

翁吉义认为,隐私保护领域会不断出现创业机会是源于三方面的推动力。一是立法监管趋严迫使数据应用从粗放式向精细化管理过渡,二是公众隐私意识增强将让企业面临更多的用户响应场景,三是外部合规驱动可以在短时间内催生大量的需求。

5、挑战和机遇并存

毋庸置疑,隐私计算本身有非常大的价值和应用前景,但是想要达到百亿级的市场规模,突破商业化的发展瓶颈,还有非常长的路要走。

目前,市场对于隐私计算的认知度、认可度仍然不足。据金智塔科技郑小林回忆,公司隐私计算平台的第一个客户是一家农村商业银行。这个客户,自己带团队整整做了一年。因为是第一个隐私计算落地项目,做的过程中遇到很多困难,不仅是技术的问题,还涉及如何说服政府机构将数据赋能金融服务小微科创企业,涉及到技术员与金融业务场景知识融合的问题。那时,郑小林亲自上阵,经常带着员工在银行会议室熬夜一起讨论,第二天给行领导和业务部门负责人汇报,一次次打磨,才最终告成。

虽然隐私计算技术通过数据“不可见”实现了数据安全的保护,但正因为“不可见”,也为攻击者留下更多“藏污纳垢”的余地。蓝象智联密码安全专家刘洋指出,首先是针对数据安全的攻击,包含数据重构、数据下毒、模型后门注入、无意识记忆;其次是针对模型安全的攻击,包含模型偷取、恶意样本、成员推断、模型更新推理。

此外,隐私计算技术推广所需的成熟商业模式仍在形成。在零壹研究院于百程介绍,目前,隐私计算市场尚处于发展的初期,商业上处于探索阶段。从服务对象来看,在中国国内,隐私计算市场目前主要是一个面向企业的市场。但是在美国,已经出现了通过为企业提供隐私计算服务从而间接为个人提供隐私保护服务的模式,未来很有可能出现直接为个人提供隐私保护服务的应用。在国内,具体的商业模式包括硬件销售、软件销售、平台分润以及开源模式。

在近期的一次行业峰会上,蓝象智联创始人兼CEO徐敏把隐私计算定位成科技与人文十字路口的选择,目的是让科技和人文更和谐相处。

“过去我们用互联网、云计算、人工智能等技术打造成提供前进动力的“发动机”,未来要通过隐私计算等技术来打造把控前进方向的方向盘、降低意外风险的刹车片。各种技术手段及法律法规等一起合作,让我们走进更符合共同价值观、道德伦理观、法律法规及经济学底层原理的数字化社会。”


资料来源:

 东方证券《区块链系列报告六:多技术路径齐演进,厂商优先布局隐私计算生态》

开源证券《隐私计算,千亿蓝海市场加速开启》

甲子光年《2021年中国隐私计算市场研究报告:蓝海壮阔,扬帆起航》

通证通研究院 《隐私计算:动态的加密技术》

https://mp.weixin.qq.com/s/BUWM48ro-L_0jrrTEqvgbA

https://mp.weixin.qq.com/s/Sb9oBwmLI3G-oQhdPInwRA

https://mp.weixin.qq.com/s/bfzGBWKxJJ2MN56s-88qkw

https://mp.weixin.qq.com/s/H8uMjVTYAXZhK72dgs9StA

产业
1
暂无评论
暂无评论~