Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Mike Lee作者

EUSIPCO 3MT 首位中国冠军,博士生借助噪声扰动算法打破数据流动壁垒

近日,欧洲信号处理协会 EURASIP 官网公布了 EUSIPCO 2020 3MT 比赛结果,丹麦 - 奥尔堡大学的中国博士生李琼秀(Qiongxiu Li)荣获冠军。

EUSIPCO 会议(European Signal Processing Conference)是欧洲信号处理协会(EURASIP)每年一度的旗舰会议,同时也是欧洲信号处理领域影响最大的会议。会议涵盖信号处理研究和技术的最新发展,这些研究和技术将对计算机视觉语音处理人工智能机器学习等诸多领域产生重要影响。 

图片


EURASIP官网:https://www.eurasip.org/index.php?option=com_content&view=article&id=150&Itemid=1172

年度三分钟论文比赛( 3MT-Three Minutes Thesis contest)于 2015 年由 EURASIP 在法国尼斯首次举办,之后每年举办一次。在 EUSIPCO 年度会议期间,邀请拥有优秀研究成果的博士候选人,以博士期间的研究工作或论文成果进行 3 分钟的论文答辩演讲。

今年来自丹麦 - 奥尔堡大学的李琼秀(Qiongxiu Li)凭借论文答辩演讲「Privacy-Preserving Distributed Signal Processing」 获得了 3MT 比赛冠军。李琼秀是第一位获得冠军的中国学生。

图片


官方证书:https://www.eurasip.org/index.php?option=com_content&view=article&id=150&Itemid=1172

相关成果是分别发表在 IEEE. Trans. on Information Forensics and Security、 IEEE. Trans. on Signal Processing 的《Privacy-Preserving Distributed Processing: Metrics, Bounds and Algorithms》以及《Privacy-Preserving Distributed Optimization via Subspace Perturbation: A General Framework》的两篇一作论文。

研究内容

李琼秀的博士研究课题为「如何在保证用户隐私的前提下在分布式系统中做去中心化计算」。  以机器学习在医疗健康领域的应用为例: 机器学习有一个基础前提是数据越多就越有可能学习出性能更好的机器学习模型,比如可以更准确地进行早期诊断以预测癌症等疾病。因此很多医学工作者都有与机器学习研究者合作的意愿,通过分享病人数据来学习出更好的模型。但这种合作往往很难达成甚至是不合法的,因为共享数据侵犯了病人的隐私。在隐私保护的限制下,各个企业机构形成了数据孤岛,没有办法做到资源共享合作双赢。隐私保护安全计算就是为了解决这个矛盾, 目标是打破数据流动壁垒,研究如何在保证用户隐私的前提下实现合作双赢。这是一门交叉学科,涉及到数据科学信息论,密码学,优化,分布式系统等多个学科,也有很多重要的应用,例如云计算区块链、分布式计算网络等。

该研究方向还有一些细化的子领域:比如整个系统可以划分为中心化和去中心化系统。图左是一个中心化系统,首先所有用户把自己的本地数据(或者一些从本地数据上学习出来的模型参数,比如联邦学习的设定)发给共同信任的第三方(比如某些权威机构),由第三方统一计算后再把全局模型发回给各个用户。这种中心化系统有很多弊端比如拓展性不高,系统安全性完全依赖于第三方,而且很难找到共同信任的第三方。图右是一个去中心化系统,顾名思义就是为了解除对第三方的依赖,形成一个点对点(p2p, peer to peer)的对等网络。由系统内部每个用户的共同协作来完成全局计算,这样的系统灵活性高,鲁棒性和拓展性也很强。

图片


目前比较流行的解决隐私安全的方法有差分隐私(differential privacy) 和安全多方计算 (secure multiparty computation)。李琼秀在博士期间提出了新的保护隐私的去中心化计算方法:基于分布式优化的子空间噪声扰动算法。其主要思想是通过添加扰动噪声在一个特定的由网络拓扑结构确定的子空间里保护隐私。这个算法有很多优点:相比于差分隐私,它的优点是不需要在隐私和算法准确度之间权衡取舍;相比于安全多方计算里的同态加密(homomorphic encryption)和秘密共享 (secret sharing) 技术,该算法的优点是计算和传输复杂度都很小。

图片


论文链接:https://scholar.google.com/citations?user=ObH3SIoAAAAJ&hl=en

此外,李琼秀提出在分布式计算系统中使用互信息量来度量隐私和结果可用性(privacy&utility),讨论它们的上下边界,并系统地分析了多种算法的特点,包括安全多方计算,差分隐私和子空间扰动。该论文指出隐私的下边界是连接这三种算法的核心,并且基于隐私的下边界可以制定出一些原则和建议来帮助用户选择合适的隐私保护分布式计算方法。

图片


论文链接:https://scholar.google.com/citations?user=ObH3SIoAAAAJ&hl=en

个人简介:李琼秀于 2015 年本科毕业于东北大学(秦皇岛)电子信息工程专业(排名 1/145), 于 2017 年硕士毕业于韩国仁荷大学(全额奖学金),之后于 2018 年 3 月前往丹麦奥尔堡大学攻读博士学位,预计在 2021 年 9 月完成博士答辩。博士期间导师分别是丹麦 - 奥尔堡大学 Mads Græsbøll Christensen 教授和荷兰 - 代尔夫特理工大学 Richard Heusdens 教授。


参考链接:

https://www.eurasip.org/index.php?option=com_content&view=article&id=150&Itemid=1172
https://sites.google.com/view/qiongxiuli/home
https://scholar.google.com/citations?user=ObH3SIoAAAAJ&hl=en
理论数据隐私
相关数据
区块链技术

区块链是用分布式数据库识别、传播和记载信息的智能化对等网络, 也称为价值互联网。 中本聪在2008年,于《比特币白皮书》中提出“区块链”概念,并在2009年创立了比特币社会网络,开发出第一个区块,即“创世区块”。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

信号处理技术

信号处理涉及到信号的分析、合成和修改。信号被宽泛地定义为传递“关于某种现象的行为或属性的信息(如声音、图像和生物测量)”的函数。例如,信号处理技术用于提高信号传输的保真度、存储效率和主观质量,并在测量信号中强调或检测感兴趣的组件。我们熟悉的语音、图像都可以看做是一种信号形式。因此,对于语音、图像的增强、降噪、识别等等操作本质上都是信号处理。

语音处理技术

语音处理(Speech processing),又称语音信号处理、人声处理,其目的是希望做出想要的信号,进一步做语音辨识,应用到手机界面甚至一般生活中,使人与电脑能进行沟通。

信息论技术

信息论是在信息可以量度的基础上,研究有效地和可靠地传递信息的科学,它涉及信息量度、信息特性、信息传输速率、信道容量、干扰对信息传输的影响等方面的知识。通常把上述范围的信息论称为狭义的信息论,又因为它的创始人是香农,故又称为香农信息论。

联邦学习技术

如何在保护数据隐私、满足合法合规要求的前提下继续进行机器学习,这部分研究被称为「联邦学习」(Federated Learning)。

推荐文章
暂无评论
暂无评论~