Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

机器之心编辑部编译

IBM新研究登上Nature封面:两种量子算法解决分类问题

机器学习核方法在模式识别中广泛使用,但当特征空间变大时,核函数计算成本高昂,普通计算机难以负担。量子计算机可以在极大的空间中展开计算,如果将数据映射到只存在量子态的空间中会怎么样呢?在 Nature 今天发表的一篇论文中,IBM 的研究者提出将量子态空间作为特征空间来使用。他们提出了两种基于超导处理器的量子算法用于解决分类问题,并进行了大量实验。

机器学习量子计算在技术炒作方面都达到了惊人的程度,除此之外,二者数学基础的某些方面也有着惊人的相似性。今天 Nature 发表了一篇论文《Supervised learning with quantum-enhanced feature spaces》(Havlíček 等人),研究者探索了二者的联系,展示了如今的量子计算机理论上可以怎样的方式从数据中学习。他们给出的方法是:将数据映射到只存在量子态的空间里。

量子计算机很难在台式电脑等经典计算机上进行模拟,这是人们对量子计算机的初步认识之一。换句话说,经典计算机无法用于获取量子计算结果,因为这一过程需要大量数字来描述计算的每个内部步骤。回忆一下我们在学校学的大数除法的多个步骤。如果这是在经典计算机上模拟的量子计算,那么每个中间步骤都需要更多的数字来描述它,这个数字比宇宙中已知的原子数还要大。

用一组数字描述的量子系统状态被称为量子态。如果一个量子态与许多值相关,我们就说其「生活在」一个很大的空间中。对于基于连续变量的量子计算机来说,这些空间甚至可能无限大。

相比较而言,机器学习分析的数据所处的空间要小得多,也就是说,描述数据的值要少得多。例如,一张 100 万像素的图像只需要 300 万个数字来描述所有像素点里的红、绿、蓝值。机器学习的一个典型任务是判断图像里的内容,或生成相似的图像。然而,机器学习中一个叫作「核方法」(kernel method)的成熟理论处理数据的方式与量子理论处理数据的方式类似。

简而言之,核方法通过定义哪些数据点彼此相似、哪些不相似来开展机器学习。从数学上来讲,相似性就是数据空间中的一段距离,即数据点数字表征之间的距离。相似的图像被认为拥有相似的内容,机器学习中数据点之间的距离非常重要。但定义相似性并没有听上去那么简单。例如,如果根据每张图像里的红色值来判断,那么两张图像在数据空间中的距离是什么?

核理论表明,许多关于数据空间相似性的定义在数学上等价于一个更大、可能是无限大的空间中对相似性的简单度量(见图 1)。因此,每次比较两张图像的时候,都要将图像隐式地映射到一个大空间的表征,然后简单地计算相似性。普通计算机无法显式地计算这种大型表征,但也许量子计算机存在这种可能性?量子计算机可以在极大的空间中展开计算,如果将数据映射到只存在量子态的空间中会怎么样呢?

图 1:量子增强机器学习。Havlíček 等人展示了量子计算机如何提升机器学习算法的性能。在这个简单的图示中,常规(经典)计算机将机器学习用于动物图像分类。图像的像素颜色相似,则在数据空间中彼此靠近。经典计算机将这些数据发送至量子计算机,后者将每一幅图像映射到量子空间中的特定量子态。数据空间中彼此靠近但内容不同的图像由量子空间中相距甚远的量子态来表示。量子计算机将量子态之间的距离发送至经典计算机,以提升图像分类效果。

几乎是在同一时间,Havlíček 等人和 Maria Schuld 的研究团队意识到机器学习量子计算之间可能存在密切联系。值得注意的是,两个团队提出了本质相同的两种策略,即设计用于机器学习的量子算法。第一种策略仅能实现量子计算机的最小使用,将其作为常规机器学习系统的硬件补充:当给定两个数据点时,量子设备返回相似性。第二种策略是在量子计算机上执行实际学习,经典计算机作为辅助。

Havlíček 等人的一项关键贡献是,他们在原理验证试验中基于真实的量子计算机(IBM量子计算机)实现了这两种策略。尽管一些新闻报道有些夸张,但任何尝试过量子计算的人都知道从这些设备中收集有意义的数据是非常困难的,因为量子计算中存在大量实验噪声。这可能也是他们在实验中仅使用了量子裸机的原因,在一些人看来这已经足够多了。量子空间仅有四个维度,因为该设置使用了 IBM 最小的 5 量子比特计算机的两个量子比特(qubit),而目前 IBM 云服务已经能够提供 20 量子比特设备。数据集也经过类似的手工处理,使其在四维量子空间中易于分析。

然而,Havlíček 及其同事的研究展示了一种有趣的原理验证试验——使用量子计算机进行机器学习,这说不定是一种变革性方法。现在已有很多研究进行了大量尝试,试图将更流行的人工神经网络与量子计算结合起来,核方法为机器学习和量子理论提供了一座很自然的桥梁。但是,意识到这座桥的存在还只是开始。

例如,Havlíček 等人在量子空间中表示数据的方式是否可用于现实世界的机器学习应用,这仍待观察。也就是说,我们不知道这种方法是否与有意义的相似性方法相关,比如在动物图像分类时,将猫的图像放得近一些,而不是将猫图像放在狗图像旁边。此外,我们不清楚是否存在其他更好的策略。这些技术是否已经足够好,可以打败有将近 30 年历史的经典方法?如果答案是肯定的,那么寻找量子计算机「杀手级应用」的行动可以告一段落了。然而,这个问题的答案可能要复杂得多。

论文:Supervised learning with quantum-enhanced feature spaces

文章链接:https://www.nature.com/articles/s41586-019-0980-2

摘要机器学习量子计算这两种技术均具备改变计算方式的潜力,以解决之前的难题。机器学习核方法在模式识别中广泛使用,例如支持向量机(SVM)是处理分类问题的最著名方法。然而,这一成功解决方案也存在局限,当特征空间变大时,SVM 核函数计算成本高昂,难以估计。量子算法中计算加速的核心元素是通过可控的纠缠和干预利用巨大的量子态空间。本研究中,我们提出了两种基于超导处理器的量子算法,并进行了大量实验。这两种方法的核心要素是将量子态空间作为特征空间来使用。使用经过量子增强的特征空间(仅能够在量子计算机上高效获取)提供了一种可能的路径,导向量子优势。这两种算法可解决监督学习问题:分类器的构建。其中一种方法是量子变分分类器,它使用变分量子电路(variational quantum circuit)对数据进行分类,运作方式与常规 SVM 很类似。另一种方法是量子核估计(quantum kernel estimator),它使用量子计算机估计核函数,并优化经典 SVM。这两种方法为探索将带噪声的中间尺度量子计算机应用到机器学习提供了工具。

量子变分分类器

量子变分分类器使用变分量子电路实现,量子电路包含三部分:特征图编码、变分优化和度量。

量子变分分类器图示。

特征图编码

变分优化

量子核估计

量子核函数

实验实现

原文链接:https://www.nature.com/articles/d41586-019-00771-0

理论IBMNature量子算法分类
1
相关数据
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

核函数技术

核函数包括线性核函数、多项式核函数、高斯核函数等,其中高斯核函数最常用,可以将数据映射到无穷维,也叫做径向基函数(Radial Basis Function 简称 RBF),是某种沿径向对称的标量函数。最常应用于SVM支持向量机中

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

映射技术

映射指的是具有某种特殊结构的函数,或泛指类函数思想的范畴论中的态射。 逻辑和图论中也有一些不太常规的用法。其数学定义为:两个非空集合A与B间存在着对应关系f,而且对于A中的每一个元素x,B中总有有唯一的一个元素y与它对应,就这种对应为从A到B的映射,记作f:A→B。其中,y称为元素x在映射f下的象,记作:y=f(x)。x称为y关于映射f的原象*。*集合A中所有元素的象的集合称为映射f的值域,记作f(A)。同样的,在机器学习中,映射就是输入与输出之间的对应关系。

监督学习技术

监督式学习(Supervised learning),是机器学习中的一个方法,可以由标记好的训练集中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练集是由一系列的训练范例组成,每个训练范例则由输入对象(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。

支持向量机技术

在机器学习中,支持向量机是在分类与回归分析中分析数据的监督式学习模型与相关的学习算法。给定一组训练实例,每个训练实例被标记为属于两个类别中的一个或另一个,SVM训练算法创建一个将新的实例分配给两个类别之一的模型,使其成为非概率二元线性分类器。SVM模型是将实例表示为空间中的点,这样映射就使得单独类别的实例被尽可能宽的明显的间隔分开。然后,将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别。

分类问题技术

分类问题是数据挖掘处理的一个重要组成部分,在机器学习领域,分类问题通常被认为属于监督式学习(supervised learning),也就是说,分类问题的目标是根据已知样本的某些特征,判断一个新的样本属于哪种已知的样本类。根据类别的数量还可以进一步将分类问题划分为二元分类(binary classification)和多元分类(multiclass classification)。

图像分类技术

图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

量子计算技术

量子计算结合了过去半个世纪以来两个最大的技术变革:信息技术和量子力学。如果我们使用量子力学的规则替换二进制逻辑来计算,某些难以攻克的计算任务将得到解决。追求通用量子计算机的一个重要目标是确定当前经典计算机无法承载的最小复杂度的计算任务。该交叉点被称为「量子霸权」边界,是在通向更强大和有用的计算技术的关键一步。

推荐文章
暂无评论
暂无评论~