12 月 15 日,光子计算芯片公司曦智科技(Lightelligence)发布了旗下第二代高性能光子计算处理器——PACE(Photonic Arithmetic Computing Engine)
曦智科技在 PACE 这块光子芯片中集成了超过 1 万个光子器件,芯片运行速度 1GHz,特定循环神经网络的运行速度可达目前高端 GPU 的数百倍。PACE 成功验证了光子计算的优越性,是曦智科技在集成电路产业的又一重大突破。
PACE 已被集成为标准 PCI 接口板卡。
PACE 芯片介绍视频 https://live.vhall.com/v3/lives/subscribe/122758716
曦智科技创始人兼首席执行官沈亦晨博士表示:「PACE 的发布具有里程碑式的意义,它成功验证了光子计算的优越性,为集成电路产业提供了新的发展路径。此外,它还充分展示了光子芯片与传统电子芯片无缝协同的运作方式,而这一切要归功于曦智科技光电封装团队的 3D 封装创新。」
基于光执行矩阵向量乘法时延极低的基本原理,PACE 通过重复矩阵乘法和巧妙利用受控噪声组成的紧密回环来实现低延迟,从而生成了伊辛问题(Ising)和最大割 / 最小割问题(Max-cut/Min-cut)的高质量解决方案。
PACE 包含 64x64 的光学矩阵,核心部分由一块集成硅光芯片和一块 CMOS 微电子芯片以 3D 封装形式堆叠而成。对于每个光学矩阵乘法,输入向量值首先从片上存储中提取,由数模转换器转换为模拟值,通过电子芯片和光子芯片之间的微凸点应用于相应的光调制器,形成输入光矢量。
接着,输入光矢量通过光矩阵传播,产生输出光矢量,并达到一组光电探测器阵列,从而将光强转换为电流信号。最后,电信号通过微凸点返回到电子芯片,通过跨阻放大器和模数转换器返回数字域。测试显示,PACE 的运算速度可达目前高端 GPU 的数百倍。
曦智科技的光芯片,因为矩阵乘法运算的方式相对于传统芯片并行能力更强,可以实现更多通量、更高主频,能效也优于电子芯片(光传输不发生热量),完成矩阵运算延时远远低于电子芯片。同时,硅光对于工艺制程要求也非常低,目前的芯片只需要 65nm,未来的发展也对制程没有特殊需求。
在实现方式上,光芯片构建了一个灵活的通信网络拓扑,可实现片上光网络的数据交互,通用性很强,可以结合不同类型的电子芯片。片间互联也可以使用光的方式。
光芯片技术的发展,主要在于不断增加光芯片器件的集成度。从四年前的原型到现在 64×64 的矩阵乘法已经提升了三个数量级,是目前已知集成度最高的光子芯片。
曦智科技表示,在测试中对比 RTX 3090 来跑循环神经网络,PACE 只需要 GPU 的 1% 时间,而且光芯片还有更多的提升空间。该公司还展示了全球首次光子芯片在人工智能、深度学习以外的应用案例。
「未来我们还可以提升一到两个数量级的速度,」沈亦晨表示。「我们尝试过学界解决 NP 问题更加领先的算法,最快可以让 GPU 速度提高 5 倍左右,即使如此我们的 PACE 速度仍然比 GPU 快几十倍。」
曦智科技预计,在基于 Transformer 架构的语言模型等任务上,光子芯片也可以实现相比传统 GPU 快 3-5 倍的优势。
在应用层面上,PACE 也做到了接近实用化,「我们的芯片不是纯光学计算,在可预见未来都将是电芯片和光子混合运算,」沈亦晨说道。「所有最终交互承载在电芯片上面。光芯片在其中承接线性计算和数据、网络传输任务。这意味着 PACE 和现有计算环境是兼容的。」
曦智科技展示了云计算、智能驾驶、量化投资等方面。当前曦智科技已经和部分云服务提供商,以及北美头部金融公司展开合作。