Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

聚类精度超96%,机器学习新算法可实现更高脑机接口性能

图片

编辑 | 萝卜皮

使用多个电极记录神经元活动已被广泛用于了解大脑的功能机制。增加电极数量使科学家能够解码更多种类的功能。然而,由于硬件资源有限和不可避免的热组织损伤,处理大量多通道电生理数据仍然具有挑战性。

在这里,韩国大邱庆北科学技术院(DGIST,Daegu Gyeongbuk Institute of Science & Technology)的研究团队提出了基于机器学习(ML)的高频神经元尖峰从二次采样的低频信号重建。

受到图像处理中高频恢复和超分辨率之间等效性的启发,研究人员将 Transformer ML 模型应用于从体外培养物和体内雄性小鼠大脑中记录的神经元数据。即使使用 x8 下采样数据集,该团队的模型也能合理估计尖峰活动的高频信息,包括尖峰时间、波形和网络连接。

该研究以「Machine learning-based high-frequency neuronal spike reconstruction from low-frequency and low-sampling-rate recordings」为题,于 2024 年 1 月 20 日发布在《Nature Communications》。

图片

脑机接口

神经元活动的多通道记录是脑机接口(BMI)的关键,可以解码运动意图或大脑功能连接。由多个植入电极记录的细胞外信号,例如尖峰和局部场电位 (LFP),已用于 BMI 技术。神经记录硬件的最新进展集中在增加同时记录电极的数量,以获得更丰富的信息以进行详细的网络分析。

记录的电极数据越多,科学家可以分类的功能就越广泛,从而进行精确的关联操作。同时,为了实现记录系统的高效长期植入,实现不受限制的无线数据传输也做出了许多努力。通过这些努力,无线设备已被证明可以在植入的灵长类动物中显示实时操作。

处理大量神经数据有局限性

尽管取得了这些进步,但当前的 BMI 技术在处理大量神经数据方面仍然存在局限性。大多数BMI系统采用单单元尖峰活动来增强解码性能;然而,为了捕获通常在毫秒时间尺度内发生的单个尖峰,记录仪器需要至少 10kHz 或更高的采样率。

此外,更多的电极需要更大的存储内存,并导致记录和无线通信中更高的功耗,导致显著的散热。在植入式脑机接口中应避免这种加热,因为它会对周围的生物组织造成热损伤,特别是对于将多路电子器件集成到探针柄中的基于 CMOS 的有源神经探针或完全植入的无线神经传感器。

为了通过减少记录数据量来缓解这些限制,采用了几种降低数据采样的技术,已经提出了诸如自适应采样、压缩感知、基于尖峰频带功率的解码、降级信号质量、片上压缩和片上尖峰检测等技术。虽然这些方法在显著减少数据方面显示出有希望的结果,但它们在高级 BMI 中的应用仍然有限。神经元信号的更宽带宽,不仅包括高频带尖峰,还包括低频带信号(例如 LFP),与 BMI 所必需的大脑功能密切相关。

迫切需要一种新算法

近期科学家提出了单独使用 LFP 或与尖峰相结合的技术,用于弥补基于尖峰的 BMI 的主要局限性:长期测量一致的困难以及高采样记录的需要。然而,现有的数据缩减算法旨在主要关注尖峰活动,因此难以应用于低频信号并提供有限的信息。

此外,现有方法通常需要定制设计的记录硬件,在数据传输之前进行片上信号预处理,例如用于实现单独算法的编码器或用于通过识别阈值交叉事件或表征尖峰波形来检测尖峰以及用于将尖峰转换为二进制形式的附加电路。这也限制了最先进的 BMI 技术的普遍适用性。因此,迫切需要开发一种普遍适用、不受信号类型限制且与通用记录硬件兼容的神经数据缩减算法。

新的 ML 框架

在最新的研究中,DGIST 的研究人员提出了一个机器学习(ML)框架,用于从二次采样的低频信号中重建高频神经元尖峰。

图片

图示:使用机器学习模型从下采样的低频数据集中重建高频神经元尖峰。(来源:论文)

该方法可以通过低通滤波和对获取的神经元信号进行简单的下采样来减少神经记录数据量。将这种下采样低通滤波 (LPF) 数据输入到 ML 模型并结合信号插值可以恢复具有高时间分辨率的高频神经元信号。它能够减少记录数据,同时获得宽带宽的神经元信号。

研究人员假设为图像超分辨率任务引入的 ML 模型(通过恢复高频细节从低分辨率图像中恢复高质量图像)可以适合尖峰恢复问题。为了测试这个假设,团队利用 Transformer 构建了一个名为 Spk-Recon 的尖峰重建机器学习模型,该模型使用二次采样的低频神经记录数据作为输入。

研究人员将 Spk-Recon 模型应用于体外海马神经元和体内小鼠大脑的多通道神经记录数据集。通过传统的定时和波形定量尖峰分析,研究人员证明 Spk-Recon 模型可以从显著下采样的低频神经元信号中重建准确的尖峰,尖峰出现的命中率接近 0.8−0.9,尖峰排序的聚类精度超过 96%。

图片

图示:Spk-Recon 模型架构和训练示意图。(来源:论文)

该团队基于 Spk-Recon 的恢复可以同时获取从 LFP 到尖峰的广泛频率范围内的丰富神经元信号:通过以低采样率直接记录的低频段 LFP 和通过基于 ML 的重建来获取高频段尖峰。以前的数据缩减技术工作有限地集中于仅获取尖峰的高频带。尽管已经有一些研究使用线性或非线性模型来估计低频 LFP 的尖峰,但它们仍然处于仅推断放电率或获得尖峰时序的水平,而不是整个尖峰波形特征。

由于能够同时获取 LFP 和尖峰,该方法可以提供更丰富的神经元信息,有助于基于尖峰触发的 LFP 平均分析 LPF-尖峰相关性或大脑功能连接。特别是,甚至能够以尖峰排序所需的高时间分辨率恢复波形特征,对于开发使用 LFP 和单单元尖峰的高级 BMI 非常有用。所有这些都可以通过传统的神经记录硬件以低记录数据量来实现。

从硬件应用的角度来看,该团队减少神经元数据量的方法具有很高的通用性。研究人员通过典型的神经记录硬件以统一较低的采样率获取低频段信号,并通过基于机器学习的软件恢复高采样尖峰。也就是说,应用他们的模型的数据量减少的信号采集可以在各种商业或定制的多通道神经记录系统中实现,而无需额外的硬件修改。

另外,考虑到最近增加记录电极数量的研究,它将允许在相同的硬件资源内从更多电极收集神经元信号或收集更长的持续时间。研究人员期望它为开发下一代脑机接口开辟新的方向,能够更深入地分析和控制大脑功能,同时减少硬件资源和最小化热组织损伤。

图片

图示:体外数据集的信号重建。(来源:论文)

最后,Spk-Recon 可以为各种类型的神经记录之间的信号估计提供通用框架。该框架可以从较低频段信号恢复高频信息。这种功能可应用于通过不同记录方式测量的神经元活动,如皮质内记录、皮质电图描记术 (ECoG) 和脑电图描记术 (EEG)。例如,从 ECoG 到尖峰或从 EEG 到 ECoG 的低频到高频信号恢复是可能的。

此外,通过利用能够实现全网络细胞内记录的最新MEA技术,还可以实现从细胞外记录重建细胞内神经元信号,例如动作电位或阈下突触信号。通过开发基于多模式或多尺度信号且物理侵入性较小的新系统,可以实现更高的脑机接口性能。

论文链接:https://www.nature.com/articles/s41467-024-44794-2

理论机器学习图像处理神经元
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

插值技术

数学的数值分析领域中,内插或称插值(英语:interpolation)是一种通过已知的、离散的数据点,在范围内推求新数据点的过程或方法。求解科学和工程的问题时,通常有许多数据点借由采样、实验等方法获得,这些数据可能代表了有限个数值函数,其中自变量的值。而根据这些数据,我们往往希望得到一个连续的函数(也就是曲线);或者更密集的离散方程与已知数据互相吻合,这个过程叫做拟合。

神经元技术

(人工)神经元是一个类比于生物神经元的数学计算模型,是神经网络的基本组成单元。 对于生物神经网络,每个神经元与其他神经元相连,当它“兴奋”时会向相连的神经元发送化学物质,从而改变这些神经元的电位;神经元的“兴奋”由其电位决定,当它的电位超过一个“阈值”(threshold)便会被激活,亦即“兴奋”。 目前最常见的神经元模型是基于1943年 Warren McCulloch 和 Walter Pitts提出的“M-P 神经元模型”。 在这个模型中,神经元通过带权重的连接接处理来自n个其他神经元的输入信号,其总输入值将与神经元的阈值进行比较,最后通过“激活函数”(activation function)产生神经元的输出。

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

压缩感知技术

压缩感知(Compressed sensing),也被称为压缩采样(Compressive sampling)或稀疏采样(Sparse sampling),是一种寻找欠定线性系统的稀疏解的技术。压缩感知被应用于电子工程尤其是信号处理中,用于获取和重构稀疏或可压缩的信号。这个方法利用讯号稀疏的特性,相较于奈奎斯特理论,得以从较少的测量值还原出原来整个欲得知的讯号。核磁共振就是一个可能使用此方法的应用。这一方法至少已经存在了四十年,由于David Donoho、Emmanuel Candès和陶哲轩的工作,最近这个领域有了长足的发展。近几年,为了因应即将来临的第五代移动通信系统,压缩感知技术也被大量应用在无线通讯系统之中,获得了大量的关注以及研究。

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

推荐文章
暂无评论
暂无评论~