Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

文龙作者

Nature 封面:超越联邦学习,群学习用于医疗诊断可以更好保护隐私

三个臭皮匠顶个诸葛亮。」这大概是群体智能(swarm intelligence)的一个很好印证。

群体智能受蚁群、蜂群这类社会性动物的行为启发而来,可用于预测体育赛事、投票选举等活动的结果。但它还可以做到更多。比如,在不违反隐私法的情况下将来自全球的医疗数据进行整合,以便快速可靠地检测患有严重疾病的患者。
最近,德国波恩大学的研究人员联合惠普公司以及来自希腊、荷兰、德国的多家研究机构,共同开发了一种将边缘计算、基于区块链的对等网络结合起来的分散式人工智能方法——「Swarm Learning」(群学习),可以从分散存储的数据中检测出多种疾病,有助于加速全球范围内的精准医疗协作。
研究成果于5月27日以 Swarm Learning for decentralized and confidential clinical machine learning 为题发表在杂志 Nature 上,并登上了最新一期的杂志封面。
图片
快速可靠地检测患有严重疾病的患者是精准医疗的主要目标,而 AI 可以很好地辅助。但由于隐私法的保护,技术上的可行和实施上的能行之间存在着巨大的差距。虽然 AI 解决方案本质上依赖于适当的算法,但实际却更依赖于大数据。目前,大量的数据掌握在世界各地成百上千万的医疗机构手中,很难安全高效地共享,而各自的本地数据又难以满足机器学习的训练。
针对这一问题,波恩大学的 Joachim Schultze 和他的合作伙伴提出了一种名为 Swarm Learning(群学习)的去中心化机器学习系统,取代了当前跨机构医学研究中集中数据共享的方式。Swarm Learning 通过 Swarm 网络共享参数,再在各个站点的本地数据上独立构建模型,并利用区块链技术对试图破坏 Swarm 网络的不诚实参与者采取强有力的措施。
图片Swarm learning 的框架。(来源:论文)
研究人员使用 Swarm Learning 根据 16,400 个血液转录组和 95,000 个胸部 X 光片开发了白血病、COVID-19 和结核病的「疾病分类器」。在满足数据保密规定的同时,分类器的性能优于单个站点上开发的分类器。

追随蚂蚁觅食之路

蚂蚁通过一种非常特殊的方法来寻找食物的踪迹:不断释放信息素。它们向群体的其他成员发出自己的信号,每只蚂蚁都从所有其他蚂蚁的经验中学习,因此,每只蚂蚁都更接近食物来源。最终,群体根据个体蚂蚁的反馈确定最佳路径。
类似地, Swarm Learning 让网络上每个节点进行本地学习,学习到的结果通过区块链收集,并传递给其他各个节点。这个过程会重复多次,逐渐提高算法识别网络每个节点模式的能力。Swarm Learning 的所有数据都保留在本地,共享的只是算法和参数——从某种意义上说,就是经验。
波恩大学生命与医学科学教授 Joachim Schultze 强调:「 Swarm Learning 以一种大自然的方式满足了数据保护的要求。」
理论来说,如果本地有足够的数据和计算能力,则可以在本地执行机器学习。在云计算中,数据集中到云端进行集中计算,增加了可用于训练的数据量,提高了机器学习的性能,但存在重复的数据流等缺点以及对数据隐私和安全的挑战;而联邦学习使用中心服务器负责将模型分发给参与者,参与者通过保留在本地的数据进行学习,再由中心服务器进行收集和聚合。
图片不同学习之间的差异。(来源:论文)
Schultze 解释说,与「联邦学习」不同, Swarm Learning 没有集中的指挥中心。「基于区块链中所有合作伙伴事先商定的规则, Swarm Learning 以合作的方式进行。」所遵循的规则是一种以具有约束力的方式规范合作伙伴之间信息交换的数字协议,它记录了所有事件并且各方都可以访问它。
「区块链是 Swarm Learning 的支柱。Swarm 网络的所有成员对发生的事情和结果都拥有平等的权利,没有中心服务器。因此,从某种角度上说,这个数据网络上没有『蜘蛛』。」
该团队指出,群体学习的分布式特性与区块链技术相结合,使其能够在不影响机密性的情况下利用大数据做出诊断。

每个节点都将从其他节点的经验中受益

Schultze 说:「医学研究数据是一个宝藏。它们可以在开发比传统治疗更精确地针对每个人量身定制的个性化治疗方面发挥决定性作用。对于科学来说,能够使用更全面的从尽可能多的来源获得的数据至关重要。」
研究人员通过白血病、结核病、 COVID-19 三个案例说明了 Swarm Learning 优异的性能。算法识别出患病个体的准确率,在血液转录组数据集中平均约为 90%,在 X 射线数据集中表现为 76%-86%。
图片Swarm Learning 预测白血病。(来源:论文)
图片Swarm Learning 识别结核病。(来源:论文)
图片Swarm Learning 识别 COVID-19 。(来源:论文)
「该方法在白血病中效果最好。这种疾病的基因活动的特征十分显着,因此最容易被人工智能检测到。传染病十分多变,然而,结核病和 COVID-19 的准确率也非常高。对于 X 射线数据,准确率稍低,这是由于数据或图像质量较低,」 Schultz 对结果评论道。
「因此,我们的研究证明 Swarm Learning 可以成功地应用于完全不同的数据,理论上,适用于可以通过人工智能进行模式识别的任何类型的信息。无论是基因组数据、X 射线图像,还是来自大脑成像或其他复杂数据。」
该研究还发现,与网络中的节点各自分别学习相比,Swarm Learning 产生了明显更好的结果。「尽管只有本地数据可用,但每个节点都将从其他节点的经验中受益。因此,Swarm Learning 的概念已经通过了实际测试。」
Schultze 坚信他们的研究成果将会对全球范围内的医疗数据共享产生革新。「我相信 Swarm Learning 可以极大地推动医学研究和其他数据驱动的学科。目前的研究只是一次试运行。未来,我们打算将这项技术应用于阿尔茨海默氏症和其他神经衰退性疾病。」
惠普人工智能首席技术官兼高级副总裁 Eng Lim Goh 博士也表示:「Swarm Learning 为医学研究和商业合作开辟了新的机会。关键是所有参与者都可以相互学习,而不必共享机密数据。」

论文链接:https://doi.org/10.1038/s41586-021-03583-3

参考内容:
https://medicalxpress.com/news/2021-05-ai-swarm-intelligence-cancer-lung.html
https://www.jiqizhixin.com/graph/technologies/4b9893a0-da9b-4705-aefa-f0f737af7c7a
https://sloanreview.mit.edu/article/how-swarm-intelligence-blends-global-and-local-insight/
理论精准医疗AI网络去中心化Nature
1
相关数据
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

群体智能技术

集群智能(Swarm Intelligence),是指在某群体中,若存在众多无智能的个体,它们通过相互之间的简单合作所表现出来的智能行为,集群机器人便是集群智能一类。它由Gerardo Beni和Jing Wang于1989年在细胞机器人系统的背景下引入。

惠普机构

惠普贸易(上海)有限公司

https://www.hpstore.cn
推荐文章
暂无评论
暂无评论~