Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

萝卜皮作者

预测细胞生长与分裂?深度学习来解决!

在生物技术和制药行业,微生物被用于各种治疗药物,如抗生素和疫苗的生产。微生物在工业制造中用于生产丙酮、酒精、甘油、二氧化碳、丁醇、乳酸、味精、乙酸、柠檬酸、葡萄糖酸和生物燃料等产品。
当前,微生物生理学的一项主要挑战是:确定「细胞生长与细胞分裂」调控和协调的基本原理。
东京大学的研究团队利用机器学习来预测生长和分裂过程中的单细胞大小;这一进展可能改善用于制药和发酵产品工业制造的微生物的预测和控制手段。
该研究以「Representation and inference of size control laws by neural-network-aided point processes」为题,发布于2021年7月8日出版的《PHYSICAL REVIEW RESEARCH》杂志。

图片

过去,人们利用物理学和数学已经建立了许多细胞生长和分裂的模型。常见模型,往往使用连续时间随机过程,其中单个细胞以可变速率生长和分裂。然而,这些模型对于高维数据通常不太有效,因为它们往往受到公式中固有的过度简化假设的限制。

高维数据在生命科学基础研究、制药和生物工程行业中是固有的存在,并且非常常见。产生高维数据的过程实例包括预测药物反应性、癌症分类、基因表达微阵列、细胞信号、结构预测、质谱、高通量筛选(HTS)分析、DNA微阵列和生物标记物选择等。

除了高维数据之外,使用现有模型进行细胞生长和分裂预测的另一个挑战是,生物数据可能表现出超出简单模型解释能力的高度变异。一种常见的解决方法是将其捕获为概率分布(例如高斯分布,也称为正态分布)中的「噪声」。但是,这些模型可能无法产生最准确的结果。
为了解决这些挑战,科学家们通过调整神经网络 (NN) 来应用人工智能深度学习,该神经网络最初用于依赖历史的时间点过程来确定细胞大小的调节。
图片微流体装置、参数定义以及大肠杆菌细胞的生长情况示意图。(来源:论文)
AI 模型设计可以扩展为额外的变量,例如基因表达、细胞大小和分裂间隔,以获得高维历史信息(各代细胞的生长分裂信息等),从而能够对细胞分裂有更多的了解。
研究人员表示:与其他基于 RNN 的模型相比,Fully NN 模型具有更好的性能;该模型可以在有史以来最小密集尺度上预测「细胞分裂前」和「细胞分裂后」细胞的大小;细胞分裂后的分布形状因之前的细胞生长情况而异;神经网络通过数据去噪,可以使加法器原理更加突出。
图片
四种模型的表现。(来源:论文)
同时研究人员发现,潜在关系可能无法通过简单的描述性方法恰当地表示。即便如此,NN仍然适用于具有不同大小控制机制的各类微生物。
图片
大肠杆菌在37℃下的条件概率密度函数(PDFs)的实际观察轨迹和介质,以及细胞大小。(来源:论文)
通过「灵活地表示确定性关系」和「噪声分布的函数形式」,神经网络可以有效地将历史相关的确定性因素和无法解释的噪声从给定数据中分离出来。科学家们指出,「通过使用该方法,我们表示并推断细菌与裂变酵母的——出生细胞和分裂细胞的大小分布。」
研究人员报告说:「这些结果表明,NN方法是一种极其强大的工具;可以将决定因素和随机因素与测量数据进行半自动分离;它可以作为传统建模方法的补充方法进一步发展。」
图片
具有不同历史记录长度为m的性能。(来源:论文)
通过将人工智能深神经网络的创新信息技术应用于复杂的生物功能,科学家开发出这种强大的工具,从而将信号与噪声分离;这可能有助于加速未来的新发现。
论文链接:https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.3.033032

相关报道:https://www.psychologytoday.com/ca/blog/the-future-brain/202107/ai-predicts-cell-growth-may-accelerate-life-sciences

理论深度学习生长分裂细胞
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

随机过程技术

在概率论概念中,随机过程是随机变量的集合。若一随机系统的样本点是随机函数,则称此函数为样本函数,这一随机系统全部样本函数的集合是一个随机过程。实际应用中,样本函数的一般定义在时间域或者空间域。随机过程的实例如股票和汇率的波动、语音信号、视频信号、体温的变化,反对法随机运动如布朗运动、随机徘徊等等。

推荐文章
暂无评论
暂无评论~