Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

晚上就应该睡觉?新的机器学习技术探索昼夜节律

编辑 | 雪松

昼夜节律,如睡眠-觉醒周期,是大多数生物与生俱来的,对地球上的生命至关重要。昼夜时钟在 24 小时日夜周期中协调生物的各项生理变化,会间接影响我们人类的体能水平、健康程度、生存能力。

同样,将新陈代谢与日出落日同步等情况也存在于植物中,准确的生物钟有助于调节开花。了解昼夜节律,于植物而言,有助于提高植物的生长和产量;于人类而言,则有可能揭示出治疗疾病的新途径。

IBM欧洲研究所与厄尔汉姆研究所的合作团队,描述了一系列基于人工智能(AI)和机器学习(ML)的方法。这些方法可以进行更具成本效益的分析并深入了解昼夜节律的调节和功能。最具创新性的是,该团队仅使用DNA序列特征来进行准确的昼夜节律基因表达预测。

该研究以「Interpreting machine learning models to investigate circadian regulation and facilitate exploration of clock function」为题,于2021年8月10日发布在《PNAS》杂志。

晚上就应该睡觉?新的<mark data-type=tech_methods data-id=1a0e9c5e-6502-4cd7-8683-6b5ca6c48be2>机器学习</mark>技术探索昼夜节律

生物钟是地球生命对环境的重要适应。在这里,研究人员使用机器学习来预测拟南芥中复杂、时间和昼夜节律的基因表达模式。最重要的是,该方法使用从公共基因组资源从头生成的 DNA 序列特征对昼夜节律基因进行分类;这意味着该方法的下游应用,无需实验工作以及先验知识

该团队使用特定转录本的本地模型解释,对 DNA 序列特征进行排序,并得出每个转录本潜在昼夜节律调节机制的详细概况。此外,该方法还可以使用 DNA 序列特征(局部的、解释性的、排序的)来区分转录表达的时间阶段,揭示昼夜节律集中隐藏的子集。「模型解释/解释」提供了方法学进步的支柱,从而可以深入了解生物过程和实验设计。

晚上就应该睡觉?新的<mark data-type=tech_methods data-id=1a0e9c5e-6502-4cd7-8683-6b5ca6c48be2>机器学习</mark>技术探索昼夜节律

图示:拟南芥昼夜节律/非昼夜节律比较 ML 二元分类,具有 12 个转录组时间点。(来源:论文)

当使用减少数量的转录组时间点预测昼夜节律转录时,该团队使用模型解释来优化采样策略。最后,从单个转录组时间点预测昼夜节律时间,得出对准确预测最有影响的标记转录本;这可以促进从现有数据集中识别改变的时钟功能。

晚上就应该睡觉?新的<mark data-type=tech_methods data-id=1a0e9c5e-6502-4cd7-8683-6b5ca6c48be2>机器学习</mark>技术探索昼夜节律

图示:拟南芥昼夜节律/非昼夜节律 ML 二元分类,以减少转录组时间点的数量。(来源:论文)

该研究描述了一系列基于 ML 的方法,这些方法可以实现对拟南芥昼夜节律调节的成本效益分析和洞察。当使用少量 mRNA 测序(mRNA-seq)时间点预测昼夜节律转录本时。尽管在选择最少三个时间点时会丢失信息并导致 F1 分数下降,但与现有方法相比,该方法不仅提高了准确性,而且还使用模型解释来优化采样策略。研究人员确定的一些最准确、减少的采样策略与现有方法一致(例如,在一天中均匀分布的时间点以最有效地捕获正弦波曲线)。

晚上就应该睡觉?新的<mark data-type=tech_methods data-id=1a0e9c5e-6502-4cd7-8683-6b5ca6c48be2>机器学习</mark>技术探索昼夜节律

图示:拟南芥昼夜节律/非昼夜节律 ML 二元分类使用 k-mer 配置文件。(来源:论文)

最重要的是,仅使用 DNA 序列特征进行准确的昼夜节律分类,不需要调节元件或转录组数据的先验知识。这提供了优于现有方法的优势,不仅可以预测表达,还可以同时破译调节途径;由于使用可解释的 AI 算法,所以在进行预测时便可即时定义调节元件。使用人工智能,从头自动定义转录本的这些特征配置文件,并确定其优先级;这项工作通过有可能支持基因组的功能注释和精准农业。这个应用程序可以重新定义「如何生成可测试的假设」,从而理解基因表达控制。

该团队利用新方法预测昼夜节律时间,同时使用模型解释来推导拟南芥标记转录本。这些选定的转录本可用于测试现有和新兴拟南芥数据集中的单个数据点,以研究基因型、处理和环境条件如何影响生物钟功能。此外,由于转录组数据集的时间成本和金钱成本很高,因此在单个时间点内减少对标记基因的分析,可以节省大量资源。

晚上就应该睡觉?新的<mark data-type=tech_methods data-id=1a0e9c5e-6502-4cd7-8683-6b5ca6c48be2>机器学习</mark>技术探索昼夜节律

图示:在基于 ML DNA 序列的分类后研究拟南芥昼夜节律 TP 转录本。(来源:论文)

文章作者 Gardiner 博士补充道:「在作物中,昼夜节律对保持健康生长和发育至关重要;农业科学家和农民使用该模型了解植物的内在节律,可能会提高作物产量。同时,我们现在正在研究不同的物种,研究生物钟及其与人类疾病的联系,例如,生物钟失调与从抑郁症到癌症等一系列疾病有关。」

论文链接:https://www.pnas.org/content/118/32/e2103070118

相关报道:https://phys.org/news/2021-08-machine-technology-explores-circadian-rhythms.html

入门机器学习
1
相关数据
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

先验知识技术

先验(apriori ;也译作 先天)在拉丁文中指“来自先前的东西”,或稍稍引申指“在经验之前”。近代西方传统中,认为先验指无需经验或先于经验获得的知识。先验知识不依赖于经验,比如,数学式子2+2=4;恒真命题“所有的单身汉一定没有结婚”;以及来自纯粹理性的推断“本体论证明”

推荐文章
暂无评论
暂无评论~