《Nature Commuciations》发表第四范式论文,AI为攻破生物化学难题提供新思路

近日,国际顶级学术期刊《Nature Communications》(IF 12.353)发表了第四范式科学家王嘉磊题为《Discovering de novo peptide substrates for enzymes using machine learning》的论文。该论文提出了一种通过联合人工智能和生物化学手段来快速优化具有特定生化机能的肽链的通用方法,该方法可大幅提高肽链的发现速度。

肽由于其无与伦比的活性和多样性,对人类近代医学发展起到了关键作用,因此发现和合成具有特殊性能的肽一直是生物化学领域的重点研究方向,而时下火热的人工智能技术则为该研究方向提供了新的“攻坚”武器。

该论文中提及通过采用迭代式的机器学习来加快肽链发现的过程:一个机器学习模型读入历史实验数据并能对任意一种新的肽链结构作出预测;基于贝叶斯优化的搜索算法将会发现最有潜力的肽链以供合成和实验验证;新的试验结果又被用来训练更新机器学习模型;该过程不断重复直到发现目标为止。

相比传统的基于变异进化的搜索方案,机器学习模型具有更强的导向性,和贝叶斯优化这种高效的搜索策略联合,整体发现速度比传统进化方案有数量级的提升。基于此方案设计的系统来发现可用作蛋白质标记的正交肽受体,发现命中率高达30%,远高于变异进化方案的3%和随机搜索的0.001%。此前有报道称,哈佛医学院曾花费一年多的时间找到一种肽链。而基于此方案设计的系统则在一年多的时间内发现了三百多种肽链,大幅提高肽链的发现速度。基于论文阐述方案的通用性,该系统可被广泛应用到生物化学的肽优化问题中。

《Nature Communications》是国际顶级学术期刊《Nature》发行的子刊,其目的在于发布颇具综合性并代表某一领域重大进展的研究论文。作为国际“综合性期刊”领域的顶级杂志,该刊物内容涉及自然科学所有领域,发表的论文极具科研及应用价值,为各领域的创新发展提供了重要的参考意义。在最新发布的2017年科学期刊引用报告(JCR, Journal Citation Reports)中,《Nature Communications》位列全球多学科综合性期刊的第3位,仅次于《Nature》与《Science》。

论文链接:https://www.nature.com/articles/s41467-018-07717-6

第四范式
第四范式

理论生物学机器学习
1
相关数据
第四范式机构

第四范式成立于2015年初,是国际领先的人工智能技术与服务提供商,已服务20多个行业完成上千个AI落地案例。目前国内重要的国有银行和全国性股份制银行,超过一半都是第四范式的客户,此外,公司在互联网、医疗、政府、能源、零售、媒体等行业均有涉猎,诸多案例取得百分之一百以上的效果提升。

https://www.4paradigm.com/
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

随机搜索技术

推荐文章
暂无评论
暂无评论~