近日,LabGenius宣布获得英国政府Innovate UK创新拨款,以扩展机器学习驱动的药物发现平台。
公开资料显示,LabGenius是第一家利用AI技术开发下一代蛋白质疗法的生物技术公司,它通过结合机器人自动化、合成生物学和先进的机器学习,运行了完整的设计-构建-测试-学习周期,以帮助指导寻找新的治疗性抗体。
LabGenius的旗舰技术称为“EVA”,被描述为一种能够进化新蛋白质的“机器学习驱动的机器人平台”。作为一个智能机器人平台,EVA能够根据自己的实验进行设计,进行和批判性学习。其最终目标是发现和开发目前人类难以找到的新蛋白质疗法。
“这笔资金将帮助我们实现计算技术在研发中的潜力,我们相信它们是加速发现和开发先进疗法的关键。”LabGenius首席执行官兼创始人James Field说。
1、LabGenius的解决方案
当今,大多数药物都是使用小分子制成。然而,基于蛋白质的疗法通常更有针对性,而且副作用更小。但是,蛋白质分子要大得多,而且结构也更加复杂,因此开发难度更大,成本更高。
更具体地说,可用于创造蛋白质的DNA组合太多,要找到哪种组合可能会诞生有效的蛋白质疗法异常之困难。氨基酸是构成蛋白质的化学构件。不同的氨基酸各有不同的化学性质,不同氨基酸的组合赋予了蛋白质不同的结构,从而提供了不同的功能。
要设计一种新的蛋白质,关键是要找到正确的氨基酸组合。这听起来像是一项简单的任务,但不幸的是,它实际上是您能想象到的最复杂、最困难的搜索问题之一。使用传统的方法,设计一个单一、实用的蛋白质可能需要耗费一名研究员数年的时间。
目前,LabGenius主要基于其人工智能平台EVA研发蛋白质疗法,这一种能够进行方案自主设计和初步试验的科研平台。通过合成生物学、机器人自动化和ML领域的技术,该平台能够智能地发现新的治疗性蛋白质。
首先,专有测序数据+高级计算。仅根据蛋白质序列预测蛋白质的结构和功能非常困难,LabGenius使用自己的先进湿实验室和自动化机器人系统,能够合成大型蛋白质库。然后按照功能分离蛋白质,并且使用下一代测序技术对其进行读取,构建起数据地图。
其次,机器学习模型+飞轮效应。虽然数以千万计的经验数据点的想法确实看起来很多,但将其与序列空间的大小进行比较时,它实际上只是一个无限小的部分。这正是机器学习的用武之地。通过在这些数据上训练机器学习模型,LabGenius可以构建空间模型;推断和预测以前从未通过经验测试过的序列。测试越多,积累数据越多,序列空间图就越准确和完。这种方法能够达到比传统定向进化方法更高的峰值。
最后,多参数优化+更高维度感知。使用模型来通知发现的美妙之处在于不仅限于一次只优化一个特征。事实上,LabGenius可以构建具有许多不同特征的多个模型,并且可以一次对所有这些进行优化。继续构建序列空间图的隐喻,想象将许多这些图叠加在一起,然后在所有图上寻找出现在同一位置的峰值。
根据LabGenius研究人员的说法,利用大量已知蛋白质,要求BERT从训练数据中预测被掩盖的氨基酸,有效地学习蛋白质的基本生物物理学。“因为它做到了这一点,该模型的隐藏值帮助我们生成有意义的蛋白质表示,我们随后用它来映射出相关特征。”
更重要的是,随着时间的推移,通过积累越来越多的将蛋白质序列与功能联系起来的数据,LabGenius将开始构建“通用”模型。这些模型使LabGenius能够使用为一个项目产生的知识来为一个完全不同的项目提供信息。随着数据量越来越大,这些模型的准确性将不断提高。
这是一个巨大的机会:未来模型可以准确地区分成功的药物和失败的药物,这将降低与开发新生物药物相关的风险。
“蛋白质疗法在治疗疾病和减轻人类痛苦方面有着巨大的潜力。通过改变药物特性,我们可以提高无数人的生活质量。”LabGenius首席执行官兼创始人James Field说。
2、多元化的科学家团队
2012年,James Field创建了这家公司,那时他还在伦敦的帝国学院(Imperial College)攻读合成生物学博士学位。
“本科毕业时,我参加了国际基因工程机器(iGEM)竞赛,并爱上了合成生物学。这确实是我职业发展的一个转折点,这段经历使我成为了系统和合成生物学硕士学位,并从那里获得了博士学位。”James Field在接受媒体采访时会议。
在博士研究期间,James Field有机会研究以合成生物学、自动化和计算的最新进展为基础的新型蛋白质工程方法。正是在这个时候,它越来越相信这些方法可以为新型蛋白质疗法的发展做出有意义的贡献,LabGenius应运而生。
然而,要开发一种新的治疗方法,需要找到一种不仅有效而且安全、可制造和稳定的分子。在所有这些不同特性上优化分子是非常具有挑战性的。在通过发现过程推进分子时,总是要在不同属性之间进行权衡。这些权衡可能会降低分子的治疗潜力,并导致代价高昂的失败或次优的患者结果。
在LabGenius成立后的最初几年,最亟需解决的是如何获得财务稳定性。当时,LabGenius获得了政府拨款和一些跨越合成生物学领域的小型项目,其中一个是与国防部签订的合同。
2017年,LabGenius获得了Acequia Capital和Kindred Capital领投种子轮投资370万美元。这对公司来说是一个重要时刻,不仅推动了团队的成长,也促成了位于伦敦市中心的自动化实验室的建设。
同年,James Field因早期职业影响而被授予BBSRC年度创新者奖。2018年,他入选福布斯30位科学和医疗保健领域的30位30岁以下人士。James Field还是著名的合成生物学卓越领导加速计划(LEAP)的成员。
随着发展方向的确定以及更多技术证明点的掌握,LabGenius完成了2500万美元的A轮融资,以扩大公司规模,研发AI平台驱动的蛋白质疗法,探索人体蛋白质适应性及改善蛋白类药物特性。投资机构包括Atomico、Obvious Ventures和Lux Capital等,其中,Atomico由Skype联合创始人、亿万富翁尼克拉斯•曾斯特罗姆创建。
为了最大限度地发挥ML的发展和影响,LabGenius只将最高质量的湿实验室数据输入到数据驱动模型中,这一点至关重要。这意味着,所有检测都需要由跨学科团队的专业知识进行全面开发和验证。
目前,LabGenius拥有一个多元化的科学家团队,其团队成员涵盖来自蛋白质工程、合成生物、软件工程、数据科学和人工智能领域的专家。
其中,数据科学团队负责整理和分析通过对计算机设计分子进行实验而产生的分析数据,然后使用这些数据开发机器学习技术,以预测具有更好性能特征的新型分子设计,并与湿实验室团队共享以进行生产和分析。这种持续的设计-构建-测试-学习循环是LabGenius跳动的心脏。
从商业模式角度看,LabGenius的业务模型非常简单,“我们使用EVA来发现和表征新药物分子,然后与可将这些分子推向市场的制药公司合作。例如,在一个典型的由合作伙伴资助的早期发现计划中,我们将把一个项目从概念阶段引入临床前阶段。典型的交易结构包括研发付款,里程碑和特许权使用费的混合。”
资料来源:https://labgeni.us/