腾讯量子实验室主办Tencent Alchemy 2019竞赛:自建数据库发布超20万个分子数据

竞赛中参赛者需使用机器学习工具,替代经典量子模拟算法中薛定谔方程的求解过程,来估计分子的12个量子力学性质。


近日,腾讯量子实验室主办的Tencent Alchemy 2019竞赛圆满结束。经过近5个月的激烈角逐,3支队伍在过百支参赛队伍中脱颖而出,其中一等奖由南京大学化学化工学院的刘子腾团队摘得。


从社交网络中的商品推荐,到日常生活中的个人语音助手,AI技术正深刻改变着人们的生活。为进一步探究AI技术对基础科学的推进作用,特别是在量子相关任务中的应用,腾讯量子实验室主办了Tencent Alchemy 2019竞赛,并公开自建的Alchemy数据库。


Tencent Alchemy 2019竞赛旨在挖掘算法的泛化性能,推动学术界与产业界聚焦化学中分子的量子性质预测问题,及其AI解决方案。竞赛中参赛者需使用机器学习工具,替代经典量子模拟算法中薛定谔方程的求解过程,来估计分子的12个量子力学性质。


三支队伍获竞赛奖项,腾讯量子实验室给出分子准确3D结构


本次竞赛共吸引了来自全球过百支团队参加,成功激发不同领域人才的创新合作,推动分子科学及应用的加速发展。其中,三支队伍获得奖项,一等奖由来自南京大学化学化工学院的刘子腾团队摘得;来自澳大利The University of Newcastle的李昕宇获得本次竞赛的二等奖;三等奖则由来自Technical University of Munich 的Janek Groß 获得。


在这些获胜算法中,可以看到人工智能领域图模型算法与量子化学领域的专家知识深度融合。前两名获胜团队基于自身在量子化学领域的多年经验,提出了对分子量化性质估计卓有成效的新特征,第三名选手则使用传统量子化学领域的能量模型,重构经典的图神经网络算法。


值得关注的是,在本次竞赛中,腾讯量子实验室已给出分子准确的3D结构,即分子内原子间距离(键长)的准确信息。不过在预估分子生化性质的实际任务中,如估计药物分子的ADMET性质,由于药物分子通常较大,计算其准确的3D结构需要耗费大量算力,这也局限了MPNN算法的广泛应用。因此,如何高效地将图模型应用到药物分子的虚拟筛选与改良中,仍任重而道远。


腾讯量子实验室自建数据库,加速AI化学和制药领域发展进程


在本次竞赛过程中,腾讯量子实验室使用近12万个分子数据作为竞赛使用数据。这些数据均属于其自建的数据库——Alchemy,该数据库由腾讯量子实验室使用腾讯云过400万CUP Hour整理并发布,包含超20万个分子的量化性质。


在此之前,学术界使用最为广泛的预测分子量化性质数据库QM9共包含13万个分子。QM即quantum mechanism, 而9则表示QM9中的每个分子包含不多于9个重原子(重原子为非氢原子)。由于量子模拟需消耗大量算力,在QM9提出后,业内再无更大分子数据库的提出。与QM9相比,Alchemy数据库中的每个分子都至少包含9个重原子,最多包含12个重原子。全新的、包含更大分子、更丰富结构的高质量数据库Alchemy的出现,将极大加速AI化学和制药领域的发展进程。


未来腾讯量子实验室将更加积极探索量子和AI技术在化学研究,及其在制药材料等行业中的潜在应用,进一步推动分子科学及应用的加速进展,助力整体生态成长和相关产业发展。


更多有关获胜算法的介绍及Alchemy最新数据可参见腾讯量子实验室Alchemy竞赛官网。https://alchemy.tencent.com/ 


工程数据库腾讯Tencent
暂无评论
暂无评论~