腾讯量子实验室发起 Alchemy 竞赛,推动分子性质的 AI 预测研发

量子实验室公开自建的Alchemy数据库,发起Tencent Alchemy 2019竞赛,挖掘算法的泛化性能,推动学术界与产业界聚焦化学中分子的量子性质预测问题,及其AI解决方案。希望该竞赛能激发不同领域人才的合作创新活力,推动分子科学及应用的加速进展,助力整体生态成长和相关产业发展。

竞赛背景

腾讯量子实验室积极探索将量子和AI技术应用于化学研究,及其在制药材料等行业中的潜在应用。该领域中的一个重要挑战是现有的大部分实验化学数据包含大量的噪声,这对还在初期阶段的AI化学和制药模型的研发与评估带来了很大的困难。一个解决方案是用高精度的量子化学计算来搭建可靠的的分子数据库,以供AI算法的研发和评估使用。但这需要耗费大量的计算资源,事实上,现有的公开数据库只提供了非常小而特殊的分子的性质,这对算法开发的作用已日趋饱和。

腾讯量子实验室利用腾讯强大的计算能力,自建了分子量子性质数据库-Alchemy:一个全新的、包含更大分子的,更丰富结构的高质量数据库,有望极大加速AI化学和制药领域的发展进程。

竞赛任务

在竞赛中,参赛者可根据腾讯量子实验室提供的分子训练集,自由使用机器学习算法预测分子的包含几何、电子、热力学性质等方面的12个属性(列表1),按要求提交结果。最终比赛将基于12个回归任务的平均误差来评估。


列表1:分子待预测的12个属性

量子力学性质对于预测分子在某些环境下的的行为至关重要。例如,HOMO和LUMO能量,以及Free energy等属性都有助于预测分子的化学反应结果。

参赛对象

此次竞赛面向全社会。国内外高等院校、科研单位、企业人员均可报名参赛。

(大赛主办和合作伙伴,以及有机会接触竞赛题目和数据的工作人员不能参与比赛。)

报名方式

访问竞赛官网https://alchemy.tencent.com进行注册,即可报名参赛。

竞赛流程

  • 准备阶段:2019年5月22日-7月31日。
  • 评测阶段:2019年8月1日-9月30日。
  • 公布结果:2019年12月31日前。

奖项设置

  • 一等奖 ¥50,000
  • 二等奖 ¥30,000
  • 三等奖 ¥20,000

特别介绍:分子量子性质数据库-Alchemy

使用量子模拟的方法生成分子数据库已经在这个领域有所尝试,不过由于算力的限制,学术界已有的分子数据库大多由小分子(重原子数量9)组成。现有公开数据库中(列表2),QM9拥有最多的分子数量并且计算了多达12个分子的量子力学性质(列表1)。

列表2:Alchemy与现有分子数据库的对比

Alchemy数据库是基于QM9的一个扩展,有更为丰富的分子结构(重原子数量9-12),包括更多元的重原子类型(S 和 Cl),而且分子样本是从GDB MedChem这一药物化学性质良好的分子数据库中筛选出来,具有较高的药物开发潜在价值。对比总结如下表(列表3)。  

维度

QM9

Alchemy

重原子个数

≤9

9-12

样本选择

GDB17

GDB MedChem

组成元素

C, H, O, N, F

C, H, O, N, F, S, Cl

文件格式

xyz(不含化学键信息)

SD(含化学键信息

列表3:Alchemy与QM9的详细对比

期望Alchemy这样一个全新的、包含更大分子的高质量数据库,能够助力分子科学及其应用,为AI化学和制药助力!

大赛已于5月22日正式发布,第一阶段将于7月31日结束,更多详情欢迎前往官网 https://alchemy.tencent.com了解!

产业量子计算腾讯
4
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

关联数据技术

关联数据是一组用来描述用户任务运行环境以及在区域中连接用户任务方式的信息。用户任务是与用户定义的事务相关的任务,或与 CICS® 提供的事务相关的任务。CEMT 是通常由操作员启动的用户启动任务示例,CSMI 是由系统代表用户启动事务启动的任务示例。

腾讯机构

腾讯科技股份有限公司(港交所:700)是中国规模最大的互联网公司,1998年11月由马化腾、张志东、陈一丹、许晨晔、曾李青5位创始人共同创立,总部位于深圳南山区腾讯大厦。腾讯由即时通讯软件起家,业务拓展至社交、娱乐、金融、资讯、工具和平台等不同领域。目前,腾讯拥有中国国内使用人数最多的社交软件腾讯QQ和微信,以及中国国内最大的网络游戏社区腾讯游戏。在电子书领域 ,旗下有阅文集团,运营有QQ读书和微信读书。

量子计算技术

量子计算结合了过去半个世纪以来两个最大的技术变革:信息技术和量子力学。如果我们使用量子力学的规则替换二进制逻辑来计算,某些难以攻克的计算任务将得到解决。追求通用量子计算机的一个重要目标是确定当前经典计算机无法承载的最小复杂度的计算任务。该交叉点被称为「量子霸权」边界,是在通向更强大和有用的计算技术的关键一步。

推荐文章
暂无评论
暂无评论~