Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

凯霞作者

独家专访深势科技:「多尺度建模+机器学习」攻克传统分子模拟瓶颈,驱动多行业应用

图片

近几年,人工智能与其他学科交叉研究正在飞速发展,国内外也涌现出一批新兴初创公司,涵盖了医药、材料等各个行业。
北京深势科技有限公司(「深势科技」)就是其中最具代表性的公司之一。他们致力于以「多尺度建模+机器学习+高性能计算」新范式解决微观尺度分子模拟问题,在药物研发、新材料研发等领域提出了极具革命性的解决方案。
机器之心·ScienceAI对深势科技联合创始人、首席科学家张林峰进行了独家专访。张林峰本科毕业于北大元培学院,后获得普林斯顿应用数学博士学位。结合机器学习、多尺度建模方法、高性能计算,其团队有效解决了电子结构、分子动力学、增强采样等方向中的一系列关键问题,发展了DeePMD-kit等开源软件和DeepModeling开源社区,并发表学术论文40余篇。
图片张林峰博士 关于创业经历与团队
ScienceAI:你本科毕业于北大,也是普林斯顿应用数学博士,作为深势科技创始人兼首席科学家。我们对此非常好奇:你是因何选择人工智能与药物、材料研发交叉研究这个行业?创业过程能分享一下吗?
张林峰:事实上,我们的研究并不限于人工智能与药物、材料交叉的研究。这是一个更大层面上的结合——从底层数理模型到计算机科学给我们提供的模拟工具,再到化学、生物、材料等具体场景的问题。这是所有这些要素交叉形成的从底层创新到现实落地的一个体系。
在做事的过程中,我发现想要实现这样的一个体系,创业是必要的,甚至几乎是必然的。我深知这需要我和孙伟杰(公司另一创始人、CEO)吸引志同道合的小伙伴、全力以赴地做好每一件事情,所以我选择了创业。
ScienceAI:想要实现以上愿景,你认为最重要的事情是什么?
张林峰:最重要的是定义问题。
人工智能与各个场景结合并不新鲜。但怎么结合?每个人看待同一个概念时脑中的图景是不一样的。做理论方法的人看到的可能是一个个公式;做计算机的人看到的可能是一行行代码;做材料和药物的人看到的可能是更宏观的设计需求和实际困难。我们需要在这样一个多重视角下定义共同的问题,并把大家的力量融合到一起。好的问题是一切的开始。定义好问题后,我们要做的便是打破偏见,不断务实地迭代、论证和实践;同时保持虚怀若谷,争取并感激每份来自外界的帮助。
ScienceAI:人才对实现这个过程很重要,公司想要吸引怎样的人才?以及你为什么认为他们应该加入你们? 
张林峰:我们想要吸引「志同道合」的人,即与我们的价值观、愿景一致,并认可我们达成愿景的方式的人。这样的人往往充满好奇心与责任心。好奇心是我们感知、认知这个客观世界的冲动;而责任心更多是关于怎样让这个世界变得更好。
这样的人为什么应该加入我们?有这样愿景的人往往很难被组合到一起,这需要一个非常合适的环境,而我们打造的就是这样的一种环境——来我们公司看看你就懂了。我们不是分配好任务,这儿有一个计算机工程师、那儿有一个医药化学家,把他们攒到一起。把几个要素physically摆一起是不好使的,「chemistry」才是最关键的。正如你们所看到的,我们这里是一个最能产生「chemistry」的地方。
ScienceAI:能再具体介绍一下所打造的这个环境和体系吗?是如何让他们产生「chemistry」的,有没有具体的机制呢?
张林峰:举例,我去年负责的高性能计算的工作,机器学习辅助分子动力学模拟上亿原子,最终获得了高性能计算最高奖戈登贝尔奖。对于这件事,我们至少需要三种类型背景的专家组合起来,且他们之间要有互相的「翻译器」。对于分子模拟的专家来说,他关注的是模拟方法和被模拟对象所对应的科学问题,我们需要把机器学习的工具所解决的科学问题「翻译」到分子模拟的语境里;对于高性能计算背景的人,我们需要把一个个公式变成一个个机器学习的算子、计算图。这样的「翻译器」存在于每两两专业领域之间。
另外一个例子是具体行业的解决方案。我们发现,这里面对应的不止是药物、材料两个大行业,而是几十个、上百个细分领域。不同细分领域所面对的问题不一样,不同的产业处在不同阶段、需要不同工具和不同的问题解决方案。这就演化成了一个复杂体系,需要具备不同背景的人有极致的协同。很幸运的是,我们的团队有这个基因。一个有追求的人会被我们打造的环境赋能,并反过来贡献到环境的打造中——这显然是个化学过程。
我们创业过程中,类似事情越来越多。解决实际问题时,我们经常需要很多小伙伴互相「翻译」,把自己懂的东西说给自己行业领域外的人,在信息对称的基础上,更关注认知对称。这样我们逐步形成了一套所谓的shared consciousness,共同意识。这个共同意识是进一步协同的基础,也定义了我们独特的能力和吸引力。
说起来我还有点擅长这个。我本科在元培学院的时候曾担任第一届学生学术学会主席,把理工科、人文社科等各个方向的同学组织起来做一些事情。我深知跨学科交流的魅力与挑战。我很享受在深势科技打造这个环境的过程。
ScienceAI:你们需要怎样背景的人?
张林峰:我们需要硬核的科学计算方法、高性能软件的开发者,与我们共同探索新的可能性、落实解决方案。我们需要很多IT行业背景的伙伴,与我们打造云原生的科学计算平台、打磨专用软件。我们需要计算辅助药物设计、计算辅助材料设计等背景的伙伴,与我们连接产业最真实的需求。我们还非常欢迎战略、市场、社区运营、产品经理、财法、人事、行政等背景的志同道合的小伙伴与我们共同定义深势科技,因为我相信我们要做的事情非常与众不同,会演化出非常有趣的公司形态与体系。对于所有这些背景的人,我们既欢迎经验丰富的前辈帮助我们,也欢迎勇于探索的朋友与我们共同成长。关键还是上面说的,志同道合最重要。
关于公司技术和产品
ScienceAI:你参与研究的「机器学习模拟上亿原子」获2020高性能计算应用领域最高奖项戈登贝尔奖,该事件入选了2020年中国十大科技进展。能给我们简单介绍一下里面的技术路线吗?
张林峰:药物、材料等体系的很多微观性质预测的本质需求是精确求解原子间相互作用。描述原子间相互作用的关键物理量是原子间的势能面。对此,长期以来人们面临着精度和效率不可兼得的困局:基于量子力学的方法准而不快,基于经验公式的方法快而不准。我们可以想象的是,势能面的本质就是从所有原子位置到一个能量的高维函数,而机器学习最擅长做的就是逼近高维函数,所以说这是一个自然的结合。
当然,真正拿机器学习工具解决这个问题时,我们并不能直接套用已有的机器学习模型框架。我们需要考虑如何以合适的方式满足一系列物理要求,例如广延性、各种对称性等等,从而使得少量小体系的准确数据训练出的模型能有效处理大规模体系;我们还需要考虑模型的端到端特性,极小化对调参的需求。这是需要二者巧妙结合的。
最后,好的计算模拟工具一定是基于当下最好算法和最好计算平台的结合。两者是需要相互适配的。这些新的思路如何与高性能计算有效结合,也需要很多新的考量。这里就不展开介绍了。
ScienceAI:「(物理建模+机器学习+高效采样)*HPC=(化学精度+AI效率)*性能最优」可以为药物发现提出新方案、助力创新药研发。该模型是否适合于其他领域的研究呢?此方法为下游的产业应用带来哪些全新可能性和机会?
张林峰:显然,该模型可以解决很多方面的问题。刚才所提到的物理模型、机器学习和高效采样等是通用方案。从下游产业应用来看,最重要的是产业应用所对应的需求、发展阶段和实际问题。有一些行业,例如药物设计,已有基于上一代计算工具的解决方案,但是解决问题的程度有限;有一些行业还处于定义问题阶段。有一些问题对业内从业人员来说不见得是一个计算问题,只有与做计算的人反复「碰撞」,才会碰撞出问题;还有一些行业是人们刚刚定义好问题,亟待有好的工具去解决。想想有限元方法作为一个基础方法被提出的时候,桥梁大坝、飞机设计、甚至家具设计等不同产业都有了新的可能性,但每个可能性的实现路径是不一样的。
ScienceAI:除了目前对外公开的产品和技术,在志同道合的应用领域合作伙伴加入之后,你会畅想哪些与之前完全不同的技术和产品创新呢?
张林峰:这不需要去畅想。一群志同道合且充满创造力的小伙伴们相互碰撞,不应过分地预期会有怎样的火花。有一些确定的事情我们一定要去做,但我们对新的可能性永远保持期待。
过去几个月里,我们所做的事情已完全超出了几个月前的想象。我们对算力的理解、对HPC的认识、对新一代工业软件的认识等已经因为一次次的碰撞产生了很大的变化。创新的魅力在于不可预测性。我们所面临的整个生态都需要我们重新思考。在这个过程中,保持开放、保持敏感、互相信任,是最重要的事情。
ScienceAI:在公司新产品的研发过程中,你在工作中遇到过最棘手的问题是什么?你采取哪些措施来解决这些问题的?
张林峰:比较难的是每个人都在挑战自己认知的边界。这对于公司整体发展来说是一个很大的挑战。比如有人擅长机器学习,但当面对一个个物理公式时,就有些不好办了。这时合作便会有困难。这样的困难如果解决不好,往往会导致在不同阶段,一边的人在解决问题,另一边的人只能等着。这样的挑战存在于方方面面。当然,以各种有效的方式边学边做既是我们所面临的挑战,也是最令人激动的事情——这是学东西最快的方式。因此,除了鼓励,我们也设置了有效机制来促进大家相互沟通、相互学习。
ScienceAI:新产品的研发都是一个长期而艰辛的过程,在研发期间可能会遇到各种问题,甚至有时得不到预期的结果,你怎样看待「失败」的可能性?
张林峰:如果「失败」的可能性对我们理性解决问题造成了负面的困扰,那它没有任何意义。我不会把时间花在对失败的担心上。
但是,在战术意义上,我们需要重视失败的可能性,这会影响我们的策略设计。例如,怎样的策略能让我们快速验证想法、快速对「失败」的可能性更加量化?这是我们需要持续思考和复盘的。失败本身不可怕,不过我们需要对「失败」本身有更好的建模。
关于产业落地
ScienceAI:医药研发是一个很长期的过程。与传统方式相比,在研发周期及时间成本上,深势科技提出的新思路能在哪些环节怎样提供更好的服务呢?
张林峰:我们在打造一系列的计算辅助药物设计的工具,致力于解决早期药物发现所对应的靶点发现、药物分子筛选、活性优化、药理优化和蛋白结构解析等问题。此外,我们还在大分子药物的计算工具上有持续的投入,也在探索场景需求基础上的一系列的数据处理方案。
ScienceAI:那我们有没有已经在和一些药企在合作?在产业界已经得到了哪些反馈?
张林峰:已有不少合作,目的主要是打磨产品。近期会有不少惊喜,敬请期待!
ScienceAI:与药物设计相比,新材料设计行业的现状和痛点有哪些不同?
张林峰:与药物设计相比,材料行业是一个更杂的行业。笼统地来讲,半导体、合金和电池等等都是不一样的,不同细分行业所面临的发展阶段和痛点也是不一样的。对材料行业来说,还有大量问题没有被定义明确,我们需要不断迭代和重构问题。对此,目前我们的重心一方面是积极支持DeepModeling开源平台的打造,打磨通用的解决方案;另一方面是与电池能源等方面的业界伙伴共同探讨专门化的解决方案。
ScienceAI:公司在产品落地及商业化的层面选择战略合作伙伴时有哪些考量和规划呢?
张林峰:志同道合最重要。在这个前提下,我们才能发挥各自的强项,实现共赢。
未来展望
ScienceAI:对于近几年人工智能、算法与其他学科交叉研究的飞速发展,你个人有什么看法呢?你认为未来几年行业的发展趋势是什么?
张林峰:我个人是乐观的。
我认为当下时代的最大改变在于一个技术从底层创新到产业落地的时间尺度,或许已经是我们人生的几分之一了。以前一个人一生可能恰好经历一次或零次技术革新,而我们可能不止是一次。我们面临着很多技术发展的不确定性。再过5~10年,或许摩尔定律将失效,算法、软件、硬件将有更深度融合;再过若干年,或许像光子计算、甚至量子计算这样的新型计算模式会在一些地方崭露头角,甚至颠覆现有体系;数据和模拟手段的极致结合终将对工业设计和控制产生巨大影响。
我很激动于拥抱这种不确定性。
ScienceAI:在这个行业发展趋势下,公司三到五年内的发展目标是?你个人又对公司有哪些大胆甚至疯狂的想法?
张林峰:三到五年内的发展目标我们非常明确。我们的愿景是运用人工智能和分子模拟算法,为人类文明最基础的生命、能源和材料科学和工程研究打造新一代基础设施,为企业和个人提供微观世界计算与设计的智能系统。当下我们的目标就是打造基于「多尺度建模+机器学习+高性能计算」这一范式的微尺度工业设计平台。
我们未来经历的,一定是场景与工具极致的迭代和融合。我相信这个过程能让世界变得更好。我不知道这是否足够疯狂。
深势科技简历接收邮箱:hr@dp.tech
产业机器学习多尺度建模深势科技
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
药物发现技术

在医学,生物技术和药理学领域,药物发现是发现新候选药物的过程。

推荐文章
暂无评论
暂无评论~