理论引导的数据科学:一种用于科学发现的新范式

By 吴攀2016年12月28日 17:54

blob.png

尽管数据科学模型已经在很多商业领域取得了成功,但在涉及复杂物理现象的科学问题上的应用还很有限。理论引导的数据科学(TGDS/theory-guided data science)是一种新兴的范式,其目标是利用丰富的科学知识来提升数据科学模型在驱动科学发现上的有效性。TGDS 的整体设想是引入科学一致性,并将其作为一种用于学习可泛化模型的关键组分。此外,通过产生可通过科学解读的模型,TGDS 的目标是通过发现全新的领域见解来提升我们的科学认识。实际上,TGDS 的范式已经开始在一些科学学科迎来了发展势头,比如:湍流建模、材料发现、量子化学、生物医学、生物标志物的发现、气候和水文科学。在这篇论文中,我们正式定义了 TGDS 的概念和 TGDS 的一个研究主题分类。我们通过来自不同学科的阐释性案例描述了几种用于整合不同研究主题中领域知识的方法。我们还强调了一些用于实现理论引导的数据科学的全部潜力的有潜力的全新研究途径。

blob.png

图 1:科学应用中知识发现方法的表示。x 轴表示数据的使用,y 轴表示科学知识的使用。理论引导的数据科学探索了知识发现空间,其可以充分利用可用的数据,同时也能严格遵守基本的科学知识。


论文地址:Theory-guided Data Science: A New Paradigm for Scientific Discovery

声明:本文由机器之心原创出品,版权归作者所有,转载请查看要求,机器之心对于违规侵权者保有法律追诉权。