参与路雪 蒋思源

深度学习预测地震余震:哈佛大学新研究登上Nature

科学家们正在使用人工智能技术分析全世界地震的数据库,来预测可能发生余震的地点。最近,来自哈佛大学、康涅狄格大学和谷歌的研究人员利用深度学习算法,开发了一个预测余震的系统,尽管准确率仍然不够,但效果显著优于随机预测。

大地震发生后的数周、数月内,周边地区经常会发生强烈余震,再次损害已经遭受破坏的社区,极大阻碍了恢复重建工作。

尽管科学家已经提出一些经验性规律(如 Bäth 定律和 Ohmori 定律)来描述余震的可能规模和时间,但是预测余震的位置相比之下更难。

受谷歌研究人员建议的启发,地球与行星科学教授 Brendan Meade 以及博士后 Phoebe DeVries 合作,利用人工智能技术尝试解决该问题。

两位研究者利用深度学习算法分析了全世界地震的数据库,试图预测可能发生余震的地点,他们开发出一个预测余震的系统,尽管准确率仍然不足,但显著优于随机预测。该研究成果已发表在 Nature 上。

Meade 说道:「人们想要了解关于地震的三个方面:地震发生的时间、规模和地点。在该研究之前,我们已经对地震发生时间和规模形成了一些经验性规律,现在我们致力于解决第三点:地点。」

「我很兴奋,机器学习有可能推动这类问题的解决。这是个很重要的问题,值得我们探究。」DeVries 称,「余震预测尤其适合机器学习,因为影响余震的物理现象如此之多,而机器学习恰好非常擅长厘清多个因素之间的关系。我认为我们仅仅触及了余震预测的表面……但这足以令人兴奋了。」使用人工智能神经网络预测余震的想法在几年前就已经提出,当时 Meade 在谷歌剑桥办公室进行学术休假。

Meade 称,当时他与一组研究人员共同研究一个相关问题,一位同事建议「深度学习」算法可能会使这个问题的处理更加简单。后来,Meade 与 DeVries 合作,DeVries 曾经使用神经网络将高性能的计算代码转换成可在笔记本电脑上运行的余震预测算法。

「我们的目标是完成这件事,我们希望能对这个问题的解决有所贡献。」Meade 说道。

为此,Meade 和 DeVries 首先评估了 199 多场大地震相关观察结果的数据库。

Meade 介绍道:「5 级或以上地震发生后,人们用大量时间找出滑动的断层位置,以及移动的范围。很多研究可能使用来自一两场地震的观察结果,而我们使用整个数据库。我们将该数据库与基于物理学的模型结合起来,该模型关于地震发生后地球的应力和应变情况,大地震引起的应力和应变情况可能是引发余震的因素。」

他们利用该信息,将一块区域分割成多个 5 平方公里面积的网格。然后用系统检查每个网格中是否发生余震,再用神经网络查看余震发生地点和大地震导致的应力之间的关联。

「问题在于哪些因素组合是有助于预测的。」Meade 说,「这方面存在很多理论,但是我们这篇论文做了一件事,就是颠覆了最主流的理论,这篇论文展示了最主流理论的预测能力其实不高,它提出了具备更好预测能力的因素。」Meade 称,该系统指向的就是偏应力张量第二不变量,简称 J2。

「J2 经常出现在冶金学和其他理论中,但在地震科学中并不流行。」Meade 说道,「但是这意味着神经网络提出的事物并不疯狂,而是具备高度可解释性。它能够确定我们应该观察哪些物理学因素,这非常酷。」

DeVries 认为,这种可解释性非常关键,因为人工智能系统长期被很多科学家认为是黑箱,而它可以根据一些数据生成答案。

「这是我们的研究过程中最重要的步骤之一。」她说,「我们最初训练神经网络时,注意到它在预测余震位置任务上做得很好,但是我们认为找出它所寻找的对余震预测重要或有用的因素非常关键。」然而,给这个挑战再加上高度复杂的现实世界数据使得这个任务难度极大,因此这两位研究者转而让系统为合成、高度理想化的地震进行预测,然后检查预测结果。

「我们查看了神经网络的输出,确认如果多种量控制余震预测结果时我们应该使用哪些量。通过对它们进行空间上的对比,我们发现 J2 对于预测比较重要。」

Meade 说,由于该神经网络是使用全世界的地震和余震数据训练的,因此得到的系统可用于多种类型的断层。

「世界不同地区的断层具备不同的几何形状。」Meade 称,「加州大部分是滑断层(slip-fault),而其他地方(如日本)有很浅的俯冲带。但该系统最酷的地方在于你可以基于一个地方的数据训练模型,但它也可以预测其他地区的余震,因此它具备较强的泛化性能。」

「在真正实现预测余震和实时预测方面,我们还有很长的路要走,但我认为机器学习对解决这个问题有很大的潜力。」Meade 说道。

Meade 称,接下来她打算研究使用人工智能技术预测地震的震级,旨在有一天能够帮助防止地震灾害带来的毁灭性影响。

「传统的地震学家更像病理学家。」Meade 说道,「他们研究灾难性地震事件后会发生什么。我不想做这些,我想成为流行病学家。我想了解导致这些事件的诱发因素、原因。」

最终,Meade 说,该研究有助于人们重视深度学习算法的潜力,解答至少近期科学家们难以回答的难题。

他说,「我认为这对地震的预测是一场无声的革命。它不再是完全无关的想法。这一结果很有趣,我认为这是在人工智能时代重建所有科学革命的一部分。

他补充说到,「近来,以前惊人的难题变得容易了,不仅是因为计算力。科学社区将会极大的得益于此因为......AI 听起来非常吓人,但实际并非如此。这是计算非常民主化的一种形式,我认为开始有大量的人接触到 AI。」

论文:Deep learning of aftershock patterns following large earthquakes

论文地址:https://www.nature.com/articles/s41586-018-0438-y

摘要:余震是对大型地震所产生的应力变化的一种响应,其代表了地震产生的最常见观察结果。Bath 定律和 Omori 定律等经验法则很好地描述了余震的最大振幅和它们的时延,但是解释和预测余震的空间分布就显得困难得多。对于余震的空间分布,库仑破裂应力变化可能是最广泛的解释标准,但是它的适用性一直存在争议。在本论文中,我们使用深度学习方法确定基于静态应力的标准,并在不事先假设地震方向的情况下预测余震位置。

我们的结果表明,深度神经网络在超过 131,000 条由主震-余震对构建的数据集训练后,它能在独立的测试集中预测余震位置,其中该测试集包含了 30,000 条主震-余震对数据。此外,该深度模型相比于库仑破裂应力变化(曲线下面积为 0.583)有更准确的预测(曲线下面积为 0.849)。我们发现学习到的余震模式在物理上是可解释的:剪切应力的最大变化、von Mises 准则和应力变化张量的独立分量的绝对值之和,他们每一个都解释了神经网络预测超过 98% 的方差。这种以机器学习为驱动观察提供了对余震位置更好的预测,并发现了在地震周期中最活跃部分能控制地震触发的物理量。 

原文链接:https://www.sciencedaily.com/releases/2018/08/180829143753.htm

理论谷歌哈佛大学深度学习
3
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

张量技术

张量是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 维空间内,有 个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。称为该张量的秩或阶(与矩阵的秩和阶均无关系)。 在数学里,张量是一种几何实体,或者说广义上的“数量”。张量概念包括标量、矢量和线性算子。张量可以用坐标系统来表达,记作标量的数组,但它是定义为“不依赖于参照系的选择的”。张量在物理和工程学中很重要。例如在扩散张量成像中,表达器官对于水的在各个方向的微分透性的张量可以用来产生大脑的扫描图。工程上最重要的例子可能就是应力张量和应变张量了,它们都是二阶张量,对于一般线性材料他们之间的关系由一个四阶弹性张量来决定。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

推荐文章
暂无评论
暂无评论~