麻省理工大学联合谷歌大脑破解失传语言
来自麻省理工大学计算机科学与人工智能实验室以及谷歌大脑的研究团队提出了一种新的方法来解读失传的语言。为了弥补缺乏强有力的监督信号,研究团队以历史语言学中记录的语言变化模式为依据来建立模型。该模型利用表达序列 - 序列模型来捕获同源物之间的字符级对应关系。为了以无人监督的方式有效地训练模型,研究团队通过将其形式化为最小成本流问题来创新培训过程。当应用于 Ugaritic 的解密时,该模型比最先进的结果实现了 5.5%的绝对改进。此外,研究团队还报告了破译线性 B 的第一个自动结果,这是一种与古希腊语相关的音节语言,而该模型正确地翻译了 67.3%的同源词。