谷歌揭秘其语音识别平台 Euphonia 背后的研究
在谷歌于 2019 年 Interspeech 大会上展示的「个性化 ASR for Dysarthric and Accented Speech with Limited Data」中,研究人员揭秘了 Project Euphonia 背后的一些研究。Euphonia 项目是谷歌一个执行语音到文本转录的语音识别(ASR)平台,这项工作提出了一种针对改善肌萎缩性脊髓侧索硬化症患者的语音识别的方法,该方法可能也将适用于许多其他类型的非标准语音。通过使用从基线「标准」语料库开始的两步训练方法并利用个性化语音数据集对训练进行微调,研究人员证明该模型对于具有非典型语音的扬声器由着显著的改进。