谷歌表示 Parallel Tacotron 模型产生合成声音的速度是其前身的 13 倍
据外媒报道,谷歌研究人员在最新的一篇论文中表示使用他们的Parallel Tacotron 来解决了文本语音转换(TTS)系统 Tacotron 2 的计算量大的局限,该模型在训练和推理过程中高度并行化,从而可以在功能较弱的硬件上高效生成语音。研究人员让人工审核人员查看 1,000 个句子,评估 Parallel Tacotron 的性能。尽管还有改进的余地,但结果表明 Parallel Tacotron 与人类语音相比「效果很好」。此外 Parallel Tacotron 比 Tacotron 2 快 13 倍。