声道长度微扰 | 机器之心

简介

发展历史

1975年，VTLP算法被提出，并应用于语音领域。1998年，Lee L等人将VTLP应用于说话人规整中。2013年，利用VTLP随机生成的噪声，来对原始数据进行处理，生成新的数据，通过增加训练数据的数量来提高识别结果。

年份	事件	相关论文/Reference
1975	VTLP算法被提出	Fant G. Vocal-tract area and length perturbations[J]. STL-QPSR, 1975, 4(1975): 1-14.
1998	使用VTLP进行说话人规整	Lee L, Rose R. A frequency warping approach to speaker normalization[J]. IEEE Transactions on speech and audio processing, 1998, 6(1): 49-60.
2013	利用VTLP增加训练数据的数量来提高识别结果	Jaitly N, Hinton G E. Vocal tract length perturbation (VTLP) improves speech recognition[C]//Proc. ICML Workshop on Deep Learning for Audio, Speech and Language. 2013, 117.

相比较于其它生成算法，这种处理方法获得的数据种类比较单一，由于扰动因子是随机生成的，数据的变化也比较简单，因此对不同说话人，不同语音处理存在一定的局限性。

如何获得更多的训练数据是目前机器学习领域面对的问题之一，通过利用扰动因子获得更多的训练数据是处理这个问题的方法之一。将来一些其他的扰动方法，如非线性的扰动也可以应用到这个问题上。

Contributor: Yilin Pan

简介