使用迁移学习 训练完全卷积神经网络来检测语音中的愤怒
机器之心获悉,来自人工智能公司 Affectiva 的研究员近日发表新研究成果,他们通过训练完全卷积网络来检测语音中的愤怒。该研究团队在论文中表示:“由于训练这些深层架构需要大量数据,并且情感数据集的大小相对较小,因此我们使用转移学习。然而,与以前使用语音或基于情感的任务进行源模型的方法不同,我们使用SoundNet,一种完全卷积神经网络,在大型视频数据集上进行多模式训练,对音频进行分类,并使用基于视觉的分类器提供的地面真实标签。通过SoundNet的转移学习,我们训练有素的愤怒检测模型可以提高性能,并可以很好地概括各种行为,引出和自然的情感语音数据集。我们还通过评估我们的普通话语音情感数据的英语训练模型来测试我们模型的跨语言效果。此外,我们提出的系统具有适合实时应用的低延迟,仅需要1.2秒的音频来进行可靠的分类。”
Affectiva 专业使用人工智能来检测情绪,曾申请过利用 AI 检测驾驶员疲劳程度的技术专利。