Alexa应该念「2/3」为「三分之二」还是「二月三日」?亚马逊技术博客探讨文本规范化与AI
亚马逊技术博客今日发布新文章,文章讨论道,文本规范化是会话AI中的一个重要处理过程。例如,Alexa用户说在「下午5点给我预订一张桌子」,自动语音识别器会将时间转录为「5 p m」。在技能处理此请求之前,「5 p m」将需要转换为「5:00 PM」。一旦Alexa处理以上请求,则会需要综合响应。 比如,「是下午6:30。好吗?」在这里例子中,下午6:30将转换为”六十三分钟“的文字转语音合成器。研究团队称将“5:00 PM”转换为“5 p m”文本标准化及其对应的过程 - 将“5 p m”转换为“5:00 PM” 为反向文本标准化。
为了用英语进行文本规范化和反文本规范化,Alexa目前依赖于数以千计的手写规则。随着与Alexa的可能交互范围的增加,创作规则成为一个本质上容易出错的过程。此外,随着Alexa继续使用新语言,研究团队也并不会彻底重新重写所有这些规则。在今年的计算语言学协会北美分会(NAACL)会议上,该研究团队将报告一组使用递归神经网络建立文本规范化系统的实验。