采用长短时记忆网络的低资源语音识别方法

通知公告

交大新闻

过刊浏览

10 现在的位置：首页 > 期刊导读 > 2012 > 10 >

【作者】舒帆 [1] 屈丹 [1] 张文林 [1] 周利莉 [1] 郭武 [2]

【关键词】语音识别低资源长短时记忆神经网络

【摘要】针对低资源环境下由于标注训练数据不足、造成语音识别系统识别率急剧下降的问题,提出一种采用长短时记忆网络的低资源语音识别(LSTM-LRASR)方法.该方法采用长短时记忆网络构建声学模型,从特征提取、数据扩展及模型优化3个方面提高低资源语音识别性能.在特征提取方面,提取语言无关的高层稳健特征参数,降低声学模型对训练数据的依赖;在数据扩展方面,对已有标注数据进行语速扰动,对无标注数据进行自动识别,从而自动获取更多标注数据;在模型优化方面,通过序贯区分性训练技术提高模型对易混淆音素的区分能力,利用最小风险贝叶斯解码对多个系统进行融合,进一步提高识别性能.对OpenKWS16评测数据的实验结果表明,采用LSTM-LRASR方法搭建的低资源语音识别系统的词错率相对基线系统下降了29.9％,所有查询词的查询项权重代价提升了60.3％.

上一篇： 采用深度学习的异步电机故障诊断方法
下一篇： 调频连续波雷达的二维截断统计量恒虚警检测方法

10 现在的位置：首页 > 期刊导读 > 2012 > 10 >

采用长短时记忆网络的低资源语音识别方法

【作者】 舒帆 [1] 屈丹 [1] 张文林 [1] 周利莉 [1] 郭武 [2]

【关键词】 语音识别 低资源 长短时记忆 神经网络

【作者】舒帆 [1] 屈丹 [1] 张文林 [1] 周利莉 [1] 郭武 [2]

【关键词】语音识别低资源长短时记忆神经网络