10 现在的位置:首页 > 期刊导读 > 2012 > 10 >

采用长短时记忆网络的低资源语音识别方法

【作者】 舒帆 [1] 屈丹 [1] 张文林 [1] 周利莉 [1] 郭武 [2]

【关键词】 语音识别 低资源 长短时记忆 神经网络

摘要】针对低资源环境下由于标注训练数据不足、造成语音识别系统识别率急剧下降的问题,提出一种采用长短时记忆网络的低资源语音识别(LSTM-LRASR)方法.该方法采用长短时记忆网络构建声学模型,从特征提取、数据扩展及模型优化3个方面提高低资源语音识别性能.在特征提取方面,提取语言无关的高层稳健特征参数,降低声学模型对训练数据的依赖;在数据扩展方面,对已有标注数据进行语速扰动,对无标注数据进行自动识别,从而自动获取更多标注数据;在模型优化方面,通过序贯区分性训练技术提高模型对易混淆音素的区分能力,利用最小风险贝叶斯解码对多个系统进行融合,进一步提高识别性能.对OpenKWS16评测数据的实验结果表明,采用LSTM-LRASR方法搭建的低资源语音识别系统的词错率相对基线系统下降了29.9%,所有查询词的查询项权重代价提升了60.3%.

上一篇: 采用深度学习的异步电机故障诊断方法
下一篇: 调频连续波雷达的二维截断统计量恒虚警检测方法

© 2015 《西安交通大学学报》编辑部  地址:西安市咸宁西路28号  邮编:710049
互联网备案号:陕ICP备07500839号