06 现在的位置:首页 > 期刊导读 > 2016 > 06 >

借助音频数据的发音字典新词学习方法

【作者】 范正光 屈丹 闫红刚 张文林    解放军信息工程大学信息系统工程学院 郑州450002

【关键词】 语音识别 发音字典 新词学习 集外词

摘要】针对已有的发音字典扩展方法只能从文本数据中学习新词而无法学习到音频数据中新词的问题,提出了一种基于混合语音识别系统的发音字典新词学习方法。该方法首先分别采用音节和字母音素对混合识别系统对音频数据进行集外词识别,利用系统间的互补性得到尽可能多的新词及其发音候选,然后借助感知器与最大熵模型对得到的新词及发音进行优化,降低错误率,最后实现发音字典的扩展,并利用语法语义信息完成对语言模型参数更新。基于华尔街日报(WSJ)语料库的连续语音识别实验表明:该方法可以有效学习到音频数据中的未知新词,采取的数据优化策略极大地提高了所得新词及发音的精度;在词错误率指标下,字典扩展后系统的识别性能相对基线系统提高约13.4%。

上一篇:轴承滚珠面型误差激光干涉测量系统的研究
下一篇:利用频谱峰值特征的窄带频谱感知方法

© 2015 《西安交通大学学报》编辑部  地址:西安市咸宁西路28号  邮编:710049
互联网备案号:陕ICP备07500839号