06 现在的位置:首页 > 期刊导读 > 2016 > 06 >

用于孤立数字语音识别的一种组合降维方法

【作者】 宋青松 田正鑫 孙文磊 吴小杰 安毅生    长安大学信息工程学院 西安710064

【关键词】 语音识别 主成分分析 受限玻尔兹曼机

摘要】针对孤立数字语音识别的噪声鲁棒性问题,提出了一个组合降维方法。该方法由梅尔频率倒谱系数(MFCC)特征提取、线性降维、受限玻尔兹曼机(RBM)、Softmax分类器4个功能模块依次组成;基于主成分分析(PCA)基本原理对MFCC特征向量实现了降维并且统一维度的目的;通过RBM对降维后的特征向量进行学习,改善了后端Softmax分类器的分类性能,RBM的预训练由对比散度算法完成,微调过程使用共轭梯度算法。采用TI-46孤立数字语音库和NOISEX-92典型噪声数据库对方法进行了测试,实验结果表明,该方法可以获得96.09%的正确识别率,相对于常规神经网络识别方法,噪声鲁棒性得到了提高。

上一篇:周界视频监控中人员翻越行为检测算法
下一篇:多路阀阀芯节流槽拓扑结构组合的神经网络模型

© 2015 《西安交通大学学报》编辑部  地址:西安市咸宁西路28号  邮编:710049
互联网备案号:陕ICP备07500839号