用于孤立数字语音识别的一种组合降维方法
【作者】
宋青松
田正鑫
孙文磊
吴小杰
安毅生
长安大学信息工程学院
西安710064
【关键词】
语音识别
主成分分析
受限玻尔兹曼机
【摘要】针对孤立数字语音识别的噪声鲁棒性问题,提出了一个组合降维方法。该方法由梅尔频率倒谱系数(MFCC)特征提取、线性降维、受限玻尔兹曼机(RBM)、Softmax分类器4个功能模块依次组成;基于主成分分析(PCA)基本原理对MFCC特征向量实现了降维并且统一维度的目的;通过RBM对降维后的特征向量进行学习,改善了后端Softmax分类器的分类性能,RBM的预训练由对比散度算法完成,微调过程使用共轭梯度算法。采用TI-46孤立数字语音库和NOISEX-92典型噪声数据库对方法进行了测试,实验结果表明,该方法可以获得96.09%的正确识别率,相对于常规神经网络识别方法,噪声鲁棒性得到了提高。
上一篇:周界视频监控中人员翻越行为检测算法
下一篇:多路阀阀芯节流槽拓扑结构组合的神经网络模型