用于孤立数字语音识别的一种组合降维方法

通知公告

交大新闻

过刊浏览

06 现在的位置：首页 > 期刊导读 > 2016 > 06 >

【作者】宋青松田正鑫孙文磊吴小杰安毅生长安大学信息工程学院西安710064

【关键词】语音识别主成分分析受限玻尔兹曼机

【摘要】针对孤立数字语音识别的噪声鲁棒性问题,提出了一个组合降维方法。该方法由梅尔频率倒谱系数（MFCC）特征提取、线性降维、受限玻尔兹曼机（RBM）、Softmax分类器4个功能模块依次组成;基于主成分分析（PCA）基本原理对MFCC特征向量实现了降维并且统一维度的目的;通过RBM对降维后的特征向量进行学习,改善了后端Softmax分类器的分类性能,RBM的预训练由对比散度算法完成,微调过程使用共轭梯度算法。采用TI-46孤立数字语音库和NOISEX-92典型噪声数据库对方法进行了测试,实验结果表明,该方法可以获得96.09%的正确识别率,相对于常规神经网络识别方法,噪声鲁棒性得到了提高。

上一篇：周界视频监控中人员翻越行为检测算法
下一篇：多路阀阀芯节流槽拓扑结构组合的神经网络模型

06 现在的位置：首页 > 期刊导读 > 2016 > 06 >

用于孤立数字语音识别的一种组合降维方法

【作者】 宋青松 田正鑫 孙文磊 吴小杰 安毅生 长安大学信息工程学院 西安710064

【关键词】 语音识别 主成分分析 受限玻尔兹曼机

【作者】宋青松田正鑫孙文磊吴小杰安毅生长安大学信息工程学院西安710064

【关键词】语音识别主成分分析受限玻尔兹曼机