子空间域相关特征变换与融合的语音识别方法
【作者】
陈斌
胡平舸
屈丹
解放军信息工程大学信息系统工程学院
郑州450001
山东大学信息科学与工程学院
济南250100
【关键词】
语音识别
区分性训练
深度神经网络
子空间域相关特征变换
【摘要】为了提高语音识别准确率,提出了一种子空间域相关特征变换与融合的语音识别方法(MFCC-BN-TC方法)。该方法提取语音短时谱结构特征(BN)和包络特征(MFCC)分别描述语音短时谱结构和包络信息,并采用域相关特征变换的形式分别对BN和MFCC特征进行特征变换;然后对这种变换进行泛化扩展提出子空间域相关特征变换,以采用不同的时间颗粒度(帧和语音分段)进行多层次区分性特征表达;最后,对多种区分性特征变换后的特征进行联合表征训练声学模型,并给出了区分性特征变换与融合的一般框架。实验结果表明:MFCC-BN-TC方法比采用原始BN特征方法和采用MFCC特征基线系统方法,识别性能各自提高了0.98%和1.62%;融合MFCCBN-TC方法变换以后的语音信号特征,相比于融合原始特征,识别率提升了1.5%。
上一篇:采用多尺度方向微分比率的角点检测算法
下一篇:一种相位编码信号及其失配滤波器设计方法