MODIFICATION ON LSA SPEECH ENHANCEMENT FOR SPEECH RECOGNITION

被引：0

作者：

You, Chang Huai ^{[1
]}

Ma, Bin ^{[1
]}

Ni, Chongjia ^{[1
]}

机构：

[1] ASTAR, Inst Infocomm Res, Singapore, Singapore

来源：

2017 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) | 2017年

关键词：

speech enhancement; speech recognition; apriori SNR; SPECTRAL AMPLITUDE ESTIMATOR; NOISE; EPHRAIM;

D O I：

暂无

中图分类号：

O42 [声学];

学科分类号：

070206 ; 082403 ;

摘要：

Speech recognition performance deteriorates in face of unknown noise. Speech enhancement offers a solution by reducing the noise in speech at runtime. However, it also introduces artificial distortions to the speech signals. In this paper, we aim at reducing the artifacts that has adverse effects on speech recognition. With this motivation, we propose a modification scheme including smoothing adaptation to frame SNR and reestimation of a priori SNR for spectral-domain log-spectral-amplitude (LSA) speech enhancement. The experiments show that the proposed scheme of enhancement significantly improves the performance of the state-of-the-art speech recognition over the baseline speech enhancement.

引用

页码：5475 / 5479

页数：5

共 50 条

[1] Research on speech enhancement based on MMSE-LSA
Zhang, Rubo
Guo, Fang
Li, Xueyao
Xu, Dong
[J]. INT CONF ON CYBERNETICS AND INFORMATION TECHNOLOGIES, SYSTEMS AND APPLICATIONS/INT CONF ON COMPUTING, COMMUNICATIONS AND CONTROL TECHNOLOGIES, VOL II, 2007, : 204 - 208
[2] NETWORKS FOR SPEECH ENHANCEMENT AND AUTOMATIC SPEECH RECOGNITION
Vu, Thanh T.
Bigot, Benjamin
Chng, Eng Siong
[J]. 2016 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING PROCEEDINGS, 2016, : 499 - 503
[3] β-Masking MMSE Speech Enhancement for Speech Recognition
You, Chang Huai
Ma, Bin
[J]. 2017 IEEE 2ND INTERNATIONAL CONFERENCE ON SIGNAL AND IMAGE PROCESSING (ICSIP), 2017, : 341 - 345
[4] SPEECH ENHANCEMENT FOR TELEPHONY NAME SPEECH RECOGNITION
You, Chang Huai
Rahardja, Susanto
Li, Haizhou
[J]. 2008 IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO, VOLS 1-4, 2008, : 973 - 976
[5] Noisy speech recognition based on speech enhancement
Wang, Xia
Tang, Hongmei
Zhao, Xiaoqun
[J]. SNPD 2007: EIGHTH ACIS INTERNATIONAL CONFERENCE ON SOFTWARE ENGINEERING, ARTIFICIAL INTELLIGENCE, NETWORKING, AND PARALLEL/DISTRIBUTED COMPUTING, VOL 3, PROCEEDINGS, 2007, : 713 - +
[6] Speech enhancement for Distributed Speech Recognition in mobile devices
Flynn, Ronan
Jones, Edward
[J]. 2008 DIGEST OF TECHNICAL PAPERS INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS, 2008, : 233 - +
[7] Spectral-domain speech enhancement for speech recognition
You, Chang Huai
Ma, Bin
[J]. SPEECH COMMUNICATION, 2017, 94 : 30 - 41
[8] CONTINUOUS VISUAL SPEECH RECOGNITION FOR AUDIO SPEECH ENHANCEMENT
Benhaim, Eric
Sahbi, Hichem
Vitte, Guillaume
[J]. 2015 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP), 2015, : 2244 - 2248
[9] SPEECH ENHANCEMENT FOR ROBUST SPEECH RECOGNITION IN MOTORCYCLE ENVIRONMENT
Mporas, Iosif
Ganchev, Todor
Kocsis, Otilia
Fakotakis, Nikos
[J]. INTERNATIONAL JOURNAL ON ARTIFICIAL INTELLIGENCE TOOLS, 2010, 19 (02) : 159 - 173
[10] Speech enhancement applied to speech recognition in noisy environments
[J]. Xu, Y.F., 2001, Press of Tsinghua University (41):

← 1 2 3 4 5 →