ROBUST SPEECH RECOGNITION IN UNKNOWN REVERBERANT AND NOISY CONDITIONS

被引：0

作者：

Hsiao, Roger ^{[1
]}

Ma, Jeff ^{[1
]}

Hartmann, William ^{[1
]}

Karafiat, Martin ^{[2
]}

Grezl, Frantisek ^{[2
]}

Burget, Lukas ^{[2
]}

Szoke, Igor ^{[2
]}

Cernocky, Jan Honza ^{[2
]}

Watanabe, Shinji ^{[3
]}

Chen, Zhuo ^{[3
]}

Mallidi, Sri Harish ^{[4
]}

Hermansky, Hynek ^{[4
]}

Tsakalidis, Stavros ^{[1
]}

Schwartz, Richard ^{[1
]}

机构：

[1] Raytheon BBN Technol, Cambridge, MA 02138 USA

[2] Brno Univ Technol, Speech FIT & Ctr Excellence IT4I, CS-61090 Brno, Czech Republic

[3] Mitsubishi Elect Res Labs, Cambridge, MA USA

[4] Johns Hopkins Univ, Baltimore, MD USA

来源：

2015 IEEE WORKSHOP ON AUTOMATIC SPEECH RECOGNITION AND UNDERSTANDING (ASRU) | 2015年

关键词：

ASpIRE challenge; robust speech recognition;

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

In this paper, we describe our work on the ASpIRE (Automatic Speech recognition In Reverberant Environments) challenge, which aims to assess the robustness of automatic speech recognition (ASR) systems. The main characteristic of the challenge is developing a high-performance system without access to matched training and development data. While the evaluation data are recorded with far-field microphones in noisy and reverberant rooms, the training data are telephone speech and close talking. Our approach to this challenge includes speech enhancement, neural network methods and acoustic model adaptation, We show that these techniques can successfully alleviate the performance degradation due to noisy audio and data mismatch.

引用

下载

页码：533 / 538

页数：6

共 50 条

[31] Listening benefits in speech-in-speech recognition are altered under reverberant conditions
Viswanathan, Navin
Kokkinakis, Kostas
JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, 2019, 145 (05): : EL348 - EL353
[32] Robust Front End Processing for Speech Recognition in Reverberant Environments: Utilization of Speech Characteristics
Petrick, Rico
Lu, Xugang
Unoki, Masashi
Akagi, Masato
Hoffmann, Ruediger
INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5, 2008, : 658 - +
[33] A discriminative and robust training algorithm for noisy speech recognition
Hong, WT
2003 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL I, PROCEEDINGS: SPEECH PROCESSING I, 2003, : 8 - 11
[34] A digital chip for robust speech recognition in noisy environment
Kim, CM
Lee, SY
2001 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS I-VI, PROCEEDINGS: VOL I: SPEECH PROCESSING 1; VOL II: SPEECH PROCESSING 2 IND TECHNOL TRACK DESIGN & IMPLEMENTATION OF SIGNAL PROCESSING SYSTEMS NEURALNETWORKS FOR SIGNAL PROCESSING; VOL III: IMAGE & MULTIDIMENSIONAL SIGNAL PROCESSING MULTIMEDIA SIGNAL PROCESSING - VOL IV: SIGNAL PROCESSING FOR COMMUNICATIONS; VOL V: SIGNAL PROCESSING EDUCATION SENSOR ARRAY & MULTICHANNEL SIGNAL PROCESSING AUDIO & ELECTROACOUSTICS; VOL VI: SIGNAL PROCESSING THEORY & METHODS STUDENT FORUM, 2001, : 1089 - 1092
[35] Multiband, Multisensor Robust Features for Noisy Speech Recognition
Dimitriadis, Dimitrios
Maragos, Petros
Lefkimmiatis, Stamatios
INTERSPEECH 2007: 8TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, VOLS 1-4, 2007, : 889 - 892
[36] Robust automatic speech recognition based on neural network in reverberant environments
Bai, L.
Li, H. L.
He, Y. Y.
CIVIL, ARCHITECTURE AND ENVIRONMENTAL ENGINEERING, VOLS 1 AND 2, 2017, : 1319 - 1324
[37] A PROGRESSIVE ENHANCEMENT METHOD FOR NOISY AND REVERBERANT SPEECH
Shu, Xiaofeng
Zhou, Yi
Cao, Yin
2018 IEEE 23RD INTERNATIONAL CONFERENCE ON DIGITAL SIGNAL PROCESSING (DSP), 2018,
[38] Enhancement of Reverberant Speech in Noisy Acoustical Environments
Joorabchi, Marjan
Ghorshi, Seyed
Sarafnia, Ali
2014 SIXTH INTERNATIONAL CONFERENCE ON WIRELESS COMMUNICATIONS AND SIGNAL PROCESSING (WCSP), 2014,
[39] SPATIAL DIFFUSENESS FEATURES FOR DNN-BASED SPEECH RECOGNITION IN NOISY AND REVERBERANT ENVIRONMENTS
Schwarz, Andreas
Huemmer, Christian
Maas, Roland
Kellermann, Walter
2015 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP), 2015, : 4380 - 4384
[40] Experiments of speech recognition in a noisy and reverberant environment using a microphone array and HMM adaptation
Giuliani, D
Omologo, M
Svaizer, P
ICSLP 96 - FOURTH INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING, PROCEEDINGS, VOLS 1-4, 1996, : 1329 - 1332

← 1 2 3 4 5 →