LEARNING FROM THE BEST: A TEACHER-STUDENT MULTILINGUAL FRAMEWORK FOR LOW-RESOURCE LANGUAGES

被引：0

作者：

Bagchi, Deblin ^{[1
,2
]}

Hartmann, William ^{[2
]}

机构：

[1] Ohio State Univ, Dept Comp Sci & Engn, Columbus, OH 43210 USA

[2] Raytheon BBN Technol, Cambridge, MA USA

来源：

2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) | 2019年

关键词：

Teacher-student learning; Low-resource speech; Multilingual training; Automatic speech recognition;

D O I：

10.1109/icassp.2019.8683491

中图分类号：

O42 [声学];

学科分类号：

070206 ; 082403 ;

摘要：

The traditional method of pretraining neural acoustic models in low-resource languages consists of initializing the acoustic model parameters with a large, annotated multilingual corpus and can be a drain on time and resources. In an attempt to reuse TDNN-LSTMs already pre-trained using multilingual training, we have applied Teacher-Student ( TS) learning as a method of pretraining to transfer knowledge from a multilingual TDNN-LSTM to a TDNN. The pretraining time is reduced by an order of magnitude with the use of language-specific data during the teacher-student training. Additionally, the TS architecture allows us to leverage untranscribed data, previously untouched during supervised training. The best student TDNN achieves a WER within 1% of the teacher TDNN-LSTM performance and shows consistent improvement in recognition over TDNNs trained using the traditional pipeline over all the evaluation languages. Switching to TDNN from TDNN-LSTM also allows sub-real time decoding.

引用

页码：6051 / 6055

页数：5

共 50 条

[1] Extending Multilingual BERT to Low-Resource Languages
Wang, Zihan
Karthikeyan, K.
Mayhew, Stephen
Roth, Dan
FINDINGS OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, EMNLP 2020, 2020, : 2649 - 2656
[2] Improving NER Tagging Performance in Low-Resource Languages via Multilingual Learning
Murthy, Rudra
Khapra, Mitesh M.
Bhattacharyya, Pushpak
ACM TRANSACTIONS ON ASIAN AND LOW-RESOURCE LANGUAGE INFORMATION PROCESSING, 2019, 18 (02)
[3] Crosslingual Transfer Learning for Low-Resource Languages Based on Multilingual Colexification Graphs
Liu, Yihong
Ye, Haotian
Weissweiler, Leonie
Pei, Renhao
Schuetze, Hinrich
FINDINGS OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS (EMNLP 2023), 2023, : 8376 - 8401
[4] Multilingual Offensive Language Identification for Low-resource Languages
Ranasinghe, Tharindu
Zampieri, Marcos
ACM TRANSACTIONS ON ASIAN AND LOW-RESOURCE LANGUAGE INFORMATION PROCESSING, 2022, 21 (01)
[5] Machine Learning approaches for Topic and Sentiment Analysis in multilingual opinions and low-resource languages: From English to Guarani
Matias Aguero-Torales, Marvin
PROCESAMIENTO DEL LENGUAJE NATURAL, 2023, (70): : 235 - 238
[6] Reinforcement Learning with Teacher-student Framework In Future Market
Chen, Sihang
Luo, Weiqi
Yu, Chao
INTERNATIONAL CONFERENCE ON ALGORITHMS, HIGH PERFORMANCE COMPUTING, AND ARTIFICIAL INTELLIGENCE (AHPCAI 2021), 2021, 12156
[7] LEARNING CROSS-LINGUAL INFORMATION WITH MULTILINGUAL BLSTM FOR SPEECH SYNTHESIS OF LOW-RESOURCE LANGUAGES
Yu, Quanjie
Liu, Peng
Wu, Zhiyong
Kang, Shiyin
Meng, Helen
Cai, Lianhong
2016 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING PROCEEDINGS, 2016, : 5545 - 5549
[8] An Analysis of Massively Multilingual Neural Machine Translation for Low-Resource Languages
Mueller, Aaron
Nicolai, Garrett
McCarthy, Arya D.
Lewis, Dylan
Wu, Winston
Yarowsky, David
PROCEEDINGS OF THE 12TH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION (LREC 2020), 2020, : 3710 - 3718
[9] Multilingual Features Based Keyword Search for Very Low-Resource Languages
Golik, Pavel
Tueske, Zoltan
Schlueter, Ralf
Ney, Hermann
16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5, 2015, : 1260 - 1264
[10] KNOWLEDGE DISTILLATION ACROSS ENSEMBLES OF MULTILINGUAL MODELS FOR LOW-RESOURCE LANGUAGES
Cui, Jia
Kingsbury, Brian
Ramabhadran, Bhuvana
Saon, George
Sercu, Tom
Audhkhasi, Kartik
Sethy, Abhinav
Nussbaum-Thom, Markus
Rosenberg, Andrew
2017 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2017, : 4825 - 4829

← 1 2 3 4 5 →