Cross-lingual speaker adaptation using domain adaptation and speaker consistency loss for text-to-speech synthesis

被引：0

作者：

Xin, Detai ^{[1
]}

Saito, Yuki ^{[1
]}

Takamichi, Shinnosuke ^{[1
]}

Koriyama, Tomoki ^{[1
]}

Saruwatari, Hiroshi ^{[1
]}

机构：

[1] Graduate School of Information Science and Technology, The University of Tokyo, Japan

来源：

Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH | 2021年 / 5卷

关键词：

D O I：

暂无

中图分类号：

学科分类号：

摘要：

Adaptation methods - Cross-lingual - Cross-lingual speaker adaptations - Domain adaptation - Fine tuning - Source language - Speaker adaptation - Speaker verification - Speech models - Text to speech

引用

页码：3376 / 3380

共 50 条

[1] Cross-lingual Speaker Adaptation using Domain Adaptation and Speaker Consistency Loss for Text-To-Speech Synthesis
Xin, Detai
Saito, Yuki
Takamichi, Shinnosuke
Koriyama, Tomoki
Saruwatari, Hiroshi
[J]. INTERSPEECH 2021, 2021, : 1614 - 1618
[2] Cross-lingual Text-To-Speech Synthesis via Domain Adaptation and Perceptual Similarity Regression in Speaker Space
Xin, Detai
Saito, Yuki
Takamichi, Shinnosuke
Koriyama, Tomoki
Saruwatari, Hiroshi
[J]. INTERSPEECH 2020, 2020, : 2947 - 2951
[3] Cross-lingual, Multi-speaker Text-To-Speech Synthesis Using Neural Speaker Embedding
Chen, Mengnan
Chen, Minchuan
Liang, Shuang
Ma, Jun
Chen, Lei
Wang, Shaojun
Xiao, Jing
[J]. INTERSPEECH 2019, 2019, : 2105 - 2109
[4] Cross-Lingual Speaker Adaptation for Statistical Speech Synthesis Using Limited Data
Saffjoo, Seyyed Saeed
Demiroglu, Cenk
[J]. 17TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2016), VOLS 1-5: UNDERSTANDING SPEECH PROCESSING IN HUMANS AND MACHINES, 2016, : 317 - 321
[5] CROSS-LINGUAL SPEAKER ADAPTATION FOR HMM-BASED SPEECH SYNTHESIS
Wu, Yi-Jian
King, Simon
Tokuda, Keiichi
[J]. 2008 6TH INTERNATIONAL SYMPOSIUM ON CHINESE SPOKEN LANGUAGE PROCESSING, PROCEEDINGS, 2008, : 9 - 12
[6] SPEAKER INTONATION ADAPTATION FOR TRANSFORMING TEXT-TO-SPEECH SYNTHESIS SPEAKER IDENTITY
Langarani, Mahsa Sadat Elyasi
van Santen, Jan
[J]. 2015 IEEE WORKSHOP ON AUTOMATIC SPEECH RECOGNITION AND UNDERSTANDING (ASRU), 2015, : 116 - 123
[7] UNSUPERVISED CROSS-LINGUAL SPEAKER ADAPTATION FOR HMM-BASED SPEECH SYNTHESIS
Oura, Keiichiro
Tokuda, Keiichi
Yamagishi, Junichi
King, Simon
Wester, Mirjam
[J]. 2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 2010, : 4594 - 4597
[8] CROSS-LINGUAL TEXT-INDEPENDENT SPEAKER VERIFICATION USING UNSUPERVISED ADVERSARIAL DISCRIMINATIVE DOMAIN ADAPTATION
Xia, Wei
Huang, Jing
Hansen, John H. L.
[J]. 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2019, : 5816 - 5820
[9] DSE-TTS: Dual Speaker Embedding for Cross-Lingual Text-to-Speech
Liu, Sen
Guo, Yiwei
Du, Chenpeng
Chen, Xie
Yu, Kai
[J]. INTERSPEECH 2023, 2023, : 616 - 620
[10] Cross-lingual Speaker Adaptation for HMM-based Speech Synthesis based on Perceptual Characteristics and Speaker Interpolation
Oliveira, Viviane de Franca
Shiota, Sayaka
Nankaku, Yoshihiko
Tokuda, Keiichi
[J]. 13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3, 2012, : 982 - 985

← 1 2 3 4 5 →