Voice Conversion Using Structrued Gaussian Mixture Model

被引：0

作者：

Zeng, Daojian ^{[1
]}

Yu, Yibiao ^{[1
]}

机构：

[1] Soochow Univ, Sch Elect & Informat Engn, Suzhou, Peoples R China

来源：

2010 IEEE 10TH INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING PROCEEDINGS (ICSP2010), VOLS I-III | 2010年

关键词：

voice conversion; SGMM; AUS;

D O I：

暂无

中图分类号：

TM [电工技术]; TN [电子技术、通信技术];

学科分类号：

0808 ; 0809 ;

摘要：

Gaussian Mixture Model (GMM) is commonly used in voice conversion.. However, traditional GMM based voice conversion usually extracts a conversion function from parallel corpus, which greatly limits the application of the technology. In an attempt to overcome this drawback, structured Gaussian Mixture Model (SGMM) is applied to model the speaker's acoustic feature distribution. In particular, two speakers' isolated SGMMs are aligned based on Acoustic Universal Structure (AUS) theory. Then the conversion function is extracted from two aligned SGMMs in a manner similar to conventional method. The subjective listening tests indicate that the proposed method achieves equivalent: speech quality and speaker individuality compared with conventional method.

引用

页码：541 / 544

页数：4

共 50 条

[1] Voice conversion algorithm using phoneme Gaussian mixture model
Sheng, L
Yin, JX
Huang, JC
[J]. PROCEEDINGS OF THE 2004 INTERNATIONAL SYMPOSIUM ON INTELLIGENT MULTIMEDIA, VIDEO AND SPEECH PROCESSING, 2004, : 5 - 8
[2] Voice Conversion Using Gaussian Mixture Models
D'souza, Kevin
Talele, K. T. V.
[J]. 2015 INTERNATIONAL CONFERENCE ON COMMUNICATION, INFORMATION & COMPUTING TECHNOLOGY (ICCICT), 2015,
[3] Voice conversion using structured Gaussian mixture model in cepstrum eigenspace
LI Yangchun
YU Yibiao
[J]. Chinese Journal of Acoustics, 2015, 34 (03) : 325 - 336
[4] Voice conversion using Viterbi algorithm based on Gaussian mixture model
Jian Zhi-Hua
Yang Zhen
[J]. 2007 INTERNATIONAL SYMPOSIUM ON INTELLIGENT SIGNAL PROCESSING AND COMMUNICATION SYSTEMS, VOLS 1 AND 2, 2007, : 40 - 43
[5] Efficient Gaussian Mixture Model Evaluation in Voice Conversion
Tian, Jilei
Nurminen, Jani
Popa, Victor
[J]. INTERSPEECH 2006 AND 9TH INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING, VOLS 1-5, 2006, : 2282 - 2285
[6] Voice conversion using canonical correlation analysis based on Gaussian mixture model
Jian, ZhiHua
Yang, Zhen
[J]. SNPD 2007: EIGHTH ACIS INTERNATIONAL CONFERENCE ON SOFTWARE ENGINEERING, ARTIFICIAL INTELLIGENCE, NETWORKING, AND PARALLEL/DISTRIBUTED COMPUTING, VOL 1, PROCEEDINGS, 2007, : 210 - +
[7] VOICE CONVERSION BASED ON MATRIX VARIATE GAUSSIAN MIXTURE MODEL
Saito, Daisuke
Doi, Hidenobu
Minematsu, Nobuaki
Hirose, Keikichi
[J]. 2014 12TH INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING (ICSP), 2014, : 567 - 571
[8] Contribution on Gaussian Mixture Model Order Determination for Voice Conversion
Ben Amara, Ahmed
Ben Jebara, Sofia
[J]. 9TH INTERNATIONAL SYMPOSIUM ON SIGNAL, IMAGE, VIDEO AND COMMUNICATIONS (ISIVC 2018), 2018, : 87 - 92
[9] Phoneme-based spectral voice conversion using temporal decomposition and Gaussian mixture model
Nguyen, Binh Phu
Akagi, Masato
[J]. 2008 SECOND INTERNATIONAL CONFERENCE ON COMMUNICATIONS AND ELECTRONICS, 2008, : 222 - 227
[10] Voice conversion based on matrix variate Gaussian mixture model using multiple frame features
Yang, Yi
Uchida, Hidetsugu
Saito, Daisuke
Minematsu, Nobuaki
[J]. 17TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2016), VOLS 1-5: UNDERSTANDING SPEECH PROCESSING IN HUMANS AND MACHINES, 2016, : 302 - 306

← 1 2 3 4 5 →