AM-FM Estimation for Speech Based on a Time-Varying Sinusoidal Model

被引：0

作者：

Pantazis, Yannis

Rosec, Olivier

Stylianou, Yannis

机构：

来源：

INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5 | 2009年

关键词：

Sinusoidal modeling; AM-FM demodulation; Speech analysis; Speech reconstruction;

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

In this paper we present a method based on a time-varying sinusoidal model for a robust and accurate estimation of amplitude and frequency modulations (AM-FM) in speech. The suggested approach has two main steps. First, speech is modeled as a sinusoidal model with time-varying amplitudes. Specifically, the model makes use of a first order time polynomial with complex coefficients for capturing instantaneous amplitude and frequency (phase) components. Next, the model parameters are updated by using the previously estimated instantaneous phase information. Thus, an iterative scheme for AM-FM decomposition of speech is suggested which was validated on synthetic AM-FM signals and tested on reconstruction of voiced speech signals where the signal-to-error reconstruction ratio (SERR) was used as measure. Compared to the standard sinusoidal representation, the suggested approach found to improve the corresponding SERR by 47%, resulting in over 30 dB of SERR.

引用

页码：112 / 115

页数：4

共 50 条

[21] Frequency estimation of a sinusoidal signal with time-varying amplitude
Vedyakov, Alexey A.
Vediakova, Anastasiia O.
Bobtsov, Alexey A.
Pyrkin, Anton A.
Aranovskiy, Stanislav V.
IFAC PAPERSONLINE, 2017, 50 (01): : 12880 - 12885
[22] ONLINE ESTIMATION OF TIME-VARYING FREQUENCY OF A SINUSOIDAL SIGNAL
Le Van Tuan
Korotina, Marina
Bobtsov, Alexey
Aranovskiy, Stanislav
Pyrkin, Anton
IFAC PAPERSONLINE, 2019, 52 (29): : 245 - 250
[23] CHIRP RATE ESTIMATION OF SPEECH BASED ON A TIME-VARYING QUASI-HARMONIC MODEL
Pantazis, Yannis
Rosec, Olivier
Stylianou, Yannis
2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS, 2009, : 3985 - 3988
[24] Real time AM-FM analysis of ultrasound video
Rodriguez, P
Pattichis, MS
2002 45TH MIDWEST SYMPOSIUM ON CIRCUITS AND SYSTEMS, VOL I, CONFERENCE PROCEEDINGS, 2002, : 216 - 219
[25] ADAPTIVE ESTIMATION OF TIME-VARYING MODEL ORDER IN THE ARMA SPEECH ANALYSIS
MORIKAWA, H
IEEE TRANSACTIONS ON ACOUSTICS SPEECH AND SIGNAL PROCESSING, 1990, 38 (07): : 1073 - 1083
[26] ON THE AMPLITUDE AND PHASE COMPUTATION OF THE AM-FM IMAGE MODEL
Nguyen, Chuong T.
Havlicek, Joseph P.
2014 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 2014, : 4318 - 4322
[27] Empirical Mode Decomposition for adaptive AM-FM analysis of Speech: A Review
Sharma, Rajib
Vignolo, Leandro
Schlotthauer, Gaston
Colominas, M. A.
Rufiner, H. Leonardo
Prasanna, S. R. M.
SPEECH COMMUNICATION, 2017, 88 : 39 - 64
[28] Multicomponent 2-D AM-FM Modeling of Speech Spectrograms
Dhiman, Jitendra Kumar
Sharma, Neeraj
Seelamantula, Chandra Sekhar
19TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2018), VOLS 1-6: SPEECH RESEARCH FOR EMERGING MARKETS IN MULTILINGUAL SOCIETIES, 2018, : 736 - 740
[29] Novel approach to AM-FM decomposition with applications to speech and music analysis
Sekhar, SC
Sreenivas, TV
2004 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL II, PROCEEDINGS: SENSOR ARRAY AND MULTICHANNEL SIGNAL PROCESSING SIGNAL PROCESSING THEORY AND METHODS, 2004, : 753 - 756
[30] Time-varying spectrum estimation of offshore structure response based on a time-varying autoregressive model
Yazid, E., 1600, Asian Network for Scientific Information (12):

← 1 2 3 4 5 →