Integrated speech enhancement and coding in the time-frequency domain

被引：0

作者：

Drygajlo, A

Carnero, B

机构：

来源：

1997 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS I - V: VOL I: PLENARY, EXPERT SUMMARIES, SPECIAL, AUDIO, UNDERWATER ACOUSTICS, VLSI; VOL II: SPEECH PROCESSING; VOL III: SPEECH PROCESSING, DIGITAL SIGNAL PROCESSING; VOL IV: MULTIDIMENSIONAL SIGNAL PROCESSING, NEURAL NETWORKS - VOL V: STATISTICAL SIGNAL AND ARRAY PROCESSING, APPLICATIONS | 1997年

关键词：

D O I：

暂无

中图分类号：

O42 [声学];

学科分类号：

070206 ; 082403 ;

摘要：

This paper addresses the problem of merging speech enhancement and coding in the context of an auditory modeling. The noisy signal is first processed by a fast wavelet packet transform algorithm to obtain an auditory spectrum, from which a rough masking model is estimated. Then, this model is used to refine a subtractive-type enhancement algorithm. The enhanced speech coefficients are then encoded in the same time-frequency transform domain using masking threshold constraints for quantization noise. The advantage of the proposed method is that both enhancement and coding are performed with the transform coefficients, without making use of the additional FFT processing.

引用

页码：1183 / 1186

页数：4

共 50 条

[1] Neural speech enhancement in the time-frequency domain
Volkmer, M
[J]. 2003 IEEE XIII WORKSHOP ON NEURAL NETWORKS FOR SIGNAL PROCESSING - NNSP'03, 2003, : 617 - 626
[2] Joint Time-Frequency and Time Domain Learning for Speech Enhancement
Tang, Chuanxin
Luo, Chong
Zhao, Zhiyuan
Xie, Wenxuan
Zeng, Wenjun
[J]. PROCEEDINGS OF THE TWENTY-NINTH INTERNATIONAL JOINT CONFERENCE ON ARTIFICIAL INTELLIGENCE, 2020, : 3816 - 3822
[3] Speech preprocessing and enhancement based on joint time domain and time-frequency domain analysis
Zhang, Wenbo
Xie, Xuefeng
Du, Yanling
Huang, Dongmei
[J]. JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, 2024, 155 (06): : 3580 - 3588
[4] Residual Unet with Attention Mechanism for Time-Frequency Domain Speech Enhancement
Chen, Hanyu
Peng, Xiwei
Jiang, Qiqi
Guo, Yujie
[J]. 2022 41ST CHINESE CONTROL CONFERENCE (CCC), 2022, : 7007 - 7011
[5] Frequency Gating: Improved Convolutional Neural Networks for Speech Enhancement in the Time-Frequency Domain
Oostermeijer, Koen
Wang, Qing
Du, Jun
[J]. 2020 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE (APSIPA ASC), 2020, : 465 - 470
[6] TIME-FREQUENCY ATTENTION FOR MONAURAL SPEECH ENHANCEMENT
Zhang, Qiquan
Song, Qi
Ni, Zhaoheng
Nicolson, Aaron
Li, Haizhou
[J]. 2022 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2022, : 7852 - 7856
[7] Watermarking of speech signals in the time-frequency domain
Al-Khassaweneh, Mahmood
Al-Zoubi, Hussein
Aviyente, Selin
[J]. 2009 IEEE INTERNATIONAL CONFERENCE ON ELECTRO/INFORMATION TECHNOLOGY, 2009, : 317 - +
[8] Segmentation on time-frequency domain for speech segregation
Lim, Sung-Kil
Lee, Hyon-Soo
[J]. 2006 INTERNATIONAL SYMPOSIUM ON INTELLIGENT SIGNAL PROCESSING AND COMMUNICATIONS, VOLS 1 AND 2, 2006, : 433 - +
[9] PHASE RECONSTRUCTION METHOD BASED ON TIME-FREQUENCY DOMAIN HARMONIC STRUCTURE FOR SPEECH ENHANCEMENT
Wakabayashi, Yukoh
Fukumori, Takahiro
Nakayama, Masato
Nishiura, Takanobu
Yamashita, Yoichi
[J]. 2017 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2017, : 5560 - 5564
[10] Improved Speech Enhancement using a Complex-Domain GAN with Fused Time-Domain and Time-frequency Domain Constraints
Dang, Feng
Zhang, Pengyuan
Chen, Hangting
[J]. INTERSPEECH 2021, 2021, : 2721 - 2725

← 1 2 3 4 5 →