Codage audio haute qualité (20 Hz-15 kHz) en sous bandes à débit réduit (64 kbit/s) et à faible retard (5 ms)High quality low delay (5 ms) sub-band audio coder (20 hz-15 khz) at low bit rate (64 kbit/s)

被引：0

作者：

Samir Saoudi

Karine Hay

Laurent Mainard

机构：

[1] ENST-Bretagne,

[2] Département SC,undefined

[3] France Télécom-CNET/DSM,undefined

[4] rue du Clos Courtel,undefined

来源：

Annales Des Télécommunications | 1999年 / 54卷 / 5-6期

关键词：

Codage parole; Décomposition sous bande; Qualité sonore; Psychaocoustique; Prédiction linéaire; Quantification bloc; Compression bande passante; Son numérique; Treillis; Speech coding; Subband decomposition; Sound quality; Psychoacoustic; Linear prediction; Block quantization; Passband compression; Digital sound; Lattice;

D O I：

10.1007/BF02995537

中图分类号：

学科分类号：

摘要：

Cet article présente une nouvelle méthode de codage audionumérique à faible retard et à débit réduit pour des applications émergentes en télécommunication telles que l’audioconférence ou la vidéoconférence. Le codeur développé permet de traiter des signaux génériques (parole, musique, sons d’accompagnement, sons d’ambiance,...) à un débit de 64 kbit/s avec un retard de codage et décodage aux environs de 5 ms dans la bande de fréquence 20-15000 Hz. Ce codeur s’articule sur une décomposition en sous-bandes du signal d’entrée associée à un codage de la parole de type LD-CELP. L’introduction d’un modéle psychoacoustique pennet de déterminer le débit optimal à allouer à chacune des sous-bandes en fonction des caractéristiques propres de l’audition humaine. Pour satisfaire la demande de débit requise par le modele psychoacoustique et pour réduire la complexité algorithmique induite par cette structure de codage, nous avons présenté une nouvelle méthode de quantification vectorielle basée sur les réseaux réguliers de points. Cette méthode permet de quantifier le signal résiduel au sein du codeur LD-CELP sans effectuer de recherche trop complexe du meilleur quantificateur. Des tests objectifs et subjectifs ont été réalisés sur des séquences sonores critiques utilisées par l’iso. Des tests formels ont montré que la qualité du codeur proposé est comparable aux meilleures implantations de la norme MPEG-I, couche II, avec l’avantage, pour la solution proposée, d’avoir un retard de codage et décodage beaucoup plus faible (5 ms).

引用

页码：267 / 280

页数：13

共 7 条

[1] High quality low delay (5 ms) sub-band audio coder (20 Hz-15 kHz) at low bit rate (64 kbit/s)
Saoudi, S
Hay, K
Mainard, L
[J]. ANNALS OF TELECOMMUNICATIONS, 1999, 54 (5-6) : 267 - 280
[2] High quality low delay (5 MS) sub-band audio coder (20 HZ-15 KHZ) at low bit rate (64 KBIT/S)
Saoudi, Samir
Hay, Karine
Mainard, Laurent
[J]. Annales des Telecommunications/Annals of Telecommunications, 54 (05): : 267 - 280
[3] Low delay coder (< 25 ms) of wideband audio (20 Hz-15 kHz) scalable from 64 to 32 kbit/s
Moreau, N.
Dymarski, P.
[J]. Annales des Telecommunications/Annals of Telecommunications, 2000, 55 (9-10): : 493 - 506
[4] A low delay sub-band audio coder (20Hz-15kHz) at 64 kbit/s
Hay, K
Mainard, L
Saoudi, S
[J]. PROCEEDINGS OF THE IEEE-SP INTERNATIONAL SYMPOSIUM ON TIME-FREQUENCY AND TIME-SCALE ANALYSIS, 1996, : 265 - 268
[5] Low delay coder (<25 ms) of wideband audio (20 Hz-15 kHz) scalable from 64 to 32 kbit/s
Moreau, N
Dymarski, P
[J]. ANNALS OF TELECOMMUNICATIONS, 2000, 55 (9-10) : 493 - 506
[6] Very low delay and high quality coding of 20 Hz - 15 kHz speech signals at 64 kbit/s
Murgia, C
Feng, G
LeGuyader, A
Quinquis, C
[J]. ICSLP 96 - FOURTH INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING, PROCEEDINGS, VOLS 1-4, 1996, : 302 - 305
[7] The D-5 lattice quantization for a 64 kbit/s low-delay subband audio coder with a 15 khz bandwidth
Hay, K
Mainard, L
Saoudi, S
[J]. 1997 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS I - V: VOL I: PLENARY, EXPERT SUMMARIES, SPECIAL, AUDIO, UNDERWATER ACOUSTICS, VLSI; VOL II: SPEECH PROCESSING; VOL III: SPEECH PROCESSING, DIGITAL SIGNAL PROCESSING; VOL IV: MULTIDIMENSIONAL SIGNAL PROCESSING, NEURAL NETWORKS - VOL V: STATISTICAL SIGNAL AND ARRAY PROCESSING, APPLICATIONS, 1997, : 319 - 322

← 1 →