Codage audio haute qualité (20 Hz-15 kHz) en sous bandes à débit réduit (64 kbit/s) et à faible retard (5 ms)High quality low delay (5 ms) sub-band audio coder (20 hz-15 khz) at low bit rate (64 kbit/s)

被引:0
|
作者
Samir Saoudi
Karine Hay
Laurent Mainard
机构
[1] ENST-Bretagne,
[2] Département SC,undefined
[3] France Télécom-CNET/DSM,undefined
[4] rue du Clos Courtel,undefined
来源
Annales Des Télécommunications | 1999年 / 54卷 / 5-6期
关键词
Codage parole; Décomposition sous bande; Qualité sonore; Psychaocoustique; Prédiction linéaire; Quantification bloc; Compression bande passante; Son numérique; Treillis; Speech coding; Subband decomposition; Sound quality; Psychoacoustic; Linear prediction; Block quantization; Passband compression; Digital sound; Lattice;
D O I
10.1007/BF02995537
中图分类号
学科分类号
摘要
Cet article présente une nouvelle méthode de codage audionumérique à faible retard et à débit réduit pour des applications émergentes en télécommunication telles que l’audioconférence ou la vidéoconférence. Le codeur développé permet de traiter des signaux génériques (parole, musique, sons d’accompagnement, sons d’ambiance,...) à un débit de 64 kbit/s avec un retard de codage et décodage aux environs de 5 ms dans la bande de fréquence 20-15000 Hz. Ce codeur s’articule sur une décomposition en sous-bandes du signal d’entrée associée à un codage de la parole de type LD-CELP. L’introduction d’un modéle psychoacoustique pennet de déterminer le débit optimal à allouer à chacune des sous-bandes en fonction des caractéristiques propres de l’audition humaine. Pour satisfaire la demande de débit requise par le modele psychoacoustique et pour réduire la complexité algorithmique induite par cette structure de codage, nous avons présenté une nouvelle méthode de quantification vectorielle basée sur les réseaux réguliers de points. Cette méthode permet de quantifier le signal résiduel au sein du codeur LD-CELP sans effectuer de recherche trop complexe du meilleur quantificateur. Des tests objectifs et subjectifs ont été réalisés sur des séquences sonores critiques utilisées par l’iso. Des tests formels ont montré que la qualité du codeur proposé est comparable aux meilleures implantations de la norme MPEG-I, couche II, avec l’avantage, pour la solution proposée, d’avoir un retard de codage et décodage beaucoup plus faible (5 ms).
引用
收藏
页码:267 / 280
页数:13
相关论文
共 7 条
  • [1] High quality low delay (5 ms) sub-band audio coder (20 Hz-15 kHz) at low bit rate (64 kbit/s)
    Saoudi, S
    Hay, K
    Mainard, L
    [J]. ANNALS OF TELECOMMUNICATIONS, 1999, 54 (5-6) : 267 - 280
  • [2] High quality low delay (5 MS) sub-band audio coder (20 HZ-15 KHZ) at low bit rate (64 KBIT/S)
    Saoudi, Samir
    Hay, Karine
    Mainard, Laurent
    [J]. Annales des Telecommunications/Annals of Telecommunications, 54 (05): : 267 - 280
  • [3] Low delay coder (< 25 ms) of wideband audio (20 Hz-15 kHz) scalable from 64 to 32 kbit/s
    Moreau, N.
    Dymarski, P.
    [J]. Annales des Telecommunications/Annals of Telecommunications, 2000, 55 (9-10): : 493 - 506
  • [4] A low delay sub-band audio coder (20Hz-15kHz) at 64 kbit/s
    Hay, K
    Mainard, L
    Saoudi, S
    [J]. PROCEEDINGS OF THE IEEE-SP INTERNATIONAL SYMPOSIUM ON TIME-FREQUENCY AND TIME-SCALE ANALYSIS, 1996, : 265 - 268
  • [5] Low delay coder (&lt;25 ms) of wideband audio (20 Hz-15 kHz) scalable from 64 to 32 kbit/s
    Moreau, N
    Dymarski, P
    [J]. ANNALS OF TELECOMMUNICATIONS, 2000, 55 (9-10) : 493 - 506
  • [6] Very low delay and high quality coding of 20 Hz - 15 kHz speech signals at 64 kbit/s
    Murgia, C
    Feng, G
    LeGuyader, A
    Quinquis, C
    [J]. ICSLP 96 - FOURTH INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING, PROCEEDINGS, VOLS 1-4, 1996, : 302 - 305
  • [7] The D-5 lattice quantization for a 64 kbit/s low-delay subband audio coder with a 15 khz bandwidth
    Hay, K
    Mainard, L
    Saoudi, S
    [J]. 1997 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS I - V: VOL I: PLENARY, EXPERT SUMMARIES, SPECIAL, AUDIO, UNDERWATER ACOUSTICS, VLSI; VOL II: SPEECH PROCESSING; VOL III: SPEECH PROCESSING, DIGITAL SIGNAL PROCESSING; VOL IV: MULTIDIMENSIONAL SIGNAL PROCESSING, NEURAL NETWORKS - VOL V: STATISTICAL SIGNAL AND ARRAY PROCESSING, APPLICATIONS, 1997, : 319 - 322