Audio-visual interaction in multimedia

被引：0

作者：

Chen, Tsuhan ^{[1
]}

Rao, Ram ^{[1
]}

机构：

[1] AT&T Bell Lab, Holmdel, United States

来源：

IEEE Circuits and Devices Magazine | 1995年 / 11卷 / 06期

关键词：

D O I：

暂无

中图分类号：

学科分类号：

摘要：

引用

页码：21 / 25

共 50 条

[41] An audio-visual speech recognition system for testing new audio-visual databases
Pao, Tsang-Long
Liao, Wen-Yuan
VISAPP 2006: PROCEEDINGS OF THE FIRST INTERNATIONAL CONFERENCE ON COMPUTER VISION THEORY AND APPLICATIONS, VOL 2, 2006, : 192 - +
[42] Perceptual thresholds of audio-visual spatial coherence for a variety of audio-visual objects
Stenzel, Hanne
Jackson, Philip J. B.
2018 AES INTERNATIONAL CONFERENCE ON AUDIO FOR VIRTUAL AND AUGMENTED REALITY, 2018,
[43] Transfer of Audio-Visual Temporal Training to Temporal and Spatial Audio-Visual Tasks
Suerig, Ralf
Bottari, Davide
Roeder, Brigitte
MULTISENSORY RESEARCH, 2018, 31 (06) : 556 - 578
[44] Audio-visual event detection based on mining of semantic audio-visual labels
Goh, KS
Miyahara, K
Radhakrishan, R
Xiong, ZY
Divakaran, A
STORAGE AND RETRIEVAL METHODS AND APPLICATIONS FOR MULTIMEDIA 2004, 2004, 5307 : 292 - 299
[45] LEARNING CONTEXTUALLY FUSED AUDIO-VISUAL REPRESENTATIONS FOR AUDIO-VISUAL SPEECH RECOGNITION
Zhang, Zi-Qiang
Zhang, Jie
Zhang, Jian-Shu
Wu, Ming-Hui
Fang, Xin
Dai, Li-Rong
2022 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, ICIP, 2022, : 1346 - 1350
[46] Audio-Visual Causality and Stimulus Reliability Affect Audio-Visual Synchrony Perception
Li, Shao
Ding, Qi
Yuan, Yichen
Yue, Zhenzhu
FRONTIERS IN PSYCHOLOGY, 2021, 12
[47] AV2AV: Direct Audio-Visual Speech to Audio-Visual Speech Translation with Unified Audio-Visual Speech Representation
Choi, Jeongsoo
Park, Se Jin
Kim, Minsu
Ro, Yong Man
2024 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), 2024, : 27315 - 27327
[48] An investigation of audio-visual speech recognition as applied to multimedia speech therapy applications
Georgopoulos, VC
IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA COMPUTING AND SYSTEMS, PROCEEDINGS VOL 1, 1999, : 481 - 486
[49] Methods for audio-visual segmentation and content based access to multimedia broadcast data
Kosmala, A
Rigoll, G
Digital Media: Processing Multimedia Interactive Services, 2003, : 586 - 591
[50] AUDIO-VISUAL PERSON RECOGNITION IN MULTIMEDIA DATA FROM THE IARPA JANUS PROGRAM
Sell, Gregory
Duh, Kevin
Snyder, David
Etter, Dave
Garcia-Romero, Daniel
2018 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2018, : 3031 - 3035

← 1 2 3 4 5 →