An audio-visual saliency model for movie summarization

被引：8

作者：

Rapantzikos, Konstantinos ^{[1
]}

Evangelopoulos, Georgios ^{[1
]}

Maragos, Petros ^{[1
]}

Avrithis, Yannis ^{[1
]}

机构：

[1] Natl Tech Univ Athens, Sch ECE, GR-15773 Athens, Greece

来源：

2007 IEEE NINTH WORKSHOP ON MULTIMEDIA SIGNAL PROCESSING | 2007年

关键词：

saliency; saliency curves; attention modeling; event detection; key-frame selection; video summarization; audiovisual;

D O I：

10.1109/MMSP.2007.4412882

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

A saliency-based method for generating video summaries is presented, which exploits coupled audiovisual information from both media streams. Efficient and advanced speech and image processing algorithms to detect key frames that are acoustically and visually salient are used. Promising results are shown from experiments on a movie database.

引用

页码：320 / 323

页数：4

共 50 条

[1] PREDICTING AUDIO-VISUAL SALIENT EVENTS BASED ON VISUAL, AUDIO AND TEXT MODALITIES FOR MOVIE SUMMARIZATION
Koutras, P.
Zlatintsi, A.
Iosif, E.
Katsamanis, A.
Maragos, P.
Potamianos, A.
[J]. 2015 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 2015, : 4361 - 4365
[2] A audio-visual model for efficient video summarization
El-Nagar, Gamal
El-Sawy, Ahmed
Rashad, Metwally
[J]. JOURNAL OF VISUAL COMMUNICATION AND IMAGE REPRESENTATION, 2024, 100
[3] Audio-visual saliency prediction for movie viewing in immersive environments: Dataset and benchmarks
Chen, Zhao
Zhang, Kao
Cai, Hao
Ding, Xiaoying
Jiang, Chenxi
Chen, Zhenzhong
[J]. JOURNAL OF VISUAL COMMUNICATION AND IMAGE REPRESENTATION, 2024, 100
[4] A Novel Lightweight Audio-visual Saliency Model for Videos
Zhu, Dandan
Shao, Xuan
Zhou, Qiangqiang
Min, Xiongkuo
Zhai, Guangtao
Yang, Xiaokang
[J]. ACM TRANSACTIONS ON MULTIMEDIA COMPUTING COMMUNICATIONS AND APPLICATIONS, 2023, 19 (04)
[5] Deep Audio-Visual Saliency: Baseline Model and Data
Tavakoli, Hamed R.
Borji, Ali
Kannala, Juho
Rahtu, Esa
[J]. ETRA 2020 SHORT PAPERS: ACM SYMPOSIUM ON EYE TRACKING RESEARCH & APPLICATIONS, 2020,
[6] Unified Audio-Visual Saliency Model for Omnidirectional Videos With Spatial Audio
Zhu, Dandan
Zhang, Kaiwei
Zhang, Nana
Zhou, Qiangqiang
Min, Xiongkuo
Zhai, Guangtao
Yang, Xiaokang
[J]. IEEE TRANSACTIONS ON MULTIMEDIA, 2024, 26 : 764 - 775
[7] A Multimodal Saliency Model for Videos With High Audio-Visual Correspondence
Min, Xiongkuo
Zhai, Guangtao
Zhou, Jiantao
Zhang, Xiao-Ping
Yang, Xiaokang
Guan, Xinping
[J]. IEEE TRANSACTIONS ON IMAGE PROCESSING, 2020, 29 : 3805 - 3819
[8] AUTOMATIC SUMMARIZATION OF AUDIO-VISUAL SOCCER FEEDS
Chen, Fan
De Vleeschouwer, C.
Duxans Barrobes, H.
Gregorio Escalada, J.
Conejero, D.
[J]. 2010 IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO (ICME 2010), 2010, : 837 - 842
[9] Does Audio help in deep Audio-Visual Saliency prediction models?
Agrawal, Ritvik
Jyoti, Shreyank
Girmaji, Rohit
Sivaprasad, Sarath
Gandhi, Vineet
[J]. PROCEEDINGS OF THE 2022 INTERNATIONAL CONFERENCE ON MULTIMODAL INTERACTION, ICMI 2022, 2022, : 48 - 56
[10] Towards Audio-Visual Saliency Prediction for Omnidirectional Video with Spatial Audio
Chao, Fang-Yi
Ozcinar, Cagri
Zhang, Lu
Hamidouche, Wassim
Deforges, Olivier
Smolic, Aljosa
[J]. 2020 IEEE INTERNATIONAL CONFERENCE ON VISUAL COMMUNICATIONS AND IMAGE PROCESSING (VCIP), 2020, : 355 - 358

← 1 2 3 4 5 →