Debiasing vision-language models for vision tasks: a survey

被引：0

作者：

Zhu, Beier ^{[1
]}

Zhang, Hanwang ^{[1
]}

机构：

[1] Nanyang Technol Univ, Sch Comp Sci & Engn, Singapore 639798, Singapore

来源：

FRONTIERS OF COMPUTER SCIENCE | 2025年 / 19卷 / 01期

关键词：

D O I：

10.1007/s11704-024-40051-3

中图分类号：

TP [自动化技术、计算机技术];

学科分类号：

0812 ;

摘要：

引用

页数：3

共 50 条

[1] Vision-Language Models for Vision Tasks: A Survey
Zhang, Jingyi
Huang, Jiaxing
Jin, Sheng
Lu, Shijian
IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, 2024, 46 (08) : 5625 - 5644
[2] DeAR: Debiasing Vision-Language Models with Additive Residuals
Seth, Ashish
Hemani, Mayur
Agarwal, Chirag
2023 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION, CVPR, 2023, : 6820 - 6829
[3] Toward Building General Foundation Models for Language, Vision, and Vision-Language Understanding Tasks
Zhang, Xinsong
Zeng, Yan
Zhang, Jipeng
Li, Hang
FINDINGS OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS - EMNLP 2023, 2023, : 551 - 568
[4] Adapting vision-language AI models to cardiology tasks
Arnaout, Rima
NATURE MEDICINE, 2024, 30 (05) : 1245 - 1246
[5] Adventures of Trustworthy Vision-Language Models: A Survey
Vatsa, Mayank
Jain, Anubhooti
Singh, Richa
THIRTY-EIGHTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, VOL 38 NO 20, 2024, : 22650 - 22658
[6] Causal Attention for Vision-Language Tasks
Yang, Xu
Zhang, Hanwang
Qi, Guojun
Cai, Jianfei
2021 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION, CVPR 2021, 2021, : 9842 - 9852
[7] Image as a Foreign Language: BEIT Pretraining for Vision and Vision-Language Tasks
Wang, Wenhui
Bao, Hangbo
Dong, Li
Bjorck, Johan
Peng, Zhiliang
Liu, Qiang
Aggarwal, Kriti
Mohammed, Owais Khan
Singhal, Saksham
Som, Subhojit
Wei, Furu
2023 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), 2023, : 19175 - 19186
[8] Compressing and Debiasing Vision-Language Pre-Trained Models for Visual Question Answering
Si, Qingyi
Liu, Yuanxin
Lin, Zheng
Fu, Peng
Cao, Yanan
Wang, Weiping
2023 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING, EMNLP 2023, 2023, : 513 - 529
[9] Vision-language navigation: a survey and taxonomy
Wu, Wansen
Chang, Tao
Li, Xinmeng
Yin, Quanjun
Hu, Yue
NEURAL COMPUTING & APPLICATIONS, 2024, 36 (07): : 3291 - 3316
[10] Vision-language navigation: a survey and taxonomy
Wansen Wu
Tao Chang
Xinmeng Li
Quanjun Yin
Yue Hu
Neural Computing and Applications, 2024, 36 : 3291 - 3316

← 1 2 3 4 5 →