Debiasing vision-language models for vision tasks: a survey

被引：0

作者：

Zhu, Beier ^{[1
]}

Zhang, Hanwang ^{[1
]}

机构：

[1] Nanyang Technol Univ, Sch Comp Sci & Engn, Singapore 639798, Singapore

来源：

FRONTIERS OF COMPUTER SCIENCE | 2025年 / 19卷 / 01期

关键词：

D O I：

10.1007/s11704-024-40051-3

中图分类号：

TP [自动化技术、计算机技术];

学科分类号：

0812 ;

摘要：

引用

页数：3

共 50 条

[41] Effectiveness assessment of recent large vision-language models
Yao Jiang
Xinyu Yan
Ge-Peng Ji
Keren Fu
Meijun Sun
Huan Xiong
Deng-Ping Fan
Fahad Shahbaz Khan
Visual Intelligence, 2 (1):
[42] VinVL: Revisiting Visual Representations in Vision-Language Models
Zhang, Pengchuan
Li, Xiujun
Hu, Xiaowei
Yang, Jianwei
Zhang, Lei
Wang, Lijuan
Choi, Yejin
Gao, Jianfeng
2021 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION, CVPR 2021, 2021, : 5575 - 5584
[43] Evaluating Attribute Comprehension in Large Vision-Language Models
Zhang, Haiwen
Yang, Zixi
Liu, Yuanzhi
Wang, Xinran
He, Zheqi
Liang, Kongming
Ma, Zhanyu
PATTERN RECOGNITION AND COMPUTER VISION, PT V, PRCV 2024, 2025, 15035 : 98 - 113
[44] Tuning Vision-Language Models With Multiple Prototypes Clustering
Guo, Meng-Hao
Zhang, Yi
Mu, Tai-Jiang
Huang, Sharon X.
Hu, Shi-Min
IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, 2024, 46 (12) : 11186 - 11199
[45] uCAP: An Unsupervised Prompting Method for Vision-Language Models
Nguyen, A. Tuan
Tai, Kai Sheng
Chen, Bor-Chun
Shukla, Satya Narayan
Yu, Harichao
Torr, Philip
Tian, Tai-Peng
Lim, Ser-Nam
COMPUTER VISION - ECCV 2024, PT LXXIV, 2025, 15132 : 425 - 439
[46] Disease-Informed Adaptation of Vision-Language Models
Zhang, Jiajin
Wang, Ge
Kalra, Mannudeep K.
Yan, Pingkun
MEDICAL IMAGE COMPUTING AND COMPUTER ASSISTED INTERVENTION - MICCAI 2024, PT XI, 2024, 15011 : 232 - 242
[47] DPO: Discrete Prompt Optimization for Vision-Language Models
Liang, Nanhao
Liu, Yong
IEEE SIGNAL PROCESSING LETTERS, 2025, 32 : 671 - 675
[48] VLATTACK: Multimodal Adversarial Attacks on Vision-Language Tasks via Pre-trained Models
Yin, Ziyi
Ye, Muchao
Zhang, Tianrong
Du, Tianyu
Zhu, Jinguo
Liu, Han
Chen, Jinghui
Wang, Ting
Ma, Fenglong
ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS 36 (NEURIPS 2023), 2023,
[49] ECO: Ensembling Context Optimization for Vision-Language Models
Agnolucci, Lorenzo
Baldrati, Alberto
Todino, Francesco
Becattini, Federico
Bertini, Marco
Del Bimbo, Alberto
2023 IEEE/CVF INTERNATIONAL CONFERENCE ON COMPUTER VISION WORKSHOPS, ICCVW, 2023, : 2803 - 2807
[50] Scaling Vision-Language Models with Sparse Mixture of Experts
Shen, Sheng
Yao, Zhewei
Li, Chunyuan
Darrell, Trevor
Keutzer, Kurt
He, Yuxiong
FINDINGS OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS (EMNLP 2023), 2023, : 11329 - 11344

← 1 2 3 4 5 →