FD-Align: Feature Discrimination Alignment for Fine-tuning Pre-Trained Models in Few-Shot Learning

被引：0

作者：

Song, Kun ^{[1
]}

Ma, Huimin ^{[1
]}

Zou, Bochao ^{[1
]}

Zhang, Huishuai ^{[3
]}

Huang, Weiran ^{[2
]}

机构：

[1] Univ Sci & Technol Beijing, SCCE, Beijing, Peoples R China

[2] Shanghai Jiao Tong Univ, SEIEE, Qing Yuan Res Inst, Shanghai, Peoples R China

[3] Microsoft Res Asia, Beijing, Peoples R China

来源：

ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS 36 (NEURIPS 2023) | 2023年

基金：

中国国家自然科学基金;

关键词：

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

Due to the limited availability of data, existing few-shot learning methods trained from scratch fail to achieve satisfactory performance. In contrast, large-scale pre-trained models such as CLIP demonstrate remarkable few-shot and zero-shot capabilities. To enhance the performance of pre-trained models for downstream tasks, fine-tuning the model on downstream data is frequently necessary. However, fine-tuning the pre-trained model leads to a decrease in its generalizability in the presence of distribution shift, while the limited number of samples in few-shot learning makes the model highly susceptible to overfitting. Consequently, existing methods for fine-tuning few-shot learning primarily focus on fine-tuning the model's classification head or introducing additional structure. In this paper, we introduce a fine-tuning approach termed Feature Discrimination Alignment (FD-Align). Our method aims to bolster the model's generalizability by preserving the consistency of spurious features across the fine-tuning process. Extensive experimental results validate the efficacy of our approach for both ID and OOD tasks. Once fine-tuned, the model can seamlessly integrate with existing methods, leading to performance improvements. Our code could be found in https://github.com/skingorz/FD-Align.

引用

页数：14

共 50 条

[1] Pathologies of Pre-trained Language Models in Few-shot Fine-tuning
Chen, Hanjie
Zheng, Guoqing
Awadallah, Ahmed Hassan
Ji, Yangfeng
PROCEEDINGS OF THE THIRD WORKSHOP ON INSIGHTS FROM NEGATIVE RESULTS IN NLP (INSIGHTS 2022), 2022, : 144 - 153
[2] Fine-tuning Pre-trained Language Models for Few-shot Intent Detection: Supervised Pre-training and Isotropization
Zhang, Haode
Liang, Haowen
Zhang, Yuwei
Zhan, Liming
Wu, Xiao-Ming
Lu, Xiaolei
Lam, Albert Y. S.
NAACL 2022: THE 2022 CONFERENCE OF THE NORTH AMERICAN CHAPTER OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS: HUMAN LANGUAGE TECHNOLOGIES, 2022, : 532 - 542
[3] PPT: Pre-trained Prompt Tuning for Few-shot Learning
Gu, Yuxian
Han, Xu
Liu, Zhiyuan
Huang, Minlie
PROCEEDINGS OF THE 60TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS (ACL 2022), VOL 1: (LONG PAPERS), 2022, : 8410 - 8423
[4] Feature Mixture on Pre-Trained Model for Few-Shot Learning
Wang, Shuo
Lu, Jinda
Xu, Haiyang
Hao, Yanbin
He, Xiangnan
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2024, 33 : 4104 - 4115
[5] Adaptive fine-tuning strategy for few-shot learning
Zhuang, Xinkai
Shao, Mingwen
Gao, Wei
Yang, Jianxin
JOURNAL OF ELECTRONIC IMAGING, 2022, 31 (06)
[6] Span Fine-tuning for Pre-trained Language Models
Bao, Rongzhou
Zhang, Zhuosheng
Zhao, Hai
FINDINGS OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, EMNLP 2021, 2021, : 1970 - 1979
[7] RIFF: Learning to Rephrase Inputs for Few-shot Fine-tuning of Language Models
Najafi, Saeed
Fyshe, Alona
FINDINGS OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS: ACL 2024, 2024, : 1447 - 1466
[8] Fine-Tuning Pre-Trained Language Models with Gaze Supervision
Deng, Shuwen
Prasse, Paul
Reich, David R.
Scheffer, Tobias
Jager, Lena A.
PROCEEDINGS OF THE 62ND ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, VOL 2: SHORT PAPERS, 2024, : 217 - 224
[9] Making Pre-trained Language Models Better Few-shot Learners
Gao, Tianyu
Fisch, Adam
Chen, Danqi
59TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS AND THE 11TH INTERNATIONAL JOINT CONFERENCE ON NATURAL LANGUAGE PROCESSING (ACL-IJCNLP 2021), VOL 1, 2021, : 3816 - 3830
[10] A fine-grained self-adapting prompt learning approach for few-shot learning with pre-trained language models
Chen, Xiaojun
Liu, Ting
Fournier-Viger, Philippe
Zhang, Bowen
Long, Guodong
Zhang, Qin
KNOWLEDGE-BASED SYSTEMS, 2024, 299

← 1 2 3 4 5 →