CAR-Transformer: Cross-Attention Reinforcement Transformer for Cross-Lingual Summarization

被引：0

作者：

Cai, Yuang ^{[1
]}

Yuan, Yuyu ^{[1
]}

机构：

[1] Beijing Univ Posts & Telecommun, Key Lab Trustworthy Distributed Comp & Serv BUPT, Minist Educ, Beijing, Peoples R China

来源：

THIRTY-EIGHTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, VOL 38 NO 16 | 2024年

基金：

中国国家自然科学基金;

关键词：

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

Cross-Lingual Summarization (CLS) involves generating a summary for a given document in another language. Most of the existing approaches adopt multi-task training and knowledge distillation, which increases the training cost and improves the performance of CLS tasks intuitively but unexplainably. In this work, we propose Cross-Attention Reinforcement (CAR) module and incorporate the module into the transformer backbone to formulate the CAR-Transformer. The CAR module formulates a pseudo-summary policy parameterized by the cross-attention weights reinforced by the ground-truth monolingual summary without introducing extra model parameters. Our approach demonstrates more consistent improvement across CLS tasks compared to traditional multi-task training methods and outperforms the fine-tuned vanilla mBART by 3.67 and the best-performing multi-task training approach by 1.48 in ROUGE-L F1 score on the WikiLingua Korean-to-English CLS task.

引用

页码：17718 / 17726

页数：9

共 50 条

[1] Embedded Heterogeneous Attention Transformer for Cross-Lingual Image Captioning
Song, Zijie
Hu, Zhenzhen
Zhou, Yuanen
Zhao, Ye
Hong, Richang
Wang, Meng
[J]. IEEE TRANSACTIONS ON MULTIMEDIA, 2024, 26 : 9008 - 9020
[2] Reinforced Transformer with Cross-Lingual Distillation for Cross-Lingual Aspect Sentiment Classification
Wu, Hanqian
Wang, Zhike
Qing, Feng
Li, Shoushan
[J]. ELECTRONICS, 2021, 10 (03) : 1 - 14
[3] Cross-Attention Transformer for Video Interpolation
Kim, Hannah Halin
Yu, Shuzhi
Yuan, Shuai
Tomasi, Carlo
[J]. COMPUTER VISION - ACCV 2022 WORKSHOPS, 2023, 13848 : 325 - 342
[4] Contributions of Transformer Attention Heads in Multi- and Cross-lingual Tasks
Ma, Weicheng
Zhang, Kai
Lou, Renze
Wang, Lili
Vosoughi, Soroush
[J]. 59TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS AND THE 11TH INTERNATIONAL JOINT CONFERENCE ON NATURAL LANGUAGE PROCESSING, VOL 1 (ACL-IJCNLP 2021), 2021, : 1956 - 1966
[5] SCATT: Transformer tracking with symmetric cross-attention
Zhang, Jianming
Chen, Wentao
Dai, Jiangxin
Zhang, Jin
[J]. APPLIED INTELLIGENCE, 2024, 54 (08) : 6069 - 6084
[6] Deblurring transformer tracking with conditional cross-attention
Sun, Fuming
Zhao, Tingting
Zhu, Bing
Jia, Xu
Wang, Fasheng
[J]. MULTIMEDIA SYSTEMS, 2023, 29 (03) : 1131 - 1144
[7] Deblurring transformer tracking with conditional cross-attention
Fuming Sun
Tingting Zhao
Bing Zhu
Xu Jia
Fasheng Wang
[J]. Multimedia Systems, 2023, 29 : 1131 - 1144
[8] GATE: Graph Attention Transformer Encoder for Cross-lingual Relation and Event Extraction
Ahmad, Wasi Uddin
Peng, Nanyun
Chang, Kai-Wei
[J]. THIRTY-FIFTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, THIRTY-THIRD CONFERENCE ON INNOVATIVE APPLICATIONS OF ARTIFICIAL INTELLIGENCE AND THE ELEVENTH SYMPOSIUM ON EDUCATIONAL ADVANCES IN ARTIFICIAL INTELLIGENCE, 2021, 35 : 12462 - 12470
[9] Cross-lingual timeline summarization
Cagliero, Luca
La Quatra, Moreno
Garza, Paolo
Baralis, Elena
[J]. 2021 IEEE FOURTH INTERNATIONAL CONFERENCE ON ARTIFICIAL INTELLIGENCE AND KNOWLEDGE ENGINEERING (AIKE 2021), 2021, : 45 - 53
[10] A Survey on Cross-Lingual Summarization
Wang, Jiaan
Meng, Fandong
Zheng, Duo
Liang, Yunlong
Li, Zhixu
Qu, Jianfeng
Zhou, Jie
[J]. TRANSACTIONS OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, 2022, 10 : 1304 - 1323

← 1 2 3 4 5 →