Multimodal Large Language Models in Vision and Ophthalmology

被引：0

作者：

Lu, Zhiyong ^{[1
]}

机构：

[1] NIH, Bethesda, MD USA

来源：

INVESTIGATIVE OPHTHALMOLOGY & VISUAL SCIENCE | 2024年 / 65卷 / 07期

关键词：

D O I：

暂无

中图分类号：

R77 [眼科学];

学科分类号：

100212 ;

摘要：

3876

引用

页数：2

共 50 条

[31] A Survey on Multimodal Large Language Models for Autonomous Driving
Cui, Can
Ma, Yunsheng
Cao, Xu
Ye, Wenqian
Zhou, Yang
Liang, Kaizhao
Chen, Jintai
Lu, Juanwu
Yang, Zichong
Liao, Kuei-Da
Gao, Tianren
Li, Erlong
Tang, Kun
Cao, Zhipeng
Zhou, Tong
Liu, Ao
Yan, Xinrui
Mei, Shuqi
Cao, Jianguo
Wang, Ziran
Zheng, Chao
2024 IEEE WINTER CONFERENCE ON APPLICATIONS OF COMPUTER VISION WORKSHOPS, WACVW 2024, 2024, : 958 - 979
[32] Woodpecker: hallucination correction for multimodal large language models
Yin, Shukang
Fu, Chaoyou
Zhao, Sirui
Xu, Tong
Wang, Hao
Sui, Dianbo
Shen, Yunhang
Li, Ke
Sun, Xing
Chen, Enhong
SCIENCE CHINA-INFORMATION SCIENCES, 2024, 67 (12)
[33] Do multimodal large language models understand welding?
Khvatskii, Grigorii
Lee, Yong Suk
Angst, Corey
Gibbs, Maria
Landers, Robert
Chawla, Nitesh V.
INFORMATION FUSION, 2025, 120
[34] Woodpecker: hallucination correction for multimodal large language models
Shukang YIN
Chaoyou FU
Sirui ZHAO
Tong XU
Hao WANG
Dianbo SUI
Yunhang SHEN
Ke LI
Xing SUN
Enhong CHEN
Science China(Information Sciences), 2024, 67 (12) : 52 - 64
[35] Do Multimodal Large Language Models and Humans Ground Language Similarly?
Jones, Cameron R.
Bergen, Benjamin
Trott, Sean
COMPUTATIONAL LINGUISTICS, 2024, 50 (04) : 1415 - 1440
[36] Using Augmented Small Multimodal Models to Guide Large Language Models for Multimodal Relation Extraction
He, Wentao
Ma, Hanjie
Li, Shaohua
Dong, Hui
Zhang, Haixiang
Feng, Jie
APPLIED SCIENCES-BASEL, 2023, 13 (22):
[37] Computing Architecture for Large-Language Models (LLMs) and Large Multimodal Models (LMMs)
Liang, Bor-Sung
PROCEEDINGS OF THE 2024 INTERNATIONAL SYMPOSIUM ON PHYSICAL DESIGN, ISPD 2024, 2024, : 233 - 234
[38] Multimodal Learning with Vision and Language
Erdem, Aykut
Erdem, Erkut
2019 NINTH INTERNATIONAL CONFERENCE ON IMAGE PROCESSING THEORY, TOOLS AND APPLICATIONS (IPTA), 2019,
[39] Semantic Mechanical Search with Large Vision and Language Models
Sharma, Satvik
Huang, Huang
Shivakumar, Kaushik
Chen, Lawrence Yunliang
Hoque, Ryan
Ichter, Brian
Goldberg, Ken
CONFERENCE ON ROBOT LEARNING, VOL 229, 2023, 229
[40] Detecting and Preventing Hallucinations in Large Vision Language Models
Gunjal, Anisha
Yin, Jihan
Bas, Erhan
THIRTY-EIGHTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, VOL 38 NO 16, 2024, : 18135 - 18143

← 1 2 3 4 5 →