A language model using variable length tokens for open-vocabulary Hangul text recognition

被引：1

作者：

Ryu, SH ^{[1
]}

Kim, JH ^{[1
]}

机构：

[1] Korea Adv Inst Sci & Technol, Div Comp Sci 373 1, Taejon 305701, South Korea

来源：

PATTERN RECOGNITION | 2004年 / 37卷 / 07期

关键词：

language model; character recognition; hangul recognition; open-vocabulary; word recognition;

D O I：

10.1016/j.patcog.2003.12.004

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

We propose a novel language model for Hangul text recognition. Without relying on prior linguistic knowledge in training, the proposed model learns variable length Hangul character sequences, which comprise the elementary tokens of Korean language, and their probabilities from statistics of a raw text corpus. Experiments in handwritten Hangul recognition shows that the proposed language model is effective in postprocessing of recognition results. (C) 2003 Pattern Recognition Society. Published by Elsevier Ltd. All rights reserved.

引用

页码：1549 / 1552

页数：4

共 50 条

[1] Improving Open-Vocabulary Scene Text Recognition
Feild, Jacqueline L.
Learned-Miller, Erik G.
2013 12TH INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION (ICDAR), 2013, : 604 - 608
[2] A Hybrid Language Model for Open-Vocabulary Thai LVCSR
Thangthai, Kwanchiva
Chotimongkol, Ananlada
Wutiwiwatchai, Chai
14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5, 2013, : 2206 - 2210
[3] Open-vocabulary recognition of machine-printed Arabic text using hidden Markov models
Ahmad, Irfan
Mahmoud, Sabri A.
Fink, Gernot A.
PATTERN RECOGNITION, 2016, 51 : 97 - 111
[4] LLMFormer: Large Language Model for Open-Vocabulary Semantic Segmentation
Shi, Hengcan
Dao, Son Duy
Cai, Jianfei
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2025, 133 (02) : 742 - 759
[5] LaMI-DETR: Open-Vocabulary Detection with Language Model Instruction
Du, Penghui
Wang, Yu
Sung, Yifan
Wang, Luting
Li, Yue
Zhang, Gang
Ding, Errui
Wang, Yan
Wang, Jingdong
Liu, Si
COMPUTER VISION - ECCV 2024, PT XXIII, 2025, 15081 : 312 - 328
[6] Can Identifier Splitting Improve Open-Vocabulary Language Model of Code
Shi, Jieke
Yang, Zhou
He, Junda
Xu, Bowen
Lo, David
2022 IEEE INTERNATIONAL CONFERENCE ON SOFTWARE ANALYSIS, EVOLUTION AND REENGINEERING (SANER 2022), 2022, : 1134 - 1138
[7] Open-Vocabulary Keyword Spotting With Audio And Text Embeddings
Sacchi, Niccolo
Nanchen, Alexandre
Jaggi, Martin
Cernak, Milos
INTERSPEECH 2019, 2019, : 3362 - 3366
[8] Learning to Prompt for Open-Vocabulary Object Detection with Vision-Language Model
Du, Yu
Wei, Fangyun
Zhang, Zihe
Shi, Miaojing
Gao, Yue
Li, Guoqi
2022 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), 2022, : 14064 - 14073
[9] OvarNet: Towards Open-vocabulary Object Attribute Recognition
Chen, Keyan
Jiang, Xiaolong
Hu, Yao
Tang, Xu
Gao, Yan
Chen, Jianqi
Xie, Weidi
2023 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), 2023, : 23518 - 23527
[10] A method for open-vocabulary speech-driven text retrieval
Fujii, A
Itou, K
Ishikawa, T
PROCEEDINGS OF THE 2002 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING, 2002, : 188 - 195

← 1 2 3 4 5 →