首页
学术期刊
论文检测
AIGC检测
热点
更多
数据
Tesseract-OCR的文档扫描识别系统
被引:4
|
作者
:
杨思怡
论文数:
0
引用数:
0
h-index:
0
机构:
深圳技师学院
深圳技师学院
杨思怡
[
1
]
付相祥
论文数:
0
引用数:
0
h-index:
0
机构:
深圳技师学院
深圳技师学院
付相祥
[
1
]
吴晓华
论文数:
0
引用数:
0
h-index:
0
机构:
深圳技师学院
深圳技师学院
吴晓华
[
1
]
夏清
论文数:
0
引用数:
0
h-index:
0
机构:
深圳技师学院
深圳技师学院
夏清
[
1
]
机构
:
[1]
深圳技师学院
来源
:
电子世界
|
2021年
/ 20期
关键词
:
D O I
:
10.19353/j.cnki.dzsj.2021.20.042
中图分类号
:
TP391.41 [];
学科分类号
:
080203 ;
摘要
:
在高速信息化的时代,针对海量文档数据处理效率低下的问题,提出了一种基于OCR技术的识别系统,首先利用OpenCV对文档数据进行预处理滤波,边缘计算,灰度化等一系列预处理,然后使用Canny算子找到图片边缘信息后应用一个透视的转换去获取一个文档的自顶向下的正图,最后完成了一个基于Tesseract-OCR的文档扫描识别项目,该实验表明此方法具有准确的识别率,提供多种语言开发调用,以及具备高可用性;可以有效提升数据录入的效率,大大减轻人工的消耗。
引用
收藏
页码:98 / 100
页数:3
相关论文
未找到相关数据
未找到相关数据