基于Tesseract-OCR的字符识别技术在特定场合的应用

被引:5
|
作者
吴鸣 [1 ]
机构
[1] 湖南城市学院信息与电子工程学院
关键词
字符识别; OCR; Tesseract; 灰度图; 二值图;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
基于谷歌开源OCR引擎Tesseract的字符识别技术,针对某特定应用场合,设计并实现了一个图片字符识别系统.首先,对尺寸一致的样本图片进行分割、灰度化和二值化预处理;其次,利用Tesseract对特定字符进行针对性的训练以提高字符识别率;最后,进行字符的识别和矫正.Python环境下的实验验证结果表明:经过训练后的Tesseract字库可以有效地提高字符识别的准确率和识别速度;同时,灰度图比二值图更适合本特定场合的图片字符识别.
引用
收藏
页码:58 / 61
页数:4
相关论文
共 8 条
  • [1] 基于学习的OCR字符识别
    肖坚
    [J]. 计算机时代, 2018, (07) : 48 - 51
  • [2] 基于Blob分析的玻璃纤维织物缺陷检测方法研究
    王庆海
    赵凤霞
    李纪峰
    金少搏
    [J]. 郑州大学学报(工学版), 2015, 36 (06) : 90 - 93
  • [3] 基于颜色矩阵映射的细胞图像核、浆提取方法研究
    王萌
    张留龙
    赵运立
    [J]. 中国医疗设备, 2012, 27 (10) : 67 - 69
  • [4] 基于机器学习的电路板印刷字符检测识别方法研究[D]. 史昊林.电子科技大学. 2019
  • [5] 基于图像处理的混合纤网纤维分布情况分析研究[D]. 梁振江.天津工业大学. 2019
  • [6] 金融票据中印刷号码识别算法的研究[D]. 岳明明.青岛大学. 2017
  • [7] 基于视频流的道路交通流参数自动检测方法研究[D]. 刘纬琪.长安大学. 2014
  • [8] PCR凝胶成像分析算法研究[D]. 黄锐.河北工业大学. 2009