基于学习的OCR字符识别

被引：21

作者：

肖坚 ^{[1
]}

机构：

[1] 中国电信有限公司无锡分公司

来源：

计算机时代 | 2018年 / 07期

关键词：

OCR; 验证码; 文字识别; 干扰线; 拒识率; 误识率;

D O I：

10.16644/j.cnki.cn33-1094/tp.2018.07.013

中图分类号：

TP391.41 [];

学科分类号：

080203 ;

摘要：

OCR(Optical Character Recognition)是通过检测字符每个像素亮度的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。文章利用Java语言实现OCR步骤,包括像素二值化,图像分割,训练识别和输出等。测试开发是在web验证码识别场景中进行的,web验证码是将一串随机产生的符号,生成为图片,再加上一些干扰线,使之能有效防止恶意注册和灌水。通过测试表明,该方法可行、有效;拒识率、误识率低;识别速度快,具有一定的实用意义。

引用

页码：48 / 51

页数：4

共 5 条

[1] 光学字符识别技术与图书馆信息资源的数字化
李南
[J]. 激光杂志, 2012, 33 (05) : 3 - 3
[2] 光学字符识别技术与展望
荆涛
王仲
[J]. 计算机工程, 2003, (02) : 1 - 2
[3] 基于深度学习的车牌检测[D]. 田媛美.西安电子科技大学. 2017
[4] 光学字符识别技术:让电脑像人一样阅读[A]. 霍强.《科学与现代化》2016年第1期（总第066期）[C]. 2016
[5] 图像识别与项目实践[M]. 电子工业出版社 , 杨淑莹, 2014

← 1 →