基于学习的OCR字符识别

被引:21
|
作者
肖坚 [1 ]
机构
[1] 中国电信有限公司无锡分公司
关键词
OCR; 验证码; 文字识别; 干扰线; 拒识率; 误识率;
D O I
10.16644/j.cnki.cn33-1094/tp.2018.07.013
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
OCR(Optical Character Recognition)是通过检测字符每个像素亮度的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。文章利用Java语言实现OCR步骤,包括像素二值化,图像分割,训练识别和输出等。测试开发是在web验证码识别场景中进行的,web验证码是将一串随机产生的符号,生成为图片,再加上一些干扰线,使之能有效防止恶意注册和灌水。通过测试表明,该方法可行、有效;拒识率、误识率低;识别速度快,具有一定的实用意义。
引用
收藏
页码:48 / 51
页数:4
相关论文
共 5 条