USACO 5.4.3 -_-|| 陆嘉辉 7.17
光学字符识别 陆嘉辉 7.17
Optical Character Recognition 将手写扫描图像或打印/印刷文本图像, 通过机械或电子学上的方法,转换成机 器编码的或是计算机可读的文本的技术 属于模式识别、人工智能和计算机视觉 的一个领域 缩写为OCR Optical Character Recognition
发展历史 Gustav Tauschek, 1929 Emanuel Goldberg, 1931 Ray Kurzweil, 1974, Kurzweil Computer Products, Inc WebOCR, 2000s 发展历史
OCR (光学字符识别) OWR (光学单词识别) ICR (智能字符识别) IWR (智能单词识别) OCR的分类
纠偏 去噪点 二值化 去噪音线 版面分析 单词检测 字符分割 比例模式化 OCR预处理
灰度化 R(x,y),G(x,y),B(x,y) G = I = ( R + G + B )/ 3 (HSI) G = Y = 0.299R + 0.587G + 0.114B (YIQ) G = min { R , G , B } 灰度化
一般24位RGB图像的灰度图是8位256个 灰度级的,如果把这个灰度级减少到1 位2个灰度级,就得到一副二值图,二 值图像中的数据全部是0或1。 二值化
等距分割 积分投影分割 提取连通分量 主要难题:字符粘连 字符分割
模式识别 特征提取 自适应字符识别(二次识别) 字典改进 “近邻”分析 语法 字符识别
早期估计为81%-99% 一个字符微小的不准确率会大幅降低 单词的正确识别率 准确率
校对与纠错 版面还原 后处理
定制的OCR 牌照,身份证 盲人 读地图 验证码识别 OCR应用
现有软件 汉王 紫光 OmniPage Tesseract ExperVision TypeReader & RTK ABBYY FineReader AnyDoc Software LEADTOOLS CuneiForm Asprise OCR SDK SimpleOCR Dyanmsoft OCR SDK Microsoft Office OneNote 2007 MeOCR Screenworm en.wikipedia.org/wiki/Comparison_of_optical_character_ recognition_software 现有软件
强制优化输入 外包 reCAPTCHA 改进算法之外……
http://www.cnblogs.com/chaosimple/archive/2013/0 7/18/3197720.html http://blog.damiles.com/2008/11/basic-ocr-in- opencv/ 冯建强,刘文波,于盛林. 《基于灰度积分投影的人眼定 位》 计算机仿真22.4 (2005): 75-76. 荆涛,王仲. 《光学字符识别技术与展望》 计算机工 程 29.2 (2003): 1-2. Eikvil, Line. "Optical Character Recognition." citeseer. ist. psu. edu/142042. html (1993). 因华.《特殊印刷体粘连字符切分方法研究》2005 Wikipedia Reference