Reconhecimento para o Reconhecimento Óptico de Caracteres Óptico de Caracteres Helder C. R. de Oliveira R. A.: 127.346-9 Orientador: Prof. Dr. Marco A. Piteri Co-Orientador: Prof. Dr. Almir O. Artero
primeiras máquinas de OCR; – 1954: A máquina de OCR no Reader's Digest; • 1960 – 1965: Primeira geração OCR; – Limitada a quantidade de fontes; • 1965 – 1975: Segunda geração OCR; – Máquinas para a leitura de cartas; • 1975 – 1985: Terceira geração OCR; – Documentos ruins, manuscritos, baixo custo, alta performance; • 1986 Hoje: → OCR e as pessoas; – Pacotes OCR, hardware barato.
de reconhecimento de caracteres aumenta; • Aplicações: – Reconhecimento de placas de veículos; – Auxílio para cegos; – Processamento de cheques; – Digitalização de documentos;
Projeto Gutenberg (década de 70); – World Digital Library (Bib. do Congresso Americano + UNESCO); – Biblioteca Brasiliana Guita e José Mindlin (~40.000 volumes); – Biblioteca Digital da Unesp; – Google Books, Google Goggles; – Biblioteca da Universidade de Heidelberg; – Europeana;
(x , y) < 128 255 se f ( x , y) ≥ 128 Pré-processamento Análise do layout Classificação Extração de Características • Assumindo que a imagem “não possua” ruídos:
p ij = m ij n −∑ i=1 K ∑ j=1 K p ij log 2 p ij Caracterização da matriz de co-ocorrência: Pré-processamento Análise do layout Classificação Extração de Características (1270 8 14 1778 ) Entropia 1.04098
1 constante ∑ i=1 K ∑ j=1 K p ij 2 Caracterização da matriz de co-ocorrência: Pré-processamento Análise do layout Classificação Extração de Características Uniformidade 0.506578 (1270 8 14 1778 ) p ij = m ij n
seu vizinho. 0 constante ∑ i=1 K ∑ j=1 K (i− j)2 p ij Caracterização da matriz de co-ocorrência: Pré-processamento Análise do layout Classificação Extração de Características Contraste 0.00716612 (1270 8 14 1778 ) p ij = m ij n
i=1 K ∑ j=1 K p ij 1+∣i− j∣ Caracterização da matriz de co-ocorrência: Pré-processamento Análise do layout Classificação Extração de Características Homogeniedade 0.996417 (1270 8 14 1778 ) p ij = m ij n
i=1 K ∑ j=1 K (i−m r )( j−m c ) p ij σ r σ c Caracterização da matriz de co-ocorrência: Pré-processamento Análise do layout Classificação Extração de Características Correlação 0.985272 (1270 8 14 1778 ) p ij = m ij n m r = ∑ i=1 K i∑ j=1 K p ij m c = ∑ j=1 K j∑ i=1 K p ij σr 2 = ∑ i=1 K (i−m r )2 ∑ j=1 K p ij σc 2 = ∑ j=1 K ( j−m c )2 ∑ i=1 K p ij
2 )= √∑ i =1 n (v 1i −v 2i )2 D Manhattan (v 1, v 2 )=∑ i= 1 n (∣v 1i −v 2i ∣) D Chebyshev (v 1, v 2 )=max i (∣v 1i −v 2i ∣) C (v 1, v 2 )= ∑ i= 1 n (v 1i − ̄ v 1 )×(v 2i − ̄ v 2 ) √∑ i= 1 n (v 1i − ̄ v 1 )2 ×∑ i =1 n (v 2i − ̄ v 2 )2 . . . . . . 1 2 3 n 1 2 3 n v 1 v 2 ? Coeficiente de correlação: Pré-processamento Análise do layout Classificação Extração de Características
aos existentes em nossos laboratórios (Hardware); • Compilador ANSI C++ (GCC) juntamente com o SDK Qt e a biblioteca de visão computacional OpenCV (software).
Layout: Sobreposição, correção de alinhamento, ... – Extratores de características: Curvas de Bezier, Zoneamento, Descritores de Fourier e Aproximação por Splines, ... – Classificadores: Rede neural, Cadeias de Markov, Linear Discriminant Analysis, K-Means, Local Binary Patterns, Árvores de Decisão, Teoria de Bayes, ... • Sistema de banco de dados;
etapas do processo de OCR: – Análise do Layout: Detecção e extração de linhas e caracteres; – Extração de atributos: Código de Freeman; Distância Borda-Caractere; Matriz de Co-Ocorrência (junto com outras medidas que a descrevem) e Cálculo dos Perfis de Projeção; – Classificadores: Distância Manhattan; Distância Euclidiana; Distância de Chebyshev e também o cálculo do coeficiente de correlação; • Framework foi desenvolvido faz uso de tecnologias atuais e que tem se tornado padrão no mercado, como a biblioteca Qt e a OpenCV, ambas são Open Source e multiplataforma.
recognition. [S.l.]: Wiley, 1999. (Wiley series in microwave and optical engineering). [2] JAIN, L.; LAZZERINI, B. Knowledge-based intelligent techniques in character recognition. [S.l.]: CRC Press, 1999. (The CRC Press international series on computational intelligence). [3] PARKER, J. R. Algorithms for image processing and computer vision. [S.l.]: Wiley Computing, 2010. 504 p. [4] CHERIET, M.; KHARMA, N.; LIU, C. Character recognition systems: a guide for students and practitioners. [S.l.]: Wiley-Interscience, 2007. [5] BUNKE, H.; WANG, P. Handbook of character recognition and document image analysis. [S.l.]: World Scientific, 1997. [6] DAVIES, E. Computer and Machine Vision: Theory, algorithms, practicalities. [S.l.]: Elsevier Science, 2012. [7] TRIER Øivind D.; JAIN, A. K.; TAXT, T. Feature extraction methods for character recognition - a survey. Pattern Recognition, v. 29, n. 4, p. 641 – 662, 1996. ISSN 0031-3203. [8] BIGUN, J. Vision with direction: a systematic introduction to image processing and computer vision. [S.l.]: Springer, 2006.
big data. In: Frontiers in Handwriting Recognition (ICFHR), 2012 International Conference on. [S.l.: s.n.], 2012. p. 479–484. [10] GONZALEZ, R.; WOODS, R. Digital image processing. [S.l.]: Prentice Hall, 2008. [11] BERTOLAMI, R.; BUNKE, H. Hidden markov model-based ensemble methods for offline handwritten text line recognition. Pattern Recognition, v. 41, n. 11, p. 3452 –3460, 2008. [12] NIXON, M.; AGUADO, A. Feature extraction and image processing. [S.l.]: Academic, 2008. [13] HULL, J. J. Document image skew detection: Survey and annotated bibliography. In: Document Analysis Systems II. Word Scientific. [S.l.]: World Scientific, 1998. p. 40–64. [14] MIRANDA, R. A. et al. Handwritten character recognition based on frequency, character-edge distances and densities. Anais do WVC 2013 - IX Workshop de Visão Computacional, 2013. Rio de Janeiro. [15] YAMPOLSKIY, R. Feature extraction approaches for optical character recognition. [S.l.]: Briviba Scientific Press, 2007.