ALGORITMO DE RECONHECIMENTO AUTOMÁTICO DE PLACAS ... - FIEB

ALGORITMO DE RECONHECIMENTO AUTOM?TICO DE PLACAS DE VE?CULOS BASEADO EM MATLAB E TESSERACT

OCR

Roberto Espinheira da Costa Bomfim, Rebeca Tourinho Lima e Roberto Luiz Souza Monteiro

Faculdade de Tecnologia SENAI CIMATEC Programa de P?s-Gradua??o em Modelagem Computacional e Tecnologia Industrial

E-mails: roberto.bomfim@.br, rebeca.lima@.br, roberto.monteiro@.br

RESUMO

Este trabalho apresenta o desenvolvimento de um algoritmo destinado ao reconhecimento de placas de ve?culos utilizando o toolbox de processamento de imagens do MATLAB e a biblioteca de reconhecimento ?ptico de caracteres Tesseract OCR. Os resultados encontrados demonstram a viabilidade t?cnica da abordagem proposta, cuja precis?o e consequente taxa de acertos pode ser aprimorada atrav?s do ajuste dos par?metros do Tesseract OCR.

1. INTRODU??O

1.1 CONTEXTUALIZA??O

Nos ?ltimos anos, um desenvolvimento not?vel vem ocorrendo em dois campos tecnol?gicos intimamente ligados ?s ?reas de Processamento de Imagem, Vis?o Computacional e disciplinas correlatas:

334

Sistema de Aquisi??o de Imagens - Surgimento de dispositivos de alta defini??o e baixo custo (e.g. c?meras fotogr?ficas, c?meras de v?deo);

Sistemas Computacionais - Evolu??o dos dispositivos atrav?s do aumento de seu poder de processamento e de sua quantidade de mem?ria, aliada ? redu??o de seus custos e de seu tamanho;

A evolu??o desses sistemas criou o cen?rio ideal para o desenvolvimento/aperfei?oamento de diversas aplica??es, como na ?rea biom?dica e no controle de qualidade e automa??o de processos industriais.

Uma aplica??o bastante difundida na literatura e cada vez mais robusta ? a de reconhecimento autom?tico de placas de ve?culos, comumente utilizada na automa??o de sistemas de controle de acesso e sistemas de fiscaliza??o eletr?nica nas vias urbanas e rodovias.

Essas aplica??es permitem a identifica??o de ve?culos que n?o estejam autorizados a trafegar e/ou acessar uma determinada localidade ou que possuam algum tipo de pend?ncia junto ao ?rg?o fiscalizador (e.g. multas registradas, IPVA vencido). Neste contexto, esse trabalho prop?e o desenvolvimento de um algoritmo computacional de reconhecimento de placas de ve?culos utilizando um banco de imagens reais.

Conforme ser? detalhado no t?pico 2.2, o algoritmo carrega as imagens do banco de imagens reais utilizado e extrai o c?digo de identifica??o contido nas placas de ve?culos automotivos brasileiros (sequ?ncia de letras e n?meros).

1.2 FUNDAMENTA??O TE?RICA

Existe uma s?rie de disciplinas intimamente relacionadas ou at? mesmo em parte coincidentes com a ?rea de processamento de imagens, como a vis?o computacional, a computa??o gr?fica ou ainda a an?lise de imagens [1]. N?o h? um consenso entre os especialistas a respeito das fronteiras entre essas disciplinas, mas o quadro esquem?tico da Figura 3 representa de maneira razo?vel a rela??o entre elas:

335

Figura 3: Rela??o existente entre a ?rea de processamento de imagens e as demais disciplinas correlatas.

Fonte: Autor. Adaptado de [1].

Dentro de um contexto mais amplo, as t?cnicas de processamento de imagem possuem diversas fun??es, podendo ser normalmente enquadradas na lista abaixo:

Aprimoramento de Imagens; Combina??o de Imagens; S?ntese de Imagens; Compress?o de Dados; Reconhecimento de Padr?es; Transforma??o de dados em informa??es mais facilmente manipul?veis ou interpret?veis;

Ao falar de processamento de imagens, normalmente est? impl?cito tratar-se de imagens digitais (apesar de o processamento de imagens anal?gicas existir, pouqu?ssimas aplica??es s?o desenvolvidas na pr?tica, devido ? complexidade do hardware envolvido, dos custos elevados e da falta de flexibilidade e modularidade dos equipamentos).

Uma imagem digital nada mais ? do que uma matriz de n?meros, onde cada elemento da matriz ? conhecido como pixel (do ingl?s picture element). Cada pixel, por sua

vez, ? representado por uma n-upla de n?meros inteiros (normalmente entre 0 e 255), que varia de acordo com o espa?o de cores utilizado. Na representa??o de uma imagem no espa?o de cores RGB, por exemplo, cada pixel ? representado por 3 n?meros inteiros. Por outro lado, para representar esta mesma imagem no espa?o de cores de Escala de Cinza ? necess?rio apenas 1 n?mero inteiro.

336

Ao representar uma imagem por uma matriz de pixels, pode-se efetuar uma mir?ade de opera??es matem?ticas sobre esses dados para implementar a fun??o que se deseja. Do ponto de vista pr?tico, as opera??es matem?ticas utilizadas correspondem a derivadas, convolu??es, opera??es estat?sticas (m?dias simples e ponderadas, medianas) transformadas (de Fourier, de Hough), dentre outras. Uma peculiaridade de se trabalhar com imagens, que pode se tornar uma das principais dificuldades de implementa??o, est? no fato que uma imagem quase nunca ? uma fun??o "bem comportada" (i.e. cont?nua e deriv?vel ao longo do intervalo de interesse). Deste modo, tornam-se necess?rias algumas aproxima??es e adapta??es nos c?lculos.

Em aplica??es de processamento de imagens, normalmente a 1? etapa corresponde ao Pr?-Processamento, onde a imagem ? preparada de maneira a ressaltar algumas caracter?sticas importantes para as etapas posteriores. Em seguida, j? na etapa de Processamento, ? necess?rio segmentar a imagem. De acordo com [2], a segmenta??o de uma imagem consiste em subdividi-la nas regi?es ou objetos que a constituem. Obviamente, o n?vel de subdivis?o depende da aplica??o em quest?o e deve possibilitar o isolamento do objeto de interesse.

O Reconhecimento ?ptico de Caracteres (do ingl?s, OCR Optical Character Recognition) ? um campo de pesquisa na ?rea de reconhecimento de padr?es, intelig?ncia artificial e vis?o computacional, que consiste na convers?o mec?nica ou eletr?nica de imagens digitalizadas ou manuscritas, digitadas ou impressas em texto codificado [3]. Algumas abordagens OCR s?o discutidas a seguir [4]:

Correla??o de Matrizes: Converte-se cada caractere em uma matriz e comparase com padr?es conhecidos. ? uma t?cnica indicada para textos que utilizem a mesma fonte e estejam escritos em uma ?nica coluna por p?gina.

L?gica Fuzzy: L?gica de m?ltiplos valores, onde se permite valores intermedi?rios em detrimento da tradicional l?gica bin?ria. Trata-se de uma tentativa de tornar o pensamento l?gico computacional mais humano, ao acrescentar um grau de incerteza ao estudo.

Extra??o de Caracter?sticas: Esse m?todo identifica cada caractere pela presen?a ou aus?ncia de determinadas caracter?sticas-chaves tais como altura, largura, densidade, loops, linhas etc. ? uma abordagem interessante para amostras de imagem de revistas, impress?es a laser e imagens de alta qualidade.

An?lise Estrutural: Identifica os caracteres atrav?s da compara??o de suas proje??es horizontais e/ou verticais. Os padr?es de proje??o de cada caractere s?o catalogados previamente e o crit?rio de igualdade ? estabelecido atrav?s de um limiar [5]. Apenas a partir da proje??o vertical j? ? poss?vel identificar alguns caracteres alfanum?ricos, no entanto, caracteres como "N", "H" e "U", por exemplo, possuem

337

proje??es verticais semelhantes, tornando necess?ria a compara??o de suas respectivas proje??es horizontais para eliminar ambiguidades [5]. ? adequada para textos de baixa qualidade e jornais.

Redes Neurais: Simula o sistema neuronal humano e, neste caso, efetua uma amostragem de pixels de cada imagem para correlacion?-los com padr?es de pixels previamente conhecidos. ? uma abordagem interessante para documentos danificados e mensagens de fax, por exemplo. 2. METODOLOGIA

2.1 ESCOPO DO TRABALHO Um sistema completo de Reconhecimento Autom?tico de Placas de Ve?culos (RAPV) compreende um subsistema de aquisi??o de imagens atrav?s de uma c?mera, um algoritmo de processamento, um banco de dados de placas de ve?culos e uma interface gr?fica com o usu?rio, conforme Figura 4.

Figura 4: Sistema completo de RAPV.

Fonte: Autor.

Levando-se em considera??o que o escopo deste trabalho corresponde apenas ao desenvolvimento do algoritmo (destacado em azul na Figura 4), optou-se por simplificar o sistema completo atrav?s das seguintes modifica??es:

338

................
................

In order to avoid copyright disputes, this page is only a partial summary.

Google Online Preview   Download