0% encontró este documento útil (0 votos)
147 vistas6 páginas

Ocr

OCR

Cargado por

Octavio Juarez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
147 vistas6 páginas

Ocr

OCR

Cargado por

Octavio Juarez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

5/9/2017 Reconocimiento ptico de caracteres - Wikipedia, la enciclopedia libre

Reconocimiento ptico de caracteres


El reconocimiento ptico de caracteres (ROC), generalmente conocido como reconocimiento de caracteres
y expresado con frecuencia con la sigla OCR (del ingls Optical Character Recognition), es un proceso dirigido
a la digitalizacin de textos, los cuales identifican automticamente a partir de una imagen smbolos o caracteres que
pertenecen a un determinado alfabeto, para luego almacenarlos en forma de datos. As podremos interactuar con
estos mediante un programa de edicin de texto o similar.

En los ltimos aos la digitalizacin de la informacin (textos, imgenes, sonido, etctera) ha devenido un punto de
inters para la sociedad. En el caso concreto de los textos, existen y se generan continuamente grandes cantidades
de informacin escrita, tipogrfica o manuscrita en todo tipo de soportes. En este contexto, poder automatizar la
introduccin de caracteres evitando la entrada por teclado implica un importante ahorro de recursos humanos y un
aumento de la productividad, al mismo tiempo que se mantiene, o hasta se mejora, la calidad de muchos servicios.

ndice
1 Problemas con el ROC
2 Esquema bsico de un algoritmo de ROC
2.1 Binarizacin
2.2 Fragmentacin o segmentacin de la imagen
2.3 Adelgazamiento de los componentes
2.4 Comparacin con patrones
3 Aplicaciones
3.1 Reconocimiento de texto manuscrito
3.2 Reconocimiento de matrculas
3.3 Indexacin con bases de datos
3.4 Reconocimiento de datos estructurados con ROC Zonal
4 Vase tambin
5 Referencias
6 Enlaces externos
6.1 Bibliografa
6.2 Software para el ROC

Problemas con el ROC


El proceso bsico que se lleva a cabo en el ROC es convertir el texto que aparece en una imagen en un archivo de
texto que podr ser editado y utilizado como tal por cualquier otro programa o aplicacin que lo necesite.

Partiendo de una imagen perfecta, es decir, una imagen con slo dos niveles de gris, el reconocimiento de estos
caracteres se realizar bsicamente comparndolos con unos patrones o plantillas que contienen todos los posibles
caracteres. Ahora bien, las imgenes reales no son perfectas, por lo tanto el ROC se encuentra con varios
problemas:

https://es.wikipedia.org/wiki/Reconocimiento_%C3%B3ptico_de_caracteres 1/6
5/9/2017 Reconocimiento ptico de caracteres - Wikipedia, la enciclopedia libre

El dispositivo que obtiene la imagen puede introducir niveles de grises al fondo que no pertenecen a la
imagen original.
La resolucin de estos dispositivos puede introducir ruido en la imagen, afectando los pxeles que han de ser
procesados.
La distancia que separa a unos caracteres de otros, al no ser siempre la misma, puede producir errores de
reconocimiento.
La conexin de dos o ms caracteres por pxeles comunes tambin puede producir errores.

Esquema bsico de un algoritmo de ROC


Todos los algoritmos de ROC tienen la finalidad de poder diferenciar un texto de una imagen cualquiera. Para
hacerlo se basan en cuatro etapas:

1. Binarizacin.
2. Fragmentacin o segmentacin de la imagen.
3. Adelgazamiento de los componentes.
4. Comparacin con patrones.

Binarizacin
La mayor parte de algoritmos de ROC parten como base de una imagen binaria (dos colores). Por lo tanto es
conveniente convertir una imagen de escala de grises, o una de color, en una imagen en blanco y negro, de tal
forma que se preserven las propiedades esenciales de la imagen. Una forma de hacerlo es mediante el histograma
de la imagen, donde se muestra el nmero de pxeles para cada nivel de grises que aparece a la imagen. Para
binarizarla tenemos que escoger un umbral adecuado, a partir del cual todos los pxeles que no lo superen se
convertirn en negro y el resto en blanco.

Mediante este proceso obtenemos una imagen en blanco y negro donde quedan claramente marcados los
contornos de los caracteres y smbolos que contiene la imagen. A partir de aqu podemos aislar las partes de la
imagen que contienen texto (ms transiciones entre blanco y negro).

Fragmentacin o segmentacin de la imagen


Este es el proceso ms costoso y necesario para el posterior reconocimiento de caracteres. La segmentacin de
una imagen implica la deteccin mediante procedimientos de etiquetado determinista o estocstico de los
contornos o regiones de la imagen, basndose en la informacin de intensidad o informacin espacial.

Permite la descomposicin de un texto en diferentes entidades lgicas, que han de ser suficientemente invariables,
para ser independientes del escritor, y suficientemente significativas para su reconocimiento.

No existe un mtodo genrico para llevar a cabo esta segmentacin de la imagen que sea lo suficientemente eficaz
para el anlisis de un texto. Aunque las tcnicas ms utilizadas son variaciones de los mtodos basados en
proyecciones lineales.

Una de las tcnicas ms clsicas y simples para imgenes de niveles de grises consiste en la determinacin de los
modos o agrupamientos (clsteres) a partir del histograma, de tal forma que permitan una clasificacin o
umbralizacin de los pxeles en regiones homogneas.

https://es.wikipedia.org/wiki/Reconocimiento_%C3%B3ptico_de_caracteres 2/6
5/9/2017 Reconocimiento ptico de caracteres - Wikipedia, la enciclopedia libre

Adelgazamiento de los componentes


Una vez aislados los componentes conexos de la imagen, se les tendr que aplicar un proceso de adelgazamiento
para cada uno de ellos. Este procedimiento consiste en ir borrando sucesivamente los puntos de los contornos de
cada componente de forma que se conserve su tipologa.

La eliminacin de los puntos ha de seguir un esquema de barridos sucesivos para que la imagen contine teniendo
las mismas proporciones que la original y as conseguir que no quede deforme.

Se tiene que hacer un barrido en paralelo, es decir, sealar los pxeles borrables para eliminarlos todos a la vez.
Este proceso se lleva a cabo para hacer posible la clasificacin y reconocimiento, simplificando la forma de los
componentes.

Comparacin con patrones


En esta etapa se comparan los caracteres obtenidos anteriormente con unos tericos (patrones) almacenados en
una base de datos. El buen funcionamiento del ROC se basa en gran medida en una buena definicin de esta etapa.

Existen diferentes mtodos para llevar a cabo la comparacin. Uno de ellos es el mtodo de proyeccin, en el cual
se obtienen proyecciones verticales y horizontales del carcter por reconocer, y se comparan con el alfabeto de
caracteres posibles hasta encontrar la mxima coincidencia.

Existen otros mtodos, como por ejemplo:

Mtodos geomtricos o estadsticos.


Mtodos estructurales.
Mtodos neuromimticos.
Mtodos markovianos (modelo oculto de Mrkov).
Mtodos de Zadeh.

Aplicaciones
Desde la aparicin de los algoritmos de ROC, han sido muchos los servicios que han introducido estos procesos
para aumentar su rendimiento y otros que se basan completamente en estas tecnologas. A continuacin se
muestran algunas de las ms destacables aplicaciones que utilizan el ROC.

Reconocimiento de texto manuscrito


Las dificultades que podemos encontrar a la hora de reconocer un texto tipografiado, no se pueden comparar con
las que aparecen cuando queremos reconocer un texto manuscrito. No todos escribimos de manera uniforme, y no
todos escribimos de la misma forma. El reconocimiento de este tipos de textos contina siendo un desafo. Para
abordar este tipo de problemas se han desarrollado tcnicas y aplicaciones especficas a las que se les llama
Reconocimiento inteligente de caracteres o ICR (del ingls Intelligent Character Recognition).

Aunque el texto se compone bsicamente de caracteres individuales, la mayora de algoritmos ROC no consiguen
buenos resultados, ya que la segmentacin de texto continuo es un procedimiento complejo.

https://es.wikipedia.org/wiki/Reconocimiento_%C3%B3ptico_de_caracteres 3/6
5/9/2017 Reconocimiento ptico de caracteres - Wikipedia, la enciclopedia libre

En el caso de reconocimiento de escritura manuscrita a la hora de correccin de exmenes, existe la posibilidad,


aadiendo un listado de lxico (nombres y apellidos) de acercarse al 100% de acierto. A travs de las casillas de
respuesta ICR se pueden reconocer palabras, como nombres de pases, nombres de regiones, marcas comerciales,
en resumen, todo aquello que pueda ser integrado en una lista de palabras (lxico), el cual puede ir aumentndose
segn las necesidades.

En el mundo real, a veces se puede llegar a comprender una frase cuando la hemos terminado de leer. Automatizar
este proceso implica una operacin de niveles morfolgico, lxico y sintctico que se consigue mediante el
reconocimiento del habla continua. Para llevar a cabo esa metodologa, se utilizan algoritmos robustos que usan una
segmentacin previa, debido a que se obtiene automticamente con la descodificacin.

Para facilitar el reconocimiento a veces la tecnologa ICR requiere que en el documento se tengan recuadros dentro
de los cuales se introducen los caracteres manuscritos, siendo obligatorio un carcter por recuadro. Habitualmente
se utiliza para formularios que debemos rellenar a mano y tenemos que poner en letras maysculas.1

Reconocimiento de matrculas
Una de las aplicaciones son los radares. Estos deben ser capaces de localizar una matrcula de un vehculo con
condiciones de iluminacin, perspectiva y entorno variables.

En la etapa de segmentacin, se buscan texturas similares a la de una matrcula y se asla el rea rectangular que
forma la matrcula.

Finalmente, se aplica un proceso de clasificacin mltiple sobre el conjunto de pxeles pertenecientes a la matrcula,
proporcionando una cadena de caracteres que se tienen que ajustar a un modelo conocido: el formato de una
matrcula. Si aparece algn error, es corregido.

Indexacin con bases de datos


Con el gran aumento de informacin publicada que ha tenido lugar en los ltimos aos, cada vez son ms los
mtodos que se emplean para organizar todo este material almacenado en bases de datos. Uno de estos
contenidos son las imgenes. Una de las formas ms corrientes de buscar imgenes es a partir de metadatos
introducidos manualmente por los usuarios. Actualmente han aparecido buscadores que proporcionan la
posibilidad de buscar imgenes mediante el texto que aparecen en ellas, como el buscador DIRS (Document
Image Retrieval System) que, mediante un algoritmo de ROC, extrae el texto que aparece en la imagen y lo utiliza
como metadato que podr servir para las bsquedas. Esta tecnologa proporciona una posibilidad en la bsqueda
de imgenes y demuestra que el ROC an puede dar mucho de s.

Reconocimiento de datos estructurados con ROC Zonal


Se usa para digitalizar de forma masiva grandes cantidades de documentos estructurados o semiestructurados
(facturas, nminas, albaranes, plizas, justificantes bancarios, etctera), catalogando automticamente los
documentos con los metadatos obtenidos y archivndolos en formato digital de forma indexada para facilitar su
posterior bsqueda. Tiene el inconveniente de que es necesario disear previamente las plantillas, pero con una
buena configuracin se ahorra mucho tiempo en el proceso de digitalizacin.

Vase tambin
https://es.wikipedia.org/wiki/Reconocimiento_%C3%B3ptico_de_caracteres 4/6
5/9/2017 Reconocimiento ptico de caracteres - Wikipedia, la enciclopedia libre

Reconocimiento ptico de marcas


Sistema de reconocimiento facial
Biometra
Efecto IA
Tesseract OCR

Referencias
1. OCR, ICR y OMR. Qu son y para qu sirven? (https://gupost.wordpress.com/2009/11/09/ocr-icr-y-omr-%C2%
BFque-son-y-para-que-sirven/)

Enlaces externos
Bibliografa
latam.abbyy.com/finereader/ocr?source=products (http://latam.abbyy.com/finereader/ocr?source=products)
Acerca de ROC (tecnologa y software).
latam.abbyy.com/Default.aspx?DN=d2740918-c2fd-4fe6-a8b1-f0bd2816b561 (http://web.archive.org/we
b/http://latam.abbyy.com/Default.aspx?DN=d2740918-c2fd-4fe6-a8b1-f0bd2816b561) Soluciones OCR
en la nube (cloud computing).
www.iti.es/media/about/docs/tic/13/articulo2.pdf (http://web.archive.org/web/http://www.iti.es/media/about/
docs/tic/13/articulo2.pdf) Instituto Tecnolgico de Informtica (ITI).
observatorio.iti.upv.es/resources/project/58 (https://observatorio.iti.upv.es/resources/project/58) Instituto
Tecnolgico de Informtica. ITI OCR: investigacin de nuevas tcnicas para ROC/ICR de Formularios
Impresos y Manuscritos.
www.iti.es/lineas-i-d-i/proyectos-de-investigacion/2010/itiocr/index.html (http://www.iti.es/lineas-i-d-i/proye
ctos-de-investigacion/2010/itiocr/index.html) Instituto Tecnolgico de Informtica. ITI OCR: nuevas
funcionalidades en el Reconocimiento de Formularios Impresos y Manuscritos Dirigido.
observatorio.iti.upv.es/resources/new/12088 (https://observatorio.iti.upv.es/resources/new/12088) Instituto
Tecnolgico de Informtica (ITI): ROC Proyecto de I+D para la Mejora de los Procesos de la
Digitalizacin Masiva.

Software para el ROC


info.captricity.com (http://info.captricity.com) Captricity. (Unix, Windows, Mac OS) ROC Zonal Solamente.
latam.abbyy.com/finereader/ (http://latam.abbyy.com/finereader/) ABBYY FineReader (Unix, Windows,
Mac OS).
Adobe Acrobat Professional (Windows, Mac OS).
BIT-Alpha (Windows).
exactscan.de/ (http://exactscan.de/) ExactScan Pro (Mac OS).
www.baseside.com/software-producto/diamond-vision (http://www.baseside.com/software-producto/diamo
nd-vision) Office Gemini. Software de Digitalizacin (Mac OS).
Neoptec (Windows, Mac OS, Unix).
www.nicomsoft.com/products/ocr/ (http://www.nicomsoft.com/products/ocr/) Nicomsoft OCR (Windows,
Unix).

https://es.wikipedia.org/wiki/Reconocimiento_%C3%B3ptico_de_caracteres 5/6
5/9/2017 Reconocimiento ptico de caracteres - Wikipedia, la enciclopedia libre

ocrkit.com (http://ocrkit.com/) OCRKit (Mac OS).


Readiris (Unix, Windows, Mac OS).
Scansoft Omnipage (Windows).
GEXCAT (Windows, Mac OS, Unix).
Tesseract OCR (https://github.com/tesseract-ocr)

Obtenido de https://es.wikipedia.org/w/index.php?
title=Reconocimiento_ptico_de_caracteres&oldid=101556750

Se edit esta pgina por ltima vez el 1 sep 2017 a las 01:18.
El texto est disponible bajo la Licencia Creative Commons Atribucin Compartir Igual 3.0; pueden
aplicarse clusulas adicionales. Al usar este sitio, usted acepta nuestros trminos de uso y nuestra poltica de
privacidad.
Wikipedia es una marca registrada de la Fundacin Wikimedia, Inc., una organizacin sin nimo de lucro.

https://es.wikipedia.org/wiki/Reconocimiento_%C3%B3ptico_de_caracteres 6/6

También podría gustarte