Unidad Educativa
Libertador Simón Bolívar
Lector de
Caracteres
Estudiante : Cristian Brayan Callizaya Choque
Prof. : Yeri Rada Blanco
Materia : Hardware de Computadoras
Curso : 4to “B” Secundaria
2023
LECTOR DE CARACTERES
¿Qué es el reconocimiento óptico de caracteres (OCR)?
El reconocimiento óptico de caracteres (OCR) es el proceso por el cual se convierte una
imagen de texto en un formato de texto que pueden leer las máquinas. Por ejemplo, si
escanea el formulario o un recibo, su computadora guarda el escaneo como un archivo de
imagen. No se puede utilizar un editor de texto para editar, buscar o contar las palabras
del archivo de imagen. Sin embargo, se puede utilizar el OCR para convertir la imagen en
un documento de texto con su contenido como datos de texto.
¿Por qué es importante el OCR?
La mayoría de los flujos de trabajo comerciales suponen recibir información de medios de
comunicación impresos. Los formularios impresos, las facturas, los documentos legales
escaneados y los contratos impresos forman parte de los procesos comerciales. Estos
grandes volúmenes de papeleo requieren mucho tiempo y espacio para almacenarse y
administrarse. Si bien la administración de documentos digitales es recomendable,
digitalizar los documentos crea desafíos. E l proceso requiere intervención manual y
puede ser tedioso y lento.
Además, la digitalización del contenido de los documentos crea archivos de imagen con el
texto oculto en su interior. El texto de las imágenes no se puede procesar con
un software de procesamiento de texto de la misma manera que los documentos de texto.
La tecnología OCR resuelve el problema mediante la conversión de imágenes de texto en
datos de texto que pueden ser analizados por otro software empresarial. Entonces, puede
utilizar los datos para llevar a cabo análisis, optimizar operaciones, automatizar procesos
y mejorar la productividad.
¿Cómo funciona el OCR?
El motor de OCR o el software de OCR funcionan mediante los siguientes pasos:
Adquisición de imagen
Un escáner lee los documentos y los convierte en datos binarios. El software de OCR
analiza la imagen escaneada y clasifica las áreas claras como fondo y las áreas oscuras
como texto.
Procesamiento previo
El software de OCR primero limpia la imagen y elimina los errores para prepararla para la
lectura. Estas son algunas de las técnicas de limpieza:
Se endereza o inclina ligeramente el documento escaneado para solucionar los
problemas de alineación durante el escaneo.
Se remueven o eliminan manchas de imágenes digitales o se suavizan los
bordes de las imágenes de texto.
Se limpian los cuadros y las líneas de la imagen.
Se reconocen guiones para tecnología OCR multilingüe.
Reconocimiento de texto
Los dos tipos principales de algoritmos de OCR o procesos de software que utiliza
un software de OCR para el reconocimiento de texto se denominan coincidencia de
patrones y extracción de características.
Coincidencia de patrones
La coincidencia de patrones aísla una imagen de carácter, llamada glifo, y la compara con
un glifo almacenado de manera similar. El reconocimiento de patrones solo funciona si el
glifo almacenado tiene una fuente y una escala similares a las del glifo de entrada. Este
método funciona bien con imágenes escaneadas de documentos que se han escrito en
una fuente conocida.
Extracción de características
La extracción de características divide o descompone los glifos en características como
líneas, circuitos cerrados, dirección de línea e intersecciones de línea. Luego, utiliza estas
características para encontrar la mejor coincidencia o el vecino más cercano entre los
glifos almacenados.
Procesamiento posterior
Después del análisis, el sistema convierte los datos de texto extraídos en un archivo
computarizado. Algunos sistemas de OCR pueden crear archivos PDF con anotaciones
que incluyen las versiones anteriores y posteriores del documento escaneado.
¿Cuáles son los tipos de OCR?
Los científicos de datos clasifican los diferentes tipos de tecnologías de OCR en función
de sus usos y aplicaciones. A continuación, se mencionan algunos ejemplos:
Software simple de reconocimiento óptico de caracteres
Un motor de OCR simple almacena muchos patrones de imágenes de texto y muchas
fuentes diferentes como plantillas. El software de OCR utiliza algoritmos de coincidencia
de patrones para comparar imágenes de texto, carácter por carácter, con su base de
datos interna. Si el sistema coincide con el texto palabra por palabra, se denomina
reconocimiento óptico de palabras. Esta solución tiene limitaciones, ya que hay fuentes y
estilos de escritura prácticamente ilimitados y no se puede capturar y almacenar en la
base de datos cada uno de los tipos.
Software inteligente de reconocimiento óptico de caracteres
Los sistemas de OCR modernos utilizan tecnología de reconocimiento inteligente de
caracteres (ICR) para leer el texto de la misma manera que lo hacen los humanos.
Utilizan métodos avanzados que entrenan a las máquinas para que se comporten como
humanos mediante el software de machine learning. Un sistema de machine
learning llamado red neuronal analiza el texto en muchos niveles y procesa la imagen
reiteradamente. Busca diferentes atributos de imagen, como curvas, líneas,
intersecciones y circuitos, y combina los resultados de todos estos niveles de análisis
diferentes para obtener el resultado final. Si bien el ICR normalmente procesa las
imágenes de a un carácter a la vez, el proceso es rápido y los resultados se obtienen en
segundos.
Reconocimiento de palabras inteligente
Los sistemas inteligentes de reconocimiento de palabras funcionan con los mismos
principios que ICR, pero procesan imágenes de palabras completas en lugar de procesar
previamente las imágenes en caracteres.
Reconocimiento óptico de marcas
El reconocimiento óptico de marcas identifica logotipos, marcas de agua y otros símbolos
de texto en un documento.
¿Qué beneficios ofrece el OCR?
Los científicos de datos clasifican los diferentes tipos de tecnologías de OCR en función
de sus usos y aplicaciones. A continuación, se mencionan algunos ejemplos:
Software simple de reconocimiento óptico de caracteres
Un motor de OCR simple almacena muchos patrones de imágenes de texto y muchas
fuentes diferentes como plantillas. El software de OCR utiliza algoritmos de coincidencia
de patrones para comparar imágenes de texto, carácter por carácter, con su base de
datos interna. Si el sistema coincide con el texto palabra por palabra, se denomina
reconocimiento óptico de palabras. Esta solución tiene limitaciones, ya que hay fuentes y
estilos de escritura prácticamente ilimitados y no se puede capturar y almacenar en la
base de datos cada uno de los tipos.
Software inteligente de reconocimiento óptico de caracteres
Los sistemas de OCR modernos utilizan tecnología de reconocimiento inteligente de
caracteres (ICR) para leer el texto de la misma manera que lo hacen los humanos.
Utilizan métodos avanzados que entrenan a las máquinas para que se comporten como
humanos mediante el software de machine learning. Un sistema de machine
learning llamado red neuronal analiza el texto en muchos niveles y procesa la imagen
reiteradamente. Busca diferentes atributos de imagen, como curvas, líneas,
intersecciones y circuitos, y combina los resultados de todos estos niveles de análisis
diferentes para obtener el resultado final. Si bien el ICR normalmente procesa las
imágenes de a un carácter a la vez, el proceso es rápido y los resultados se obtienen en
segundos.
Reconocimiento de palabras inteligente
Los sistemas inteligentes de reconocimiento de palabras funcionan con los mismos
principios que ICR, pero procesan imágenes de palabras completas en lugar de procesar
previamente las imágenes en caracteres.
Reconocimiento óptico de marcas
El reconocimiento óptico de marcas identifica logotipos, marcas de agua y otros símbolos
de texto en un documento.
¿Qué beneficios ofrece el OCR?
A continuación, se mencionan los beneficios principales de la tecnología OCR:
Texto consultable
Las empresas pueden convertir sus documentos existentes y nuevos en un archivo de
conocimiento con capacidad de búsqueda completa. También pueden procesar la base de
datos de texto de forma automática mediante el uso de software de análisis de datos para
un mayor procesamiento del conocimiento.
Eficacia operativa
Puede mejorar la eficiencia con el software de OCR para integrar de forma automática los
flujos de trabajo de documentos y los flujos de trabajo digitales dentro de su empresa. A
continuación, se incluyen algunos ejemplos de lo que el software de OCR puede hacer:
Escanea formularios completados a mano para verificaciones, revisiones,
ediciones y análisis automatizados. Esto ahorra el tiempo necesario para el
procesamiento manual de documentos y la entrada de datos.
Encuentra los documentos requeridos mediante la búsqueda rápida de un término
en la base de datos para que usted no tenga que ordenar manualmente los
archivos en un cuadro.
Convierte notas escritas a mano en textos y documentos editables.
Soluciones de inteligencia artificial
El OCR es muchas veces parte de otras soluciones de inteligencia artificial que las
empresas pueden implementar. Por ejemplo, escanea y lee matrículas y señales de
tránsito en vehículos autónomos, detecta logotipos de marcas en publicaciones en redes
sociales o identifica envases de productos en imágenes publicitarias. Esta tecnología de
inteligencia artificial ayuda a las empresas a tomar mejores decisiones operativas y de
marketing que reducen los gastos y mejoran la experiencia del cliente.
¿Para qué se utiliza el OCR?
A continuación, se incluyen algunos casos de uso comunes de OCR en varios sectores:
Banca
El sector bancario utiliza el OCR para procesar y verificar el papeleo de documentos de
préstamo, cheques de depósito y otras transacciones financieras. Esta verificación mejoró
la prevención de fraude y mejoró la seguridad de las transacciones.
Sanidad
El sector de la salud utiliza el OCR para procesar registros de pacientes, incluidos
tratamientos, pruebas, registros hospitalarios y pagos de seguros. El OCR ayuda a
optimizar el flujo de trabajo y reduce el trabajo manual en los hospitales mientras
mantiene los registros actualizados. Por ejemplo, nib Group ofrece seguros médicos y de
salud a más de un millón de australianos y recibe miles de solicitudes médicas al día.
Logística
Las empresas de logística utilizan el OCR para rastrear etiquetas de paquetes, facturas,
recibos y otros documentos de manera más eficiente. Por ejemplo, Foresight Group utiliza
Amazon Textract para automatizar el procesamiento de facturas en SAP.
¿Cómo puede ayudar AWS con el OCR?
AWS ofrece dos servicios que pueden ayudarlo a implementar el OCR en su empresa:
Amazon Textract es un servicio de machine learning (ML) que utiliza el OCR para extraer
de forma automática texto, escritura a mano y datos de documentos escaneados, como
archivos PDF. Puede leer miles de documentos diferentes en varios diseños y formatos a
alta velocidad. Cuando extrae información de los documentos.