0% encontró este documento útil (0 votos)

68 vistas6 páginas

Qué es y cómo funciona el OCR

El documento describe el reconocimiento óptico de caracteres (OCR), que es el proceso de convertir imágenes de texto en texto digital editable. Explica que el OCR funciona escaneando documentos, limpiando y procesando las imágenes antes de reconocer los caracteres mediante coincidencia de patrones o extracción de características. Luego, el texto reconocido se convierte en un archivo de texto. El documento también describe los tipos de OCR, como el simple y el inteligente, y los beneficios del OCR como la búsqueda de texto y la mejora de

Cargado por

Sam Apaza

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

68 vistas6 páginas

Qué es y cómo funciona el OCR

Cargado por

Sam Apaza

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Unidad Educativa

Libertador Simón Bolívar

Lector de
Caracteres

Estudiante : Cristian Brayan Callizaya Choque

Prof. : Yeri Rada Blanco

Materia : Hardware de Computadoras

Curso : 4to “B” Secundaria

2023
LECTOR DE CARACTERES

¿Qué es el reconocimiento óptico de caracteres (OCR)?

El reconocimiento óptico de caracteres (OCR) es el proceso por el cual se convierte una

imagen de texto en un formato de texto que pueden leer las máquinas. Por ejemplo, si
escanea el formulario o un recibo, su computadora guarda el escaneo como un archivo de
imagen. No se puede utilizar un editor de texto para editar, buscar o contar las palabras
del archivo de imagen. Sin embargo, se puede utilizar el OCR para convertir la imagen en
un documento de texto con su contenido como datos de texto.

¿Por qué es importante el OCR?

La mayoría de los flujos de trabajo comerciales suponen recibir información de medios de

comunicación impresos. Los formularios impresos, las facturas, los documentos legales
escaneados y los contratos impresos forman parte de los procesos comerciales. Estos
grandes volúmenes de papeleo requieren mucho tiempo y espacio para almacenarse y
administrarse. Si bien la administración de documentos digitales es recomendable,
digitalizar los documentos crea desafíos. E l proceso requiere intervención manual y
puede ser tedioso y lento.

Además, la digitalización del contenido de los documentos crea archivos de imagen con el
texto oculto en su interior. El texto de las imágenes no se puede procesar con
un software de procesamiento de texto de la misma manera que los documentos de texto.
La tecnología OCR resuelve el problema mediante la conversión de imágenes de texto en
datos de texto que pueden ser analizados por otro software empresarial. Entonces, puede
utilizar los datos para llevar a cabo análisis, optimizar operaciones, automatizar procesos
y mejorar la productividad.

¿Cómo funciona el OCR?

El motor de OCR o el software de OCR funcionan mediante los siguientes pasos:

Adquisición de imagen

Un escáner lee los documentos y los convierte en datos binarios. El software de OCR
analiza la imagen escaneada y clasifica las áreas claras como fondo y las áreas oscuras
como texto.

Procesamiento previo

El software de OCR primero limpia la imagen y elimina los errores para prepararla para la
lectura. Estas son algunas de las técnicas de limpieza:

 Se endereza o inclina ligeramente el documento escaneado para solucionar los

problemas de alineación durante el escaneo.
 Se remueven o eliminan manchas de imágenes digitales o se suavizan los
bordes de las imágenes de texto.
 Se limpian los cuadros y las líneas de la imagen.
 Se reconocen guiones para tecnología OCR multilingüe.

Reconocimiento de texto

Los dos tipos principales de algoritmos de OCR o procesos de software que utiliza
un software de OCR para el reconocimiento de texto se denominan coincidencia de
patrones y extracción de características.

Coincidencia de patrones

La coincidencia de patrones aísla una imagen de carácter, llamada glifo, y la compara con
un glifo almacenado de manera similar. El reconocimiento de patrones solo funciona si el
glifo almacenado tiene una fuente y una escala similares a las del glifo de entrada. Este
método funciona bien con imágenes escaneadas de documentos que se han escrito en
una fuente conocida.

Extracción de características

La extracción de características divide o descompone los glifos en características como

líneas, circuitos cerrados, dirección de línea e intersecciones de línea. Luego, utiliza estas
características para encontrar la mejor coincidencia o el vecino más cercano entre los
glifos almacenados.

Procesamiento posterior

Después del análisis, el sistema convierte los datos de texto extraídos en un archivo
computarizado. Algunos sistemas de OCR pueden crear archivos PDF con anotaciones
que incluyen las versiones anteriores y posteriores del documento escaneado.

¿Cuáles son los tipos de OCR?

Los científicos de datos clasifican los diferentes tipos de tecnologías de OCR en función
de sus usos y aplicaciones. A continuación, se mencionan algunos ejemplos:

Software simple de reconocimiento óptico de caracteres

Un motor de OCR simple almacena muchos patrones de imágenes de texto y muchas

fuentes diferentes como plantillas. El software de OCR utiliza algoritmos de coincidencia
de patrones para comparar imágenes de texto, carácter por carácter, con su base de
datos interna. Si el sistema coincide con el texto palabra por palabra, se denomina
reconocimiento óptico de palabras. Esta solución tiene limitaciones, ya que hay fuentes y
estilos de escritura prácticamente ilimitados y no se puede capturar y almacenar en la
base de datos cada uno de los tipos.

Software inteligente de reconocimiento óptico de caracteres

Los sistemas de OCR modernos utilizan tecnología de reconocimiento inteligente de

caracteres (ICR) para leer el texto de la misma manera que lo hacen los humanos.
Utilizan métodos avanzados que entrenan a las máquinas para que se comporten como
humanos mediante el software de machine learning. Un sistema de machine
learning llamado red neuronal analiza el texto en muchos niveles y procesa la imagen
reiteradamente. Busca diferentes atributos de imagen, como curvas, líneas,
intersecciones y circuitos, y combina los resultados de todos estos niveles de análisis
diferentes para obtener el resultado final. Si bien el ICR normalmente procesa las
imágenes de a un carácter a la vez, el proceso es rápido y los resultados se obtienen en
segundos.

Reconocimiento de palabras inteligente

Los sistemas inteligentes de reconocimiento de palabras funcionan con los mismos

principios que ICR, pero procesan imágenes de palabras completas en lugar de procesar
previamente las imágenes en caracteres.

Reconocimiento óptico de marcas

El reconocimiento óptico de marcas identifica logotipos, marcas de agua y otros símbolos

de texto en un documento.

¿Qué beneficios ofrece el OCR?

Los científicos de datos clasifican los diferentes tipos de tecnologías de OCR en función
de sus usos y aplicaciones. A continuación, se mencionan algunos ejemplos:

Software simple de reconocimiento óptico de caracteres

Un motor de OCR simple almacena muchos patrones de imágenes de texto y muchas

Software inteligente de reconocimiento óptico de caracteres

Los sistemas de OCR modernos utilizan tecnología de reconocimiento inteligente de

Los sistemas inteligentes de reconocimiento de palabras funcionan con los mismos

principios que ICR, pero procesan imágenes de palabras completas en lugar de procesar
previamente las imágenes en caracteres.

Reconocimiento óptico de marcas

El reconocimiento óptico de marcas identifica logotipos, marcas de agua y otros símbolos

de texto en un documento.

¿Qué beneficios ofrece el OCR?

A continuación, se mencionan los beneficios principales de la tecnología OCR:

Texto consultable

Las empresas pueden convertir sus documentos existentes y nuevos en un archivo de

conocimiento con capacidad de búsqueda completa. También pueden procesar la base de
datos de texto de forma automática mediante el uso de software de análisis de datos para
un mayor procesamiento del conocimiento.

Eficacia operativa

Puede mejorar la eficiencia con el software de OCR para integrar de forma automática los
flujos de trabajo de documentos y los flujos de trabajo digitales dentro de su empresa. A
continuación, se incluyen algunos ejemplos de lo que el software de OCR puede hacer:

 Escanea formularios completados a mano para verificaciones, revisiones,

ediciones y análisis automatizados. Esto ahorra el tiempo necesario para el
procesamiento manual de documentos y la entrada de datos.

 Encuentra los documentos requeridos mediante la búsqueda rápida de un término

en la base de datos para que usted no tenga que ordenar manualmente los
archivos en un cuadro.

 Convierte notas escritas a mano en textos y documentos editables.

Soluciones de inteligencia artificial

El OCR es muchas veces parte de otras soluciones de inteligencia artificial que las
empresas pueden implementar. Por ejemplo, escanea y lee matrículas y señales de
tránsito en vehículos autónomos, detecta logotipos de marcas en publicaciones en redes
sociales o identifica envases de productos en imágenes publicitarias. Esta tecnología de
inteligencia artificial ayuda a las empresas a tomar mejores decisiones operativas y de
marketing que reducen los gastos y mejoran la experiencia del cliente.
¿Para qué se utiliza el OCR?

A continuación, se incluyen algunos casos de uso comunes de OCR en varios sectores:

Banca

El sector bancario utiliza el OCR para procesar y verificar el papeleo de documentos de

préstamo, cheques de depósito y otras transacciones financieras. Esta verificación mejoró
la prevención de fraude y mejoró la seguridad de las transacciones.

Sanidad

El sector de la salud utiliza el OCR para procesar registros de pacientes, incluidos

tratamientos, pruebas, registros hospitalarios y pagos de seguros. El OCR ayuda a
optimizar el flujo de trabajo y reduce el trabajo manual en los hospitales mientras
mantiene los registros actualizados. Por ejemplo, nib Group ofrece seguros médicos y de
salud a más de un millón de australianos y recibe miles de solicitudes médicas al día.

Logística

Las empresas de logística utilizan el OCR para rastrear etiquetas de paquetes, facturas,
recibos y otros documentos de manera más eficiente. Por ejemplo, Foresight Group utiliza
Amazon Textract para automatizar el procesamiento de facturas en SAP.

¿Cómo puede ayudar AWS con el OCR?

AWS ofrece dos servicios que pueden ayudarlo a implementar el OCR en su empresa:

Amazon Textract es un servicio de machine learning (ML) que utiliza el OCR para extraer
de forma automática texto, escritura a mano y datos de documentos escaneados, como
archivos PDF. Puede leer miles de documentos diferentes en varios diseños y formatos a
alta velocidad. Cuando extrae información de los documentos.

También podría gustarte

Soluciones de Reconocimiento de Imágenes
Aún no hay calificaciones
Soluciones de Reconocimiento de Imágenes
20 páginas
Guía Completa sobre Reconocimiento OCR
Aún no hay calificaciones
Guía Completa sobre Reconocimiento OCR
8 páginas
Introducción al Reconocimiento Óptico de Caracteres
Aún no hay calificaciones
Introducción al Reconocimiento Óptico de Caracteres
2 páginas
ChristianRenteria Digitalizacion
Aún no hay calificaciones
ChristianRenteria Digitalizacion
9 páginas
Digitalización de Documentos para Aplicación de Ocr Usando Office Lens
Aún no hay calificaciones
Digitalización de Documentos para Aplicación de Ocr Usando Office Lens
5 páginas
Reconocimiento Óptico de Caracteres (OCR)
Aún no hay calificaciones
Reconocimiento Óptico de Caracteres (OCR)
9 páginas
Textscan: App de Copiado Rápido
Aún no hay calificaciones
Textscan: App de Copiado Rápido
15 páginas
Tecnologías OCR, ICR y OMR en Digitalización
Aún no hay calificaciones
Tecnologías OCR, ICR y OMR en Digitalización
7 páginas
5 Mejores Herramientas OCR Gratuitas
Aún no hay calificaciones
5 Mejores Herramientas OCR Gratuitas
6 páginas
Prac2 EjemploDeAplicacionPDI
Aún no hay calificaciones
Prac2 EjemploDeAplicacionPDI
10 páginas
OCR y Redes Neuronales: Avances
100% (2)
OCR y Redes Neuronales: Avances
27 páginas
Tecnología OCR en Digitalización Cultural
Aún no hay calificaciones
Tecnología OCR en Digitalización Cultural
4 páginas
Reconocimiento de Caracteres: OCR, ICR y NHR
Aún no hay calificaciones
Reconocimiento de Caracteres: OCR, ICR y NHR
21 páginas
Guía de Digitalización con OCR y PDF
Aún no hay calificaciones
Guía de Digitalización con OCR y PDF
6 páginas
U2-A1 Digitalizar Documentos y Aplicarle Ocr
Aún no hay calificaciones
U2-A1 Digitalizar Documentos y Aplicarle Ocr
4 páginas
Sistemas de Reconocimiento de Caracteres
Aún no hay calificaciones
Sistemas de Reconocimiento de Caracteres
8 páginas
Sistema OCR para Captura de Texto
Aún no hay calificaciones
Sistema OCR para Captura de Texto
28 páginas
Ocr
Aún no hay calificaciones
Ocr
8 páginas
Metodos de Captura de Datos - Ingenieria de La Informacion
Aún no hay calificaciones
Metodos de Captura de Datos - Ingenieria de La Informacion
62 páginas
Digitalización y OCR: Guía Práctica
Aún no hay calificaciones
Digitalización y OCR: Guía Práctica
8 páginas
OCR y Reconocimiento de Voz: Tecnologías Clave
100% (1)
OCR y Reconocimiento de Voz: Tecnologías Clave
37 páginas
ABBYY FineReader v15.0.112.2130 Corporate Edition Multilenguaje (Español)
100% (1)
ABBYY FineReader v15.0.112.2130 Corporate Edition Multilenguaje (Español)
11 páginas
Facultad de Telemática: Ingeniería de Software
Aún no hay calificaciones
Facultad de Telemática: Ingeniería de Software
5 páginas
Digitalización de Documentos con OCR
Aún no hay calificaciones
Digitalización de Documentos con OCR
2 páginas
Digitalización de Imágenes y Textos
Aún no hay calificaciones
Digitalización de Imágenes y Textos
7 páginas
Digitalización y OCR de Documentos
Aún no hay calificaciones
Digitalización y OCR de Documentos
4 páginas
Sistemas de Apoyo para la Toma de Decisiones
Aún no hay calificaciones
Sistemas de Apoyo para la Toma de Decisiones
15 páginas
Función y tipos de escáneres modernos
Aún no hay calificaciones
Función y tipos de escáneres modernos
6 páginas
IA en Python para Reconocimiento de Texto
Aún no hay calificaciones
IA en Python para Reconocimiento de Texto
12 páginas
Reconocimiento de Texto, Voz e Imagen - Inteligencia Artificial
Aún no hay calificaciones
Reconocimiento de Texto, Voz e Imagen - Inteligencia Artificial
13 páginas
El Escaner y OCR
Aún no hay calificaciones
El Escaner y OCR
6 páginas
Algoritmo OCR para Búsqueda Bibliográfica
Aún no hay calificaciones
Algoritmo OCR para Búsqueda Bibliográfica
6 páginas
Reconocimiento Óptico de Texto Manuscrito
Aún no hay calificaciones
Reconocimiento Óptico de Texto Manuscrito
6 páginas
Sistema OCR para Digitalización de Facturas
Aún no hay calificaciones
Sistema OCR para Digitalización de Facturas
10 páginas
EasyOCR: Optimiza el OCR en tu negocio
Aún no hay calificaciones
EasyOCR: Optimiza el OCR en tu negocio
3 páginas
Actividades de OCR con OmniPage en UiPath
Aún no hay calificaciones
Actividades de OCR con OmniPage en UiPath
2 páginas
Aplicaciones RP - Reconocimiento de Caracteres
Aún no hay calificaciones
Aplicaciones RP - Reconocimiento de Caracteres
11 páginas
Llerenas Rosiles Alberich Ramses - Actividad 6 Ocr
Aún no hay calificaciones
Llerenas Rosiles Alberich Ramses - Actividad 6 Ocr
3 páginas
OCR en Procesamiento de Información
Aún no hay calificaciones
OCR en Procesamiento de Información
126 páginas
La Digitalización
Aún no hay calificaciones
La Digitalización
6 páginas
Técnicas de Reconocimiento Óptico de Caracteres
Aún no hay calificaciones
Técnicas de Reconocimiento Óptico de Caracteres
7 páginas
Qué Es Un PDF
Aún no hay calificaciones
Qué Es Un PDF
2 páginas
Modificación de Tesseract para OCR
Aún no hay calificaciones
Modificación de Tesseract para OCR
41 páginas
Tarea D. de Texto
Aún no hay calificaciones
Tarea D. de Texto
4 páginas
Digitalización de Documentos
100% (1)
Digitalización de Documentos
9 páginas
Dossier MobbScan
Aún no hay calificaciones
Dossier MobbScan
14 páginas
Sistema OCR: Reconocimiento de Caracteres
Aún no hay calificaciones
Sistema OCR: Reconocimiento de Caracteres
26 páginas
Actividades de OCR con OmniPage en UiPath
Aún no hay calificaciones
Actividades de OCR con OmniPage en UiPath
9 páginas
Los Problemas de Identificación de Caracteres
Aún no hay calificaciones
Los Problemas de Identificación de Caracteres
8 páginas
Captcha y OCR
Aún no hay calificaciones
Captcha y OCR
6 páginas
Investigación en IA: Unidad 1
100% (1)
Investigación en IA: Unidad 1
17 páginas
Convertir Imagen A Texto - Extraer Texto de Imágenes Online
Aún no hay calificaciones
Convertir Imagen A Texto - Extraer Texto de Imágenes Online
1 página
Tipos de PDF - PDF Con Capacidad de Búsqueda, Solo Imagen, y PDF Verdadero - ABBYY
Aún no hay calificaciones
Tipos de PDF - PDF Con Capacidad de Búsqueda, Solo Imagen, y PDF Verdadero - ABBYY
3 páginas
Funcionamiento de Escáneres y Lectores de Códigos
Aún no hay calificaciones
Funcionamiento de Escáneres y Lectores de Códigos
9 páginas
Utilizas La Funcionalidad OCR de ChatGPT
Aún no hay calificaciones
Utilizas La Funcionalidad OCR de ChatGPT
8 páginas
ANPR Utilizando OCR Convencionales
Aún no hay calificaciones
ANPR Utilizando OCR Convencionales
129 páginas
Derechos Políticos y Régimen Electoral en Bolivia
Aún no hay calificaciones
Derechos Políticos y Régimen Electoral en Bolivia
3 páginas
Beneficios del Camote Morado para la Salud
Aún no hay calificaciones
Beneficios del Camote Morado para la Salud
4 páginas
Cosmovisión Andina: Principios y Simbología
Aún no hay calificaciones
Cosmovisión Andina: Principios y Simbología
3 páginas
Arterio Bases
Aún no hay calificaciones
Arterio Bases
44 páginas
El Explorador
100% (3)
El Explorador
33 páginas
Ley 3131
Aún no hay calificaciones
Ley 3131
31 páginas
Actitudes Positivas y Negativas
78% (9)
Actitudes Positivas y Negativas
2 páginas
Pueblos Originarios de América - Abya Yala
100% (1)
Pueblos Originarios de América - Abya Yala
2 páginas
Órganos de la Fonación y su Función
Aún no hay calificaciones
Órganos de la Fonación y su Función
26 páginas
Funcion Sales Hidrosales
50% (2)
Funcion Sales Hidrosales
4 páginas
Casos Especiales-Ácidos Oxácidos
Aún no hay calificaciones
Casos Especiales-Ácidos Oxácidos
6 páginas
Uso del Verbo Modal "Can"
Aún no hay calificaciones
Uso del Verbo Modal "Can"
5 páginas
Programación No Lineal en Optimización
Aún no hay calificaciones
Programación No Lineal en Optimización
11 páginas
Actividades de Geometría para Primer Grado
Aún no hay calificaciones
Actividades de Geometría para Primer Grado
5 páginas
Importancia de La Estadistica en La Labor de Contador Publico
0% (2)
Importancia de La Estadistica en La Labor de Contador Publico
3 páginas
Evolución de las Generaciones de Computadoras
Aún no hay calificaciones
Evolución de las Generaciones de Computadoras
15 páginas
Orígenes y evolución de las ciudades
Aún no hay calificaciones
Orígenes y evolución de las ciudades
3 páginas
Ensayo
Aún no hay calificaciones
Ensayo
10 páginas
Certificacion en PNL Leonardo Lujan (Recuperado Automáticamente)
Aún no hay calificaciones
Certificacion en PNL Leonardo Lujan (Recuperado Automáticamente)
8 páginas
6 Circunferencia
Aún no hay calificaciones
6 Circunferencia
12 páginas
Geometria Proporcional Ii y Homotecia
Aún no hay calificaciones
Geometria Proporcional Ii y Homotecia
8 páginas
Semana Iii - Ficha - Historia de La Psicología Ii-1
Aún no hay calificaciones
Semana Iii - Ficha - Historia de La Psicología Ii-1
2 páginas
Reglamento - Escolar - Universidad - Tecnologica - de - Tabasco 1
Aún no hay calificaciones
Reglamento - Escolar - Universidad - Tecnologica - de - Tabasco 1
31 páginas
Informe Linea de Tierra
100% (1)
Informe Linea de Tierra
12 páginas
Catenaria y Parabola en Cables
Aún no hay calificaciones
Catenaria y Parabola en Cables
4 páginas
El Respeto y La Equidad Son Los Dos Valores Que Durante Este Mes de Marzo Promueve El Ministerio de Educación en Las Escuelas de Todo El País
Aún no hay calificaciones
El Respeto y La Equidad Son Los Dos Valores Que Durante Este Mes de Marzo Promueve El Ministerio de Educación en Las Escuelas de Todo El País
3 páginas
Histéresis en Interruptores Neumáticos y Capacitivos
Aún no hay calificaciones
Histéresis en Interruptores Neumáticos y Capacitivos
7 páginas
Enseñanza de Literatura en la Escuela
Aún no hay calificaciones
Enseñanza de Literatura en la Escuela
1 página
Sesión de Aprendizaje: Vanguardismo
Aún no hay calificaciones
Sesión de Aprendizaje: Vanguardismo
5 páginas
Benjamín Domb - La Clínica Psicoanalítica-Posición Del Analista
100% (1)
Benjamín Domb - La Clínica Psicoanalítica-Posición Del Analista
10 páginas
Estrategias de Aprendizaje y Enseñanza
Aún no hay calificaciones
Estrategias de Aprendizaje y Enseñanza
9 páginas
Adicción a Redes Sociales en UTP Arequipa
Aún no hay calificaciones
Adicción a Redes Sociales en UTP Arequipa
28 páginas
Cuestionario Ecología de Poblaciones
100% (2)
Cuestionario Ecología de Poblaciones
4 páginas
Biología del fenómeno social en Maturana
50% (4)
Biología del fenómeno social en Maturana
3 páginas
Embraguez y Frenos
Aún no hay calificaciones
Embraguez y Frenos
104 páginas
Ejercicios de Balanceo de Línea
Aún no hay calificaciones
Ejercicios de Balanceo de Línea
4 páginas
Memoria Descriptiva Extraccion Kayra UNSAAC
Aún no hay calificaciones
Memoria Descriptiva Extraccion Kayra UNSAAC
3 páginas
Formulario para Avisar A SEREMI de Salud de La Programación de Las Revisiones y Pruebas
Aún no hay calificaciones
Formulario para Avisar A SEREMI de Salud de La Programación de Las Revisiones y Pruebas
1 página
Calidad de Producto en Software ISO 9126
100% (3)
Calidad de Producto en Software ISO 9126
29 páginas
El Silencio en la Masonería
100% (1)
El Silencio en la Masonería
5 páginas
Ejemplos de Párrafos para Niños
Aún no hay calificaciones
Ejemplos de Párrafos para Niños
6 páginas