Instituto Politécnico Nacional
Escuela Superior de Computo
“ESCOM”
Carrera:
Ingeniería en inteligencia artificial
Materia:
Visión Artificial
Profesor:
García Salas Horacio Alberto
Alumnos:
González Sánchez Erick Iván
Guzmán Ramírez Carlos Antonio
Luna González Gabriel Alexis
Grupo:
5BV1
Reconocimiento y reproducción en voz del entorno
Descripción del problema
El acceso a la información visual es un derecho fundamental que muchas personas con
discapacidad visual no pueden ejercer plenamente. En la actualidad, la interacción con el
entorno urbano y la lectura de información escrita dependen en gran medida del sentido de
la vista, lo que representa una barrera significativa para las personas ciegas o con baja visión.
Este proyecto busca eliminar esas barreras mediante una aplicación móvil innovadora que
utiliza inteligencia artificial y visión por computadora para transformar información visual
en sonido. Con ello, los usuarios podrán "ver" a través del oído, obteniendo descripciones
auditivas del entorno en tiempo real.
Estado actual
Aunque existen aplicaciones que permiten extraer texto de imágenes mediante técnicas de
reconocimiento óptico de caracteres (OCR), presentan dos limitaciones significativas:
1. Falta de accesibilidad sonora: Muchas de estas aplicaciones solo muestran el texto
detectado en pantalla, sin ofrecer una reproducción en voz automatizada.
2. Interfaces poco intuitivas: La mayoría de las aplicaciones no están optimizadas para
usuarios con discapacidad visual, lo que dificulta su uso.
Estado ideal
Nuestra solución busca transformar la forma en que las personas con discapacidad visual
interactúan con su entorno mediante un sistema accesible, intuitivo y altamente funcional. Al
abrir la aplicación, el usuario podrá:
• Activar la interacción mediante comandos de voz.
• Usar la cámara para tomar fotografías o grabar video en tiempo real.
• Obtener una reproducción en voz alta del texto detectado en su entorno.
• Identificar señales y objetos clave en la vía pública para mejorar su seguridad y
movilidad.
• Descripción del entorno en tiempo real
• Lectura de voz sobre textos que se detecten en ciertas imágenes si así se desea
Este proyecto no solo mejora la independencia de los usuarios, sino que también representa
un paso significativo en la construcción de una sociedad más inclusiva
Funciones y características del sistema
Interfaz Accesible y Adaptativa
• Diseño optimizado para interacción por voz y comandos intuitivos.
• Opciones configurables para personalizar la experiencia del usuario.
Reconocimiento de Texto
• Extracción y lectura de texto a partir de imágenes capturadas por la cámara.
• Análisis de texto en video en tiempo real.
Reconocimiento de Señales y Objetos Relevantes
• Identificación de señales de tránsito y advertencias de seguridad.
• Detección de elementos sobresalientes en el entorno (por ejemplo, policías o puntos
de referencia clave en la calle).
Descripción del entorno
• Identificación de objetos alrededor del área para indicar que se encuentra en el
entorno a distancias cercanas.
Búsqueda de lugares
• Función de interacción con voz en la aplicación para indicar que se desea encontrar,
de esta manera la aplicación brindara apoyo identificando lo que el usuario necesita
(por ejemplo, si el usuario dice “Necesito una tienda” la aplicación, al identificar en
una distancia próxima una tienda, le comunicara su ubicación al usuario)
Opciones de Personalización
• Configuración para activar la lectura en voz alta solo cuando el usuario lo desee.
• Modo continuo para narración en tiempo real sin interrupciones.
• Función de almacenamiento de información relevante, activable mediante voz o
ajustes en la configuración.
5. Impacto y Beneficios
Este proyecto representa una revolución en la accesibilidad digital para personas con
discapacidad visual. Su implementación podría:
• Mejorar significativamente la independencia y movilidad de los usuarios.
• Proporcionar acceso instantáneo a información escrita sin necesidad de asistencia
externa.
• Fomentar el desarrollo de tecnologías inclusivas en entornos urbanos, educativos y
culturales.
• Sentar las bases para futuras innovaciones en inteligencia artificial aplicada a la
accesibilidad.
Con este enfoque, la aplicación trasciende el ámbito tecnológico y se convierte en una
herramienta de cambio social. Estamos convencidos de que este desarrollo no solo mejorará
la calidad de vida de las personas con discapacidad visual, sino que también contribuirá a
una sociedad más equitativa e inclusiva.