0% encontró este documento útil (0 votos)
51 vistas4 páginas

Control de Lectura

El documento aborda conceptos fundamentales sobre imágenes digitales, incluyendo su estructura de píxeles, modelos de color y el impacto del ruido en la calidad de las fotografías. También se discuten técnicas de procesamiento de imágenes como transformaciones geométricas, suavizado, detección de contornos, segmentación, reconocimiento de patrones y visión computacional, así como sus aplicaciones en diversas industrias. Finalmente, se exploran métodos avanzados como la detección de acciones humanas y el reconocimiento facial, destacando su relevancia en campos como la medicina y la seguridad.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
51 vistas4 páginas

Control de Lectura

El documento aborda conceptos fundamentales sobre imágenes digitales, incluyendo su estructura de píxeles, modelos de color y el impacto del ruido en la calidad de las fotografías. También se discuten técnicas de procesamiento de imágenes como transformaciones geométricas, suavizado, detección de contornos, segmentación, reconocimiento de patrones y visión computacional, así como sus aplicaciones en diversas industrias. Finalmente, se exploran métodos avanzados como la detección de acciones humanas y el reconocimiento facial, destacando su relevancia en campos como la medicina y la seguridad.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Control de Lectura

Imagen digital: la imagen digital es formadas por elementos diminutos de


imagen llamados píxeles. Naturalmente, los píxeles se organizan en una matriz
rectangular ordenada. El tamaño de una imagen está determinado por las
dimensiones de esta matriz de píxeles. El ancho de la imagen es el número de
columnas y la altura de la imagen es el número de filas en la matriz. Por tanto, la
matriz de píxeles es una matriz de M columnas x N filas.
Color: El color es la impresión creada por los tonos de luz en los órganos
visuales, para ser más exactos es una percepción visual que produce nuestro
cerebro y en el cerebro de otros animales al interpretar las señales nerviosas
que envían los fotorreceptores a la retina del ojo.
Un ejemplo donde se aplica el color, es en el diseño. El color en el diseño es la
forma mas valiosa que una creación de una pieza grafica transmita las mismas
sensaciones que el diseñador sintió o experimento frente a la escena o encargo
original; usando el color de una buena manera, teniendo un buen conocimiento
de si naturaleza y efectos, será posible expresar lo alegre o triste.
A continuación, se muestra algunos modelos de color:
• RGB: El haz de luz conforma un espectro lumínico que se divide en tres
canales de color.
• CMYK: Ya sabemos que las impresoras imprimen la información que se
ve en la pantalla. Sin embargo, los monitores trabajan en RGB y las
impresoras lo hacen con otros cuatro colores: cian, magenta, amarillo y
negro.
• LAB: Este modo de color es el que más se asemeja al espectro de colores
percibido por el ojo humano, y su función es descriptiva.
• Escala de grises: Este modo representa una imagen en distintos valores
de gris definidos a través de su luminosidad o brillo, que va del 0 (negro)
al 255 (blanco).

Ruido: El ruido digital en la fotografía digital se refiere a los píxeles aleatorios


esparcidos al azar por toda la foto. Es un efecto similar al "grano" en la fotografía
de película y degrada la calidad de la foto.
El ruido digital suele producirse cuando toma fotografías con poca luz (como
fotografías nocturnas o escenas oscuras en interiores) o utiliza velocidades de
obturación muy lentas o modos de sensibilidad muy alta.
Transformaciones geométricas: Es una transformación que se aplica a las
coordenadas de un pixel en la imagen, modificando su ubicación. En términos
del procesamiento de imágenes digitales una transformación geométrica
consiste de dos operaciones básicas: Una transformación espacial que define la
reubicación de los píxeles en el plano imagen y la Interpolación de los niveles de
grises, los cuales tienen que ver con la asignación de los valores de intensidad
de los píxeles en la imagen transformada.
Las aplicaciones de las transformaciones geométricas son muchas, tienen una
infinidad de aplicaciones tanto en la vida diaria como en la naturaleza,
astronomía, ingeniería, arquitectura, diseño, etc.
Suavizado de Imágenes: El suavizado, también conocido como desenfoque, es
una de las operaciones más utilizadas en el procesamiento de imágenes. El uso
más común de la operación de suavizado es reducir el ruido en la imagen para
su posterior procesamiento.
Hay muchos algoritmos para realizar operaciones de suavizado, dentro del
opencv tenemos: cv2.fastNlMeansDenoising () que funciona con una sola
imagen en escala de grises, cv2.fastNlMeansDenoisingColored () que funciona
con una imagen en color, cv2.fastNlMeansDenoisingMulti () que funciona con la
secuencia de imágenes capturada en un período corto de tiempo (imágenes en
escala de grises) y cv2.fastNlMeansDenoisingColoredMulti () - igual que arriba,
pero para imágenes en color.
Detección de contornos: Los contornos se definen como la línea que une todos
los puntos a lo largo del límite de una imagen que representa o delimita la forma
o forma de un objeto Los algoritmos de detección de contornos son
fundamentalmente necesarios para realizar tareas prácticas, como, encontrar el
tamaño del objeto de interés y para la detección de objetos.
Para poder realizar la detección de contornos en una imagen en Python, OpenCV
tiene una findContour()función que ayuda a extraer los contornos de la imagen.
Funciona mejor en imágenes binarias, por lo que primero debemos aplicar
técnicas de umbral, bordes Sobel, etc.
Segmentación de imágenes: La segmentación de imágenes es un proceso
donde la imagen se divide en regiones que deben corresponder a las áreas de
la imagen. Por regiones se entiende un conjunto de "píxeles" contiguos, que se
extienden bidireccionalmente y que presentan uniformidad.
Para entender la segmentación de imagen se realizará mediante un ejemplo.
Considerando la siguiente imagen
Aquí solo hay un objeto: un perro. Podemos construir un modelo sencillo de
clasificador gato-perro y predecir que hay un perro en la imagen dada
Aquí es donde la segmentación de imágenes entra en escena. Nos ayuda a
identificar la ubicación de un solo objeto en la imagen dada. En caso de que
tengamos varios objetos presentes, nos basamos en el concepto de detección
de objetos. Podemos predecir la ubicación junto con la clase de cada objeto
usando la detección de objetos.

Reconocimiento de patrones: El reconocimiento de patrones es un proceso


cognitivo que ocurre en nuestro cerebro cuando hacemos coincidir cierta
información que encontramos con datos almacenados en nuestra memoria. En
informática y aprendizaje automático, el reconocimiento de patrones es una
tecnología que hace coincidir la información almacenada en la base de datos con
los datos entrantes.
El reconocimiento de patrones, puede ser aplicable en todas las industrias y
empresas. Un ejemplo claro puede ser en la ciencia médica donde es una de las
áreas más importantes donde la tecnología de reconocimiento de patrones
puede literalmente salvar vidas mediante el diagnóstico asistido por
computadora, que ayudan a los médicos a comprender cómo proceder con los
tratamientos.
Visión computacional: La visión computacional, se define como un campo de
estudio que busca desarrollar técnicas para ayudar a las computadoras a
“visualizar” y comprender el contenido de imágenes digitales como fotografías y
videos. Un problema particular de la visión se puede abordar fácilmente con un
método estadístico hecho a mano, mientras que otro puede requerir un conjunto
grande y complejo de algoritmos de aprendizaje automático generalizados.
Las aplicaciones de la visión computacional van desde la medicina a la robótica
industrial. En la medicina, el procesamiento de imágenes de microscopía, de
radiografía, de angioplastia, de ultrasonografía, de tomografía y de resonancia
magnética, prevé ofrecer diagnósticos más precisos sobre los pacientes.
Detección de acciones humanas: El reconocimiento de actividades humanas
es una tarea muy difícil de clasificación. implica predecir el movimiento de una
persona en función de los datos de los sensores y, tradicionalmente, implica una
profunda experiencia en el dominio y métodos desde el procesamiento de
señales para diseñar correctamente las características de los datos sin procesar
para que se ajusten a un modelo de aprendizaje automático.
Las aplicaciones prácticas de la detección de acciones humana pueden ser:
Clasificar / categorizar automáticamente un conjunto de datos de videos,
Capacitar y monitorear a un nuevo empleado para que realice correctamente una
tarea (por ejemplo, pasos y procedimientos adecuados al hacer una pizza,
incluido extender la masa, calentar el horno, poner salsa, queso, aderezos, etc.),
etc
Reconocimiento de rostros: En la visión computacional, un problema esencial
que se trata de resolver es detectar automáticamente objetos en una imagen sin
intervención humana por lo cual el reconocimiento de rostros se consideraría un
problema, por ende,el reconocimiento de rostros es un método para identificar o
verificar la identidad de un individuo usando su rostro. Existen varios algoritmos
que pueden hacer reconocimiento facial, pero su precisión puede variar.
Las aplicaciones prácticas para el reconocimiento de rostros pueden ser
principalmente en sistemas de seguridad para el reconocimiento de usuarios. En
estos sistemas se utiliza un lector que define las características del rostro, y
cuando este solicita el acceso, se verifica comparando los datos obtenidos con
la base de datos

También podría gustarte