Visualización con Python
Adriana Marcela Corredor Beltrán, Faustino Javier tejedor Barrios
Profundización III Algoritmos Avanzados de Optimización para problemas de gran
Escala
Docente:
Jorge Isaac Castañeda Valbuena
Fundación Universitaria del Área Andina
Ingeniería Industrial, Facultad de Ciencias Básicas
6 de mayo de 2024
Tabla de contenido
Introducción .............................................................................................................. 3
Objetivos generales ................................................................................................... 4
Actividad ................................................................................................................... 5
Conclusiones............................................................................................................ 15
Referencias .............................................................................................................. 17
Introducción
La representación visual de información juega un rol esencial en la ingeniería
industrial al facilitar la comprensión, el análisis y la comunicación de datos cruciales sobre
procesos, sistemas y operaciones. En este contexto, Google Colab se erige como una
plataforma sumamente beneficiosa al proporcionar un entorno de programación basado en
Python en la nube, eliminando las barreras de acceso al ofrecer recursos computacionales
potentes de manera gratuita. Al fusionar las capacidades de Python con las funciones
colaborativas de Colab, los profesionales de la ingeniería industrial pueden crear
visualizaciones interactivas y dinámicas que posibilitan la exploración profunda de datos
complejos y la extracción de conocimientos valiosos. La flexibilidad de Python y la amplia
gama de bibliotecas de visualización disponibles, como Matplotlib, Seaborn y Plotly,
brindan a los ingenieros las herramientas necesarias para generar gráficos, diagramas y
tablas que representen eficazmente datos relacionados con procesos, rendimiento de
sistemas, análisis de riesgos, entre otros aspectos críticos. Desde representaciones visuales
de flujos de producción hasta el análisis de tendencias en datos de calidad, la combinación
de Google Colab y Python proporciona a los ingenieros industriales una plataforma sólida y
adaptable para enfrentar los desafíos de visualización de datos en su campo, impulsando la
toma de decisiones informadas y la mejora continua de procesos en entornos industriales
complejos y dinámicos.
Objetivos generales
1. Optimizar la comprensión de datos complejos relacionados con procesos
industriales mediante la creación de visualizaciones interactivas y dinámicas
utilizando Google Colab y Python.
2. Facilitar la identificación de patrones y tendencias en datos de sistemas y
operaciones industriales a través de visualizaciones claras y efectivas desarrolladas
con herramientas de visualización en Python en el entorno colaborativo de Google
Colab.
3. Mejorar la toma de decisiones en la ingeniería industrial mediante la generación de
visualizaciones informativas y perspicaces que ayuden a los profesionales a
entender rápidamente la información clave y a tomar medidas correctivas o
estratégicas según sea necesario.
Actividad
Aplicación Ingeniería Industrial
Google Colab, como parte de la suite de
herramientas de Google Cloud,
proporciona un entorno de desarrollo
colaborativo en la nube que permite
escribir, ejecutar y compartir código
Python. Colab es especialmente útil para la
Google Colab
visualización de datos en ingeniería
industrial debido a su capacidad para
ejecutar código Python y aprovechar las
bibliotecas de visualización de datos
populares como Matplotlib, Seaborn,
Plotly y Altair.
Python es un lenguaje de programación
muy utilizado en la ingeniería industrial
debido a su versatilidad y su amplia gama
de bibliotecas para análisis de datos y
visualización. Las bibliotecas de
Python visualización mencionadas anteriormente
permiten a los ingenieros industriales crear
gráficos, diagramas y visualizaciones
interactivas para explorar datos, identificar
tendencias y patrones, y comunicar
resultados de manera efectiva.
Tabla 1. Fuente (Google Colab, s. f.)
2. Prácticas en la herramienta Google Colab
Gráfica: 1. Fuente propia, ejercicio practico
Gráfica: 2. Fuente propia, ejercicio practico
Gráfica: 3. Fuente propia, ejercicio practico
Gráfica: 4. Fuente propia, ejercicio practico
Gráfica: 5. Fuente propia, ejercicio practico
3. Reconocer la importancia de la información obtenida más relevante,
mediante una organización de las ideas y el conocimiento previo adquirido
en el eje.
Biblioteca Importancia Organización de ideas Conocimientos previos
Fundamental para la manipulación y Carga de datos, limpieza,
Pandas Alta análisis de datos. transformación y análisis de
datos.
Permite resolver ecuaciones y Definición de símbolos,
manipular expresiones matemáticas. resolución de ecuaciones,
SymPy Media
manipulación de expresiones
matemáticas.
Proporciona una amplia variedad de Creación de diferentes tipos de
Matplotlib Alta gráficos y herramientas de gráficos, personalización y
visualización. etiquetado.
Fundamental para la computación Creación de matrices, cálculo de
NumPy Alta numérica y el trabajo con matrices y estadísticas básicas,
arreglos multidimensionales. manipulación de datos.
Ofrece algoritmos especializados Utilización de funciones para la
SciPy Media para la resolución de problemas optimización, álgebra lineal,
científicos y de ingeniería. interpolación, etc.
Tabla 2. Fuente propia
4. Realice una evaluación de los recursos de información (utilizando
parámetros objetivos).
Autoridad y credibilidad del recurso:
La información proveniente de fuentes como el sitio oficial de Google Colab, la
documentación oficial de Python, o instituciones académicas reconocidas, se considera
altamente confiable y autorizada en el campo de la ingeniería industrial y la programación.
Actualidad y relevancia:
La actualización constante de la información proporcionada asegura su relevancia
para las prácticas actuales en ingeniería industrial. Los recursos que abordan problemas y
desafíos comunes en la industria y ofrecen soluciones prácticas utilizando Google Colab y
Python son altamente valiosos.
Complejidad y claridad de la información:
La claridad y precisión en la presentación de la información es fundamental para su
comprensión por parte del público objetivo, que son ingenieros industriales. Los recursos
que ofrecen explicaciones detalladas y ejemplos claros para ilustrar el uso de Google Colab
y Python en diferentes contextos industriales son altamente apreciados.
Profundidad y amplitud de la cobertura:
La profundidad y amplitud de la cobertura de los temas relacionados con el uso de
Google Colab y Python en ingeniería industrial es crucial. Los recursos que cubren una
amplia gama de temas, desde conceptos básicos hasta técnicas avanzadas, y exploran
diferentes aplicaciones y casos de uso en la industria, son considerados más completos y
útiles.
Interactividad y recursos adicionales:
La disponibilidad de herramientas interactivas, como notebooks de Google Colab, y
otros recursos adicionales como tutoriales en video, ejercicios prácticos y enlaces a
conjuntos de datos, complementan la información presentada y facilitan el aprendizaje
práctico.
Opiniones y comentarios de usuarios:
Las opiniones y testimonios de usuarios que respaldan la utilidad y eficacia del
recurso en el uso de Google Colab y Python para la ingeniería industrial proporcionan una
validación adicional de la calidad del recurso.
5. Modifique las búsquedas con otras librerías que utilizan Python
Biblioteca Descripción Principales características Ejemplos de uso
Biblioteca de - Creación de gráficos interactivos, - Crear un gráfico de
visualización incluyendo gráficos 3D y mapas dispersión interactivo.
interactiva que interactivos. Soporte para varios Generar un mapa de
permite crear gráficos lenguajes de programación, calor interactivo.
Plotly
dinámicos y incluyendo Python, R, y Julia. -
colaborativos. Integración con herramientas de
colaboración como Google Colab y
Jupyter Notebooks.
Biblioteca declarativa - Sintaxis simple y consistente - Crear un gráfico de
para la creación de basada en gramática de la barras agrupadas.
visualizaciones visualización. Generación Generar un diagrama de
Altair
estadísticas elegantes automática de ejes, leyendas y dispersión con regresión
y concisas. escalas. Soporte para interactividad lineal.
y personalización avanzada.
Biblioteca de - Generación de gráficos - Crear un gráfico de
visualización interactivos con alto rendimiento y líneas con herramientas
interactiva que escalabilidad. Soporte para widgets interactivas. Generar un
Bokeh permite crear gráficos interactivos y herramientas de diagrama de dispersión
web modernos y edición. Exportación de gráficos en con herramientas de
dinámicos. formato HTML para su zoom y pan.
visualización en navegadores web.
Marco de trabajo de - Desarrollo de aplicaciones web - Crear un panel de
Python para la basadas en Python con control interactivo para
creación de componentes reutilizables. Soporte el análisis de datos. -
Dash aplicaciones web para gráficos interactivos, tablas de Desarrollar una
interactivas y paneles datos y controles de usuario. - aplicación web para la
de control. Integración con Flask para el visualización de datos en
despliegue sencillo de aplicaciones. tiempo real.
Biblioteca que - Generación automática de - Crear un mapa de calor
simplifica la creación visualizaciones a partir de a partir de un conjunto
de visualizaciones estructuras de datos complejas. de datos
complejas mediante la Soporte para una amplia variedad multidimensional.
Holoviews declaración de datos y de tipos de gráficos, incluyendo Generar un gráfico de
opciones de gráficos multidimensionales y barras animado con
visualización en un geoespaciales. Integración con datos en streaming.
solo paso. otras bibliotecas de visualización
como Matplotlib y Bokeh.
Tabla 3. Fuente propia.
6. Construya la matriz colocando la información y atribuya un valor de
importancia probabilístico entre 0 y 1 para sistematizar la información.
Valor
Biblioteca Importancia
Probabilístico
Altamente importante debido a su capacidad para crear gráficos
Plotly interactivos y dinámicos, facilitando la exploración de datos 0.9
complejos.
Muy relevante por su enfoque declarativo y elegante para la
Altair creación de gráficos, simplificando el proceso de visualización de 0.85
datos.
De gran importancia debido a su capacidad para crear gráficos
Bokeh interactivos basados en la web y aplicaciones web interactivas, lo 0.8
que facilita la exploración de datos.
Importante por su capacidad para crear aplicaciones web
Dash interactivas y paneles de control personalizados para la 0.75
visualización y exploración de datos en tiempo real.
Relevante por su capacidad para simplificar la creación de
visualizaciones complejas al permitir la declaración de datos y
Holoviews 0.7
opciones de visualización en un solo paso, facilitando la
exploración de datos multidimensionales.
Tabla 4. Fuente propia.
7. Valore en otra columna con una crítica de cada librería encontrada.
Valor
Biblioteca Importancia Crítica
Probabilístico
Aunque Pandas es poderoso para el análisis de datos
tabulares, puede ser menos eficiente para
operaciones con grandes volúmenes de datos
Pandas Alta 0.9
debido a su naturaleza basada en memoria. Además,
la documentación puede ser extensa y a veces
desafiante para los usuarios nuevos.
Sympy es útil para cálculos simbólicos, pero su
rendimiento puede ser lento en comparación con
otras bibliotecas cuando se trata de grandes
Sympy Media 0.85 cantidades de datos numéricos. Además, la curva de
aprendizaje puede ser pronunciada para aquellos
que no están familiarizados con las matemáticas
simbólicas.
Valor
Biblioteca Importancia Crítica
Probabilístico
Matplotlib es muy versátil y ampliamente utilizado,
pero a veces puede ser engorroso para crear gráficos
complejos y personalizados debido a su sintaxis.
Matplotlib Alta 0.8
Además, la estética predeterminada de los gráficos
puede no ser tan atractiva como la de otras
bibliotecas.
NumPy es esencial para el cálculo numérico en
Python, pero algunas operaciones pueden ser menos
intuitivas y más verbosas en comparación con
NumPy Alta 0.75
bibliotecas más modernas. Además, la indexación y
el manejo de errores pueden ser difíciles de entender
para los principiantes.
SciPy es una extensión de NumPy con
funcionalidades adicionales, pero puede ser menos
utilizado que NumPy en algunos casos debido a su
SciPy Media 0.7
enfoque más específico en herramientas de análisis y
optimización. Además, puede requerir más recursos
computacionales para algunas operaciones.
Plotly ofrece una amplia gama de funcionalidades
interactivas, pero a veces su documentación puede
Plotly Alta 0.65
resultar un poco abrumadora para los principiantes
debido a la gran cantidad de opciones disponibles.
Altair es muy elegante y fácil de usar, pero a veces
puede resultar limitado en términos de
Altair Alta 0.6 personalización avanzada de gráficos. Además, su
rendimiento puede disminuir con conjuntos de datos
muy grandes.
Bokeh es excelente para crear visualizaciones
interactivas, pero su curva de aprendizaje puede ser
Bokeh Media 0.55 empinada para los nuevos usuarios, especialmente
aquellos que no están familiarizados con los
conceptos de desarrollo web.
Dash es poderoso para la creación de aplicaciones
web interactivas, pero puede ser complicado
configurar y puede requerir conocimientos
Dash Alta 0.5
adicionales de HTML y CSS para lograr un diseño
personalizado. También puede ser más lento que
otras bibliotecas para renderizar visualizaciones.
Valor
Biblioteca Importancia Crítica
Probabilístico
Holoviews simplifica la creación de visualizaciones
complejas, pero su flexibilidad puede ser limitada en
comparación con otras bibliotecas. Además, algunas
Holoviews Baja 0.45
características avanzadas pueden requerir una
comprensión más profunda de los conceptos
subyacentes.
Tabla 5. Fuente propia.
Conclusiones
Basándonos en la información obtenida en la matriz, podemos sacar las siguientes
conclusiones:
Importancia de las bibliotecas: Se observa que las bibliotecas pandas, Matplotlib
y NumPy son consideradas altamente importantes, lo que resalta su papel fundamental en el
ecosistema de Python para análisis de datos y visualización. Esto coincide con su amplia
adopción y uso en una variedad de campos, incluida la ingeniería industrial.
Variedad de opciones: Existe una amplia gama de bibliotecas disponibles para la
visualización de datos en Python, cada una con sus propias características y fortalezas.
Desde bibliotecas altamente interactivas como Plotly y Bokeh hasta enfoques más
declarativos como Altair, los usuarios tienen la flexibilidad de elegir la herramienta que
mejor se adapte a sus necesidades y preferencias.
Curva de aprendizaje: Se observa que algunas bibliotecas, como Dash y Bokeh,
pueden tener una curva de aprendizaje más pronunciada debido a su enfoque en la creación
de aplicaciones web interactivas. Esto sugiere que los usuarios pueden necesitar invertir
más tiempo y esfuerzo en aprender estas herramientas antes de poder utilizarlas de manera
efectiva.
Limitaciones y desafíos: Aunque todas las bibliotecas tienen sus puntos fuertes,
también tienen sus limitaciones y desafíos. Por ejemplo, Altair puede ser limitado en
términos de personalización avanzada de gráficos, mientras que Bokeh puede ser
complicado de configurar para nuevos usuarios. Es importante tener en cuenta estas
consideraciones al elegir la biblioteca adecuada para un proyecto específico.
Finalmente, la visualización de datos con Google Colab y Python emerge como una
herramienta indispensable en el ámbito de la ingeniería industrial. Google Colab ofrece un
entorno de programación en la nube que elimina las barreras de acceso a recursos
computacionales potentes, lo que resulta especialmente beneficioso para profesionales que
buscan iniciar proyectos de visualización de datos de manera ágil y eficiente. Por otro lado,
Python cuenta con una amplia gama de bibliotecas de visualización, como Matplotlib,
Seaborn, Plotly, Altair y otras, que proporcionan diferentes enfoques y capacidades para
representar datos de manera efectiva. Estas herramientas permiten a los ingenieros
industriales crear gráficos, diagramas y tablas que facilitan la comprensión, el análisis y la
comunicación de información crítica sobre procesos, sistemas y operaciones industriales.
Además, la capacidad de crear visualizaciones interactivas y dinámicas con bibliotecas
como Plotly y Bokeh proporciona un valor agregado significativo, especialmente en
entornos industriales donde se requiere la toma de decisiones informadas en tiempo real. La
colaboración y documentación también son aspectos destacados, ya que Google Colab
permite compartir y trabajar en conjunto en notebooks, mientras que Python y sus
bibliotecas cuentan con una amplia documentación y una comunidad activa que ofrece
soporte y recursos adicionales.
Referencias
DataScientest. (2023, 30 octubre). Pandas : La biblioteca de Python dedicada a la
Data Science. Formación En Ciencia de Datos | [Link].
[Link]
python#:~:text=%C2%BFCu%C3%A1les%20son%20las%20ventajas%20de,f%C3%A1cil
mente%20dentro%20de%20los%20DataFrames.
SymPy. (s. f.). [Link]
1 - Qué es Matplotlib y su importancia en la Ciencia de Datos y el Machine
Learning | Codificando Bits. (s. f.). Codificando Bits.
[Link]
que-es-matplotlib-e-importancia-ciencia-de-datos-machine-
learning/#:~:text=Y%20esta%20librer%C3%ADa%20permite%20generar,a%20lo%20larg
o%20del%20curso).
Alberca, A. S. (2022, 12 mayo). La librería Numpy | Aprende con Alf. Aprende Con
Alf. [Link]
Campbell, S. (2024, 9 marzo). SciPy in Python Tutorial: What is, Library, Function
& Examples. Guru99. [Link]
Zapata, J. R. (s. f.). Visualización de Datos con Python | Jose Ricardo Zapata. Jose
Ricardo Zapata. [Link]
Russo, C. (2021, 15 diciembre). Como crear graficos interactivos usando Plotly y
Python. Medium. [Link]
usando-plotly-y-python-91520d163813
Sánchez, S. (2021, 6 diciembre). Visualización de Datos con Altair - Ciencia y
Datos - Medium. Medium. [Link]
datos-con-altair-
297b0639448d#:~:text=%C2%BFQu%C3%A9%20es%20altair%20%3F,comportamiento
%20interactivo%20de%20tu%20visualizaci%C3%B3n.
Bokeh | Technology Radar | ThoughtWorks. (s. f.). Thoughtworks.
[Link]
López, B. R. (2021, 27 septiembre). Librerías de Python para crear un
“dashboard”. Cursos GIS | TYC GIS Formación. [Link]
python-para-crear-un-
dashboard/#:~:text=Dash%3A%20es%20una%20de%20las,una%20gran%20variedad%20d
e%20dise%C3%B1os.
HoloViews. (2005). [Link].
[Link]