03 - Groupby in Python - Es

Este documento trata sobre cómo agrupar datos por variables categóricas como el tipo de tracción y estilo de carrocería de vehículos para comparar el precio promedio entre los grupos. Explica cómo usar el método groupby en Pandas para agrupar los datos y calcular estadísticas como el precio promedio para cada subconjunto. También muestra cómo pivotar la tabla para hacerla más fácil de visualizar y crear un mapa de calor para ver la relación entre variables.

Cargado por

sankhasubhra mandal

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como TXT, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

52 vistas1 página

03 - Groupby in Python - Es

Cargado por

sankhasubhra mandal

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como TXT, PDF, TXT o lee en línea desde Scribd

En este vídeo, trataremos los conceptos básicos de agrupación y cómo esto puede

ayudar a transformar nuestro conjunto de datos. Supongamos que desea saber, ¿hay
alguna relación entre los diferentes tipos de sistema de tracción, delantera,
trasera y tracción en las cuatro ruedas, y el precio de los vehículos? En caso
afirmativo, ¿qué tipo de sistema de accionamiento aporta el mayor valor a un
vehículo? Sería bueno si pudiéramos agrupar todos los datos por los diferentes
tipos de ruedas motrices y comparar los resultados de estas diferentes ruedas
motrices entre sí. En Pandas, esto se puede hacer usando el grupo por método. El
grupo por método se utiliza en variables categóricas, agrupa los datos en
subconjuntos de acuerdo con las diferentes categorías de esa variable. Puede
agrupar por una sola variable o puede agruparse por varias variables pasando varios
nombres de variables. A modo de ejemplo, supongamos que estamos interesados en
encontrar el precio medio de los vehículos y observar cómo difieren entre
diferentes tipos de estilos de carrocería y variables de ruedas motrices. Para
hacer esto, primero seleccionamos las tres columnas de datos que nos interesan, que
se realiza en la primera línea de código. A continuación, agrupamos los datos
reducidos según las ruedas motrices y el estilo de la carrocería en la segunda
línea. Dado que estamos interesados en saber cómo difiere el precio medio en
general, podemos tomar la media de cada grupo y añadirla este bit al final de la
línea también. Los datos se agrupan ahora en subcategorías y solo se muestra el
precio medio de cada subcategoría. Podemos ver que, según nuestros datos, los
convertibles de tracción trasera y las tapas duras de tracción trasera tienen el
valor más alto, mientras que los hatchbacks de tracción en las cuatro ruedas tienen
el valor más bajo. Una tabla de este formulario no es la más fácil de leer y
tampoco muy fácil de visualizar. Para que sea más fácil de entender, podemos
transformar esta tabla en una tabla dinámica mediante el método pivot. En la tabla
anterior, tanto las ruedas motrices como el estilo de la carrocería eran columnas
de escucha. Una tabla dinámica tiene una variable mostrada a lo largo de las
columnas y la otra variable a lo largo de las filas. Solo con una línea de código y
utilizando el método pivote del Panda, podemos pivotar la variable de estilo de
cuerpo para que se muestre a lo largo de las columnas y las ruedas motrices se
mostrarán a lo largo de las filas. Los datos de precios ahora se convierten en una
cuadrícula rectangular, que es más fácil de visualizar. Esto es similar a lo que
normalmente se hace en las hojas de cálculo de Excel. Otra forma de representar la
tabla dinámica es usar una gráfica de mapa de calor. El mapa de calor toma una
cuadrícula rectangular de datos y asigna una intensidad de color basada en el valor
de los datos en los puntos de la cuadrícula. Es una gran manera de trazar la
variable objetivo sobre múltiples variables y a través de esto obtener pistas
visuales con la relación entre estas variables y el objetivo. En este ejemplo,
utilizamos el método de color p de pyplot para trazar el mapa de calor y convertir
la tabla dinámica anterior en una forma gráfica. Especificamos el esquema de color
rojo-azul. En la gráfica de salida, cada tipo de estilo de cuerpo se numerará a lo
largo del eje X y cada tipo de ruedas motrices se numerará a lo largo del eje Y.
Los precios medios se trazan con diferentes colores en función de sus valores. De
acuerdo con la barra de color, vemos que la sección superior del mapa de calor
parece tener precios más altos que la sección inferior.

También podría gustarte

Examen Modulo Ii - Equipo F
Aún no hay calificaciones
Examen Modulo Ii - Equipo F
30 páginas
Tutorial Tableau
Aún no hay calificaciones
Tutorial Tableau
31 páginas
Pbi DAX Segmentacion Dinamica
Aún no hay calificaciones
Pbi DAX Segmentacion Dinamica
4 páginas
Ejercicios R Ggplot
Aún no hay calificaciones
Ejercicios R Ggplot
19 páginas
Apuntes de Estadística Descriptiva
Aún no hay calificaciones
Apuntes de Estadística Descriptiva
17 páginas
Eda en Python Con Colab
Aún no hay calificaciones
Eda en Python Con Colab
11 páginas
Descriptiva Con Python - Ipynb - Colab
Aún no hay calificaciones
Descriptiva Con Python - Ipynb - Colab
35 páginas
Estadística Descriptiva con Minitab
100% (1)
Estadística Descriptiva con Minitab
32 páginas
Tabla Dinámica Car
Aún no hay calificaciones
Tabla Dinámica Car
3 páginas
U6 - Guía Completa de Visualización Con Python
Aún no hay calificaciones
U6 - Guía Completa de Visualización Con Python
34 páginas
Informe Final Tipo Articulo
Aún no hay calificaciones
Informe Final Tipo Articulo
5 páginas
Estadistica - Graficos en R - Ggplot
Aún no hay calificaciones
Estadistica - Graficos en R - Ggplot
40 páginas
Análisis de Datos en Ingeniería
Aún no hay calificaciones
Análisis de Datos en Ingeniería
13 páginas
Análisis de Datos Básico en Python
Aún no hay calificaciones
Análisis de Datos Básico en Python
5 páginas
2.2. Configuración de Gráficos Dinámicos
Aún no hay calificaciones
2.2. Configuración de Gráficos Dinámicos
4 páginas
Clase 12 Análisis de Datos
Aún no hay calificaciones
Clase 12 Análisis de Datos
19 páginas
Presentación Visualizacion 14052021
Aún no hay calificaciones
Presentación Visualizacion 14052021
44 páginas
Crear Tablas Dinámicas en Excel
Aún no hay calificaciones
Crear Tablas Dinámicas en Excel
17 páginas
Análisis de Datos de Diamantes en Python
Aún no hay calificaciones
Análisis de Datos de Diamantes en Python
81 páginas
Tema 2. Análisis de Datos. Descriptivo y Exploratorio
Aún no hay calificaciones
Tema 2. Análisis de Datos. Descriptivo y Exploratorio
52 páginas
Sklearn - Regresion Lineal, Ejemplo Practico Mitad
Aún no hay calificaciones
Sklearn - Regresion Lineal, Ejemplo Practico Mitad
20 páginas
Símbolos y Conclusiones en Gráficos
Aún no hay calificaciones
Símbolos y Conclusiones en Gráficos
4 páginas
Presentación 1
Aún no hay calificaciones
Presentación 1
8 páginas
Minnki Palsii
Aún no hay calificaciones
Minnki Palsii
6 páginas
Word Gaston Martinez Pensamiento
Aún no hay calificaciones
Word Gaston Martinez Pensamiento
10 páginas
Características de Tablas Dinámicas
Aún no hay calificaciones
Características de Tablas Dinámicas
14 páginas
CODIGOS
Aún no hay calificaciones
CODIGOS
7 páginas
Clasificación y regresión con Random Forest
Aún no hay calificaciones
Clasificación y regresión con Random Forest
61 páginas
Cargar Datos: 1. Click en Visual Dashboard
Aún no hay calificaciones
Cargar Datos: 1. Click en Visual Dashboard
14 páginas
Guía de Análisis y Visualización de Datos
Aún no hay calificaciones
Guía de Análisis y Visualización de Datos
10 páginas
Proyecto Final Fernando Diaz Visualizacion de Resultados en Python Con Jupyter Fernando Fer
Aún no hay calificaciones
Proyecto Final Fernando Diaz Visualizacion de Resultados en Python Con Jupyter Fernando Fer
4 páginas
Gráficos de Tableau - Tipos, Usos y Aplicaciones
Aún no hay calificaciones
Gráficos de Tableau - Tipos, Usos y Aplicaciones
10 páginas
Librerías Clave
Aún no hay calificaciones
Librerías Clave
12 páginas
Apunte Academico 2
Aún no hay calificaciones
Apunte Academico 2
7 páginas
1 Datos y Preprocesamiento
Aún no hay calificaciones
1 Datos y Preprocesamiento
34 páginas
Todo Sobre Las Tablas Dinámicas de Excel
Aún no hay calificaciones
Todo Sobre Las Tablas Dinámicas de Excel
8 páginas
Lección 10 - Cómo Representar Datos Lineales Visualmente
Aún no hay calificaciones
Lección 10 - Cómo Representar Datos Lineales Visualmente
8 páginas
Wuolah Free INFOGRAFIA Y VISUALIZACION DE DATOS
Aún no hay calificaciones
Wuolah Free INFOGRAFIA Y VISUALIZACION DE DATOS
15 páginas
Subtitle (30) Funciones Excel
Aún no hay calificaciones
Subtitle (30) Funciones Excel
3 páginas
Excel
Aún no hay calificaciones
Excel
5 páginas
Esl ES 3
Aún no hay calificaciones
Esl ES 3
43 páginas
Tablas Dinamicas
Aún no hay calificaciones
Tablas Dinamicas
8 páginas
Análisis de Datos con Tablas Dinámicas
Aún no hay calificaciones
Análisis de Datos con Tablas Dinámicas
1 página
CLASE Ejercicios de Medidas de Tendencia Central
Aún no hay calificaciones
CLASE Ejercicios de Medidas de Tendencia Central
33 páginas
Tudashboard Com Tipos-De-Graficas
Aún no hay calificaciones
Tudashboard Com Tipos-De-Graficas
1 página
Visualizar en Tableau
Aún no hay calificaciones
Visualizar en Tableau
58 páginas
Clase 10 - Herramientas de Visualización
Aún no hay calificaciones
Clase 10 - Herramientas de Visualización
83 páginas
Resultados Practica 1
Aún no hay calificaciones
Resultados Practica 1
12 páginas
01 - Agrupamiento de Datos
Aún no hay calificaciones
01 - Agrupamiento de Datos
37 páginas
Spss 8
Aún no hay calificaciones
Spss 8
19 páginas
Encoding Categorical Data (2) - 26-38
Aún no hay calificaciones
Encoding Categorical Data (2) - 26-38
13 páginas
Ejemplos de Gráficos Empresariales
Aún no hay calificaciones
Ejemplos de Gráficos Empresariales
83 páginas
CaC Big Data - Material Imprimible - Librerías - Unidad 3 - Matplotlib
Aún no hay calificaciones
CaC Big Data - Material Imprimible - Librerías - Unidad 3 - Matplotlib
15 páginas
Practica 1 - Estadistica
Aún no hay calificaciones
Practica 1 - Estadistica
18 páginas
Producto Academico 4
Aún no hay calificaciones
Producto Academico 4
12 páginas
Analítica de Datos y Clustering
Aún no hay calificaciones
Analítica de Datos y Clustering
17 páginas
Clase 10
Aún no hay calificaciones
Clase 10
53 páginas
Información General Sobre Tablas Dinámicas y Gráficos Dinámicos
Aún no hay calificaciones
Información General Sobre Tablas Dinámicas y Gráficos Dinámicos
15 páginas
Diagnóstico Electrónico Vehicular
100% (1)
Diagnóstico Electrónico Vehicular
3 páginas
GALANT Instrucciones A4 - (V18) - 1
Aún no hay calificaciones
GALANT Instrucciones A4 - (V18) - 1
2 páginas
Municipalidad Provincial de Castilla: Ubicacion Edwin Gonzalo Perez Carpio
Aún no hay calificaciones
Municipalidad Provincial de Castilla: Ubicacion Edwin Gonzalo Perez Carpio
1 página
Catalogo Crumex 2018
Aún no hay calificaciones
Catalogo Crumex 2018
8 páginas
CVC-001-HSE-FOR-123-01 Check List Pre-Uso de Equipos de Poder - Ok
Aún no hay calificaciones
CVC-001-HSE-FOR-123-01 Check List Pre-Uso de Equipos de Poder - Ok
1 página
Investigación Rueda de Carga de Hamburgo
Aún no hay calificaciones
Investigación Rueda de Carga de Hamburgo
6 páginas
Catálogo de Bicicletas Spiro 2019
Aún no hay calificaciones
Catálogo de Bicicletas Spiro 2019
32 páginas
Evaluación Unidad 01. Derecho Mercantil y Sociedades
100% (2)
Evaluación Unidad 01. Derecho Mercantil y Sociedades
8 páginas
Botas Operarias Reflectivas y Seguras
Aún no hay calificaciones
Botas Operarias Reflectivas y Seguras
2 páginas
INSPECCIÓN PREOPERACIONAL - Planta Eléctrica
Aún no hay calificaciones
INSPECCIÓN PREOPERACIONAL - Planta Eléctrica
1 página
Mapa KzCui
100% (2)
Mapa KzCui
2 páginas
Resumen Materiales Carroceria
100% (1)
Resumen Materiales Carroceria
7 páginas
Reparación Camiones
Aún no hay calificaciones
Reparación Camiones
63 páginas
Motor BGU
100% (1)
Motor BGU
4 páginas
Turbinas Kaplan: Diseño y Funcionamiento
Aún no hay calificaciones
Turbinas Kaplan: Diseño y Funcionamiento
43 páginas
Portafolio de Servicios Transportes Elite Gaitan Sas
Aún no hay calificaciones
Portafolio de Servicios Transportes Elite Gaitan Sas
17 páginas
Gestión de Inventario y Ventas
Aún no hay calificaciones
Gestión de Inventario y Ventas
3 páginas
Funcionamiento del Sistema Hidráulico Cerrado
Aún no hay calificaciones
Funcionamiento del Sistema Hidráulico Cerrado
12 páginas
Preguntas t3
Aún no hay calificaciones
Preguntas t3
5 páginas
Guía Completa del Sensor CKP
Aún no hay calificaciones
Guía Completa del Sensor CKP
9 páginas
N.T. 6009 A ZXX, Y Zd3 Motor Diesel ZD3 - Common Rail - 4 Cilindros - 16 Válvulas
100% (2)
N.T. 6009 A ZXX, Y Zd3 Motor Diesel ZD3 - Common Rail - 4 Cilindros - 16 Válvulas
172 páginas
Diapositivas
Aún no hay calificaciones
Diapositivas
28 páginas
Imforme Senala 5 de Gas
Aún no hay calificaciones
Imforme Senala 5 de Gas
26 páginas
Wa118802 63 hth623c Sep20 Spanish
Aún no hay calificaciones
Wa118802 63 hth623c Sep20 Spanish
101 páginas
Optimización de Gases en Motores Automotrices
Aún no hay calificaciones
Optimización de Gases en Motores Automotrices
27 páginas
Formato para Certificación de Vehículos Ligeros Peña Colorada
100% (1)
Formato para Certificación de Vehículos Ligeros Peña Colorada
1 página
Excel 4 - Funciones Basicas-ciclo-I-SUMA-MAX-MIN-PROMEDIO
Aún no hay calificaciones
Excel 4 - Funciones Basicas-ciclo-I-SUMA-MAX-MIN-PROMEDIO
22 páginas
Makita HM1304
Aún no hay calificaciones
Makita HM1304
4 páginas
Adeudo Vehicular y Tenencia 2025
Aún no hay calificaciones
Adeudo Vehicular y Tenencia 2025
1 página
03-1 Sistema Híbrido (Componentes)
100% (2)
03-1 Sistema Híbrido (Componentes)
97 páginas