Análisis de Datos de Automóviles: SOLUCIONARIO INBOX
Contexto del Problema
Se recopilaron datos de cientos de automóviles pertenecientes a diferentes marcas, modelos
y años con el objetivo de analizar cómo variables como el tipo de transmisión, el tipo de
combustible y el tamaño del motor influyen en el precio, el rendimiento y otras
características técnicas. Esta evaluación permitirá estudiar tendencias, niveles de asociación
entre variables y la distribución de datos clave para entender mejor el comportamiento del
mercado automotriz.
Descripción de las Variables
car_brands: Marca del automóvil.
model: Modelo específico del auto.
year: Año de fabricación del vehículo.
price: Precio de venta del auto en moneda local.
transmission: Tipo de transmisión.
mileage: Kilometraje acumulado del auto.
fueltype: Tipo de combustible (Bencina, Diésel, Híbrido, Eléctrico).
mpg: Rendimiento de combustible en millas por galón.
enginesize: Tamaño del motor en litros.
Base de Datos: Datos Solemne [Link]
Problema 1: Medidas de tendencia central (20 puntos)
Filtra los datos según el tipo de combustible. Para cada grupo:
1.1 Presente en una tabla la media, mediana y desviación estándar del rendimiento (mpg)
por grupo.
1. 1.2 Realizar los siguientes gráficos:
- Boxplot del rendimiento por tipo de combustible.
- Histograma del rendimiento (mpg).
- Gráfico de barras con la media del rendimiento por marca.
2. 1.3 Concluya:
- ¿Qué tipo de combustible tiene mayor rendimiento promedio?
- ¿Cuál grupo muestra mayor variabilidad en el rendimiento?
- ¿Se observan diferencias relevantes en el rendimiento según el tipo de combustible?
Problema 2: Medidas de posición y dispersión (20 puntos)
Filtra los datos según marca. Para cada grupo:
2.1 Calcular Q1, Q2, Q3 y coeficiente de variación del kilometraje.
3. 2.2 Realizar los siguientes gráficos:
- Boxplot del kilometraje por tipo de transmisión.
- Histograma del kilometraje.
4. 2.3 Concluya:
- ¿Cuál tipo de marca está asociado a mayor kilometraje?
- ¿Dónde hay mayor desigualdad en el kilometraje?
- ¿Se observan patrones distintos en función de la marca?
Problema 3: Medidas de asociación (20 puntos)
Filtra los datos por marca (car brands). Para cada grupo:
3.1 Calcular la correlación de Pearson entre kilometraje y precio.
3.2 Realizar un gráfico de dispersión con línea de tendencia.
5. 3.3 Concluya:
- ¿Mayor kilometraje se asocia con menor precio?
- ¿Varía la relación según la marca?
- ¿Qué marca presenta una relación más fuerte entre estas variables?