Diplomado de Métodos
Estadísticos y Aplicaciones - 2024
Mónica Bravo
Carolina Honores
Matías Esquivel
Descriptiva univariada
Datos muestrales:
Surgen interrogantes como:
• ¿Cuál es el mínimo? ¿Cuál es el máximo?
• ¿Cómo están distribuidos? ¿Muestran algún patrón?
• ¿Hay alguna tendencia? ¿Habrá datos atípicos?
• ¿Cómo agruparlos? ¿Cómo resumirlos?
• ¿De qué forma se pueden visualizar? ….
Descriptiva univariada
Depende de la cantidad de variables consideradas, el
análisis de datos puede ser univariado, bivariado o
multivariado.
¿Cómo describir una variable de una muestra aleatoria
simple de manera inicial?
1. Tabular y graficar en para determinar la distribución
de los datos muestrales.
2. Se busca también detectar posibles anomalías
2. Calcular estadísticos de resumen para conocer otras
características de interés (solo si la variable es de tipo
numérica)
Descriptiva univariada
Tabular y graficar con una variable
Descriptiva univariada
Tabla de frecuencias con una variable:
Tabla de Frecuencia
tabla 1
tabla 2 Tabla de Frecuencia
Descriptiva univariada
Tabla de frecuencias con una variable:
Tabla de Frecuencia
tabla 1
tabla 2 Tabla de Frecuencia
Si la variable es nominal, NO acumular
Descriptiva univariada
Comentarios:
- No confundir la variable con frecuencia absoluta.
- Un gráfico asociado a la frecuencia (absoluta o %)
ayuda a observar la distribución de la variable.
- Si la variable es de tipo cualitativa nominal, no
acumular. En el ejemplo anterior: no tiene sentido leer
o interpretar el valor, por ejemplo “91”.
Descriptiva univariada
Algunos gráficos para
una variable:
Descriptiva univariada
¿Para que tipo de variables?
Histograma
Barras
Para variable continua
Para variable categórica con intervalos
Descriptiva univariada
Nota:
En el caso de una variable categórica (cualitativa)
normalmente realizamos un gráfico de barras. Sin em-
bargo no siempre es el más apropiado ….
• Si la variable es ordinal, el grafico de barras es muy
adecuado ya que permite observar tendencias en
caso de haberla.
• Si la variable es de tipo nominal, el gráfico de barras
puede tener formas diferentes (al cambiar el orden
de las categorías). En cada uno de estos podía haber
una tendencia diferente?
Descriptiva univariada
Ejemplo caso de variable nominal …
En este caso, es mejor
un gráfico circular!
Descriptiva univariada
En el caso de un histograma se puede observar la
distribución de los datos y determinar la ubicación del
“centro”
Descriptiva univariada
Pareto (para variable cualitativa nomimal)
Suponga la siguiente tabla de frecuencia sobre la
opinión de los clientes de un hotel:
Descriptiva univariada
Finalmente, el gráfico de Pareto queda:
eje eje
Descriptiva univariada
El objetivo del análisis del gráfico de Pareto es utilizar los
hechos para identificar la máxima concentración de
potencial del efecto en estudio (magnitud del costo,
del problema, del tiempo…)
• Pocos vitales (son las pocas
contribuciones que acumulan
el 80% del problema)
• Muchos triviales (son muchas
contribuciones que aportan el
20% al problema)
Descriptiva univariada
Gráfico de puntos (para muestra pequeña)
Se ubica cada dato en el eje de los reales (cada punto
es un dato). Muestra la distribución de éstos.
n° de veces que ingresa
a internet al día.
Descriptiva univariada
Gráfico de tallo y hoja (muestra numérica pequeña)
Se grafica con los mismos datos. Muestra la distribución
de éstos.
Descriptiva univariada
Gráfico de caja y de violín
Muestran la distribución de los datos
de una variable continua
violín
De caja
Descriptiva univariada
Resumen numérico
Descriptiva univariada
Resumen numérico (para variable cuantitativa):
a) Estadísticos de centro (media, moda, mediana)
Media centro de gravedad de los datos.
Mantiene equilibrada la suma de las
distancias de los datos y la media, en
ambos lados de ésta.
Mediana dato que acumula el 50% de los que
son inferiores a él.
Moda dato con mayor frecuencia
Descriptiva univariada
La media se ve afectada por variaciones pequeñas o
grandes y por tanto, es un estadístico sensible.
La mediana en cambio, es un estadístico robusto.
Descriptiva univariada
Suponiendo un conjunto unimodal, la distribución de
los datos puede ser:
Descriptiva univariada
Ejemplo 1:
𝑝̂
Media > Mediana
asimetría a la derecha
𝑝̂
Descriptiva univariada
Ejemplo 2:
Mediana Media
Descriptiva univariada
b) De posición: en datos ordenados
• Cuartiles: separa grupos con 25% de datos c/u(son 3).
• Quintiles: separa grupos con 20% de datos c/u (son 4).
• Deciles: separa grupos con 10% de datos c/u (son 9).
• Percentiles: separa grupos de 1% de datos c/u(son 99)
En general, un cuantil se define como:
Sea , entonces, el -ésimo cuantil es un
valor tal que el % de los datos son al menos menores o
iguales que él, y el % restantes son mayores o
iguales él.
Descriptiva univariada
Los grupos generados contienen el mismo porcentaje
de datos, pero no necesariamente la misma dispersión.
(en cada grupo hay 3 datos. = cuartiles)
Relacionado con los cuartiles gráfico de caja
Descriptiva univariada
El gráfico de caja proporciona información sobre la
dispersión, localización, y sesgo de un conjunto de
datos.
Permite además, detectar empíricamente, posibles
datos anómalos o atípicos mediante la siguiente regla:
Si dato < C1 – 1,5 (C3 – C1) posible anómalo
Si dato > C3 + 1,5 (C3 – C1) posible anómalo
Ejemplo 1: 20 datos
Descriptiva univariada
límite inferior = 32,75 límite superior = 54,75
32 41 43,5 46,5 51
Descriptiva univariada
Ejemplo 3:
¿qué deduce?
Descriptiva univariada
Descriptiva univariada
c) De variabilidad:
• Rango: Máx – Min (estadístico sensible)
• RIC: Cuartil 3 – Cualtil 1 (dispersión del 50% central en
datos ordenados)
𝟐
• : Promedio de distancias cuadráticas respecto de
la media. Se denomina Varianza muestral.
𝟐 ∑( )
Descriptiva univariada
• : raíz de la varianza, llamada desviación estándar.
• Coeficiente de variación: mide variabilidad entre
conjuntos diferentes de datos, aun cuando tengan
diferentes unidades de medida: Cv =
Las desviaciones estándar no son comparables
entre grupos a menos que los datos estén en la
misma unidad y tengan la misma media.
Descriptiva univariada
Ejemplo Cv
Ejemplo 1 Media Desv. Estándar
Muestra 1 4,5 ml. 0,6 ml.
Muestra 2 4,5 ml. 0,9 ml.
Si las dos muestras tienen datos medidos en la misma
unidad y con igual media, entonces las desviaciones
estándar son comparables entre sí.
Ejemplo 2 Media Desv. Estándar
Muestra 1 4,5 ml. 0,7 ml.
Muestra 2 5,3 gr. 0,8 gr.
Muestra 1 = 16,2 Muestra 2 = 15,1
Descriptiva univariada
d) De forma:
• Coeficiente de asimetría ( )
Cuantifica la asimetría que se observa cuando media
y mediana se alejan. Hay varias formas de calcular
este indicador, pero su interpretación es la misma:
Si < 0 asimetría a la izquierda.
Si > 0 asimetría a la derecha.
Si = 0 distribución simétrica.
Descriptiva univariada
• Coeficiente de Curtosis:
Indica el apuntamiento (puntudo o plano) del centro
en una distribución unimodal.
Si coeficiente > 0 Leptocúrtica
Si coeficiente = 0 Mesocúrtica
Si coeficiente < 0 Platicúrtica
Descriptiva univariada
En resumen ….un buen resumen gráfico y numérico
aporta mucha información de los datos!
Diplomado de Métodos
Estadísticos y Aplicaciones - 2024
Mónica Bravo
Carolina Honores
Matías Esquivel