0% encontró este documento útil (0 votos)
24 vistas37 páginas

Métodos Estadísticos: Análisis Univariado

El documento aborda el análisis descriptivo univariado de datos, destacando la importancia de tabular y graficar para identificar patrones, tendencias y anomalías. Se presentan diferentes métodos de visualización, como histogramas, gráficos de barras y gráficos de caja, así como estadísticos de resumen como media, mediana y moda. Además, se discuten medidas de variabilidad y forma, como el coeficiente de asimetría y curtosis, para proporcionar un análisis integral de los datos.

Cargado por

Richard Quiroga
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
24 vistas37 páginas

Métodos Estadísticos: Análisis Univariado

El documento aborda el análisis descriptivo univariado de datos, destacando la importancia de tabular y graficar para identificar patrones, tendencias y anomalías. Se presentan diferentes métodos de visualización, como histogramas, gráficos de barras y gráficos de caja, así como estadísticos de resumen como media, mediana y moda. Además, se discuten medidas de variabilidad y forma, como el coeficiente de asimetría y curtosis, para proporcionar un análisis integral de los datos.

Cargado por

Richard Quiroga
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Diplomado de Métodos

Estadísticos y Aplicaciones - 2024


Mónica Bravo
Carolina Honores
Matías Esquivel
Descriptiva univariada

Datos muestrales:

Surgen interrogantes como:


• ¿Cuál es el mínimo? ¿Cuál es el máximo?
• ¿Cómo están distribuidos? ¿Muestran algún patrón?
• ¿Hay alguna tendencia? ¿Habrá datos atípicos?
• ¿Cómo agruparlos? ¿Cómo resumirlos?
• ¿De qué forma se pueden visualizar? ….
Descriptiva univariada

Depende de la cantidad de variables consideradas, el


análisis de datos puede ser univariado, bivariado o
multivariado.

¿Cómo describir una variable de una muestra aleatoria


simple de manera inicial?
1. Tabular y graficar en para determinar la distribución
de los datos muestrales.
2. Se busca también detectar posibles anomalías
2. Calcular estadísticos de resumen para conocer otras
características de interés (solo si la variable es de tipo
numérica)
Descriptiva univariada

Tabular y graficar con una variable


Descriptiva univariada

Tabla de frecuencias con una variable:

Tabla de Frecuencia
tabla 1

tabla 2 Tabla de Frecuencia


Descriptiva univariada

Tabla de frecuencias con una variable:

Tabla de Frecuencia
tabla 1

tabla 2 Tabla de Frecuencia

Si la variable es nominal, NO acumular


Descriptiva univariada

Comentarios:
- No confundir la variable con frecuencia absoluta.

- Un gráfico asociado a la frecuencia (absoluta o %)


ayuda a observar la distribución de la variable.

- Si la variable es de tipo cualitativa nominal, no


acumular. En el ejemplo anterior: no tiene sentido leer
o interpretar el valor, por ejemplo “91”.
Descriptiva univariada

Algunos gráficos para


una variable:
Descriptiva univariada

¿Para que tipo de variables?

Histograma
Barras

Para variable continua


Para variable categórica con intervalos
Descriptiva univariada

Nota:
En el caso de una variable categórica (cualitativa)
normalmente realizamos un gráfico de barras. Sin em-
bargo no siempre es el más apropiado ….

• Si la variable es ordinal, el grafico de barras es muy


adecuado ya que permite observar tendencias en
caso de haberla.

• Si la variable es de tipo nominal, el gráfico de barras


puede tener formas diferentes (al cambiar el orden
de las categorías). En cada uno de estos podía haber
una tendencia diferente?
Descriptiva univariada

Ejemplo caso de variable nominal …

En este caso, es mejor


un gráfico circular!
Descriptiva univariada

En el caso de un histograma se puede observar la


distribución de los datos y determinar la ubicación del
“centro”
Descriptiva univariada

Pareto (para variable cualitativa nomimal)


Suponga la siguiente tabla de frecuencia sobre la
opinión de los clientes de un hotel:
Descriptiva univariada

Finalmente, el gráfico de Pareto queda:

eje eje
Descriptiva univariada

El objetivo del análisis del gráfico de Pareto es utilizar los


hechos para identificar la máxima concentración de
potencial del efecto en estudio (magnitud del costo,
del problema, del tiempo…)

• Pocos vitales (son las pocas


contribuciones que acumulan
el 80% del problema)
• Muchos triviales (son muchas
contribuciones que aportan el
20% al problema)
Descriptiva univariada

Gráfico de puntos (para muestra pequeña)


Se ubica cada dato en el eje de los reales (cada punto
es un dato). Muestra la distribución de éstos.

 n° de veces que ingresa


a internet al día.
Descriptiva univariada

Gráfico de tallo y hoja (muestra numérica pequeña)


Se grafica con los mismos datos. Muestra la distribución
de éstos.
Descriptiva univariada

Gráfico de caja y de violín

Muestran la distribución de los datos


de una variable continua

violín

De caja
Descriptiva univariada

Resumen numérico
Descriptiva univariada

Resumen numérico (para variable cuantitativa):

a) Estadísticos de centro (media, moda, mediana)

Media  centro de gravedad de los datos.


Mantiene equilibrada la suma de las
distancias de los datos y la media, en
ambos lados de ésta.
Mediana  dato que acumula el 50% de los que
son inferiores a él.
Moda  dato con mayor frecuencia
Descriptiva univariada

La media se ve afectada por variaciones pequeñas o


grandes y por tanto, es un estadístico sensible.
La mediana en cambio, es un estadístico robusto.
Descriptiva univariada

Suponiendo un conjunto unimodal, la distribución de


los datos puede ser:
Descriptiva univariada

Ejemplo 1:

𝑝̂

Media > Mediana


asimetría a la derecha

𝑝̂
Descriptiva univariada

Ejemplo 2:

Mediana Media
Descriptiva univariada

b) De posición: en datos ordenados

• Cuartiles: separa grupos con 25% de datos c/u(son 3).


• Quintiles: separa grupos con 20% de datos c/u (son 4).
• Deciles: separa grupos con 10% de datos c/u (son 9).
• Percentiles: separa grupos de 1% de datos c/u(son 99)

En general, un cuantil se define como:


Sea , entonces, el -ésimo cuantil es un
valor tal que el % de los datos son al menos menores o
iguales que él, y el % restantes son mayores o
iguales él.
Descriptiva univariada

Los grupos generados contienen el mismo porcentaje


de datos, pero no necesariamente la misma dispersión.

(en cada grupo hay 3 datos. = cuartiles)

Relacionado con los cuartiles  gráfico de caja


Descriptiva univariada

El gráfico de caja proporciona información sobre la


dispersión, localización, y sesgo de un conjunto de
datos.
Permite además, detectar empíricamente, posibles
datos anómalos o atípicos mediante la siguiente regla:

Si dato < C1 – 1,5 (C3 – C1)  posible anómalo


Si dato > C3 + 1,5 (C3 – C1)  posible anómalo

Ejemplo 1: 20 datos
Descriptiva univariada

límite inferior = 32,75 límite superior = 54,75

32 41 43,5 46,5 51
Descriptiva univariada

Ejemplo 3:

¿qué deduce?
Descriptiva univariada
Descriptiva univariada

c) De variabilidad:

• Rango: Máx – Min (estadístico sensible)

• RIC: Cuartil 3 – Cualtil 1 (dispersión del 50% central en


datos ordenados)

𝟐
• : Promedio de distancias cuadráticas respecto de
la media. Se denomina Varianza muestral.
𝟐 ∑( )
Descriptiva univariada

• : raíz de la varianza, llamada desviación estándar.

• Coeficiente de variación: mide variabilidad entre


conjuntos diferentes de datos, aun cuando tengan
diferentes unidades de medida: Cv =

Las desviaciones estándar no son comparables


entre grupos a menos que los datos estén en la
misma unidad y tengan la misma media.
Descriptiva univariada

Ejemplo Cv

Ejemplo 1 Media Desv. Estándar


Muestra 1 4,5 ml. 0,6 ml.
Muestra 2 4,5 ml. 0,9 ml.
Si las dos muestras tienen datos medidos en la misma
unidad y con igual media, entonces las desviaciones
estándar son comparables entre sí.

Ejemplo 2 Media Desv. Estándar


Muestra 1 4,5 ml. 0,7 ml.
Muestra 2 5,3 gr. 0,8 gr.

Muestra 1 = 16,2 Muestra 2 = 15,1


Descriptiva univariada

d) De forma:

• Coeficiente de asimetría ( )
Cuantifica la asimetría que se observa cuando media
y mediana se alejan. Hay varias formas de calcular
este indicador, pero su interpretación es la misma:

Si < 0  asimetría a la izquierda.


Si > 0  asimetría a la derecha.
Si = 0  distribución simétrica.
Descriptiva univariada

• Coeficiente de Curtosis:

Indica el apuntamiento (puntudo o plano) del centro


en una distribución unimodal.

Si coeficiente > 0  Leptocúrtica


Si coeficiente = 0  Mesocúrtica
Si coeficiente < 0  Platicúrtica
Descriptiva univariada

En resumen ….un buen resumen gráfico y numérico


aporta mucha información de los datos!
Diplomado de Métodos
Estadísticos y Aplicaciones - 2024
Mónica Bravo
Carolina Honores
Matías Esquivel

También podría gustarte