EL DIAGRAMA DE CAJAS Y BIGOTES
LAURA VANESSA MULFORD CHICO
DANIEL JOSÉ MONTALVO AGUILERA
DANZI PATRICIA RODRIGUEZ ARRIETA
MICHAEL JAFITH RODRIFUEZ QUINTANA
ESTADISTICA DESCRIPTIVA
CORPORACIÓN UNIVERSITARIA RAFAEL NÚÑEZ
ADMINISTRACIÓN DE EMPRESAS
2023
¿Qué es el diagrama de caja y bigotes?
Los diagramas de Caja-Bigotes, también llamado diagrama de caja o boxplot, son
una presentación visual que describe varias características importantes, al mismo
tiempo, tales como la dispersión y simetría.
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más
largos muestran el recorrido intercuartílico. Este rectángulo está dividido por un
segmento vertical que indica donde se posiciona la mediana y por lo tanto su
relación con los cuartiles primero y tercero (recordemos que el segundo cuartil
coincide con la mediana). Las líneas que se extienden paralelas a las cajas se
conocen como «bigotes», y se usan para indicar variabilidad fuera de los cuartiles
superior e inferior. Los valores atípicos se representan a veces como puntos
individuales que están en línea con los bigotes. Los diagramas de cajas y bigotes
se pueden dibujar vertical u horizontalmente.
Los datos se dividen en cuatro partes iguales, separada por punto llamado
cuarteles. Aparte también pueden ver el punto de datos más pequeños, el extremo
mínimo y el punto de datos más grande, el extremo máximo
Un diagrama de caja y bigote se crea por la determinación de cinco puntos.
Primero, ubicaremos los datos en orden de Mail de menor a mayor. Luego
crearemos una línea numérica que demuestra rango de los datos utilizados inter
intervalos iguales. Utilizaremos la mediana como nuestro punto medio en el
diagrama de Ca bigotes y para separar en la mitad de los datos. Luego se calcula
la mediana de cada mitad, el cuartil se separa los datos en cuarto finalmente
utilizamos los datos más alto y los datos más bajo como muestra punta o extremo
la caja se dibujan entre los cuarteles y los bigotes en los extremos.
¿Cómo se llama a un valor cuando se encuentra muy lejos de la mediana?
Solución: Un valor atípico.
¿Cambiará la media o la mediana si se elimina un valor atípico?
Solución: Ambos cambiarían. El valor de la media será diferente, y la media se
verá afectada porque el valor atípico no será calculado como parte del promedio.
¿Un diagrama de caja y bigotes siempre tiene cuartiles?
Solución: Sí. Se organiza alrededor de los cuartiles y la mediana.
Para construir el diagrama de caja, debemos seguir los siguientes pasos:
1. Ordenar los datos.
2. Calcular los tres cuartiles (Q1, Q2 y Q3).
3. Calcular el rango intercuartílico (IQR), que es el tercer cuartil menos el primero.
4. Se identifica el Dato Mínimo y el Dato Máximo.
5. Se realiza el gráfico. Se traza una recta numérica, con una escala adecuada,
dibujamos el rectángulo (caja) cuya base
está determinada por el rango intercuartílico, se ubica desde Q1 hasta Q3,
dibujando entre los dos cuartiles una línea
para indicar dónde está la mediana (segundo cuartil, Q2) y se construyen los
bigotes.
Ejemplo 1:
Distribución de edades
-Tomamos 20 edades de una encuesta
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41
45
-Calculamos los cuartiles
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la
distribución. Como N = 20
resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el
siguiente:
Q1 = (24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el
valor de la variable
que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10; la
mediana es la
media aritmética de dicho valor y el siguiente:
me= Q2 = (33 + 34) / 2 =33,5
Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la
distribución. En nuestro
caso, como 3N / 4 = 15, resulta Q2= (39 + 39) / 2 = 39
20/4 = 5 Q1 = (24 + 25) / 2 = 24,5
20/2=10 me= Q2 = (33 + 34) / 2 =33,5
3(20) /4=15 Q3= (39 + 39) / 2 = 39
-Dibujamos el diagrama de caja-bigotes
Información del diagrama
Podemos obtener abundante información de una distribución a partir de estas
representaciones.
Veamos alguna:
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que
las edades
comprendidas entre el 25% y el 50% de la población está más dispersa que entre
el 50% y el 75%.
El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el
25% de los más
jóvenes están más concentrados que el 25% de los mayores.
El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está
comprendido en 14,5 años.
Comparar distribuciones
La mayor utilidad de los diagramas caja-bigotes es para comparar dos o más
conjuntos de datos.
Comparación distribución de edades
Comparación entrenamientos de un corredor
Comparación clasificación liga
Ejemplo 2:
Cuando Shanda analiza el diagrama de caja y bigotes, se da cuenta que su
tiempo, 11,1 segundos, es apenas más bajo que el primer cuartil. Sabe que su
amiga, Teresa, es muy rápida. A ella ya le han ofrecido becas de atletismo de
grandes universidades. Shanda cree, muy realista, que nunca podrá alcanzar a
Teresa. Otra compañera del equipo, Lisa, se cayó durante la carrera, pero se
levantó y continuó hasta la línea final. Shanda cree que ni las marcas de Teresa ni
las de Lisa son útiles para medir su velocidad. Ella decide mirar los mismos datos,
pero eliminar esos valores atípicos.
Aquí están los nuevos datos.
10.8, 10.9, 11.0, 11.1, 11.3, 11.5, 11.5, 11.6, 11.6, 11.6, 11.6, 11.7, 11.7, 11.7,
12.0, 12.0, 12.2, 12.3
Ella calcula otra vez sus medidas estadísticas y crea un nuevo diagrama de caja y
bigotes.
Extremos: 10,8 y 12,3.
Mediana: 11,6
Primer y tercer cuartil: 11,3 y 11,7.
Cuando se eliminar los dos valores atípicos, Shanda puede ver que la mayoría de
los datos se agrupan muy cercanamente. Su tiempo, 11,1, aún está en el primer
cuartil. Sin embargo, su competición está apretada porque el resto del equipo no
está muy atrás. Está orgullosa de su tiempo y motivada para seguir adelante con
el equipo.
Ejemplo 3:
Paso 1: para determinar la mediana del conjunto de datos, dispone los datos en
orden de menor a mayor. Identifica los valores de datos en el medio del conjunto
de datos. Para este conjunto de datos, la mediana es 102.
89, 91, 95, 98, 102, 108, 110, 118, 152
Paso 2: Identifica la mediana para el cuartil inferior. Otra vez, ya que dos valores
de datos comparten la posición media, encuentra la media. La mediana para el
cuartil inferior es 93.
89, 91, 95, 98_, 102, 108, 110, 118, 152 91+95=186 186÷2=93
Paso 3: Identifica la mediana para el cuartil superior. Recuerda encontrar la media
de los dos valores de datos que comparten la posición media. La mediana del
cuartil superior es 114.
89, 91, 95, 98, 102, 108, 110, 118, 152_ 110+118=228 228÷2=114
Paso 4: Dibuja una línea numérica. El primer valor en la línea numérica debe estar
cerca del número más pequeño en el conjunto de datos. En este caso, el número
más pequeño es 89. Por lo tanto, la línea numérica comenzará en 80. El último
valor en la línea numérica debe estar cerca del número más grande en el conjunto
de datos. El número más grande en el conjunto de datos es 152. Por lo tanto, la
línea numérica terminará en 160. En este caso, etiqueta la línea numérica con
decenas.
El valor más pequeño, 89, se marca con una "I" al final del bigote en el cuartil
inferior. El valor más pequeño, 151, se marca con una "I" al final del bigote en el
cuartil superior.
La mediana del primer, segundo y tercer cuartil se marca con una "+".
¿Para qué sirve un diagrama de caja y bigotes?
el diagrama de caja y bigotes es muy útil para saber los cuartiles, el rango Inter
cuartil, la mediana, los valores extremos y los valores atípicos de una serie de
datos de manera rápida, ya que se pueden identificar todas estas medidas
estadísticas a simple vista.
Además, el diagrama de caja y bigotes sirve para analizar la simetría de la
muestra estadística, pues representa todo el conjunto de datos de manera visual.
Si la mediana no está en el centro de la caja, significa que la muestra no es
simétrica.
Asimismo, los boxplots se utilizan mucho en la bolsa para representar la variación
del precio de una acción durante un periodo de tiempo, ya que permite ver el valor
máximo, el valor mínimo y los valores intermedios en poco tiempo y así tomar
decisiones más rápidas.
BIBLIOGRFÍA
https://sites.google.com/site/probabilidadyestadisticaigf/home/diagrama-de-
caja-bigotes
http://www.innovacionescyc.net/PW10/wp-content/uploads/2021/09/Guia-3er-
Periodo-Estadistica-grado-9%C2%B0.pdf
https://www.probabilidadyestadistica.net/diagrama-de-caja-y-bigotes-
boxplot/