DATOS y AZAR-2
MEDIDAS DE DISPERSIÓN DE UNA MUESTRA ESTADISTICA
Dispersión es el grado de variación de los datos con respecto a las medidas centrales, indica si la distribución o
conjunto de datos es un grupo homogéneo (menos disperso) o heterogéneo (más disperso).
Dos conjuntos de datos pueden tener las mismas medidas de tendencia central, pero diferir mucho en términos
de dispersión.
Ejemplo:
1) 2,2,2,2,2 x= 2 (Homogéneo)
2) 1,1,2,3,3 x = 2 (Heterogéneo)
Una alta dispersión indica que las medidas de tendencia central que representan a los datos no son muy
confiables.
Las medidas de dispersión a estudiar son:
Rango
Varianza
Desviación estándar.
1. RANGO(R): El rango es la diferencia positiva entre el valor máximo y el valor mínimo de un conjunto de datos.
Si los datos están agrupados en intervalo, el rango o recorrido es la diferencia entre el límite superior del último
intervalo y el límite real inferior del primer intervalo.
2. VARIANZA ( 2 ): La varianza se define como el promedio aritmético de las diferencias entre cada uno de los
valores y la media aritmética del conjunto de datos elevadas al cuadrado. Su símbolo es 2 .
Datos en lista Datos en tabla, no agrupados Datos en tabla agrupados como
intervalos
n n n
( xi x ) 2 f i ( xi x) 2 f i (Ci x) 2
2= 1
2= 1
2 1
n n n
xi :dato xi :dato ci :marca de clase del intervalo
x :media aritmética x :media aritmética x :media aritmética
n: total de datos fi : frecuencia absoluta fi : frecuencia absoluta
n: total de datos n: total de datos
1
3. DESVIACIÓN TÍPICA O ESTÁNDAR ( ): Es la raíz cuadrada de la varianza. Es más usada que la anterior, ya que
tiene las mismas unidades de la variable estudiada. Es una medida de la desigualdad de los datos.
var ianza 2
Observaciones:
(1) Cuando a todos los datos se le suma o resta una misma constante k , la varianza y desviación típica se
mantienen invariables.
(2) Si un conjunto de datos de varianza 2 y desviación estándar se multiplican o dividen todos por
una misma constante k ,la nueva varianza corresponde a k2∙ 2 y la nueva desviación típica es K∙
(3) Si todos los datos tienen igual valor varianza= desviación típica =Rango =0
(4) Siempre 0 , 2 0
(5) Si = 0 ó = 1 entonces = 2
EJERCICIOS:
1. Si las edades, en años, de una población de 6 niños son 3, 5, 6, 7, 8 y 13, entonces su desviación
estándar, en años, es
14 14 58 58
A) 10 B) C) √ 6 D) √ 6 E)
6 6
2. Se puede determinar que la desviación estándar de los datos de un conjunto A es mayor que la desviación
estándar de los datos de un conjunto B, si se sabe que:
(1) El rango de A es mayor que el rango de B.
(2) La media de los cuadrados de los datos de A es mayor que la media de los cuadrados
de los datos de B.
A) (1) por sí sola
B) (2) por sí sola
C) Ambas juntas, (1) y (2)
D) Cada una por sí sola, (1) ó (2)
E) Se requiere información adicional
2
MEDIDAS DE POSICIÓN DE UNA MUESTRA ESTADÍSTICA
Son los datos que dividen a la muestra en varias partes iguales, para encontrarlos es necesario ordenar los datos
en forma creciente . Sólo se pueden obtener para variables cuantitativas. Las medidas más usadas son los:
•Cuartiles: Corresponden a los 3 datos que dividen a la muestra en cuatro partes iguales. Se representan como
Q1,Q2 y Q3 y representan al dato que supera al 25%,50% y 75% de las n observaciones respectivamente.
Q1 Q2 Q3
1
Dato que supera
al 75% del total
Dato que supera
Dato que supera
al 25% del total
al 50% del total
obs. (1) Rango Intercuartilíco = Q3 - Q1
k (n 1)
(2) Qk dato ubicado en la posición donde k es el orden del cuartil . Si la posición calculada
4
no corresponde a un entero, el cuartil se calcula como e l promedio de los datos que están a la izquierda y a la
derecha.
Por ejemplo:
(1) Dado el conjunto de datos 1,3,3,4,4,5,5,6,6,6
Q1= 3
Q2= 4,5
Q3= 6
(2) Dado el conjunto de datos 1,1,3,4,4,5,5,6,6
Q1= 2
Q2= 4
Q3= 5,5
Veamos el siguiente ejercicio tipo PSU, publicado por el DEMRE.
3
¿Cuál de los siguientes gráficos representa a un conjunto de datos con media igual a 5 y primer cuartil igual a 2?
4
•Deciles : Corresponden a los nueve datos que dividen a la muestra en 10 partes iguales. Se representan como
D1,D2 …….D9 y representan al dato que supera al 10%,20% , 90 % del las n observaciones.
k
D se encuentra en la posición que iguala o supera al número (n 1) , donde k es el orden del decil.
10
D1 D2 D3 D4 D5 D6 D7 D8 D9
Dato que supera al 10% de total
Ejemplo: Dado el conjunto de datos 1,1,3,3,3,3,4,5,5,5,6,6,6,6,6,6,6 ,6,6,7
D4=5
Percentiles: Corresponden a los 99 datos que dividen a la muestra en 100 partes iguales. Se denomina percentil
de orden k ,al dato que supera al k% de las n observaciones, se escribe Pk y corresponde a la posición
k
(n 1)
100
Ejemplo:
Dada la tabla de frecuencia
Peso (kg) Frecuencia
¿Cuál es el valor del percentil 70?
40 120
50 150
61 130
72 99
5
EJERCICIOS
1. Dados los datos: 6, 5, 4, 3, 6, 6 la desviación típica es:
2 3 3 2 4
A) B) C) 1 D) E)
3 2 3 3
2. Si en un conjunto de datos todos ellos tienen el mismo valor numérico, entonces ¿cuál(es) de las siguiente(s)
afirmaciones respecto de esos datos es(son) siempre verdadera(s)?
I) La Media aritmética es cero
II) La desviación estándar o típica es cero
III) Mediana - Moda = 0
A) Solo I B) Solo II C) Sólo III D) Sólo I y II E) Sólo II y III
3. ¿Cuál(es) de las siguientes afirmaciones es (son) siempre verdadera(s)?
I. Si todos los datos numéricos de una población son iguales, entonces la varianza de esta población es 0.
II. Si dos poblaciones de datos numéricos tienen igual promedio, entonces sus varianzas son iguales.
III. Si todos los datos numéricos de una población difieren en una unidad con respecto a su promedio,
entonces la varianza de esta población es 1.
A) Solo I
B) Solo II
C) Solo I y II
D) Solo I y III
E) I, II y III
6
4. A dos cursos distintos se les aplicó la misma prueba en iguales condiciones, obteniéndose las desviaciones
estándares que se muestran en la tabla adjunta. ¿Cuál(es) de las siguientes afirmaciones es (son)verdadera(s)?
I) El curso Q es el más homogéneo.
II) El curso R es el más homogéneo. CURSO PROMEDIO DESVIACIÓN
III) El curso Q presenta mayor dispersión en las notas. ESTÁNDAR
Q 4,6 1
A) Sólo I R 5,2 0,8
B) Sólo II
C) Sólo III
D) Sólo II y III
E) Ninguna de ellas
5. De acuerdo a los 100 datos de la tabla adjunta, ¿cuál(es) de las siguientes afirmaciones es (son verdadera(s)?
I) El primer cuartil se ubica en el intervalo [45,50]
II) El intervalo donde se ubica el percentil 50 coincide con el intervalo modal.
III) La cantidad de datos que se encuentran en el cuarto intervalo corresponden a un 10% del total de los datos
A) Solo III
B) Solo I y II
C) Solo I y III
D) Solo II y III
E) I, II y III.
6. La tabla adjunta muestra algunos de los datos que resultan de encuestar a un grupo de adultos mayores
sobre la edad que tienen. Con respecto a los datos de esta tabla, ¿cuál de las siguientes afirmaciones es
FALSA?
A) La marca de clase del segundo intervalo es 64,5 años.
B) El rango de la variable edad es 15 años.
C) La moda es 42.
D) La mediana se encuentra en el intervalo [66,69]
E) La frecuencia relativa porcentual del último intervalo es 8%.
7
7. Los cuartiles Q1, Q2, Q3 del siguiente grupo de datos 8,12,14,21,24,32,33,44,47,48 son respectivamente:
Q1 Q2 Q3
A) 44 28 14
B) 13 28 45,5
C) 14 32 47
D) 12 24 44
E) 8 28 48
8. ¿Cuál de las siguientes opciones es FALSA?
A) Una desviación estándar pequeña significa que los datos están concentrados muy cerca de la media
aritmética.
B) Una desviación estándar grande indica poca confianza en la media aritmética.
C) La desviación estándar puede ser cualquier número real no negativo.
D) Dos muestras con igual número de datos y con la misma media aritmética, tienen desviaciones estándar
iguales.
E) La desviación estándar siempre se mide en las mismas unidades que los datos
9. Si a, b y c son tres números enteros cuya desviación estándar es , entonces la desviación estándar de n∙a,
n∙b y n∙c, con n un número entero positivo, es :
A) n2 B)
C) n D) n
E) 3n
10. Sea el conjunto A formado por los elementos a1,a2,a3,a4 ,a5 y a6 ,con desviación estándar y varianza
2 ¿Cuáles de las siguientes afirmaciones es verdadera
A) y 2nunca serán iguales.
B)2 nunca será cero
C) Siempre 2>
D) Si los elementos de A son números impares consecutivos, entonces = 1.
E) Si los elementos de A son números enteros positivos distintos entre sí, entonces es mayor que cero
8
11. De 400 postulantes a una carrera universitaria ,Diego que tiene 640 puntos quedó en el percentil 76
mientras que Luis con 730 puntos está en el percentil 92. Entonces es verdadero que:
A) Hay 76 postulante con puntajes inferiores a 640
B) Hay 92 postulante con puntajes inferiores a 730
C) Hay 16 postulante con puntajes inferiores a 730 pero superiores a 640
D) Diego está sobre el 76% del total de postulantes.
E) Diego es superado por 24 postulantes.
12. Entre 1000 alumnos que dan La PSU de Matemática Juan obtuvo 800 puntos y está en el percentil 98.
¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)?
I) Juan superó al 98% de los alumnos
II) 20 alumnos obtuvieron un puntaje mayor a 800 puntos.
III) 980 alumnos tienen puntajes entre 300 y 800
A) Sólo I B) Sólo II C) Sólo I y II D) Sólo II y III E) Todas
13. La tabla muestra el tiempo en horas dedicadas a estudiar de un grupo de estudiantes del preuniversitario.
¿Cuál de las siguientes afirmaciones es verdadera?
A) El primer cuartil es 120 Horas de estudio Número de estudiantes
B) El segundo cuartil es 145 1 120
C) El percentil 80 es 135 2 145
D) El primer decil es 1 3 135
E) El percentil 80 es 2 4 100
14. Lo siguientes datos corresponden a la cantidad de mascotas que tienen 18 familias.
0,0,3,5,7,7,1,4,3,5,2,2,2,1,2,5,2,0
¿Cuál(es) de las siguientes proposiciones es(son) verdadera(s)
I) La mediana es igual a la moda
II) El segundo decil es 0
III) El tercer cuartil es 3
A) Sólo I B) Sólo II
C) Sólo III D) Sólo II y III E) Ninguna de ellas
9
15. Se realizó una encuesta a 500 alumnos, respecto de los deportes praticados, los resultados se muestran en
el gráfico circular:
¿Cuál es la
afirmación es falsa? 36
otros
28% futbol
tenis
natacion
72
I) El fútbol lo pratican 210 alumnos
II) La moda es practicar tenis
III) Practicar tenis corresponde al percentil 20
A) Sólo I
B) Sólo II
C) Sólo I y III
D) Sólo II y III
E) Ninguna de ellas
16. Para calcular el percentil 30 de una distribución , se necesita:
(1) La tabla de distribución de frecuencias
(2) El número total de observaciones.
A) (1) por sí sola
B) (2) por sí sola
C) Ambas juntas, (1) y(2)
D) Cada una por sí sola, (1) ó(2)
E) Se requiere información adicional
RESPUESTAS DE DATOS Y AZAR -2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Pag-2 D E
Pag-4 E
Pag-6 E E D D E C B D D E D A D A D A
10