ESTADISTICA
Concepto.
Es una metodología que nos provee de un conjunto de métodos y procedimientos, para la recolección,
organización, análisis e interpretación de datos, para la toma decisiones en situaciones de incertidumbre. Por
ejemplo estudiar la venta de juguetes, para averiguar que meses del año será más favorable la producción de
ellos.
Clases de estadística:
- Estadística Descriptiva.
Es la que se ocupa de al recolección, organización, presentación, descripción y simplificación de datos.
- Estadística Inferencial.
Es la parte de la Estadística que en base a los resultados del análisis de los datos y a teorías necesarias, pretende
inferir las peculiaridades y las leyes que gobiernan la población de la cuál provienen los datos.
Población y Muestra.
- Población.
Es el conjunto de todos los individuos (características comunes), que se pretenden estudiar. Ejemplo.
Se desea averiguar la edad promedio de los alumnos de las Academias “PRE - U”. del Cusco.
- Muestra.
Es un sub conjunto de la población Ejemplo:
En el mismo ejemplo anterior, solo se considera esta Academia para dicho estudio.
Variables Estadísticas:
- Variable Cualitativa.
Cuando presenta una cualidad, característica o atributo de la población Ejemplo.
La variable “contextura” con posibles valores “gruesa”, “delgada”.
- Variable Cuantitativa.
Cuando los valores que toma son números.
Variable Cuantitativa Discreta.
Cuando toma valores enteros, como: La cantidad de Enfermos del SIDA.
Variable Cuantitativa Continua.
Cuando toma valores fraccionarios como: Tiempo de vida de un foco.
Etapas del Estudio Estadísticos.-
P lanificación
R ecolección de la información
O rganización, Clasificación y presentación de los datos recolectados
A nálisis e Interpretación de los datos.
Presentación de los datos mediante tablas o cuadros.
Supongamos que de 10 familias se saca los siguientes datos sobre la cantidad de hijos que tienen:
4 ; 2 ; 3 ; 3 ; 4 ; 1 ; 2 ; 4 ; 5 ; 3.
Tamaño de la muestra( n ).
Cantidad total de datos ; n = 10
Alcance ( A ).
Es el intervalo cerrado del menor y mayor datos: A = [ 1,5]
Rango (R).
Ó “ recorrido de los datos “, es la diferencia del mayor dato con el menor dato.
R= 5 - 1 = 4
Frecuencia Absoluta ( f i).
La frecuencia absoluta de un valor, es la cantidad de veces que éste se repite.
f 4 = 3 ( el 4 se repite 3 veces) f2=2 ( el 2 se repite 2 veces)
f3=3 ( el 3 se repite 3 veces) f5=1 ( el 5 se repite 1 vez)
Mediana.- (Med).- Es el término central de varios valores ordenados.
Casos:
Si la cantidad de datos es impar: los siguientes 7 valores ordenados.
2 ; 4 ; 5 ; 8 ; 9 ; 11 ; 15.
Med = 8
Si la cantidad de datos es par: Es la Ma de los dos datos centrales; Ej. de 6 valores siguientes: 3 ; 5 ; 6 ; 8 ; 9 ;
12.
Med = Ma ( 6 y 8 )
= ( 6+8 ) / 2
= 7
Mediana para datos agrupados por intervalos de clase:
m n
Med L m Fm1
fm 2
L m : Limite inferior de laclasemediana.
m :Anchodelaclasedelamediana.
n :Total dedatos.
Fm1 : frecuenciaabsolutaacumuladadelaclasequeprecedealaclasemediana.
fm : frecuenciaabsolutadelaclasemediana.
Ejemplo
I xi fi Fi
[60, 63 > 61,5 2 2
[63, 66 > 64,5 6 8 Según se observa existen 20 datos, la mitad de ellos
[66, 69 > 67,5 4 12 serían 10 datos y deben corresponder al intervalo
[69, 72 > 70,5 6 18 [ 66, 69 > que sería la clase mediana
[72, 75 > 73,5 2 20
3 20
Med 66 8 67,5
4 2
Moda (Z ó mod).- Es aquel dato que tiene mayor frecuencia, es decir es él que más veces se repite. Ej.
2;3;4;3;2;3;4;3;2
Mod = 3 ( por que es el que más se repite)
Moda para datos agrupados por intervalos de clase:
d1
Mo L o o
d1 d2
L o :LimiteInferioralaclasemodal.
o :anchodelaclasemodal.
d1:Diferencia entre la frecuencia de la clase modal con la clase anterior.
d2 : Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase siguiente.
Ejemplo
x fi
[ 12, 15 > 10
[ 15, 18 > 15
[ 18, 21 > 25 La clase modal es aquella que tiene la mayor
[ 21, 24 > 20 frecuencia absoluta, en este a caso es [ 18, 21>
[ 24, 27 > 10
10
Mo 18 3 20
10 5
d1 ff3 2 25 15 10
d1 ff3 4 25 20 5
PROBLEMAS RESUELTOS Número de
Edades
Problema 01 Empleados
En una empresa, se hizo el estudio sobre las edades 20 25 12
de los empleados y se obtuvo la siguiente tabla. 25 30 15
30 35 23
35 40 11
40 45 9
Total: 70
Donde A es el porcentaje de empleados con 30 años o
más, B es el porcentaje de empleados con menos de
40 años.
Señale Con la información señalada se puede confeccionar la
AB siguiente tabla.
a) b) c)
Puntaje fi Fi hi % H i%
148,6% 160,8% 180,6%
d) e) 10 15 10 10 11,1% 11,1%
186,4% 164,8% 15 20 15 25 16,7% 27,8%
Solución: 20 25 28 53 31,1% 58,9%
El número de empleados es la frecuencia de cada
intervalo, luego se puede señalar la tabla de 25 30 20 73 22,2% 81,1%
frecuencias respectiva. 30 35 17 90 18,9% 100%
Como se necesitan porcentajes, se determinará la
frecuencia relativa (simple y acumulada) en forma De la tabla:
porcentual, utilizando: A 31,1%
1444 22,2%
4 2 4 4 18,9%
4 4 3 72,2%
frecuencia Suma de las frecuencias relativas
frecuencia de los intervalos donde el puntaje
relativa 100% es mayor a 20
total de datos
%
Luego: (de la tabla)
B 11,1%
Se tendrá la siguiente tabla:
Edades fi Fi hi % H i% Entonces:
20 25 12 12 17,1% 17,1% A B 72,2% 11,1%
25 30 15 27 21,4% 38,5% Rpta.
A B 61,1%
30 35 23 50 32,9% 71,5%
35 40 11 61 15,7% 87,1% Problema 03
Dado el tablero incompleto de la distribución de
40 45 9 70 12,9% 100% frecuencias de las notas de 50 alumnos. Completar el
tablero, con un ancho de clase constante e igual a 2.
Hallamos A, empleados con 30 años según la tabla Señale: ¿cuántos alumnos sacaron un puntaje menor
serían los 3 ultimos intervalos: de 10? y ¿qué porcentaje de alumnos obtuvieron 12 ó
A 32,9% 15,7% 12,9% 61,5% más de 12 pero menos de 16?
Ii xi fi Fi hi %
También se pudo encontrar, señalando los que tienen
menos de 30 años es 38,5% (frec. Relativa [ , 9
acumulada) luego el resto será: [ , 22%
100% 38,5% 61,5%
[ , 11 12
Hallamos B, según la tabla, los que tienen menos de
40 años es 87,1% (frec. relativa acumulada). [ ,
[ , 7
Entonces:
A B 61,5% 87,1% [ , 6%
Rpta. a) 20 , 30% b) 30 , 20% c) 25% , 25%
A B 148,6% d) 20 , 25% e) 30 , 25%
Solución:
Problema 02 Conocido el ancho de clase constante y una de
La siguiente tabla muestra el número de jóvenes que 2
obtuvieron los puntajes señalados en una prueba de las marcas de clase se puede indicar:
ingreso. x3 11
Número de 1) Las demás marcas de clase, ya que se
Puntaje diferencian en el ancho de clase, así:
J óvenes , , ,
10 15 10 x1 7 x 2 9 x3 11 x4 13
15 20 15 ,
x5 15 x6 17
20 25 28
25 30 20 2) Los límites de cada clase, ya que la marca de
30 35 17 clase es la semisuma de los límites superior e inferior
y la diferencia de los mismos es el ancho de clase así:
LS LI
Donde A es el porcentaje de jóvenes con puntaje 11
mayor a 20. 2 L S 12, L I 10
B es el porcentaje de jóvenes con puntaje menor a 15. L S L I 2
Halle .
AB Conocido , se determina las demás conocidas
a) 16,6% b) 61,1% c) 46,4% [10,12
d) 64,6% e) 71,7% las propiedades:
Solución:
a)
f1 F1 9 Del gráfico:
b)
44 26
Fk 50 (tamaño de la población) 2
De donde:
Además: 4
c)
h2 22% f2 50 22% 11 Con el cual se conocerá los límites de clase y las
marcas de clase respectivas.
d)
h6 6% f6 50 6% 3 Según la tabla:
e)
ff1 2 ff3 4 ff5 6 50 f4 8 h1 8,75% f1 80 8,75% 7 F1
Se completa la tabla: h5 18,75% f5 80 18,75% 15
Ii xi fi Fi hi %
También:
[6, 8 7 9 9 18%
F2 F1 ff2 20 7 13
[8,10 9 11 20 22% 2
[10,12 11 12 32 24% ff1 2 ... f5 80 f4 25
[12,14 13 8 40 16%
Se tendrá la siguiente tabla:
[14,16 15 7 47 14%
Ii xi fi Fi hi %
[16,18 17 3 50 6%
[26,30 28 7 7 8,75%
De ella se puede indicar que:
[30,34 32 13 20 16,25%
– Hay 20 alumnos con puntaje menor a 10
[34,38 36 20 40 25%
– Hay 30% que sacó más de 12 pero menos de
16 [38,42 40 25 65 31,25%
[42,46 44 15 80 18,75%
Rpta.
20 y 30%
Se observa:
– 7 empleados tienen menos de 30 años,
Problema 04 entonces tendrán más de 30 años.
Dada la siguiente tabla incompleta, de las frecuencias 80 7 73
de las edades de 80 empleados: – Poseen menos de 42 años
Ii xi fi Fi hi % H 4 %
[26, 8,75% 8,75% 16,25% 25% 31,25% 81,25 %
[ , 20 Rpta.
73 ; 81,25%
[ , 20
[ ,
[ , 44 18,75% Problema 05
La tabla muestra la distribución de pesos
Siendo el ancho de clase constante, encontrar: correspondientes a 40 estudiantes, con un ancho de
a) ¿Cuántos empleados tienen más de 30 años? clase constante.
b) ¿Qué porcentaje del total de empleados Pesos Kg xi fi hi
poseen menos de 42 años? [ , > 56,5 0,10
a) b) [ , > 5
37 ; 81,25% 37 ; 18,75% [ , >
c) d)
37 ; 31,25% 73 ; 81,25% [ , > 65,5
e) [ , > 7
26 73 ; 18,75% [ , > 0,15
44 Señale la cantidad de estudiantes que pesan menos
Solución:
Calculamos el ancho de clase constante, ( ), de 67 kg y el porcentaje de estudiantes que pesan
61 kg o más pero menos de 70 kg.
colocando los intervalos sobre una recta numérica: a) 27 y 60% b) 13 y 60,5% c) 27 y 61%
d) 13 y 62% e) 27 y 62,5%
2Solución:
Nótese que las marcas de clase, están igualmente
distanciadas, gráficamente:
Se obtiene
x4 x1 3
x3 x4x2 x1
56,5
65,5
Ingreso fi Fi
[ , > 35
Resolviendo: [ , 240>
65,5 56,5 3 3
[ , > 45 120
De donde:
, [ , > 157
x 2 59,5 x3 62,5 [280, >
y
x5 68,5 x6 71,5 [ , > 20
¿Cuántas familias tienen un ingreso comprendido
Los intervalos de clase se obtienen según las marcas entre 230 y 300 soles?
de clase y el ancho de clase a) 100 b) 120 c) 125
3 d) 130 e) 152
Así: Solución
x1 56,5 I1 [L 1,L 2 Si la distribución de frecuencias se ha realizado con un
ancho de clase constante, se tendrá:
L1 L 2 I2 [a,240 240 a
56,5
2 L 1 55 L 2 58 I3 [240,b b 240 ...()
L 2 L 1 3 I4 [b,c c b ...()
I1 [55,58 I5 [c,d [280,d> c 280
Sumando
Se puede indicar:
I 2 [58,61 , etc.
c 240 280 240 2
Lugo, conocidos: y
h1 0,10 h6 0,15 20
Se halla: Se obtiene:
,
f1 0,10 40 4 I1 [200,220 I 4 [260,280
f6 0,15 40 6 ,
I 2 [220,240 I 5 [280,300
Podemos señalar la siguiente tabla: ,
Pesos Kg fi I 3 [240,260 I 6 [300,320
Además:
[55,58> 4
f1 F1 35
[58,61> 5
F3 f3 F2 F2 120 45 75
[61,64> a F2 f2 F1 f2 75 35 40
[64,67> b F4 f4 F3 f4 157 120 37
[67,70> 7
[70,73> 6 6
n fi 200 35 40 45 37 f5 20
Como: i1
6
f5 23
fi 40
i 1 Se tendrá:
4 5 a b 7 6 40
Ingreso fi
a b 18
[200,220> 35
Se pide, % de estudiantes comprendidos entre [220, 240> 40
esto será:
[60,70 [240,260> 45
a b 7 25 [260,280> 37
% 100% 100%
40 40 [280,300> 23
% 62,5% [ 300,320> 20
Pesan menos de 67 Total Pesan más de 67 Se desea conocer cuantas familias tienen un ingreso
entre 230 y 300 soles.
Pesan menos de 67 40 7 6 De
Pesan menos de 67 27 I 2 [220,240
Rpta. Se considera:
27 y 62,5%
220 230 240
Problema 06
Dada la siguiente distribución de frecuencias en base
al ingreso familiar de 200 familias: Finalmente:
Número de
Familias 20 45 37 23
40 familias
Rpta. Luego:
Número de m 14, 27, 40, etc.
Familias 125
Pero el enunciado: “… los que tienen 42 años o más
son menos de 20 de los cuales 3 son casados…” se
Problema 07 identifica sólo se admite y luego
Dada la siguiente distribución de frecuencias, en base 3 m 20 m 14
a las edades de 120 personas. Se conoce que los que .
tienen 42 o más años, son menos de 20, de los cuales n 6
3 son casados. Ii fi
Ii xi fi Fi [26,30> 24
[ , > 28 4n [30,34> 24
[ , > 8n [34,38> 30
[ , > 5n [38,42> 28
[38 , > 2m [42,46> 14
[ , > m Nos piden hallar:
¿Cuántos tienen entre 28 y 32 años?
a) 20 b) 22 c) 24 f2 f124
24
d) 18 e) 16
32
30 34Solución:
28 26 Se tendrá: Rpta.
a) Hallando los intervalos de clase: 12 12 24
Problema 08
2 Se conoce la siguiente distribución en base a los
pesos de 80 niños.
28 38 Pesos fi
2
[17 , 20 7
Del gráfico se plantea: [20 , 23 18
, luego:
4 [23 , 26 5 a
28 38
2 [26 , 29 12
Primer intervalo: [29 , 32 2 a
I1 [28 ,28 [32 , 35 8
2 2
Luego de reemplazar “ ”: ¿Cuántos niños tienen pesos comprendidos entre 21 y
28kg?
I1 [26,30 a) 55 b) 52 c) 50
d) 45 e) 25
,
Solución:
I 2 [30,34 I 3 [34,38
Conocido:
, k
I 4 [38,42 I 5 [42,46 fi Total de datos
i 1
b) Completando las frecuencias absolutas: 6
Se conoce del cuadro se tendrá: fi 80
F2 ff2 i1
1
7 18 5a 12 2a 8 80
8n f2 4n Resolviendo:
f2 4n a 5
Además: Nos piden la cantidad de niños entre 21 y 28kg.
Total
64 7 de4
datos
8 6
120 fi
y i 1
f4 12f3niños
25 niños f2 18 niños
ff
} 1 }2}ff3 }4 f}5
4n 4n 5n 2m 2 120 x
13n 3m 120
Despejando n: 21 23 26 29
120 3m 3m 3 Cantidad de niños
n 9
13 13 28
Veamos por partes:
Como “n” es entero, también es entero.
3 m 1
13
i) Del segundo intervalo se sabe que Hk 1
20 , 23
15m 1
hay 18 niños , pero se desea a partir de 21.
1
f2 m
15
18 Además: , pero: , o sea:
23 20 18 1 H 1 h1
20 23 H1 m
23 21 x 15
x
x 12 1
21 23 h1
15
ii) El tercer intervalo es considerado en su 1
totalidad, 25 niños. f1 60 4
15
iii) hay 12 niños, pero se desea hasta
26 , 29 También: como: , entonces:
28, luego. 11 f5 9
H 4 11m
12 15
29 26 12 9
26 29 h5
28 26 y 60
y
y 8
26 28 H 5 h5 H 4
De (i), (ii) y (iii): 53
H5
Total: Rpta. 60
12 25 8 45
Encontramos :
Problema 09 h6 H 6 h6 H 5 1
Dada la siguiente distribución de frecuencias, de 7
ancho constante. Señale cuantos valores se h6 f6 7
60
encuentran comprendidos en el intervalo
20 , 30 Finalmente:
Ii fi
Ii fi Hi
[10,15 4
, 15
[15,20 10
, 10 [20,25 f3
, [25,30 f4
, 11m [30,35 9
, 9 [35,40 7
35 , 15m
No se conoce y pero se desea conocer aquellos
Total 60 f3 f4
a) 20 b) 30 c) 40 que están en es decir:
d) 25 e) 35 [20,30
ff3 4 x
Solución:
anchoa) Se conoce: De la tabla:
de clase y
I1 [ , 15 > I 6 [ 35 , > 4 10 x 9 7
Luego:
10 20 30 40
Total es: Rpta.
II65 I4 I3 I2 I1 35 15
60 14 x 16 X 30
Problema 10
Se observa:
Se tiene la siguiente tabla de frecuencias relativas de
15 35 200 personas, según el tiempo de años de servicio en
5 una fábrica:
Entonces: Tiempo hi
I1 [10,15 [2 5 0,150
I 2 [15,20 [5 8 0,185
I 3 [20,25 [8 11 0,255
M [11 14 0,215
Son conocidos todos los intervalos.
b) es la frecuencia relativa acumulada, luego: [14 17
Hi
¿Cuántos empleados hanx trabajado entre 10 y 15
y a) empleamos entre 10 y 15 años
años? Kg
¿Qué porcentaje tiene 8 ó más años de servicio, pero 39 empleados
43 empleados
51 empleados
menos de 14?
a) 10
Empleados entre 73yempleados,
15 74% b) 37 empleados,
47%
c) 37 empleados, 74% d)
10 10
73 empleados, 8 11 14
47%
e) 43 empleados, 77%
i) De :
Solución: I3 11 8 51
x 17
Se conoce: 11 10 x
fi
hi fi 200 hi ii) De :
Total de datos I 5 17 14 39
y 13
15 14 y
se forma la tabla:
Tiempo fi Total buscado:
[2 5 30 17 43 13 73
[5 8 37 b) empleados en , esto es considerar:
[8 11 51 [8,14
[11 14 43 ,
[14 17 I 3 [8,11 I 4 [11,14
no se conoce , pero: # de empleados 51 43 94
f5
5 94 94
fi Total de datos Porcentaje 100%
100% 47%
Total 200
i1
30 37 51 43 f5 200 Se tendrá finalmente:
f5 200
Rpta.
73 empleados y 47%