Tema 5.
- estadística
-estadística: rama de las matemáticas que se encarga de recopilar y organizar datos (para estudiar
fenómenos)
-población: conjunto de individuos sobre el que se va a estudiar una característica (son todos)
ejemplos
Fenómeno 1: hacer un estudio acerca de la edad de los estudiantes del curso
Población: todos los estudiantes que conforman el curso
Fenómeno 2: hacer un estudio del color preferido de los estudiantes de la universidad
Población: todos los estudiantes de la universidad
Fenómeno 3: hacer un estudio de la intención de voto para las elecciones presidenciales
Población: todas las personas que pueden votar
Fenómeno 4: en una fábrica de fósforos se quiere estudiar qué porcentaje de fósforos que
funcionan
Población: todos los fósforos que fabrica esa empresa
-individuo: o unidad estadística es cada uno de los elementos que componen la población (es
solamente uno)
Ejemplo
Fenómeno 1: el individuo es cada persona del curso a la que se va a preguntar
Fenómeno 2: el individuo es cada estudiante de la universidad al que se va a preguntar
Fenómeno 3: el individuo es cada votante que se vaya a encuestar
Fenómeno 4: el individuo es cada fosforo al que se le va a hacer el estudio
-muestra: un conjunto representativo de la población (una parte de la población)
Se utiliza cuando la población es muy grande o el estudio no se le puede hacer a todos los de la
población
Ejemplo
Fenómeno 1: puede ser todos los estudiantes del curso
Fenómeno 2: de 5000 estudiantes se encuestan 500 estudiantes de la universidad
Fenómeno 3: de un millón de votantes se seleccionan 5000 personas votantes
Fenómeno 4: de un millón de fósforos que se fabrican por hora se seleccionan 100 fósforos de
muestra
-dato: cada uno de los valores obtenidos (respuestas)
Ejemplo
Fenómeno 1: 15 años, 16 años, 15 años, 17 años
Fenómeno 2: azul, rojo, verde, azul, fucsia, turquesa, naranja, rojo, amarillo
Fenómeno 3: fulano, zultano, fulano, mengano, nulo, no sabe
Fenómeno 4: si, no, si, si, si, si, si, si, si, si
-tipos de variables estadísticas
-cualitativas: se refieren a características o cualidades que no pueden ser medidas con números
-nominal: no admite orden. Estado civil, color preferido
-ordinal: si existe orden. Rendimiento
-cuantitativa: se expresa mediante un número, se pueden realizar operaciones con ellas
-discreta: toma un numero finito de valores. Edad, numero de hermanos
-continua: toma un número infinito de valores. Tiempo que se gasta en recorrer los 400m
planos, peso de un balón
-ejercicio:
Deporte favorito: nominal
Medallas ganadoras en una competencia: ordinal
Numero de pantalones de mis amigos: discreta
Primer apellido: ordinal
Peso de compañeros del salón: continua
-tabla de frecuencia acumulada
Edades en una clase
22 19 16 13 18 15 20 14 15 16
15 16 20 13 15 18 15 13 18 15
1 ¿ Rango=R= X max −X min
R=22−13=9
2 ¿ Intervalos ( regla de sturges )=K=1+3.322 log ( n )
K=1+ 3.322 log ( 20 )=5.32=( se aproxima al numero impar )=5
R
3 ¿ amplitud= A=
K
9
A= =1.8=2
5
Tabla de frecuencia
Li−Ls
intervalos : : Ls=Li + A
13−15
Li+ Ls
Marca de clase= X=
2
Frecuencia absoluta f es el número de veces que se repite un dato o el número de veces que
aparecen los datos
f i=numero de datos ǀ Li ≤ dato< Ls
n=∑ f i
fi
frecuencia relativa(hi o f r )=f ri =
n
1=∑ f ri
frecuencia absoluta acumulda=F i=f i + F i−1
clases X f fr F
13-15 14 4 0.2 4
15-17 16 9 0.45 13
17-19 18 3 0.15 16
19-21 20 3 0.15 19
21-23 22 1 0.05 20
n=∑ f i=20=4+ 9+3+3+1
1=∑ f ri =1=0.2+0.45+0.15+ 0.15+0.05
-tabla de frecuencia acumulada por intervalos
Peso en kg de 30 personas
P = {58, 50, 56, 56, 58, 58, 56, 63, 50, 63, 68, 63, 64, 64, 53, 60, 68, 65, 63, 61, 55, 65, 56, 63, 52,
57, 60, 59, 58, 64}
R=68−50=18
K=1+ 3.322 log ( 30 )=5.91=5
18
A= =3.6=4
5
nuevo rango=NR=K∗A
NR=5∗4=20
diferencia de rangos=∆ R=NR−R
nuevo rango menor=NX min =X min −(∆ R/2)
nuevo rango mayor=NX max= X max +(∆ R /2)
∆ R=20−18=2
NX min =50−(2/2)=49
NX max=68+(2 /2)=69
peso X f fr F
49-53 51 3 0.1 3
53-57 55 6 0.2 9
57-61 59 8 0.27 17
61-65 63 9 0.3 26
65-69 67 4 0.13 30
n=∑ f i=30=3+ 6+8+ 9+4
1=∑ f ri =1=0.1+0.2+0.27+ 0.3+0.13
-hallar la media, mediana y moda en datos sin agrupar
La media x es el promedio de todos los datos
La mediana Me una vez ordenadas de menor a mayor o viceversa se escoge el número que está en
la mitad
La moda Mo es el dato que más se repita
Media x=(∑ x i)/n
Edades = 15, 16, 14, 17, 15
15+16+14 +17+15
x= =15.4 años
5
Numero de hermanos = 3, 1, 1, 0, 2, 2, 1, 3, 0
13
x= =1
9
Mediana Me
Si los datos son impares de ordenan y se selecciona el del centro
Edades = 15, 17, 14, 15, 16
14, 15, 15, 16, 17
Me=15años
Si los datos son pares de ordenan y se obtiene la media de los dos centrales
Edades = 13, 15, 14, 16, 14, 15
13, 14, 14, 15, 15, 16
14+15
Me= =14.5 años
2
Moda Mo
Edades= 15, 14, 16, 15, 15, 17
14, 15, 15, 15, 16, 17
Mo=15
Edades= 12, 13, 13, 14, 15, 15, 16
Mo=13, 15 (distribución multimodal)
-media, mediana y moda de datos agrupados en intervalos
x=
∑ Xf
n
n n+1
posicion de Me= ( n= par ) o (n=inpar )
2 2
Se busca la posición de Me en F
Si un F es igual a la posición de Me entonces Me=Ls
posicion de Me−Fi −1
Me=Li + ∗A i
fi
Se aplica en el intervalo que posea el valor de F que siga al valor de la posición de Me
Se busca Mo donde f sea mayor
f i−f i−1
Mo=Li+ ∗Ai
( f i−f i−1 ) +(f i−f i+1 )
Edades X f F Xf
13-15 14 4 4 56
15-17 16 9 13 144
17-19 18 3 16 54
19-21 20 3 19 60
21-23 22 1 20 22
Σ 20 336
x=
∑ Xf = 336 =16.8 años
n 20
20
posicion de Me= =10
2
Se me busca en F=13
Li=15 Fi-1=4 fi=9 Ai=Ls-Li=2
10−4
Me=15+ ∗2=16.33 años
9
Se busca la Mo en f=9
9−4
Mo=15+ ∗2=15.9 años
( 9−4 )+(9−3)
-interpretación de las medidas de tendencia central
Edades de u grupo de amigos
E = {14, 14, 15, 15, 15, 16, 17, 17, 18}
x=15.6
Me=15
Mo=15
x el promedio de … es …
Me el 50% de … es menor o igual a …
Mo … con más frecuencia …
Número de hijos de 50 familias de una ciudad
X f
0 2
1 5
2 20
3 15
4 6
5 1
6 1
x=2.5
Me=2
Mo=2
x el promedio de hijos de las 50 familia es de 2.5
Me el 50% de las familias de la ciudad tiene una cantidad de hijos menor o igual a 2
Mo el número de hijos con más frecuencia en las 50 familias de la ciudad es de 2
Número de horas trabajadas por 130 empleados de una empresa
horas f
55-
5
60
60-
18
65
65-
20
70
70-
50
75
75-
17
80
80-
16
85
85-
4
90
x=72.11horas
Me=72.2 horas
Mo=74.28 horas
x el promedio de horas trabajadas por los 130 empleados es 72.11 horas
Me el 50% de los empleados trabajo un tiempo menor o igual a 72.2 horas
Mo Número de horas trabajadas con más frecuencia por los empleados fue de 74.28 horas
-ejercicio
Numero de hermanos de 30 estudiantes de un curso:
x=3
Me=2.2
Mo=2
Sueldo de los 70 trabajadores de una empresa
x=1000 bs
Me=947bs
Mo=950bs
-ejercicio
Peso de 13 alumnos: 42, 47, 53, 47, 50, 45, 46, 48, 41, 49, 45, 40, 54
-varianza y desviación estándar
Varianza: promedio de los cuadrados de las desviaciones medidas alrededor de la media
2 2
varianza=σ o S
poblacion=σ =
2 ∑ ( X−X )2
n
2 ∑ (X −X )
2
muestra=S =
n−1
Edades 5, 6, 6, 7, 8
X=
∑ X = 32 =6.4
n 5
2 2 2 2 2
(5−6.4) +(6−6.4) +(6−6.4) +(7−6.4) +( 8−6.4 )
poblacion=σ 2= =1.04
5
2 2
σ =1.04 años
2 2 2 2 2
2 (5−6.4 ) +(6−6.4) +(6−6.4 ) +(7−6.4) +(8−6.4)
mestra=S = =1.3
5−1
2 2
S =1. 3 años
Desviación estándar: es una medida de dispersión de los datos (mientras más grande sea la
dispersión mayor será la desviación estándar)
σ =√ 1.04=1.01 años
S= √ 1 .3=1. 14 años
-ejercicio
Peso en kg = 52, 55, 58
-varianza, desviación estándar y coeficiente de variación, de datos agrupados puntualmente
poblacion=σ =
∑ ( X−X )2∗f
2
n
2
muestra=S =
∑ (X −X )2∗f
n−1
x=
∑ Xf
n
σ
Cv= ∗10 0
X
2 2
X (edad) f Xf (X −X ) (X −X ) ∗f
13 3 39 4.7524 14.2572
14 15 210 1.3924 20.886
15 23 345 0.0324 0.7452
16 10 160 0.6724 6.724
17 5 85 3.3124 16.562
18 4 72 7.9524 31.8096
Σ 60 911 90.984
911
x= =15.18
60
2 90.984 2
σ = =1.5164 años
60
σ =√ 1.5164=1.23 años
1.23
Cv= ∗10 0=8.1%
15.18
(si los datos varían más del 25% se puede decir que varían mucho)
-ejercicio
X 2 2
X f ( X −X ) ( X −X ) ∗f
f
10 5
11 6
12 3
-varianza, desviación estándar y coeficiente de variación, de datos agrupados en intervalos
poblacion=σ =
∑ ( X−X )2∗f
2
n
2
muestra=S =
∑ (X −X )2∗f
n−1
x=
∑ Xf
n
σ
Cv= ∗10 0
X
2 2
edad X f Xf (X −X ) (X −X ) ∗f
10-
12.5 5 62.5 182.25 911.25
15
15-
17.5 9 157.5 72.25 650.25
20
20-
22.5 12 270 12.25 147
25
25-
27.5 15 412.5 2.25 33.75
30
30-
32.5 11 357.5 42.25 464.75
35
35-
37.5 8 300 132.25 1058
40
Σ 60 1560 3265
1560
x= =26
60
2 3265 2
σ = =54.41 años
60
σ =√ 54.41=7.37 años
7.37
Cv= ∗10 0=28 %
26
-ejercicio
2 2
peso X f Xf ( X −X ) (X −X ) ∗f
40-50 3
50-60 10
60-70 2
Σ