Untitled
Untitled
DESCRIPTIVA
Un enfoque de casos prácticos
11%
12%
9%
10%
7%
8% 6%
6%
3%
4%
2%
0%
America Africa Asia Europa Oceanía
GILBERT CHUA
Docente: Gilbert Chua
PRESENTACIÓN
“Educar” decía José Marti, “es depositar en cada hombre toda la obra humana
que le ha antecedido; es hacer a cada hombre resumen del mundo viviente hasta
el día en que vive. Es ponerlo a nivel de su tiempo; con lo que no podrá salir a
flote. Es preparar al hombre para la vida.”
Este folleto consta de 2 unidades que están bien distribuidos de acuerdo al silabo
actualizado, el primer capitulo consta de estadística descriptiva univariada y la
segunda unidad de probabilidades.
Finalmente, a los jóvenes y a la inteligencia nacional, les digo que “No hay
cambio ni transformación sin participación humana. Únicamente se puede
transformar aquello que se conoce, y para conocerlo hay que estudiarlo.
A los estudiantes de esta facultad les deseo los mejores éxitos en su formación
profesional.
LA ESTADÍSTICA
Son heterogéneos los vocablos que se citan como antecedentes del término
estadística. Sin intentar ser exhaustivos, pero si indagando para describir los de mayor
mención, se pueden nombrar los siguientes:
¿QUÉ ES LA ESTADÍSTICA?
Porque constituye una ciencia auxiliar y complementaria, que ofrece técnicas, métodos,
modelos y procedimientos para el análisis cuantitativo y cualitativo de los fenómenos y
hechos que interesa estudiar a los profesionales.
Porque ofrece los fundamentos lógicos en los que se sustente la investigación básica y
aplicada, de manera que ayuda a desarrollar una investigación rigurosa
Ayuda a conocer las características de una población y hacer sus inferencias, a partir de
datos obtenidos de una muestra representativa cuyos resultados orienta la toma de
decisiones.
2
Docente: Gilbert Chua
3
Docente: Gilbert Chua
4
Docente: Gilbert Chua
TABLA 01:
Nivel educativo
Total
PEA
Provincias Total Sin Nivel Primaria Secundaria Superior
5
Docente: Gilbert Chua
2) Frecuencia Absoluta (fi): Es el número de datos que cae dentro de cada intervalo. Se
representa por: 0 < fi < n donde: n=Nº total de datos.
F1= f1
F2= f1+ f2
F3= f1+ f2 + f3
………….
Fk= f1+ f2 + f3+…..+ fk=n
hi = fi
n
0 < hi < 1 n = Nº total de datos
H1= h1
H2= h1 + h2
H3= h1 + h2 + h3
………………………..
Hk= h1 + h2 + h3+…. + hk =1
6) Marca de clase (Xi): Son los puntos medios de los intervalos de clase, donde:
6
Docente: Gilbert Chua
TABLA 02:
Intervalo de
Clase Xi fi Fi hi Hi hi*100% Hi*100%
Li < x ≤ Ls
K = 1+3. 32Log(n)
Rango
C
K
3. 279 = 3. 28 7. 341 = 7. 34
7
Docente: Gilbert Chua
Intervalos Intervalos
8
Docente: Gilbert Chua
Intervalo de clase
- Curva de Frecuencias: Es aquella representación grafica que consiste en suavizar
los polígonos de frecuencias absolutas y relativas, de modo tal que expresen en forma
de curvas.
Intervalo de clase.
Frecuencias Frecuencias
Menores Absolutas (Fi) Relativas
que: (H)
L.inferio 1 0 0
L.inferio 2 F1 H1
L.inferio 3 F2 H2
L.inferio 1 F3 H3
. . .
. . .
. . .
9
Docente: Gilbert Chua
Xi-1 X Intervalos
Ejemplo de aplicación:
3. Número de hijos_______
4. ¿Edad en años?________
Nº DE
Nº GENERO EDUCACIÓN OCUPACIÓN EDAD
HIJOS
1 Mujer Primaria Obrero 2 25
2 Hombre Analfabeta Empleado 3 45
3 Mujer Primaria Desempleado 4 44
4 Mujer Secundaria Independiente 1 23
5 Hombre Superior Agricultor 2 34
6 Hombre Secundaria Desempleado 3 36
7 Hombre Primaria Empleado 4 45
10
Docente: Gilbert Chua
11
Docente: Gilbert Chua
Se pide:
TABLA 03:
12
Docente: Gilbert Chua
INTERPRETACION:
TABLA 04:
13
Docente: Gilbert Chua
INTERPRETACION:
TABLA 05:
14
Docente: Gilbert Chua
INTERPRETACION:
TABLA 06:
INTERPRETACION:
15
Docente: Gilbert Chua
EDAD:
25 45 44 23 34 36 45 46 34 25 27 34 30 27 38 45 36 45 53 51 53 48 38
49 51 50 52 35 28 26 29 52 37 26 48 39 25 45 44 23 34 36 45 46 34 25
27 34 30 27 38 45 36 45 53 51 53 51 50 40
Paso 1 Rango:
R V .máx V .mín
R 53 23
R 30
K 1 3.32 log( n)
K 1 3.32 log( 60)
K 6.9 7
TABLA 07:
Frecuencia
Frecuencia Frecuencia Frecuencia
Frecuencia Frecuencia relativa
absoluta relativa relativa
EDAD absoluta relativa porcentual
acumulada acumulada porcentual
acumulada
fi Fi hi Hi hi% Hi%
23 ≤ x ≤ 28 13 13 0.217 0.217 21.70% 21.70%
28 < x ≤ 33 3 16 0.050 0.267 5.00% 26.70%
33 < x ≤ 38 15 31 0.250 0.517 25.00% 51.70%
38 < x ≤ 43 2 33 0.033 0.550 3.30% 55.00%
43 < x ≤ 48 14 47 0.233 0.783 23.30% 78.30%
48 < x ≤ 53 13 60 0.217 1.000 21.70% 100.00%
TOTAL 60 1 100.00%
FUENTE: Elaborado por el investigador
16
Docente: Gilbert Chua
INTERPRETACION:
Histograma
Polígono de frecuencias
17
Docente: Gilbert Chua
Curva de frecuencias
10 12 8 40 6 8 10 30 2 8 6 14 16 20 25 28 30 26 30 4 6 10 18
17 13 17 21 7 6 8 14 7 15 19 27 22 0 14 6 8 9 11 13 15 20 30
60 12 6 5 6 5 8 7 12 15 36 39 52
2. Los datos presentan los lapsos en minutos necesarios para 50 clientes del
Banco de Crédito que realizan una transacción bancaria en minutos.
2.3 5.8 9.5 0.8 1.6 0.4 0.5 1.4 0.2 2.8 1.8 0.9 1.9 1.3 6.8 2.9 3.3
4.7 0.4 2.4 1.1 5.2 0.4 9.7 0.7 1.3 4.6 5.5 6.3 2.8 2.5 6.2 3.1 3.8
3.4 7.6 2.4 5.6 1.2 3.7 1.5 4.2 1.4 4.4 3.3 7.8 7.2 2.7 1.2 0.5
18
Docente: Gilbert Chua
ESTADIGRAFOS: En esta etapa, la estadística plantea reducir los datos y sustituir toda la
tabla de frecuencias por unos pocos valores representativos del conjunto o por unas pocas
características descriptivas de los aspectos fundamentales de la distribución considerada;
Estas características descriptivas constituyen los llamados ESTADIGRAFOS, que son
indicadores o medidas de resumen estadísticos.
Como medidas de resumen del comportamiento de estas distribuciones se definen cuatro tipos
de ESTADIGRAFOS.
a).1 Medidas de Posición o Tendencia Central: Describen la posición que ocupa una
distribución de frecuencia alrededor de un valor de la variable y son llamados generalmente
promedios, obtenidos a partir de datos cuantitativos de una población o muestra y son:
La media aritmética.
La media geométrica
La media armónica
La mediana
La moda
La media geométrica, es aquella que se usa especialmente en los casos en que existe una
tasa de crecimiento relativamente constante (población, montos, medios de capitales
sujetos a interés compuesto, etc). O simplemente, cuando se desea un porcentaje medio de
crecimiento o de baja, según corresponda.
La media geométrica se utiliza para promediar porcentajes, tasas, índices de precios, etc.
es decir, en aquellos casos en los que la variable representa variaciones acumulativas.
19
Docente: Gilbert Chua
¿Qué es la mediana?
Es aquel valor, Me, que divide a la muestra ordenada en dos partes iguales, es decir, hay el
mismo número de datos menores que la mediana como mayores que ella. Si hay un número
impar de observaciones, la mediana es el único valor central
¿Qué es la moda?
Es el valor que se presenta con más frecuencia. Se nota Mo. Puede haber varias modas.
Medidas de
Para datos sueltos o Para datos agrupados o tablas
tendencia
tablas sin frecuencias con frecuencias
central
Media X
X FX
Aritmética n X
n
Media
G n X 1 X 2 X 3 ... X n f log x
G Anti log
Geométrica
n
n n
Media H H
1 f
Armónica x x
n Fi 1
Mediana Valor central
Me Li C 2
Fi Fi 1
20
Docente: Gilbert Chua
5 7 11 12 14
Media Aritmética: X 9 .8
5
5
Media Armónica: H 8.4957
1 1 1 1 1
5 7 11 12 14
5, 7, 11, 12, 14
Me
10 11
Luego la mediana seria: Me 10.5
2
Moda:
440 560 335 587 613 400 424 466 565 393
21
Docente: Gilbert Chua
17 13 17 21 7 6 8 14 7 15 19 27 22
Dado los datos agrupados o tablas con frecuencias del ejercicio anterior acerca del
cuestionario para conocer las características de los padres de familia de la Institución
Educativa Daniel Becerra Ocampo
Frecuencia
Marca de Marca de
Logaritmo absoluta
Marca Frecuencia clase por clase sobre
de marca por Log. de
EDAD de clase absoluta Frecuencia frecuencia
de clase marca de
absoluta absoluta
clase
Xi fi fi.Xi LogXi fi.LogXi fi/Xi
23 ≤ x ≤ 28 25.5 13 331.5 1.407 18.285 0.510
28 < x ≤ 33 30.5 3 91.5 1.484 4.453 0.098
33 < x ≤ 38 35.5 15 532.5 1.550 23.253 0.423
38 < x ≤ 43 40.5 2 81.0 1.607 3.215 0.049
43 < x ≤ 48 45.5 14 637.0 1.658 23.212 0.308
48 < x ≤ 53 50.5 13 656.5 1.703 22.143 0.257
TOTAL 60 2330.0 94.561 1.645
FUENTE: Elaborado por el investigador
fi. Xi 2330
Media Aritmética: X 38.83 años
n 60
f log x
Media Geométrica: G Anti log
n
94.561
G Anti log 37.67 años
60
22
Docente: Gilbert Chua
n 60
Media Armónica: H 36.47 años
f
x
1.645
El promedio armónico es de 36.47 años para la variable edad de los padres de familia
de la Institución Educativa Daniel Becerra Ocampo.
Mediana:
n Fi 1
Me Li C 2
Fi Fi 1
n 60
Primero hallamos: 30
2 2
Frecuencia
Frecuencia
absoluta
EDAD absoluta
acumulada
fi Fi
Límite 23 ≤ x ≤ 28 13 13
Por tanto:
30 16
Me 33 5 37.67 años
31 16
Luego del total de padres de familia, el 50% tienen edades menores o iguales a 37.7
años, en tanto que el 50% restante, mayores a 37.7 años
Me
50% 50%
≤42.7>
23
Docente: Gilbert Chua
Moda:
f i f i 1
Mo Li C
( f i f i 1 ) ( f i f i 1 )
Frecuencia
EDAD absoluta
fi
Limite 23 ≤ x ≤ 28 13
Inferior 28 < x ≤ 33 3 fi-1
33 < x ≤ 38 15 fi (Por ser el de mayor cantidad)
38 < x ≤ 43 2 fi+1
43 < x ≤ 48 14
48 < x ≤ 53 13
60
El ancho de clase es C=5
Por tanto:
f i f i 1 15 3
Mo Li C 33 5 35.4 años
( f i f i 1 ) ( f i f i 1 ) (15 3) (15 2)
La edad mas frecuente entre los padres de familia de la Institución Educativa Daniel
Becerra Ocampo es de 35.4 años.
Ejercicios: hallar, para todos los casos las medidas de tendencia central
Ingreso fi Fi
35
240
45 120
157
280
20
24
Docente: Gilbert Chua
2. En una encuesta sobre el ingreso de turistas a una ciudad según la edad, se obtuvo la
siguiente información donde el ancho de clase es 4
Edades fi Fi
10 m
a 2a
b c
a+b c+d
40 15 15c/7
Pesos Xi fi Fi hi
70 0.075
5
18
79
7
40 0.175
4. Dado el cuadro estadístico, sabiendo que la mediana es 72.5 y que además pertenece
al quinto intervalo, Hallar el valor de “n”
Intervalos fi
30 40 2
40 50 3
50 60 4
60 70 1
70 80 n
Intervalos fi
20 30 10
30 40 2n
40 50 4
50 60 n
60 70 5
25
Docente: Gilbert Chua
Intervalos fi
10 19 6
19 28 10
28 37 2n
37 46 14
46 5 3n
Los Deciles son nueve valores que dividen a la distribución en diez partes
iguales, estando en cada una de ellas el 10% de las observaciones. Se
indican por Di.
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1 D2 D3 D4 D5 D6 D7 D8 D9
1% 1% 1% …………………………………………………………… 1% 1% 1%
P1 P2 P3………………………………………….P97 P98 P99
Hay que tener en cuenta algunas relaciones entre ellos, como son:
Me = Q2 = D5 = P50
Q1 = P25; Q3 = P75
D1 = P10; D2 = P20; D3 = P30; D4 = P40; D6 = P60
26
Docente: Gilbert Chua
in
4 Fi 1
Cuartiles Ci Li C
Fi Fi 1
in
10 Fi 1
Deciles Di Li C
Fi Fi 1
in
100 Fi 1
Percentiles Pi Li C
Fi Fi 1
Ejemplo
Dado los datos del ejercicio anterior acerca del cuestionario para conocer las
características de los padres de familia de la Institución Educativa Daniel Becerra
Ocampo.
1n
4 Fi 1
C1 Li C
Fi Fi 1
1n 1(60)
Primero hallamos: 15
4 4
27
Docente: Gilbert Chua
Frecuencia
Frecuencia
absoluta
EDAD absoluta
acumulada
fi Fi
Límite 23 ≤ x ≤ 28 13 13 Fi-1
Por tanto:
15 13
C1 28 5 31.33 años
16 13
Luego del 100% de padres de familia, el 25% tienen edades menores o iguales a 31
años, en tanto que el 75% restante, mayores a 31 años.
75%
7n
10 Fi 1
D7 Li C
Fi Fi 1
7 n 7(60)
Primero hallamos: 42
10 10
28
Docente: Gilbert Chua
Frecuencia
Frecuencia
absoluta
EDAD absoluta
acumulada
fi Fi
23 ≤ x ≤ 28 13 13
Por tanto:
42 33
D7 43 5 46.21 años
47 33
Luego del 100% de padres de familia, el 70% tienen edades menores o iguales a 46
años, en tanto que el 30% restante, mayores a 46 años.
70% 30%
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D7
46 años
85n
100 Fi 1
P85 Li C
Fi Fi 1
85n 85(60)
Primero hallamos: 51
100 100
29
Docente: Gilbert Chua
Frecuencia
Frecuencia
absoluta
EDAD absoluta
acumulada
fi Fi
23 ≤ x ≤ 28 13 13
48 < x ≤ 53 13 60 Fi
60
El ancho de clase es C=5
Por tanto:
51 47
P85 48 5 49.54 años
60 47
Luego del 100% de padres de familia, el 85% tienen edades menores o iguales a 49
años, en tanto que el 15% restante, mayores a 49 años
85% 15%
1% 1% 1% ……………………………………………………………
P1 P2 P3………………………………………….P85
49 años
Ejercicios:
Intervalos fi Fi
10 21 2
21 32 14
32 43 2X
43 54 X
54 65 50
30
Docente: Gilbert Chua
Intervalos fi Fi
8 14 20
14 20 X+5
20 26 X
26 32
32 38 100
Intervalos fi Fi
7 14 10
14 21
21 28 38
28 35 45
35 42 X
Intervalos fi Fi
7 14 155
14 21
21 28 13n+5
28 35 n
35 42 300
Intervalos fi Fi
20 40 150
40 60
60 80 8 178
80 100
100 120 n
31
Docente: Gilbert Chua
En el tema anterior hemos definido una serie de medidas de tendencia central, cuyo objetivo
era tratar de sintetizar toda la información disponible, pero cabe preguntarse posteriormente si
esa medida es o no representativa de la distribución de frecuencias.
Las dos medias son iguales y sin embargo las dos distribuciones son muy diferentes pues los
valores de X están mucho más dispersa que los de Y.
Así pues, para intentar medir la representatividad de una determinada medida debemos de
cuantificar la separación de los valores de la distribución respecto de dicha medida. Resulta
necesario que, para completar la información de un promedio (por ejemplo media aritmética),
éste vaya acompañado de uno o varios coeficientes que nos midan el grado de dispersión de la
distribución de la variable con respecto a él.
Además estas medidas nos permiten tener una idea de cómo se agrupa la población respecto a
la media, esta medida cuantifica el grado de concentración o dispersión de los datos en torno
al promedio; si los datos están estrechamente concentrados, la dispersión será pequeña. En
cambio si los datos están dispersos, entonces la variabilidad será grande.
Cabe citar entre éstas el recorrido, la desviación media, desviación mediana, la varianza y la
desviación típica. Todas son referidas en general a un promedio.
El Rango.
La Desviación media absoluta
La Desviación mediana absoluta
La varianza
La desviación típica o estándar
32
Docente: Gilbert Chua
¿Qué es la varianza?
“La raíz cuadrada positiva del promedio aritmético de los cuadrados de los
desvíos de las observaciones con respecto a su media aritmética”. La
desviación típica es una forma refinada de la desviación media”.
33
Docente: Gilbert Chua
Medidas
de Para datos sueltos o tablas Para datos agrupados o tablas
dispersión sin frecuencias con frecuencias
absoluta
Desviación x Me f x Me
mediana
DMe DMe
n n
( x x ) 2 f (x x)2
S2 si, n 30 S2 si, n 30
N N
Varianza
( x x ) 2 f (x x)2
S
2
si , n 30 S
2
si, n 30
n 1 n 1
( x x ) 2 f (x x)2
S si, n 30 S si, n 30
N N
Desviación
estándar
( x x ) 2 f (x x)2
S si , n 30 S si, n 30
n 1 n 1
R 14 5
Rango:
R 9 años
34
Docente: Gilbert Chua
Desviación Media:
xx
DM
n
Nº Edades xx
1 5 4.8
2 7 2.8
3 11 1.2
4 12 2.2
5 14 4.2
TOTAL 15.2
Luego:
15.2
DM 3.04 años
5
Desviación Mediana:
x Me
DMe
n
Nº Edades x Me
1 5 6
2 7 4
3 11 0
4 12 1
5 14 3
TOTAL 14
Luego:
14
DMe 2.8 años
5
Varianza:
( x x ) 2
S2 si , n 30
n 1
35
Docente: Gilbert Chua
Nº Edades ( x x )2
1 5 23.04
2 7 7.84
3 11 1.44
4 12 4.84
5 14 17.64
TOTAL 54.8
Luego:
( x x ) 2 54.8
S
2
13.7 años
n 1 4
Desviación estándar:
13.7
S 1.85 años
4
36
Docente: Gilbert Chua
S
CV 100
X
1.85
CV 100
9 .8
CV 18.88%
440 560 335 587 613 400 424 466 565 393
17 13 17 21 7 6 8 14 7 15 19 27 22
37
Docente: Gilbert Chua
R 53 23
R 30
f xx
Desviación Media: DM
n
496.66
DM 8.28 años
60
Esto quiere decir que el promedio de las desviaciones en edades (años), de los padres
de familia de los alumnos respecto al peso vivo promedio es de 8.28 años.
f x Me
Desviación Mediana: DMe
n
513.02
DMe 8.55 años
60
Esto quiere decir que el promedio de las desviaciones en edades (años), de los padres
de familia de los alumnos respecto al peso vivo mediano es de 8.55 años.
38
Docente: Gilbert Chua
EDAD Xi fi ( x x )2 f .( x x ) 2
23 ≤ x ≤ 28 25.5 13 177.689 2309.956
28 < x ≤ 33 30.5 3 69.389 208.167
33 < x ≤ 38 35.5 15 11.089 166.334
38 < x ≤ 43 40.5 2 2.789 5.578
43 < x ≤ 48 45.5 14 44.489 622.845
48 < x ≤ 53 50.5 13 136.189 1770.456
TOTAL 60 5083,334
f .( x x ) 2
Varianza: S
2
5083.334
S2 84.72 años
60
Esto quiere decir que las edades (años), de los padres de familia de los alumnos se
dispersa en promedio 84.72 años al cuadrado con respecto a la media aritmética o
valor central.
f (x x)2
Desviación Estándar: S
N
5083.334
S 9.2044 años
60
Las edades de los padres de familia de los alumnos se dispersan en promedio 9.2
años con respecto a la media aritmética o valor central.
S
Coeficiente de Variación: CV 100
X
9.2044
CV 100 23.7%
38.83
Las edades de los padres de familia de los alumnos se dispersan en promedio 23.7%
con respecto a la media aritmética o valor central, lo cual muestra que la media es
poco representativa y el análisis realizado es poco confiable.
39
Docente: Gilbert Chua
Tienen por objeto establecer el grado de simetría (o asimetría) de una distribución sin
necesidad de realizar la representación gráfica.
Entenderemos la simetría respecto al eje determinado por la media aritmética, detal forma
que diremos que una distribución es simétrica cuando los valores de la variable equidistantes
de este valor central tengan la misma frecuencia, en caso contrario diremos que es
asimétrica, siendo esta asimetría negativa o a izquierda si es más larga la rama de la
izquierda, es decir, las frecuencias descienden más lentamente por la izquierda que por la
derecha; análogamente llamaremos asimetría positiva o a derechas aquella en que la rama
de la derecha es más larga, es decir las frecuencias descienden más lentamente por la
derecha que por la izquierda.
Su interpretación será:
(ASF > 0): La curva es asimétricamente positiva por lo que los valores
se tienden a reunir más en la parte izquierda que en la derecha de la
media.
(ASF < 0): La curva es asimétricamente negativa por lo que los valores
se tienden a reunir más en la parte derecha de la media.
Desde luego entre mayor sea el número (Positivo o Negativo), mayor será la
distancia que separa la aglomeración de los valores con respecto a la media.
40
Docente: Gilbert Chua
Para estudiar el apuntamiento, debemos hacer referencia a una distribución tipo que
consideraremos la distribución "Normal"; ésta corresponde a fenómenos muy corrientes en la
naturaleza cuya representación gráfica es la campana de Gauss.
41
Docente: Gilbert Chua
Medidas de
Para datos sueltos o Para datos agrupados o
Deformación y
tablas sin frecuencias tablas con frecuencias
Apuntamiento
( x x ) 3 f .( x x ) 3
AS F N N
Asimetría de
3
AS F 3
Fisher
( x x ) 2 2 f .( x x ) 2 2
N N
( x x ) 4 f .( x x ) 4
K N 3 K N 3
Curtosis
2 2 2 2
( x x ) f .( x x )
N N
Asimetría de Fisher:
( x x ) 3
AS F N
3
( x x ) 2 2
N
42
Docente: Gilbert Chua
Nº Edades ( x x )2 (x x)3
1 5 23.04 -110.592
2 7 7.84 -21.952
3 11 1.44 1.728
4 12 4.84 10.648
5 14 17.64 74.088
TOTAL 54.8 -46.080
( x x ) 3 46.08
5 9.216
AS F N 0.254
3 3
36.284
( x x )
2 2
54.8 2
5
N
Asimetría de Pearson:
3( X Me)
AS P
S
3(9.8 11)
AS P 1.946
1.85
Curtosis:
( x x ) 4
K 3
N
2
( x x ) 2
N
Nº Edades ( x x )2 (x x)4
1 5 23.04 530.8416
2 7 7.84 61.4656
3 11 1.44 2.0736
4 12 4.84 23.4256
5 14 17.64 311.1696
TOTAL 54.8 928.9760
43
Docente: Gilbert Chua
( x x ) 4 928.976
5
K N 3 K 3 K
185.7952 3
K 1.453
( x x ) 2
2
54.8
2
10.962
5
N
EDAD Xi fi ( x x )2 f .( x x ) 2 (x x)3 f .( x x ) 3
23 ≤ x ≤ 28 25.5 13 177.689 2.309.956 -2368.593 -30791.709
28 < x ≤ 33 30.5 3 69.389 208.167 -578.010 -1734.029
33 < x ≤ 38 35.5 15 11.089 166.334 -36.926 -553.891
38 < x ≤ 43 40.5 2 2.789 5.578 4.657 9.315
43 < x ≤ 48 45.5 14 44.489 622.845 296.741 4154.373
48 < x ≤ 53 50.5 13 136.189 1.770.456 1589.324 20661.218
TOTAL 60 5083.334 -8254.722
Asimetría de Fisher:
f .( x x ) 3 8254.722
AS F
N 60
AS F 3 3 AS F 0.176
f .( x x )
2 2
5083.334 2
60
N
AS < 0
44
Docente: Gilbert Chua
Asimetría de Pearson:
Curtosis:
EDAD Xi fi ( x x )2 f .( x x ) 2 (x x)4 f .( x x ) 4
23 ≤ x ≤ 28 25.5 13 177.689 2.309.956 31573.345 410453.487
28 < x ≤ 33 30.5 3 69.389 208.167 4814.819 14444.458
33 < x ≤ 38 35.5 15 11.089 166.334 122.964 1844.456
38 < x ≤ 43 40.5 2 2.789 5.578 7.778 15.556
43 < x ≤ 48 45.5 14 44.489 622.845 1979.262 27709.671
48 < x ≤ 53 50.5 13 136.189 1.770.456 18547.416 241116.414
TOTAL 60 5083.334 695584.043
f .( x x ) 4 695584 .043
3
K 3
N 60
K K 1.385
2 2 2
f .( x x ) 5083.334
60
N
45
Docente: Gilbert Chua
GASTO hi Hi
a/2
6 2m
3a
10 a 0.85
m
NOTAS fi hi Hi
24 0.18
26
72 0.78
EDAD fi hi Fi Hi
0 0.2
20
0.85
12 80
Nº DE
xi fi Fi xi.fi
ALUMNOS
210
40 320
20
30
8 80
46
Docente: Gilbert Chua
e) Medidas de Concentración:
Entre ambas situaciones extremas hay infinidad de situaciones intermedias que trataremos
de cuantificar con las siguientes medidas de concentración:
- Índice de Gini
Para una población determinada el índice de Gini puede oscilar entre cero (0) y uno (1).
Tomaría un valor de cero cuando todos los integrantes de la población reciben el mismo
ingreso. Por el contrario, el uno significa que un miembro o unos pocos perciben todo el
ingreso y los restantes nada.
N 1 N 1
( p i qi ) q i
IG i 1
N 1
1 i 1
N 1
p
i 1
i p
i 1
i
- Curva de Lorenz
47
Docente: Gilbert Chua
De tal forma que en el caso de mínima concentración la curva de Lorenz se confundirá con la
diagonal. Luego, cuanta mayor concentración se establezca en el reparto, mayores serán las
diferencias (pi - qi) y, por tanto, más alejada de la diagonal aparecerá la curva de Lorenz. En
el otro caso extremo de máxima concentración la curva de Lorenz quedará formada por el
propio eje de abscisas y la vertical trazada por el punto de abscisa igual a 100. Tal como se
refleja en los siguientes gráficos:
Dado los datos agrupados o tablas con frecuencias del ejercicio anterior acerca del
cuestionario para conocer las características de los padres de familia de la Institución
Educativa Daniel Becerra Ocampo.
EDAD xi fi Fi xi.fi ui pi qi
23 ≤ x ≤ 28 25.5 13 13 331.5 331.5 21.7 14.2 N 1
28 < x ≤ 33 30.5 3 16 91.5 423.0 26.7 18.2 q
i 1
i
33 < x ≤ 38 35.5 15 31 532.5 955.5 51.7 41.0 N 1
38 < x ≤ 43 40.5 2 33 81.0 1036.5 55.0 44.5 p i
43 < x ≤ 48 45.5 14 47 637.0 1673.5 78.3 71.8 i 1
Fi ui
pi x100 qi x100
n xi f i
48
Docente: Gilbert Chua
N 1 N 1
( pi qi ) q i
189.7
IG i 1
N 1
1 i 1
N 1
IG 1 0.187
p p
233.3
i i
i 1 i 1
El índice de Gini es un indicador entre 0 y 1, cuanto mas próximo esté a 1 indica una mayor
concentración, lo cual indica que los padres de familia en cuanto a sus edades, estas tienen
una débil concentración y en consecuencia la distribución en sus edades son casi equitativos
para los 60 padres de familia, como se muestra en la siguiente grafica.
pi qi pi
0 0 0
21.7 14.2 21.7
26.7 18.2 26.7
51.7 41.0 51.7
55.0 44.5 55.0
78.3 71.8 78.3
100.0 100.0 100.0
SALARIO xi fi Fi hi%
3
28%
3000 8
2
4%
49
Docente: Gilbert Chua
INGRESO S./ fi Fi
35
240
45 120
157
280
20
3. Dada la siguiente distribución de frecuencias acerca de los sueldos diarios en soles, de los
obreros de la empresa el Sol, donde h2=h3.
Li Ls fi hi Hi
15 0.25
25 0.65
40
0.15
INGRESO S/. fi Fi hi
170
48 60
0.125
200 0.075
INGRESO S/. hi fi
1/k k
1100 2/k
9/k
1700 3/k
50
Docente: Gilbert Chua
TRABAJO ENCARGADO
Alumnos por
secciones
Puntaje A B
35 – 45 4 3
45 – 55 12 14
55 – 65 20 18
65 – 75 15 18
75 – 85 9 20
85 – 95 2 2
Calcular e interpretar:
a) Puntajes promedios
b) Puntajes medianos
c) Puntaje modal
d) Desviación Estándar
e) Analizar comparativamente y determinar que sección presenta mejores
rendimientos y es más homogéneo.
f) Que puntaje tiene el 25% de los mejores alumnos.
51
Docente: Gilbert Chua
Intervalos fi
5 15 a
15 25 2m
25 35 10
35 45 3m
45 55 2a
Intervalos fi
20 30 3
30 40 1
40 50 2
50 60 6
60 70 n
52
Docente: Gilbert Chua
PROBABILIDADES
53
Docente: Gilbert Chua
PROBABILIDAD
Mientras que la Estadística se puede describir como la ciencia y el arte de recopilar, resumir y
analizar datos e inferir, estimar y proyectar valores y consecuencias a partir de estos
elementos, la probabilidad se pude definir como el estudio de fenómenos o experimentos
puramente “aleatorios” o libres de determinación. En el estudio de la probabilidad interesa
deducir las leyes del azar y los resultados que estos determinan.
Históricamente la probabilidad se inicia con el estudio de los juegos al azar, tales como la ruleta
y las cartas; frecuentemente se usa el término probabilidad para sugerir que existe duda o
incertidumbre sobre lo que ocurrió, lo que ocurrirá.
Ejem:
54
Docente: Gilbert Chua
n( A)
p( A)
n()
AXIOMAS DE PROBABILIDAD
a) Un valor impar
b) Un valor mayor a 4
c) Un valor negativo
Desarrollo:
Luego:
n( A) 3
p( A) 0.5 x100 50%
n() 6
Luego:
n( B ) 2
p( B) 0.333x100 33.3%
n() 6
Entonces la probabilidad de obtener un valor mayor a 4 es del 33.3%
55
Docente: Gilbert Chua
Luego:
n(C ) 0
p(C )
n() 6
a) 8 como suma de los puntajes A= {2,6; 3,5; 4,4; 5,3; 6,2 } → n (A)=5
n( A) 5
p( A) 0.139 x100 13.9%
n() 36
n( B ) 6
p( A) 0.167 x100 16.7%
n() 36
C= {2,2; 2,4; 2,6; 4,2; 4,4; 4,6; 6,2; 6,4; 6,6} → n (C)=9
n(C ) 9
p(C ) 0.25 x100 25%
n() 36
56
Docente: Gilbert Chua
Luego:
n( A) 2
p( A) 0.5 x100 50%
n() 4
2 . Una bola se extrae aleatoriamente de una urna que contiene 3 bolas rojas y 2
azules, si se extrae una bola ¿Cuál es la probabilidad de que la bola sea de color
roja y cual es la probabilidad de que sea de color azul?
3 . Una urna tiene ocho bolas rojas, cinco amarillas y siete verdes. Si se extrae una
bola al azar, que probabilidades hay de que:
57
Docente: Gilbert Chua
Ejemplo:
58
Docente: Gilbert Chua
Ejercicios:
- Gana M
- No gane P
- M le gana a N
- M o P ganan la competencia
- N quede en 2do lugar
A= {Ingenieros} B= {Analfabetos}
59
Docente: Gilbert Chua
Luego se cumple que A B por que no hay ingenieros que sean analfabetos
Por tanto:
P( A B) P( A) P( B)
Ejercicios:
1. Una caja contiene 220 tornillos iguales, de los cuales 80 son producidos por la
maquina A, 60 por la maquina B, ¿50 por la maquina C y 30 por la maquina
D. sí se elige un tornillo al azar de la caja, cual es la probabilidad que el
tornillo elegido haya sido producido por las maquinas A o C?
Es claro que A, B, C y D son sucesos mutuamente excluyentes, porque cada
tornillo es producido por una y solo una maquina.
3. Una bola se extrae al azar de una caja que contiene 4 bolas blancas, 5 bolas
rojas y 2 azules. Determinar la probabilidad de que sea azul o roja; queda
claro que la bola sea azul y roja a la vez (eventos mutuamente excluyentes)
P( A B) P( A) P( B) P( A B)
Ejemplo:
60
Docente: Gilbert Chua
P( A B) P( A) P( B) P( A B)
8 12 4
P( A B) 0.8 x100
20 20 20
P( A B) 80%
Ejercicios:
4. José y María son invitados a una fiesta. La probabilidad de que María asista a
la fiesta es 2/5 y de que juan asista es 3/8.
P( A B) P( A) P( B)
P( A B C ......Z ) P( A) P( B) P(C )......P( Z )
Ejemplo:
Solución:
Si la probabilidad de obtener un 6 al lanzar un dado es 1/6
61
Docente: Gilbert Chua
1 1 1 1 1
P( A B C D) P( A) P( B) P(C ) P( D) x x x 0.077%
6 6 6 6 1296
Ejercicios:
Eventos dependientes
P( A B) P( A) P( B / A)
P( A B C ) P( A) P( B / A) P(C / A B)
62
Docente: Gilbert Chua
Ejemplo:
Solución:
P( F D R) P( F ) P( D / F ) P( R / F D)
6 4 5
P( F D R) x x 4.4%
15 14 13
Ejercicios:
1. En una caja hay 15 fichas, de las cuales 10 están pintadas de rojo y el resto
de blanco. Una persona extrae dos fichas (sin reposición), una por una. Halle
la probabilidad de que ambas sean de color rojo
Evento condicional
Sean A y B dos sucesos tal que P(A) ≠0, se llama probabilidad de B condicionada
a A (P(B/A)); a la probabilidad de B tomando como espacio muestral A; es decir
la probabilidad de que ocurra B dado que ha sucedido A y queda denotado de la
siguiente manera:
P( B A)
P( B / A)
P( A)
63
Docente: Gilbert Chua
Ejemplo:
Solución:
P( M E ) 0.10
P( M / E ) 66.67%
P( E ) 0.15
P( E M ) 0.10
P( E / M ) 40%
P( M ) 0.25
P( M E ) P( M ) P( E ) P( M E )
P( M E ) 0.25 0.15 0.1 0.3 x100
P( M E ) 30%
Ejercicios:
64
Docente: Gilbert Chua
Calcular:
18
P( A M ) 113
a) P( A / M ) 28.57%
P( M ) 63
113
Especialidad
Procedencia TOTAL
Ing. Industrial Administración Economía Derecho
Limeño 100 40 50 20 210
Provinciano 20 60 50 10 140
Extranjero 5 0 1 0 6
TOTAL 125 100 101 30 356
65
Docente: Gilbert Chua
Teorema de Bayes
El teorema de Bayes lleva este nombre porque fue enunciado por el ministro
plebisteriano Thomas Bayes (1702 – 1761) matemático de nacionalidad inglesa.
El expresa que se puede determinar la probabilidad de las causas a partir de los
efectos que han podido ser observados. Sean: A1; A2; A3;…..;An; los sucesos que
cumplen las características de una probabilidad total y sea B un suceso
cualquiera del que se conoce las probabilidades condicionales P(B/A i) entonces la
probabilidad P(Ai/B) viene dada por la expresión:
P( Ai ) P( B / Ai )
P( Ai / B)
P( A1 ) P( B / A1 ) P( A2 ) P( B / A2 ) ... P( An ) P( B / An )
P( Ai ) P( B / Ai )
P( Ai / B) n
; i 1; 2; 3;...; n
P( A ) P( B / A )
i 1
i i
Ejemplo:
Tenemos tres urnas: A con 3 bolas rojas y 5 negras, B con 2 bolas rojas y 1
negra y C con 2 bolas rojas y 3 negras. Escogemos una urna al azar y extraemos
una bola. Si la bola ha sido roja, ¿cuál es la probabilidad de haber sido extraída
de la urna A?
Solución:
Llamamos
66
Docente: Gilbert Chua
P( A) P( R / A)
P( A / R)
P( A) P( R / A) P( B) P( R / B) P(C ) P( R / C )
1 3
x
3 8 45
P( A / R) 26%
1 3 1 2 1 2 175
x x x
3 8 3 3 3 5
Ejercicios:
3. Una persona puede viajar de 3 formas, bicicleta, auto y avión. Cada forma de
transporte tiene una probabilidad de tener un defecto en el sistema de rodado
y no llegar al destino del 3%, 4% y 5% respectivamente.
Para escoger el método de traslado se tienen 3 fichas, las cuales tienen una
probabilidad de aparecer del 50%, 30% y 20% respectivamente. Si se toma
un viaje al azar, y no llega a destino, hallar la probabilidad de que ese viaje se
realizó en bicicleta.
4. En un centro escolar los alumnos pueden optar por cursar como lengua
extranjera inglés o francés. En un determinado curso, el 90% de los alumnos
estudia inglés y el resto francés. El 30% de los que estudian inglés son chicos
y de los que estudian francés son chicos el 40%. El elegido un alumno al azar,
¿cuál es la probabilidad de que sea chica?
67
Docente: Gilbert Chua
VARIABLES ALEATORIAS
Una variable aleatoria es una variable que toma valores numéricos determinados por el
resultado de un experimento aleatorio. No hay que confundir la variable aleatoria con
sus posibles valores. Ejemplos:
Función de distribución
D iscreta P(X=x)
Altu ra
Variable probabilidad
aleatoria X
X Función densidad
f(x)=P(a<X<b)
Continua Area
densidad
x x1 x2 ... xk
P(x) p1 p2 ... pk
Ejemplo:
En la práctica se consideran discretas aquellas variables para las que merece la pena
asignar probabilidades a todos los posibles sucesos elementales.
68
Docente: Gilbert Chua
Sea x una variable aleatoria discreta. Su distribución viene dada por los valores que
puede tomar, x1, x2, x3,…, xk, y las probabilidades de que aparezcan p1, p2, p3,…, pk.
Estas cantidades pi P{x xi } reciben el nombre de función de probabilidad o
función de masa.
Ejemplo:
Posibles valores de x: 0, 1, 2 y 3
x 0 1 2 3
p(x) 1 3 3 1
8 8 8 8
p0 P{x 0} 1 / 8 0,125
p1 P{x 1} 3 / 8 0,375
p2 P{x 2} 3 / 8 0,375
p3 P{x 3} 1 / 8 0,125
Graficando la Función de probabilidad de x:
69
Docente: Gilbert Chua
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0 1 2 3
Función de distribución de x
1.0
0.8
0.6
0.4
0.2
0.0
0 1 2 3
70
Docente: Gilbert Chua
Si X es una variable aleatoria discreta que toma valores x1, x2, ... xk, con probabilidad p1,
p2,... pk, entonces la media o el valor esperado de X está dado por:
E ( X ) X x1 p1 x2 p2 xk pk
k
E ( X ) xi p i
i 1
x x2
x 0 1 2 3
p(x) 1/8 3/8 3/8 1/8
1 3 3 1
La media de X es: E ( X ) X 0 1 2 3
8 8 8 8
3 6 3 12
E( X ) 0 1,5 caras
8 8 8 8
1 2 2 32 1,5
1 23 3 1
Var ( X ) 0 2
2
8 8 8 8
1,5
3 12 9
Var ( X ) 0
2
8 8 8
24
Var ( X ) 2,25 0,75
8
Sea X una variable aleatoria que representa el número de libros que llevan en la mochila
los estudiantes de esta universidad:
71
Docente: Gilbert Chua
x 0 1 2 3
P(x) 0,5 0,2 0,2 0,1
Ejercicio
Sea x una variable aleatoria que expresa el nº de personas que habitan en una vivienda
elegida al azar. La distribución de probabilidad de x es la siguiente:
xi 1 2 3 4 5 6 7 8ó+
pi 0,230 0,322 0,177 0,155 0,067 0,024 0,015 0,010
Nº de juntas al año 1 2 3 4 5
Probabilidad 2/15 5/15 1/15 3/15 4/15
a) Calcular la media
b) Calcular la varianza y la desviación típica
c) Probabilidad de que en un año elegido al azar se celebren más de 3 juntas
72
Docente: Gilbert Chua
73
Docente: Gilbert Chua
74
Docente: Gilbert Chua
75
Docente: Gilbert Chua
Ejemplo:
a(3x x 2 ) si 0 x 3
f ( x)
0 en otros casos
Hallar el coeficiente a
Graficar la función de densidad
Hallar la probabilidad de que x se encuentre en el intervalo [1,2]
Hallar la media, varianza y desviación estándar
Desarrollo:
76
Docente: Gilbert Chua
3
a(3x x )dx 1
2
0
3
3x 2 x3
a 1
2 3 0
3(3) 2 (3)3 3(0) 2 (0)3
a 1
3 2 3
a)
2
27
a 9 1
2
2
a
9
2 2 2 2
(3 x x ) si 0 x 3 x x si 0 x 3
2
f ( x) 9 f ( x) 3 9
0 en otros casos 0 en otros casos
Graficando la función:
Y X
0 0.000
1 0.444
5 0.500
2 0.444
3 0.000
b) P (1 ≤ x ≤ 2)
2 2 2
p(1 x 2) ( x x 2 )dx
1 3 9
2
2 x 2 2 x 3 2(2) 2 2(2)3 2(1) 2 2(1)3
p(1 x 2)
6 27 1 6 27 6 27
p(1 x 2) 0,4815
p(1 x 2) 48,15%
77
Docente: Gilbert Chua
E( x) xf ( x)dx
2 2
E ( x) x( x x 2 )dx
3
0 3 9
3 2 2
E ( x) ( x 2 x 3 )dx
0 3 9
3
2 2
E ( x) x 3 x 4
9 36 0
2 2 2 2
E ( x) (3)3 (3) 4 (0)3 (0) 4
9 36 9 36
3
E ( x) 1,5
2
Hallando la varianza
3 2 2
E ( x 2 ) x 2 ( x x 2 )dx
0 3 9
3 2 2
E ( x 2 ) ( x 3 x 4 )dx
0 3 9
3
2 2 5
E( x ) x4
2
x
12 45 0
2 2 2 2
E ( x 2 ) (3) 4 (3)5 (0) 4 (0)5
12 45 12 45
27
E( x2 ) 2,7
10
2 E ( x 2 ) E ( x)2
Reemplazando en la ecuación de la varianza 2 2,7 1,52
2 0,45
2 0,45
0,45 0,67082
78
Docente: Gilbert Chua
Ejercicios:
k ( x 2 32 x 5) si 15 x 17
f ( x)
0 en otros casos
Hallar el coeficiente k
Graficar la función de densidad
Hallar la probabilidad de que x se encuentre en el intervalo [15,16]
Hallar la media, varianza y desviación estándar
2) En un hospital se comprobó que el peso en kilos de los niños al nacer era una
V.A con función de densidad:
kx si 2 x 4
f ( x)
0 en otros casos
Hallar el coeficiente k
Graficar la función de densidad
Hallar la probabilidad de que x se encuentre entre 2 y 3,4 kilogramos
Hallar la media, varianza y desviación estándar
3
( x 2 12 x 20) si 2 x 10
f ( x) 256
0 en otros casos
Graficar la función de densidad
Hallar la probabilidad de que una sandía pese menos de 5 kilogramos
Hallar la media, varianza y desviación estándar
79
Docente: Gilbert Chua
1. Distribución Binomial
Existen muchas situaciones en las que se presenta una experiencia binomial. Este tipo
de experiencias se caracteriza por estar formada por un número predeterminado n de
experimentos iguales. Cada uno de los experimentos es independiente de los restantes
(la probabilidad del resultado de un experimento no depende del resultado del resto). El
resultado de cada experimento ha de admitir sólo dos categorías (a las que se denomina
éxito y fracaso). Las probabilidades de ambas posibilidades han de ser constantes en
todos los experimentos (se denotan como p y q o p y 1-p).
Se designa por X a la variable que mide el número de éxitos que se han producido en los
n experimentos.
Cuando se dan estas circunstancias, se dice que la variable X sigue una distribución de
probabilidad binomial, y se nota B(n,p).
Características analíticas
donde
Parámetros de la distribución
Si tenemos una distribución Binomial de parámetro n y p se verifica que
Media o esperanza: np
80
Docente: Gilbert Chua
Varianza: 2 np(1 p)
Una prueba de inteligencia está compuesta por 10 preguntas, cada una de las cuales
tiene 4 respuestas y solo una de ellas correcta. Un alumno tiene prisa por acabar la
prueba y decide contestar aleatoriamente. Se pide
Solución
Consideremos los sucesos
A = Contestar bien P (A) = 0.25
A = No contestar bien P ( A ) = 0.75
Se trata de una distribución Binomial de parámetros B (10, 0.25 )
Sea X la variable aleatoria que representa el número de preguntas contestadas
correctamente
10
a) P(acertar 4) = PX 4 (0.25) 4 (0.75)6 0.1460
4
10
b) P (no acertar ninguna) = PX 0 (0.25)0 (0.75)10 0.0563
0
10
c) P(acertar todas) = PX 10 (0.25)10 (0.75)0 0
10
10 10
(0.25)8 (0.75) 2 (0.25)9 (0.75) 0 0.005
8 9
81
Docente: Gilbert Chua
e) P( acertar a lo sumo 3) =
P X 3 PX 0 PX 1 PX 2 PX 3
f) Media y Varianza
np 10 (0.25) 2.5
2 np(1 p) 10(0.25)(0.75) 1.875
Ejercicio 1:
Ejercicio 2
En un estudio socioeconómico se ha determinado que las condiciones socioeconómicas
del 35% de la población de un distrito de Moquegua son inaceptables. Elegida una
muestra de esa población formada por 9 individuos, calcular:
Distribución de Poisson
Esta distribución se presenta cuando los “éxitos” (que son elementos ó sucesos que
suelen ser expresados por unidad de área ó unidad de tiempo respectivamente) llegan a
satisfacer las siguientes características:
82
Docente: Gilbert Chua
e x
f ( x) x 0,1,...
x!
Con media y varianza:
np
np
Ejemplo:
Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las
probabilidades de que reciba,
83
Docente: Gilbert Chua
Ejercicio
Una compañía aérea observa que el número de componentes que fallan antes de cumplir
100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número
promedio de fallos es ocho. Se pide:
84
Docente: Gilbert Chua
85
Docente: Gilbert Chua
86
Docente: Gilbert Chua
87
Docente: Gilbert Chua
88
Docente: Gilbert Chua
89
Docente: Gilbert Chua
90
Docente: Gilbert Chua
91
Docente: Gilbert Chua
92
Docente: Gilbert Chua
EJERCICIOS: Hallar
1) P (3,01≤ Z ≤3,62)
2) P (1,84≤ Z ≤1,96)
3) P (-2,36≤ Z ≤-1,43)
4) P (-1,75≤ Z ≤-0,45)
5) P (Z > 2,03)
6) P (Z <-2,33)
93
Docente: Gilbert Chua
94