Contenidos
1.
2.
Introduccin
Estadstica Descriptiva:
Univariante
Bivariante
3.- Probabilidades
4.- Distribucin de probabilidades
5.- Distribucin en el Muestreo
6.- Estimacin de Parmetros
7.- Dcimas de Hiptesis
8.- Anlisis de Varianza
Prof.: David Becerra
Rojas
Bibliografa
1.
2.
3.
4.
5.
6.
7.
Murray y Espieges Estadstica
Paul Newbold Estadstica para los negocios
Mario Triola Probabilidad y Estadstica
L. Chao Estadstica para la ciencia Administrativa
R. Levin Estadstica para Administradores
Mongomery Probabilidad y Estadstica para Ingeniera
Apuntes Prof.
Prof.: David Becerra
Rojas
ESTADISTICA
CIENCIA QUE NOS PERMITE
TOMAR DECISIONES BAJO
CIERTA INCERTIDUMBRE
Trminos Comunes
Proceso de realizar una observacin o una medicin
Experimento
Caracterstica o fenmeno, que puede tomar distintos va
Variable
Dato
Resultado de la observacin de una variable.
Poblacin Conjunto total de elementos o individuos, que poseen una
Muestra
caracterstica comn, acerca de la cual se quiere informacin
Subconjunto de la poblacin, seleccionada de acuerdo a una regla o u
Censo Obtencin de todos los datos de inters que posee la pobla
EstadsticoFuncin o formula que depende de los datos de la mues
Parmetro Funcin o formula que depende de los datos de la pobla
Inferencia Estimacin del parmetro a travs del estadstico
Prof.: David Becerra
Rojas
Mtodo Cientfico
1.
2.
3.
4.
Planteamiento del Problema
Diseo del Experimento
Experimentacin y Recoleccin
Organizacin y Descripcin de
Resultados
5. Inferencia Estadstica
Prof.: David Becerra
Rojas
Muestreo
Notacin:
N : Tamao de la Poblacin
n : Tamao de la Muestra
Prof.: David Becerra
Rojas
Tipos de Muestreos Aleatorios
Aleatorio Simple
Estratificado
Sistemtico
Por Conglomerado
Muestreo en Etapas
Prof.: David Becerra
Rojas
Muestreo Aleatorio Simple
Todos los elementos de la poblacin, tienen la misma
oportunidad de estar contenidos en la muestra.
Se enumeran todos los elementos, y luego se
extraen de uno en uno, aleatoriamente, hasta
completar el tamao de la muestra.
Cuando la poblacin es muy grande, se puede
recurrir a los nmeros aleatorios.
Prof.: David Becerra
Rojas
Muestreo Estratificado
Mtodo de seleccin, utilizado cuando la
poblacin, est dividida en grupos llamados
estratos, cada uno, formado por una gran
cantidad de elementos homogneos.
Se toma una muestra aleatoria simple, en cada
estrato.
Los estratos, pueden ser de igual o distinto tamao,
si son distintos, una manera posible de determinar
el tamao de la muestra al interior de cada estrato,
es que esta sea proporcional al tamao del mismo,
a este tipo de asignacin, se le conoce como
Afijacin Proporcional, que no siempre resulta la
mejor, debido al costo de muestreo en cada estrato.
Prof.: David Becerra
Rojas
Muestreo Sistemtico
Este mtodo, se utiliza cuando la poblacin tiene
sus elementos ordenados. Se divide la poblacin
(de tamao N) en tantas sub poblaciones, como sea
el tamao de la muestra (n), todas de igual tamao
(k = N/n).
Se selecciona al azar un elemento de la
primera sub poblacin, y de ah en adelante,
de las sub poblaciones siguientes, se extrae el
elemento correspondiente.
Prof.: David Becerra
Rojas
10
Muestreo por Conglomerado
Se utiliza, cuando la poblacin, est dividida en
una gran cantidad de pequeos grupos, llamados
Conglomerados, cada uno formado por elementos
heterogneos. Se toma una muestra aleatoria de
Conglomerados, y luego se censan todos los
conglomerados seleccionados.
Prof.: David Becerra
Rojas
11
Tipos (gnero)de Variables
(Datos )
Variable
(Escalas)
Cuntitativas
Numricos
Discreta
Continua
Cualitativas
Categricos
Ordinal
Nominal
Ejemplo
Variable
Gnero ( Tipo )
Nombre
Categrica Nominal
Direccin
Categrica Nominal
Edad
Numrica Continua
No. Telfono
Categrica Nominal
Remuneracin
Numrica Discreta
Color de pelo
Categrica Nominal
Sonido
Categrica Ordinal
Intensidad del
Sonido
Numrica - Continua
Calidad
Numrica - Continua
Velocidad
Hora
Prof.: David Becerra
Rojas
Categrica Ordinal
No es variable ( Unidad de
medida de tiempo )
13
Escala Nominal
Usa nmeros como una manera de
separar los elementos de la poblacin
en diferentes clases o categoras.
El nmero asignado a la observacin
slo sirve como un nombre o
identificador,
identificador para distinguir la
categora a la cual pertenece la
observacin.
Ejemplo alumnos por...
Sexo : 1: masculino, 2: femenino;
Colegio: 1: Trinity College; 2: Scuola Andrea
Doria,
Escala Ordinal
Existe un orden implcito entre las
mediciones.
El valor numrico es usado slo como una
manera de arreglar los elementos de
acuerdo al orden establecido.
existe una relacin de orden total entre las clases.
no es posible cuantificar la diferencia entre los
individuos
pertenecientes a las distintas clases.
Ejemplo: Calificaciones
1 (muy bueno), 2 (bueno), 3 (satisfactorio), 4 (admisible), 5
(deficiente)
MB
Organizacin de Datos
Consideremos que la variable X, se divide
En k clases o categoras, denominadas:
C1 , C2 , C i , Ck
Dando origen a la Siguiente tabla de Frecue
Prof.: David Becerra
Rojas
16
Tablas de Frecuencia
i
ni
fi
Ni
Fi
C1
n1
f1
N1
F1
C2
n2
f2
N2
F2
Ci
ni
fi
Ni
Fi
Ck
nk
fk
Nk=n
Fk=1
///
///
To tal
Prof.: David Becerra
Rojas
17
Tablas de Frecuencias
Frecuencia Absoluta:
(ni )
Frecuencia Relativa :
( fi =ni/n )
Frecuencia Acumulada Absoluta:
(Ni)
Frecuencia Acumulada Relativa :
(Fi =Ni/n )
Prof.: David Becerra
Rojas
18
Ejemplo 1:
Opinin de alumnos por una bebida nueva
M MB B B R M MM R MB MB R B B
M R B B
R MB B B B
R M MM B
R R B R B R
Determine: a.- La variable x:
Opinin de los alumnos..
b.- El tpo de Variable: Categrica Ordinal
c.- Una tabla de frecuencia
Tabla
i
X
1 MM
2
M
3
R
4
B
5 MB
Total
ni
2
4
10
12
4
32
fi
.06
.13
.31
.38
.12
1.0
Ni
2
6
16
28
32
//
Fi
.06
.19
.50
.88
1.0
//
d.- Determine e
Interprete5
.38
k= 10
f4= 16
n3=32
N3= .50
n= alumnos
F3= consideran q
e.- Cuantos
la bebida es al menos regular?
26 alumnos
Prof.: David Becerra
Rojas
19
Ejemplo 2:
4
3
3
5
5
8
4
Determine:
Tabl
a
i
X
ni
4
8
5
4
6
0
3
30
1 2
2 3
3 4
4 5
5 6
6 7
7 8
Total
Prof.: David Becerra
Rojas
Nmero de artculos defectuosos por da.
6
6
8
6
3
3
2
6
2
6
4
4
4
3
3
5
Nmero de artic. Defec. Por da
a.- La variable X:
b.- El tpo de Variable: Numrica Discreta
c.- Una tabla de frecuencia
fi
Ni
Fi
d.- Determine e Interprete
7
k=
f4= .13
n3=
n=
.13
.27
.17
.13
.20
.00
.10
1.0
4
12
17
21
27
27
30
//
.13
.40
.57
.70
.90
.90
1.0
//
5
30
N4=
F3=
21
.57
e.- En cuantos das el nmero de
artculos defectuosos fue de al
18 das
menos 4?
f.- Cul fu el nmero mximo de artculos
def. por da, en los 15 das que hubieron
menos?
4 artculos
g.- Cuntos artc. Defec. en total, se juntaron
42 artculos
en los 6 das en que hubieron ms?
20
Tabla de Frecuencia con
Intervalos de Clase
Caractersticas
( X(X
Caractersticas
R):A):
1. Rango:
R=
Valor Mx. Valor mn.
+ 1u
Se
1.- obtienen
Limite inferior
a partir
delde
primer
los Intervalos
intervaloAparentes,
corresponde
ampliando
al valor
(1u: Una unidad de medida)
estos
mnimo
en media
menos
unidad
las p*
de unidades
medida hacia
adicionales
cada extremo,
correspondientes
de tal
2.
Cantidad
dedelIntervalos,
Segn
Sturgers:
manera,
2.- Limiteque
superior
el limite
superior
ltimo intervalo
de un intervalo,
corresponde
corresponda
al valor al
k = 1siguiente.
+ unidades
3.3 log(n)
kN
inferior
mximo
del intervalo
ms las p**
adicionales correspondientes.
3.
Amplitud:
Rk (ade valor
superior cuando no es exacto)
3.- Se
expresan enala=unidad
medida.
Obs.: La amplitud (a), se puede obtener de la diferencia entre dos limites
Ej.
1u =separados
0.01
4.-SiEstn
por una unidad de medida.
inferiores
o superiores consecutivos, o*entre dos marcas de clases
y a= consecutivas
R/k = 4.571 4.58 ( se expresa en la unidad de medida)
4. Adicionales: p = a k R
5. Intervalos : Aparentes (X )
A
Reales (XR)
6. Marcas de Clases (Xi)
Prof.: David Becerra
Rojas
Xi = ( Ls + Li ) 2
21
Ejemplo
Sea Valor mnimo = 4.7
Valor Mximo
= 12.6
n = 42
Determine los intervalos aparentes y
reales con sus respectivas marcas de
clase.
Prof.: David Becerra
Rojas
22
1.
2.
3.
4.
Rango R = 12.6 4.7 + 0.1 = 8.0
K = 1 +3.3 log(42) = 6.4 6
a = 8.0 6 = 1.33 1.4
P = 1.4*6 -8.0=0.4 ( = 0.2 + 0.2 )
5. =Intervalos :
1
2
3
4
5
6
Prof.: David Becerra
Rojas
4.5 5.8
5.9 7.2
7.3 8.6
8.7 10.0
10.1 11.4
11.5 12.8
XA
XR
Xi
4.45 5.85 5.15
5.85 7.25 6.55
7.25 8.65 7.95
8.65 10.05 9.35
10.05 11.45 10.75
11.45 12.85 12.15
23
Ejemplo 2:
Considere los siguientes datos:
0.94 1.05 0.86 0.94 0.96 1.03 1.01
0.78 0.84 0.86 1.04 0.76 0.65 0.70
Confeccione una tabla de frecuencia.
Prof.: David Becerra
Rojas
24
1.
2.
3.
4.
Rango R = 1.05 0.65 + 0.01 = 0.41
K = 1 +3.3 log(14) = 4.8 5
a = 0.41/5=0.082 0.09
P = 0.09*5 -0.41=0.04 (=0.02 + 0.02)
5. =Intervalos :
i
1
2
3
4
5
XA
0.63
0.72
0.81
0.90
0.99
0.71
0.80
0.89
0.98
1.07
Prof.: David Becerra
Rojas
XR
0.625
0.715
0.805
0.895
0.985
0.715
0.805
0.895
0.985
1.075
Xi
0.67
0.76
0.85
0.94
1.03
ni
2
2
3
3
4
14
0.14
0.14
0.21
0.21
0.29
1.00
fi
2
4
7
10
14
Ni
Fi
0.14
0.28
0.49
0.70
1.00
25
Complete la siguiente Tabla
Luego como a = 2.9
i
1
2
3
4
XR
8.25
11.15
14.05
14.05
16.95
ni
- 11.15 12
-
24
16.95
19.85
Total
19.85
Prof.: David Becerra
22.75
Rojas
0.20
Ni
24
120
Fi
Xi
12
9.7
36
12.6
48
12
48
fi
96
0.8
0
15.5
18.4
12
21.
0
3
//// ///// /////
26
Tarea No. 1 ( Excel )
Determine una muestra aleatoria de
tamao n = 1500
Construya una tabla de frecuencia 9
intervalos.
Ilustre los datos a travs de un:
Histograma
Ojiva
Nota: Consulte videos de youtube.
Prof.: David Becerra
Rojas
27
TIPOS de GRFICOS
Principalmente en variables :
Categricas y Numricas Discret
Grfico de Barras
Grfico de Sectores Categricas
Histograma
Numricas Continuas
Polgono
Numricas Continuas
Ojiva
Numricas
Pctograma
Numricas y Categricas
Diagrama de Caja y Bigote
(Tarea)
Prof.: David Becerra
Rojas
28
Grfico de Barras
ni
H A
Prof.: David Becerra
Rojas
K M
xi
29
Grfico de Sectores (
Circular)
1
2
3
4
Prof.: David Becerra
Rojas
30
Histograma
ni
|
100|
|
80
|
60
|
40
|
20
|_________________________
120
3.5
Prof.: David Becerra
Rojas
5.5
7.5
9.5 11.5
13.5
XR
31
Polgono
ni
2.5
Prof.: David Becerra
Rojas
4.5
6.5
8.5
10.5
12.5
Xi
32
Ojiva
Fi
Prof.: David Becerra
Rojas
33
Pictograma
(Consumo de carne de vacuno)
1000 ejemplares
1990
1995
2000
2005
Prof.: David Becerra
Rojas
34
Ejemplo 1
i
xi
ni
fi
fix360
1
2
3
4
5
To
H
A
K
M
B
tal
10
18
12
5
25
70
.143
51.4
.257
92.5
51.4
.171
61.6
143.
9
.071
25.6
.357 128.5
1.00 360
()a
c
205.
5
231.
1
360.
0
Confeccione un grfico de Barras y uno de Sectores
/////
Prof.: David Becerra
Rojas
35
Ejercicio
Supongamos que los datos siguientes representan los tiempos,
que demoran unos atletas en terminar una maratn.
1:35 1:28 1:45 1:52 1:40 1:30 1:38 1:47 1:37
1:30 1:40 1:36 1:29 1:35 1:37 1:36 1:40 1:36 1:48
2:05 1:32 2:28 1:45 1:50 1:47 2:29 1:44 1:49
1.
2.
3.
4.
5.
Identifique la variable
Indique el gnero ( tipo)
Construya una tabla de frecuencia de 5 intervalos
Confeccione un; Histograma, Ojiva y un grfico de sectores
Calcule de la tabla:
a.- Media, Moda, Mediana, P35.
b.- Si clasifican los 10 primeros, cual es el tiempo mximo para
clasificar?
Prof.: David Becerra
Rojas
36
ESTADISTICOS ( o
Estimadores)
CUANTILES ( Estadsticos de Orden)
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE DISPERSIN
Prof.: David Becerra
Rojas
37
CUANTILES: (ESTADSTICOS DE
ORDEN)
Cuartles
( Kk )
Quintles
(Qq)
Decles
( Dd )
Percentles
( Pp )
Prof.: David Becerra
Rojas
38
Cuartiles:
k = 1, 2, 3
75%
50%
25%
K1
Prof.: David Becerra
Rojas
K2
K3
39
Quintiles:
Q = 1, 2, 3, 4
q x 20%
Qq
Prof.: David Becerra
Rojas
40
Deciles:
d = 1, 2, .., 9
(10*d)%
Dd
Prof.: David Becerra
Rojas
41
Percentles:
p = 1, 2, ., 99
p%
Pp
Prof.: David Becerra
Rojas
42
Ejercicio
La tabla siguiente, representa los aos de
Servicio de los trabajadores de una empresa.
i
1
2
3
4
5
6
X i ni
3
6
9
10
12
18
Total
15
18
26
38
30
25
152
Prof.: David Becerra
Rojas
Ni
15
33
59
97
127
152
Fi
1.-
Calcular : K1 , Q3 , D2 , P45
K1 = 9
0.09
Q3 = 10
0.22
D2 = 6
P45 = 10
0.39
0.64 2.- Cul es el ao de servicio mnimo
0.84
de los 30 trabajadores ms
1.00 antiguos
12
aos
43
Cuantiles:
t : 1,2,3
1,2,3,4
1,2..9
Cuando los datos estn ordenados en una tabla de frecuencia1,2,99
Con intervalos de clase, se puede utilizar la siguiente expresin
Cuartiles
Quintiles
Deciles
Percentiles
a
t *n
Ct Li
N t 1 *
S
nt
Li : Limite real inferior del intervalo que contiene el cuantil t, que es aquel
donde por primera vez la frecuencia acumulada pasa el (t/Sx100)%.
S : 4, 5, 10, 100 ( Cuartil, Quintil, Decl, Percentil , respectivamente)
Nt-1: frec. Acumulada anterior al intervalo que contiene el C t.
nt : frec. Absoluta del intervalo que contiene el Ct.
a : Amplitud del intervalo.
n : Tamao de Muestra ( Total de Datos)
Prof.: David Becerra
Rojas
44
Ejemplo
i
1 2.4 - 2.9
2 3.0 - 3.5
3 3.6 - 4.1
4 4.2 - 4.7
5 4.8 - 5.3
6Determine
5.4 - 5.9:
ni f i
Ni Fi
4 .08 4
8 .16 12
15 .30 27
10 .20 37
5 .10 42
8 .16 50
50 1.0
K3 , D1 , P35, y
.08
.24
.54
.74
.84
1.0
3 * 50
0.6
37 *
5
4
= 4.81
1* 50 0.6
4 *
10
8
= 3.025
35 * 50
0.6
12 *
100
15
= 3.77
K 3 4.75
D1 2.95
P35 3.55
P74 , Q3
P74 = 4.75
Si la variable X representa la utilidad en M$ por da determine:
i.- Cul fue la utilidad mxima de los 15 das que gan menos?
Total
ii. En cuntos das la utilidad fue de al menos M$ 5.0?
Q3 = 4.33
M$ 3.67
11 das
iii.- Que porcentaje de los das tiene una utilidad no superior a
5.0 ni inferior a 4.5 M$?
Prof.: David Becerra
Rojas
45
MEDIDAS DE TENDENCIA
CENTRAL
MODA
MEDIANA
MEDIA ARITMTICA
MEDIA ARMNICA
MEDIA GEOMTRICA
Prof.: David Becerra
Rojas
46
MODA ( MODO)
La denotaremos por : Mo
a.Est dada por la observacin que ms se
repite la de mayor frecuencia.
b.Es posible calcularla para cualquier tipo de
variable.
c.Pueden existir muchas o ninguna.
Prof.: David Becerra
Rojas
47
MODA
Ejemplo 1: Sean los siguientes datos:
F D
i
R F T D R U D U U D
X i ni
1 F
2 D
3 R
4 T
5 U
Total
Prof.: David Becerra
Rojas
2
4
2
1
3
12
Luego; en este caso la
Moda es:
Mo = D
48
MODA
Ejemplo 2 :
2 3 5 1 1 5 2 5 4 2 4 2 5 1 6
i Xi
1 1
2 2
3 3
4 4
5 5
6 6
Total
Prof.: David Becerra
Rojas
ni
3
4
1
2
4
1
15
En este caso tenemos dos Mo:
Mo1= 2
Mo2 = 5
49
MODA
La moda para datos tabulados, se obtiene a partir de la
siguiente expresin:
1
M o Li
*a
1 2
Donde: Li : Limite real inferior del intervalo que contiene la Mo
que es
aquel que tiene mayor frecuencia
1 : Diferencia entre las frecuencias absolutas del intervalo modal y
el intervalo anterior.
2 : Diferencia entre las frecuencias absolutas del intervalo modal y
el intervalo posterior.
a : Amplitud del intervalo.
Prof.: David Becerra
Rojas
50
Ejemplo :
i
1
2
3
4
X
4- 5
6- 7
8- 9
10 - 11
T otal
ni
42
68
102
38
250
1 (102 68)
2 (102 38)
Prof.: David Becerra
Rojas
Calcule la Moda
1
M o Li
*a
1 2
34
M o 7.5
*2
34 64
8.19
51
MEDIANA
La denotaremos como : Md
Puntuacin que divide la distribucin de los
datos ( la muestra) en dos partes iguales.
Es decir nos indica el punto hasta donde se
tiene acumulado el 50% de las observaciones.
Nota: - Para su determinacin, los datos se
ordenan previamente.
- No tiene sentido cuando la
variable
es categrica nominal.
Prof.: David Becerra
Rojas
52
MEDIANA
Si el nmero de observaciones impar,
entonces la Md estar dada por la
observacin central.
Si el nmero de observaciones par,
entonces la Md estar dada por el
promedio de las dos observaciones
centrales.
Prof.: David Becerra
Rojas
53
MEDIANA
Ejemplo: 1
2 3 5 5 7 9 10 27 29 30 38 40 98
En este caso la Md = 10
n=13
Ejemplo: 2
2,1 2,3 2,6 3,6 5,8 6,8 7,9 10,3
n=8
Luego ; Md =
Prof.: David Becerra
Rojas
(3,6+5,8)/2 = 4,7
54
MEDIANA
Ejemplo: dado los siguientes datos:
i
1
2
3
4
5
6
Xi
ni
3
2
2
3
4
3
17
Ni
3
5
7
10
14
17
Fi
.18
.29
.41
.59
.82
1.0
4
5
6
7
8 Determine;
9
Prof.: David Becerra
Rojas
10
11
12
13 14
15
16
17
4 4 4 5 5 6 6 7 7 7 8 8 8 8 9 9 9
Md = 7
Md
55
MEDIANA
La mediana para datos tabulados, se obtiene a partir de
la siguiente expresin:
a
n
M d Li N d 1 *
2
nd
Donde:
Li : Limite real inferior del intervalo que contiene la Md, que es aquel
donde por primera vez la frecuencia acumulada pasa el 50%.
n : Tamao de la muestra
N d-1 : Frec. acumulada anterior al intervalo que contiene la Mediana.
n d : Frec. Absoluta del intervalo que contiene la Md
a : Amplitud del intervalo.
Prof.: David Becerra
Rojas
56
Ejemplo de Mediana
i
ni
4
8
15
18
2
3
50
fi
.08
.16
.30
.36
.04
.06
1.0
1 4 - 5
2 6 - 7
3 8- 9
4 10 - 11
5 12 - 13
6Determine;
14 - 15
Prof.: David Becerra
Rojas
Ni
4
12
27
45
47
50
Fi
.08
.24
.54
.90
.94
1.0
n
2
M d 7.5 12 *
2
15
Luego la Md = 9.23
y la Moda Mo = 9.82
M d , Mo
57
Ejercicio.
4.8
3.6
5.2
6.1
6.0
2.9
3.5
4.8
4.3
4.2
4.8
3.1
4.8
2.9
5.5
5.0
4.8
5.6
6.0
1. Calcular Mo , Md
2. Construya una tabla de frecuencia
3. Calcule de la tabla Mo , Md.
4. Comente.
Prof.: David Becerra
Rojas
58
MEDIA ARITMTICA
La media Aritmtica tambin llamada Promedio
simplemente Media, y esta dada para datos no
tabulados por : (Se calcula solamente en variables numricas)
Poblacional
Muestral
X
i 1
X
i 1
Donde: Xi : Corresponde a las Observaciones
n : Tamao de la Muestra
N : Tamao de la Poblacin
Prof.: David Becerra
Rojas
59
MEDIA ARITMTICA
Para datos Tabulados la Media est dada por :
k
n
i 1
Xi
fx
i 1
i i
Donde: Xi : Observacin Marca de Clase
n : Tamao de la muestra
ni : Frecuencia Absoluta de la observacin o del
intervalo
k : Nmero de intervalos
Prof.: David Becerra
Rojas
60
Ejemplo:
La tabla siguiente representa una muestra de
los
aos de servicio de trabajadores.
i Xi ni Xi*ni fi
fixxi
----------------------------------------------1 5 4 20 0.167
0.835
2 10 7 70 0.292
2.920
3 12 8 96 0.333
3.996
4 15 3 45 0.125
1.875
20 2 40
5----------------------------------------------0.083
1.660
Total 24 271 1.000
11.292
Determine la Media:
5
n x
i i
i 1
271
X
11.292
24
X f i xi = 11.292
i 1
Prof.: David Becerra
Rojas
61
Ejemplo 2:
Se toma una muestra de 21
observaciones,
calcule la Media.
i
1
2
3
4
5
6
X
2.3 - 2.4
2.5 - 2.6
2.7 - 2.8
2.9 - 3.0
3.1 - 3.2
3.3 - 3.4
Total
ni
4
5
3
2
4
3
21
Luego como
xi
2.35
2.55
2.75
2.95
3.15
3.35
6
X
k
X A
Prof.: David Becerra
Rojas
n u
i i
i 1
n x
i i
i 1
ni*xi
9.40
12.75
8.25
5.90
12.60
10.05
58.95
ui
-3
-2
-1
0
1
2
ni*ui
-12
-10
-3
0
4
6
-15
58.95
2.807
21
15
2.95
0.2 =
21
2.807
62
MEDIA PONDERADA
n1 * x1 n2 x 2 ... nk x k
X P XT
n1 n2 ... nk
i 1
ni * x i
Ejemplo: En una empresa donde se distinguen tres tipos de trabajadores, el
salario medio es de 290. Los 100 trabajadores de la categora A
tienen un salario medio de 480, los 300 de la categora B tienen un
salario medio de 320, Cunto es el salario medio de los 400 de la
categora C?
_
100x480 + 300x320 + 400x Xc
290 = --------------------------------------100 + 300 + 400
Prof.: David Becerra
Rojas
_
Luego Xc = 220
63
Tarea N
Ventajas y Desventajas de: Moda,
Mediana y Media.
Defina y de un ejemplo de :
Media Geomtrica :
(G)
Media Armnica
:
(H)
Sesgo
Curtosis
Ocupando los datos de la tarea anterior;
a) Calcule; Moda, Mediana y Media, con los
datos; no tabulados y tabulados.
b) Construya un grafico de caja y bigotes
Prof.: David Becerra
Rojas
64
Media Geomtrica:
Gn
xi
i 1
x1 * x2 * ..... * xn
Media Armnica:
n
n
i 1 xi
Prof.: David Becerra
Rojas
i 1
n
1
* ni
xi
65
MEDIDAS DE DISPERSIN
Rango:
(R)
Desviacin Intercuartlica: (K)
Desviacin Media:
(DM)
Varianza:
( s2 )
Desviacin Tpica:
(s)
Prof.: David Becerra
Rojas
66
MEDIDAS DE
DISPERSIN
Rango: (R)
R = V. Mximo V. Mnimo
Prof.: David Becerra
Rojas
1 Unidad de Medida
67
MEDIDAS DE DISPERSIN
Desviacin Intercuartlica: (K)
K
Prof.: David Becerra
Rojas
K 3 K1
2
68
MEDIDAS DE DISPERSIN
Desviacin Media:
Para datos No Tabulados
(DM)
DM
i 1
Para datos Tabulados
k
DM
Prof.: David Becerra
Rojas
n
i 1
Xi X
n
69
MEDIDAS DE DISPERSIN
Varianza: (s2 , 2)
X
i 1
Prof.: David Becerra
Rojas
2
(
x
)
i
2
x
i
i 1
i 1
Para datos No Tabulados
S2
Poblacional
Muestral
n 1
i 1
xi
2
i 1
n ( n 1)
xi
70
MEDIDAS DE
DISPERSIN
Muestral
k
S
2
Para datos Tabulados
ni X i X
i 1
Prof.: David Becerra
Rojas
n 1
n ni xi
i 1
n x
i 1
n(n 1)
i i
71
Ejemplo
Sean las edades ( en ao) de 5 nios
Obs. :
Xi :
x1 x2 x3 x4 x5
2 5 6 8 9
Determinar: Desv Media
Total
30
Varianza
___
xi - x : - 4 -1
_
| xi x | : 4 1
_
(xi - x)2 : 16 1
X 2i
S
2
i 1
10
4 25 36 64 81
n 1
Prof.: David Becerra
Rojas
30
7.5
4
S2
DM
30
X
i 1
10
2
5
210
n
30
6
5
n xi
i 1
i 1
n(n 1)
5 * 210 30
7.5
5* 4
2
72
MEDIDAS DE
DISPERSIN
Desviacin Tpica: (S , )
Poblacional:
Muestral :
n
Prof.: David Becerra
Rojas
(x )
i 1
2
i
i 1
Para datos No Tabulados
Xi
i 1
n 1
n xi
i 1
i 1
n(n 1)
73
MEDIDAS DE DISPERSIN
Para datos Tabulados
ni X i X
i 1
Prof.: David Becerra
Rojas
n 1
n ni xi
i 1
n x
i 1
n( n 1)
74
COEFICIENTE DE
VARIACIN
CV
S
X
Mide la homogeneidad que existe en los datos
Respecto a la variable en estudio.
Mientras ms pequeo, ms homogneo.
Prof.: David Becerra
Rojas
75
Ejemplo 2
i
1
2
3
4
5
6
Calcule: la Media , Desv. Tpica
ni
4
5
3
2
4
1
19
X
2.3 - 2.4
2.5 - 2.6
2.7 - 2.8
2.9 - 3.0
3.1 - 3.2
3.3 - 3.4
xi
2.35
2.55
2.75
2.95
3.15
3.35
nixxi
9.40
12.75
8.25
5.90
12.60
3.35
52.25
nixxi2
22.09
32.51
22.69
17.41
39.69
11.22
145.61
Sabemos que : X
n
n ni xi
i 1
n x
i 1
n(n 1)
Prof.: David Becerra
Rojas
i i
n x
i i
i 1
52.25
2.75
19
CV
s 0.327
0.119
x 2.75
19(145.61) 52.25
19(19 1)
= 0.327
76
Calcule: la Media , Desv. Tpica
por el Medio Provisorio
Ejemplo 2
i
1
2
3
4
5
6
ni
4
5
3
2
4
1
19
X
2.3 - 2.4
2.5 - 2.6
2.7 - 2.8
2.9 - 3.0
3.1 - 3.2
3.3 - 3.4
k
X A
n
S a
n u
i i
i 1
n ni ui
Prof.: David Becerra
Rojas
i 1
n u
i 1
n(n 1)
i i
xi
2.35
2.55
2.75
2.95
3.15
3.35
ui
-3
-2
-1
0
1
2
2.95
(19)
0.2
19
ni*ui
-12
-10
-3
0
4
2
-19
ni*ui2
36
20
3
0
4
4
67
= 2.75
19(67) 19
0.2
19(19 1)
= 0.327
77
Coeficiente de Asimetra ( Sesgo )
de Pearson
1
1 3
S
3
ni ( xi x) 3
S
i 1
k
de Fisher
Su valor es cero cuando la distribucin es simtrica, positivo
cuando existe asimetra a la derecha y negativo cuando existe
asimetra a la izquierda.
Prof.: David Becerra
Rojas
78
Coeficiente de Curtosis:
1
4
4
2 4 ni ( xi x) 3 4 3
S i 1
S
k
Prof.: David Becerra
Rojas
2 0 : Leptocrtica
2 0 : Mesocrtica
2 0 : Platicrtica
79
Estadstica Descriptiva
Bivariante
Prof.: David Becerra
Rojas
80
Estadstica Descriptiva Bivariante
Sean las siguientes variables:
X : A1, A2, ...................Af
Y : B1, B2,.....................Bc
Estas variables, se pueden ordenar en una tabla de
doble entrada llamada Tabla de Contingencia:
Prof.: David Becerra
Rojas
81
Tabla de Contingencia
X \ Y B1
A1
n11
A2
n21
B2
..Bj ..
:
:
Bc
Total
n1.
n2.
Ai
. . nij
. ni.
:
:
:
Af
:
nf.
Total n.1
n.2 ... n.j ..... n.c
n
Prof.: David Becerra
Rojas
n12
n22
82
Frecuencia Absoluta
(Conjunta)
Se denota por nij y se define como: Cantidad de
elementos que cuentan simultneamente con la
caracterstica Ai de la variable X y Bj de la variable Y
Prof.: David Becerra
Rojas
83
Frecuencia Absoluta
Marginal
ni.: Total de la fila i
= nij
j=1
n.j : Total de la Columna j
n.. : Total General
=
nij
i=1
= nij =
( Tamao muestra)
i=1 j=1
Prof.: David Becerra
Rojas
84
Frecuencia Relativa
Conjunta
Se denota por fij =
Prof.: David Becerra
Rojas
nij
n
85
Frecuencia Marginal Relativa
fi. =
fij =
j=1
f.j
f..
=
f =
i=1 ij
f
= fij =
ni.
n
n.j
n
i=1 j=1
Prof.: David Becerra
Rojas
86
Frecuencia Condicional
De x dado y ( x/y):
fi
j
De y dado x ( y/x):
fj
i
Prof.: David Becerra
Rojas
f ij
f. j
f ij
f i.
nij
n. j
nij
ni.
87
Independencia de Variables
Diremos que dos variables X e Y son
independientes si y solo si, la conjunta es igual al
producto de las marginales, para todo i, y para todo j.
Es decir;
f ij f i . * f . j
o
Prof.: David Becerra
Rojas
nij
i , j
ni . * n. j
n
88
Estadstica Descriptiva Bivariante
Ejemplo: Considere una muestra de contenedores en un recinto portuario.
Sea X : Peso (toneladas)
Y : Pas de origen
X
\ Y
Francia
Alemania
Japn
Total
Espaa
5 10
10
23
10 - 15
10
27
15 - 20
10
25
20 - 25
10
24
25 - 30
12
22
24
33
24
40
121
Total
Determine e Interprete :
f 5= c =4 n51 = 8
f34 = 10/121 f4. =
24/121
0.083
0.20
Prof.: David Becerra
Rojas
f.2 =
33/121
0.27
n2. = 27
fi=4/j=3 = 7/24
0.29
n.3 = 24 n.. = 121
fj=4/i=3 =
10/25
0.40
89
Asociacin de Variables
Numricas
i
1
2
.
.
.
n
Prof.: David Becerra
Rojas
X
x1
x2
.
.
.
xn
Y
y1
y2
.
.
.
yn
90
Tipos de Asociacin
Favorable :
Inversa:
yj
..
yi
. .
..
..
yi
.. .
xi
Prof.: David Becerra
Rojas
... .
. ..
yj
xj
xi
..
xj
x
91
Ejemplo:
Sea X: Remuneracin
Y: Cargas
iFamiliares
x
y
( x x)
1
2
3
4
5
6
Total
1
1
3
4
4
5
2
3
3
5
2
6
18
21 0
Media 3.0
Prof.: David Becerra
Rojas
3.5
-2
-2
0
1
1
2
( y y)
-1.5
-0.5
-0.5
1.5
-1.5
2.5
0
---------
( x x)( y y )
3
1
0
1.5
-1.5
5
9
1.5
92
Covarianza ( cov (x,y) )
( x x)( y y )
Cov ( x, y )
n
9
Cov ( x, y ) 1.5
6
Cov ( x, y )
Prof.: David Becerra
Rojas
93
Coeficiente de Correlacin
Mide el grado de asociacin
entre las variables
Cov( x, y )
r
sx * s y
r
n xy x y
(n x ( x) )(n y ( y ) )
2
-1 r 1
r : Se expresa en porcentaje
Prof.: David Becerra
Rojas
94
En nuestro caso tenemos:
i
1
2
3
4
5
6
X
1
1
3
4
4
5
Y
2
3
3
5
2
6
XY
2
3
9
20
8
30
X2
1
1
9
16
16
25
Y2
4
9
9
25
4
36
Total
18
21
72
68
87
XY
n xy x y
(n x 2 ( x) 2 )(n y 2 ( y ) 2 )
Prof.: David Becerra
Rojas
6 * 72 18 * 21
(6 * 68 18 )(6 * 87 21 )
2
= 0.65
95
Tarea 4
Ejercicio de aplicacin del coeficiente de
correlacin
de Sperman. ( Variables Categricas )
Prof.: David Becerra
Rojas
96
Regresin Lineal
Consiste en ajustar a los datos (representados en el
diagrama de Dispersin, una lnea, que puede ser rect
o curvilnea .
En esta oportunidad analizaremos el caso de la lnea re
Esta recta, tambin sirve para marcar la tendencia
De los datos, para hacer proyecciones, y para estimar
algn valor de y dado un valor de x.
Y = a + bX
Prof.: David Becerra
Rojas
97
Error:
ei yi y i
e ( y y ) O
i
Varianza del Error: (2)
cuyo estimador est dado por:
S S
2
e
Prof.: David Becerra
Rojas
2
y
(
y
y
)
i i
n2
98
Debemos minimizar la varianza del Error
Para tal efecto debemos minimizar:
A ( yi y i ) ( yi a bxi )
2
Es decir derivar A
Prof.: David Becerra
Rojas
99
Sistema de Ecuaciones Normales
A
a
A
b
Prof.: David Becerra
Rojas
0
0
100
Luego tenemos:
A
2 ( yi a bxi )( 1) 0
a
na b xi yi
A
2 ( yi a bxi )( xi ) 0
b
2
a xi b xi xi yi
Prof.: David Becerra
Rojas
101
Por lo tanto, el sistema de Ecuaciones Normales
queda de la siguiente forma:
na b xi y
a xi b x xy
2
i
Prof.: David Becerra
Rojas
102
Por determinante tenemos;
x
x x
n
n x x
2
y x
y x x xy
xy x
a
a
n xy x y
x xy
b
b
Prof.: David Becerra
Rojas
103
Estimadores Mnimos Cuadrado
y x x xy
a
n x ( x )
2
xy x y
n x ( x )
Prof.: David Becerra
Rojas
a
Y bX
104
En el caso que estamos analizando tenem
(e)
i
1
2
3
4
5
6
X
1
1
3
4
4
5
Total
18
Luego tenemos que;
Y
2
3
3
5
2
6
21
X
1
1
9
16
16
25
Y
4
9
9
25
4
36
72
68
87
(21)(68) (18)(72)
1.57
2
n(68) 18
y la varianza del error es
Prof.: David Becerra
Rojas
XY
2
3
9
20
8
30
2
y x
Y
2.2
2.2
3.5
4.1
4.1
4.8
(Y Y)2
0.04
0.64
0.25
0.81
4.41
1.44
0.0
6(72) (18)(21) 7.59
b
0.64
2
n(68) 18
(
y
y
)
i i
n2
Y-Y
-0.2
0.8
-0.5
0.9
-2.1
1.2
( e2 )
7.59
1.898
4
105
Error Tpico: ( )
Sy x S
2
e
( y i yi )
n2
7.59
1.898 1.38
4
Tambin se puede obtener a partir de:
Se S y
x
Prof.: David Becerra
Rojas
a y b xy
n2
106
Coeficiente de
Determinacin
El coeficiente de Determinacin, nos
indica la variabilidad explicada por la recta
de regresin lineal, es decir que tan bueno
es el ajuste de la recta.
Esta dado por:
r2
0 r2 1
Nota: Referencia para el ajuste, tambin lo
el error tpico Sy/x
Prof.: David Becerra
Rojas
107
Ejemplo:
X : Aos de servicio de vendedore
Supongamos que tenemos dos variables:
Y : Ventas en M$
1. Confeccione un diagrama de dispersin
2. Determine el grado de asociacin entre las variables
3. Estime a travs de una recta de m. c. cuanto debiera vender
4.
un vendedor con siete aos de servicio?.
Estime a travs de una recta de m. c. cuanto aos de servicio
debera tener, un vendedor que vende m$ 4.0?.
Vendedor
1
2
3
4
5
6
Total
Prof.: David Becerra
Rojas
X
2
2
3
4
4
5
20
Y
1.2
2.4
4.1
3.1
2.4
3.8
17.0
XY
2.4
4.8
12.3
12.4
9.6
19.0
60.5
X2
4
4
9
16
16
25
74
Y2
1.44
5.76
16.81
9.61
5.76
14.44
53.82
108
Luego:
n xy x y
6(60.5) (20.)(17.)
r
(n x 2 ( x ) 2 )(n y 2 ( y) 2 )
(6(74.) (20.) 2 )(6(53.82.) (17.) 2 )
=.5954
x xy (17)(74) (20)(60.5)
1.09
6(74) (20)
n x ( x )
y
x2
2
xy x y 6(60.5) (20)(17) .523
6(74) (20)
n x ( x )
Prof.: David Becerra
Rojas
109
Varianza del Error:
S y2 x
(
y
y
)
i i
n2
2
y
a y b xy
n2
=.9124
Error Tpico:
Sy x
(
y
y
)
i i
Prof.: David Becerra
Rojas
n2
2
y
a y b xy
n2
=.9552
110
Luego:
r
n xy x y
(n x ( x) )(n y ( y ) )
2
2
x
y
y xy
n y ( y )
2
n xy x y
n y ( y )
Sx/ y
Prof.: David Becerra
Rojas
1.41
0.68
2
x
c x d xy
n2
0.5954
1.079
111
Las propiedades de la media son las siguientes:
- La Media de una constante es la propia constante.
- La media de la suma o diferencia de variables es igual a la suma
o diferencia de las medias de dichas variables.
- La media del producto de una constante por una variable, es
igual a la constante por la media de la variable.
- La media de una combinacin lineal de dos o ms variables es
igual a la combinacin lineal de las medias de dichas variables.
- La media es el centro de gravedad de la distribucin, ya que las
desviaciones respecto a la media suman 0.
- Mediana: La mediana es el valor del elemento que ocupa el
lugar central, si los datos estn ordenados, bien de forma creciente
o de forma decreciente.
- Moda: La moda es el valor ms frecuente, es decir es el valor de
la variable que se repite un mayor nmero de veces.
En el caso de una distribucin totalmente simtrica, la media y la
mediana coinciden. Si la media y la mediana difieren mucho
significa que hay heterogeneidad entre los datos y que la
distribucin, por tanto ser asimtrica.
Prof.: David Becerra
Rojas
112
Las propiedades de la varianza son:
- La varianza es siempre positiva o cero.
- La varianza de una constante es cero.
- La varianza de la suma o diferencia de una variable y una
constante es igual a la varianza de la variable.
- La varianza de un producto de una constante por una
variable es igual al cuadrado de la constante por la varianza
de la variable.
Las propiedades de la desviacin tpica son:
- La desviacin tpica es siempre positiva o cero.
- La desviacin tpica de una constante es cero.
- La desviacin tpica de una constante por una variable es
igual a la constante por la desviacin tpica de la variable.
- La desviacin tpica de la suma o diferencia de una variable
y una constante es igual a la desviacin tpica de la variable.
Prof.: David Becerra
Rojas
113
Ejercicio:
Se toma una muestra de 112 turistas registrando
el peso de equipaje y nacionalidad.
X\Y
5 10
10 15
15 20
20 25
25 - 30
Chilena
Argentina Peruana
Brasilea
Total
4
8
2
3
4
1
10
12
3
0
5
9
10
2
3
1
0
10
10
15
20
24
25
21
22
57
112
Total 20
26
Determine:
1.- Cuntos turistas chilenos app llevan un peso no superior a 12kr.
2.- Podemos decir que el comportamiento del peso que llevan los turistas
argentinos , es mas homogneo del que llevan los brasileros?
3.- Determine e interprete:
fj=1/i=2 =
4.- Determine el grado de asociacin respecto al peso de equipaje,
entre los turistas chilenos y argentinos.
5.- A travs de una recta de m. c. estime cuntos turistas deberan llevar un
peso 27.5kr
Prof.: David Becerra
Rojas
114
Cuartiles
a
k *n
K k Li
N k 1 *
4
nk
Li : Limite real inferior del intervalo que contiene el cuartil t, que es aquel
donde por primera vez la frecuencia acumulada pasa el (k/4x100)%.
Prof.: David Becerra
Rojas
115
Quintiles
( Qq )
q = 1,..,99
a
q*n
Qq Li
N q 1 *
5
nq
Li : Limite real inferior del intervalo que contiene el percentil q, que es aquel
donde por primera vez la frecuencia acumulada pasa el (q%)
Prof.: David Becerra
Rojas
116
Deciles
( Dd ) d = 1,.,9
a
d *n
Dd Li
N d 1 *
10
nd
Li : Limite real inferior del intervalo que contiene el decil d, que es aquel
donde por primera vez la frecuencia acumulada pasa el (d*10)%
Prof.: David Becerra
Rojas
117
Percentiles
( Pp )
p = 1,..,99
a
p*n
Pp Li
N p 1 *
100
np
Li : Limite real inferior del intervalo que contiene el percentil p, que es aquel
donde por primera vez la frecuencia acumulada pasa el (p%)
Prof.: David Becerra
Rojas
118
Teorema 3.5.5. (Propiedades de ) Para una distribucin
bien definida, el operador de valor esperado cumple:
Escala:
Adicin:
Independencia: si X e Y son independientes.
Composicin:
No desviado:
Prof.: David Becerra
Rojas
119
Teorema 3.5.6. (Propiedades de la
varianza) Para una distribucin
bien definida, la varianza cumple:
Origen:
Adicin: si X e Y son
independientes.
Escala:
Prof.: David Becerra
Rojas
120