0% encontró este documento útil (0 votos)
117 vistas120 páginas

Guía Completa de Muestreo y Variables

Aquí está la tabla completada: i 1 2 3 4 5 XA 8.25 - 11.15 11.15 - 14.05 14.05 - 16.95 16.95 - 19.85 19.85 - 22.75 Total XR 9.7 - 11.15 11.15 - 14.05 14.05 - 16.95 16.95 - 19.85 19.85 - 22.75 ni 12 24 24 48 12 120 fi 0.10 0.20 0.20 0.40 0.10 1.

Cargado por

Sebastian Mella
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPT, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
117 vistas120 páginas

Guía Completa de Muestreo y Variables

Aquí está la tabla completada: i 1 2 3 4 5 XA 8.25 - 11.15 11.15 - 14.05 14.05 - 16.95 16.95 - 19.85 19.85 - 22.75 Total XR 9.7 - 11.15 11.15 - 14.05 14.05 - 16.95 16.95 - 19.85 19.85 - 22.75 ni 12 24 24 48 12 120 fi 0.10 0.20 0.20 0.40 0.10 1.

Cargado por

Sebastian Mella
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPT, PDF, TXT o lee en línea desde Scribd

Contenidos

1.
2.

Introduccin
Estadstica Descriptiva:
Univariante
Bivariante

3.- Probabilidades
4.- Distribucin de probabilidades
5.- Distribucin en el Muestreo
6.- Estimacin de Parmetros
7.- Dcimas de Hiptesis
8.- Anlisis de Varianza

Prof.: David Becerra


Rojas

Bibliografa
1.
2.
3.
4.
5.
6.
7.

Murray y Espieges Estadstica


Paul Newbold Estadstica para los negocios
Mario Triola Probabilidad y Estadstica
L. Chao Estadstica para la ciencia Administrativa
R. Levin Estadstica para Administradores
Mongomery Probabilidad y Estadstica para Ingeniera
Apuntes Prof.

Prof.: David Becerra


Rojas

ESTADISTICA
CIENCIA QUE NOS PERMITE
TOMAR DECISIONES BAJO
CIERTA INCERTIDUMBRE

Trminos Comunes

Proceso de realizar una observacin o una medicin


Experimento
Caracterstica o fenmeno, que puede tomar distintos va
Variable
Dato
Resultado de la observacin de una variable.
Poblacin Conjunto total de elementos o individuos, que poseen una

Muestra

caracterstica comn, acerca de la cual se quiere informacin


Subconjunto de la poblacin, seleccionada de acuerdo a una regla o u

Censo Obtencin de todos los datos de inters que posee la pobla


EstadsticoFuncin o formula que depende de los datos de la mues
Parmetro Funcin o formula que depende de los datos de la pobla
Inferencia Estimacin del parmetro a travs del estadstico
Prof.: David Becerra
Rojas

Mtodo Cientfico
1.
2.
3.
4.

Planteamiento del Problema


Diseo del Experimento
Experimentacin y Recoleccin
Organizacin y Descripcin de
Resultados
5. Inferencia Estadstica

Prof.: David Becerra


Rojas

Muestreo
Notacin:
N : Tamao de la Poblacin
n : Tamao de la Muestra

Prof.: David Becerra


Rojas

Tipos de Muestreos Aleatorios

Aleatorio Simple
Estratificado
Sistemtico
Por Conglomerado
Muestreo en Etapas

Prof.: David Becerra


Rojas

Muestreo Aleatorio Simple


Todos los elementos de la poblacin, tienen la misma
oportunidad de estar contenidos en la muestra.

Se enumeran todos los elementos, y luego se


extraen de uno en uno, aleatoriamente, hasta
completar el tamao de la muestra.

Cuando la poblacin es muy grande, se puede


recurrir a los nmeros aleatorios.

Prof.: David Becerra


Rojas

Muestreo Estratificado
Mtodo de seleccin, utilizado cuando la
poblacin, est dividida en grupos llamados
estratos, cada uno, formado por una gran
cantidad de elementos homogneos.
Se toma una muestra aleatoria simple, en cada
estrato.
Los estratos, pueden ser de igual o distinto tamao,
si son distintos, una manera posible de determinar
el tamao de la muestra al interior de cada estrato,
es que esta sea proporcional al tamao del mismo,
a este tipo de asignacin, se le conoce como
Afijacin Proporcional, que no siempre resulta la
mejor, debido al costo de muestreo en cada estrato.
Prof.: David Becerra
Rojas

Muestreo Sistemtico
Este mtodo, se utiliza cuando la poblacin tiene
sus elementos ordenados. Se divide la poblacin
(de tamao N) en tantas sub poblaciones, como sea
el tamao de la muestra (n), todas de igual tamao
(k = N/n).

Se selecciona al azar un elemento de la


primera sub poblacin, y de ah en adelante,
de las sub poblaciones siguientes, se extrae el
elemento correspondiente.

Prof.: David Becerra


Rojas

10

Muestreo por Conglomerado


Se utiliza, cuando la poblacin, est dividida en
una gran cantidad de pequeos grupos, llamados
Conglomerados, cada uno formado por elementos
heterogneos. Se toma una muestra aleatoria de
Conglomerados, y luego se censan todos los
conglomerados seleccionados.

Prof.: David Becerra


Rojas

11

Tipos (gnero)de Variables


(Datos )
Variable
(Escalas)

Cuntitativas
Numricos

Discreta

Continua

Cualitativas
Categricos

Ordinal

Nominal

Ejemplo
Variable

Gnero ( Tipo )

Nombre

Categrica Nominal

Direccin

Categrica Nominal

Edad

Numrica Continua

No. Telfono

Categrica Nominal

Remuneracin

Numrica Discreta

Color de pelo

Categrica Nominal

Sonido

Categrica Ordinal

Intensidad del
Sonido

Numrica - Continua

Calidad

Numrica - Continua

Velocidad
Hora
Prof.: David Becerra
Rojas

Categrica Ordinal
No es variable ( Unidad de
medida de tiempo )
13

Escala Nominal

Usa nmeros como una manera de


separar los elementos de la poblacin
en diferentes clases o categoras.

El nmero asignado a la observacin


slo sirve como un nombre o
identificador,
identificador para distinguir la
categora a la cual pertenece la
observacin.
Ejemplo alumnos por...

Sexo : 1: masculino, 2: femenino;


Colegio: 1: Trinity College; 2: Scuola Andrea
Doria,

Escala Ordinal

Existe un orden implcito entre las


mediciones.
El valor numrico es usado slo como una
manera de arreglar los elementos de
acuerdo al orden establecido.

existe una relacin de orden total entre las clases.


no es posible cuantificar la diferencia entre los
individuos
pertenecientes a las distintas clases.

Ejemplo: Calificaciones
1 (muy bueno), 2 (bueno), 3 (satisfactorio), 4 (admisible), 5
(deficiente)
MB

Organizacin de Datos
Consideremos que la variable X, se divide
En k clases o categoras, denominadas:
C1 , C2 , C i , Ck

Dando origen a la Siguiente tabla de Frecue

Prof.: David Becerra


Rojas

16

Tablas de Frecuencia
i

ni

fi

Ni

Fi

C1

n1

f1

N1

F1

C2

n2

f2

N2

F2

Ci

ni

fi

Ni

Fi

Ck

nk

fk

Nk=n

Fk=1

///

///

To tal

Prof.: David Becerra


Rojas

17

Tablas de Frecuencias
Frecuencia Absoluta:

(ni )

Frecuencia Relativa :

( fi =ni/n )

Frecuencia Acumulada Absoluta:

(Ni)

Frecuencia Acumulada Relativa :

(Fi =Ni/n )

Prof.: David Becerra


Rojas

18

Ejemplo 1:

Opinin de alumnos por una bebida nueva

M MB B B R M MM R MB MB R B B
M R B B
R MB B B B
R M MM B
R R B R B R
Determine: a.- La variable x:
Opinin de los alumnos..
b.- El tpo de Variable: Categrica Ordinal
c.- Una tabla de frecuencia
Tabla
i
X
1 MM
2
M
3
R
4
B
5 MB
Total

ni
2
4
10
12
4
32

fi
.06
.13
.31
.38
.12
1.0

Ni
2
6
16
28
32
//

Fi
.06
.19
.50
.88
1.0
//

d.- Determine e
Interprete5
.38
k= 10
f4= 16
n3=32
N3= .50

n= alumnos
F3= consideran q
e.- Cuantos
la bebida es al menos regular?
26 alumnos

Prof.: David Becerra


Rojas

19

Ejemplo 2:
4

3
3

5
5

8
4

Determine:

Tabl
a
i
X

ni
4
8
5
4
6
0
3
30

1 2
2 3
3 4
4 5
5 6
6 7
7 8
Total
Prof.: David Becerra
Rojas

Nmero de artculos defectuosos por da.

6
6

8
6

3
3

2
6

2
6

4
4

4
3

3
5

Nmero de artic. Defec. Por da


a.- La variable X:
b.- El tpo de Variable: Numrica Discreta
c.- Una tabla de frecuencia

fi

Ni

Fi

d.- Determine e Interprete


7
k=
f4= .13
n3=
n=

.13
.27
.17
.13
.20
.00
.10
1.0

4
12
17
21
27
27
30
//

.13
.40
.57
.70
.90
.90
1.0
//

5
30

N4=
F3=

21
.57

e.- En cuantos das el nmero de


artculos defectuosos fue de al

18 das

menos 4?
f.- Cul fu el nmero mximo de artculos
def. por da, en los 15 das que hubieron
menos?
4 artculos
g.- Cuntos artc. Defec. en total, se juntaron
42 artculos
en los 6 das en que hubieron ms?
20

Tabla de Frecuencia con


Intervalos de Clase
Caractersticas
( X(X
Caractersticas
R):A):

1. Rango:

R=

Valor Mx. Valor mn.

+ 1u

Se
1.- obtienen
Limite inferior
a partir
delde
primer
los Intervalos
intervaloAparentes,
corresponde
ampliando
al valor
(1u: Una unidad de medida)
estos
mnimo
en media
menos
unidad
las p*
de unidades
medida hacia
adicionales
cada extremo,
correspondientes
de tal
2.
Cantidad
dedelIntervalos,
Segn
Sturgers:
manera,
2.- Limiteque
superior
el limite
superior
ltimo intervalo
de un intervalo,
corresponde
corresponda
al valor al
k = 1siguiente.
+ unidades
3.3 log(n)
kN
inferior
mximo
del intervalo
ms las p**
adicionales correspondientes.
3.
Amplitud:
Rk (ade valor
superior cuando no es exacto)
3.- Se
expresan enala=unidad
medida.
Obs.: La amplitud (a), se puede obtener de la diferencia entre dos limites
Ej.
1u =separados
0.01
4.-SiEstn
por una unidad de medida.
inferiores
o superiores consecutivos, o*entre dos marcas de clases
y a= consecutivas
R/k = 4.571 4.58 ( se expresa en la unidad de medida)

4. Adicionales: p = a k R
5. Intervalos : Aparentes (X )
A

Reales (XR)

6. Marcas de Clases (Xi)


Prof.: David Becerra
Rojas

Xi = ( Ls + Li ) 2

21

Ejemplo
Sea Valor mnimo = 4.7
Valor Mximo
= 12.6
n = 42
Determine los intervalos aparentes y
reales con sus respectivas marcas de
clase.
Prof.: David Becerra
Rojas

22

1.
2.
3.
4.

Rango R = 12.6 4.7 + 0.1 = 8.0


K = 1 +3.3 log(42) = 6.4 6
a = 8.0 6 = 1.33 1.4
P = 1.4*6 -8.0=0.4 ( = 0.2 + 0.2 )

5. =Intervalos :
1
2
3
4
5
6

Prof.: David Becerra


Rojas

4.5 5.8
5.9 7.2
7.3 8.6
8.7 10.0
10.1 11.4
11.5 12.8

XA

XR

Xi

4.45 5.85 5.15


5.85 7.25 6.55
7.25 8.65 7.95
8.65 10.05 9.35
10.05 11.45 10.75
11.45 12.85 12.15

23

Ejemplo 2:
Considere los siguientes datos:
0.94 1.05 0.86 0.94 0.96 1.03 1.01
0.78 0.84 0.86 1.04 0.76 0.65 0.70

Confeccione una tabla de frecuencia.

Prof.: David Becerra


Rojas

24

1.
2.
3.
4.

Rango R = 1.05 0.65 + 0.01 = 0.41


K = 1 +3.3 log(14) = 4.8 5
a = 0.41/5=0.082 0.09
P = 0.09*5 -0.41=0.04 (=0.02 + 0.02)

5. =Intervalos :
i
1
2
3
4
5

XA
0.63
0.72
0.81
0.90
0.99

0.71
0.80
0.89
0.98
1.07

Prof.: David Becerra


Rojas

XR
0.625
0.715
0.805
0.895
0.985

0.715
0.805
0.895
0.985
1.075

Xi
0.67
0.76
0.85
0.94
1.03

ni
2
2
3
3
4
14

0.14
0.14
0.21
0.21
0.29
1.00

fi
2
4
7
10
14

Ni

Fi

0.14
0.28
0.49
0.70
1.00

25

Complete la siguiente Tabla


Luego como a = 2.9

i
1
2
3
4

XR
8.25
11.15
14.05
14.05
16.95

ni

- 11.15 12
-

24

16.95
19.85

Total

19.85
Prof.: David Becerra
22.75
Rojas

0.20

Ni

24
120

Fi

Xi

12

9.7

36

12.6

48

12
48

fi

96

0.8
0

15.5

18.4

12
21.
0
3
//// ///// /////
26

Tarea No. 1 ( Excel )


Determine una muestra aleatoria de
tamao n = 1500
Construya una tabla de frecuencia 9
intervalos.
Ilustre los datos a travs de un:
Histograma
Ojiva
Nota: Consulte videos de youtube.
Prof.: David Becerra
Rojas

27

TIPOS de GRFICOS

Principalmente en variables :

Categricas y Numricas Discret


Grfico de Barras
Grfico de Sectores Categricas
Histograma
Numricas Continuas
Polgono
Numricas Continuas
Ojiva
Numricas
Pctograma
Numricas y Categricas
Diagrama de Caja y Bigote
(Tarea)

Prof.: David Becerra


Rojas

28

Grfico de Barras
ni

H A

Prof.: David Becerra


Rojas

K M

xi

29

Grfico de Sectores (
Circular)

1
2
3
4

Prof.: David Becerra


Rojas

30

Histograma
ni

|
100|
|
80
|
60
|
40
|
20
|_________________________
120

3.5
Prof.: David Becerra
Rojas

5.5

7.5

9.5 11.5

13.5

XR
31

Polgono
ni

2.5

Prof.: David Becerra


Rojas

4.5

6.5

8.5

10.5

12.5

Xi

32

Ojiva
Fi

Prof.: David Becerra


Rojas

33

Pictograma
(Consumo de carne de vacuno)

1000 ejemplares

1990
1995
2000
2005
Prof.: David Becerra
Rojas

34

Ejemplo 1
i

xi

ni

fi

fix360

1
2
3
4
5
To

H
A
K
M
B
tal

10
18
12
5
25
70

.143

51.4

.257

92.5

51.4

.171

61.6

143.
9

.071

25.6

.357 128.5
1.00 360

()a
c

205.
5
231.
1

360.
0
Confeccione un grfico de Barras y uno de Sectores
/////

Prof.: David Becerra


Rojas

35

Ejercicio
Supongamos que los datos siguientes representan los tiempos,
que demoran unos atletas en terminar una maratn.

1:35 1:28 1:45 1:52 1:40 1:30 1:38 1:47 1:37


1:30 1:40 1:36 1:29 1:35 1:37 1:36 1:40 1:36 1:48
2:05 1:32 2:28 1:45 1:50 1:47 2:29 1:44 1:49

1.
2.
3.
4.
5.

Identifique la variable
Indique el gnero ( tipo)
Construya una tabla de frecuencia de 5 intervalos
Confeccione un; Histograma, Ojiva y un grfico de sectores
Calcule de la tabla:
a.- Media, Moda, Mediana, P35.
b.- Si clasifican los 10 primeros, cual es el tiempo mximo para
clasificar?

Prof.: David Becerra


Rojas

36

ESTADISTICOS ( o
Estimadores)
CUANTILES ( Estadsticos de Orden)
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE DISPERSIN

Prof.: David Becerra


Rojas

37

CUANTILES: (ESTADSTICOS DE
ORDEN)
Cuartles

( Kk )

Quintles

(Qq)

Decles

( Dd )

Percentles

( Pp )

Prof.: David Becerra


Rojas

38

Cuartiles:

k = 1, 2, 3

75%
50%
25%

K1
Prof.: David Becerra
Rojas

K2

K3
39

Quintiles:
Q = 1, 2, 3, 4

q x 20%
Qq
Prof.: David Becerra
Rojas

40

Deciles:

d = 1, 2, .., 9

(10*d)%
Dd
Prof.: David Becerra
Rojas

41

Percentles:
p = 1, 2, ., 99

p%
Pp
Prof.: David Becerra
Rojas

42

Ejercicio
La tabla siguiente, representa los aos de
Servicio de los trabajadores de una empresa.
i

1
2
3
4
5
6

X i ni

3
6
9
10
12
18
Total

15
18
26
38
30
25
152

Prof.: David Becerra


Rojas

Ni
15
33
59
97
127
152

Fi

1.-

Calcular : K1 , Q3 , D2 , P45

K1 = 9
0.09
Q3 = 10
0.22
D2 = 6
P45 = 10
0.39
0.64 2.- Cul es el ao de servicio mnimo
0.84
de los 30 trabajadores ms
1.00 antiguos

12

aos
43

Cuantiles:

t : 1,2,3
1,2,3,4
1,2..9
Cuando los datos estn ordenados en una tabla de frecuencia1,2,99
Con intervalos de clase, se puede utilizar la siguiente expresin

Cuartiles
Quintiles
Deciles
Percentiles

a
t *n

Ct Li
N t 1 *
S
nt
Li : Limite real inferior del intervalo que contiene el cuantil t, que es aquel
donde por primera vez la frecuencia acumulada pasa el (t/Sx100)%.
S : 4, 5, 10, 100 ( Cuartil, Quintil, Decl, Percentil , respectivamente)
Nt-1: frec. Acumulada anterior al intervalo que contiene el C t.
nt : frec. Absoluta del intervalo que contiene el Ct.
a : Amplitud del intervalo.
n : Tamao de Muestra ( Total de Datos)
Prof.: David Becerra
Rojas

44

Ejemplo
i

1 2.4 - 2.9
2 3.0 - 3.5
3 3.6 - 4.1
4 4.2 - 4.7
5 4.8 - 5.3
6Determine
5.4 - 5.9:

ni f i

Ni Fi

4 .08 4
8 .16 12
15 .30 27
10 .20 37
5 .10 42
8 .16 50
50 1.0
K3 , D1 , P35, y

.08
.24
.54
.74
.84
1.0

3 * 50
0.6
37 *
5
4

= 4.81

1* 50 0.6
4 *
10
8

= 3.025

35 * 50
0.6
12 *
100
15

= 3.77

K 3 4.75

D1 2.95

P35 3.55

P74 , Q3

P74 = 4.75

Si la variable X representa la utilidad en M$ por da determine:


i.- Cul fue la utilidad mxima de los 15 das que gan menos?
Total
ii. En cuntos das la utilidad fue de al menos M$ 5.0?

Q3 = 4.33

M$ 3.67

11 das
iii.- Que porcentaje de los das tiene una utilidad no superior a
5.0 ni inferior a 4.5 M$?
Prof.: David Becerra
Rojas

45

MEDIDAS DE TENDENCIA
CENTRAL

MODA
MEDIANA
MEDIA ARITMTICA
MEDIA ARMNICA
MEDIA GEOMTRICA

Prof.: David Becerra


Rojas

46

MODA ( MODO)
La denotaremos por : Mo
a.Est dada por la observacin que ms se
repite la de mayor frecuencia.
b.Es posible calcularla para cualquier tipo de
variable.
c.Pueden existir muchas o ninguna.

Prof.: David Becerra


Rojas

47

MODA
Ejemplo 1: Sean los siguientes datos:
F D
i

R F T D R U D U U D

X i ni

1 F
2 D
3 R
4 T
5 U
Total
Prof.: David Becerra
Rojas

2
4
2
1
3
12

Luego; en este caso la


Moda es:
Mo = D

48

MODA
Ejemplo 2 :
2 3 5 1 1 5 2 5 4 2 4 2 5 1 6
i Xi
1 1
2 2
3 3
4 4
5 5
6 6
Total
Prof.: David Becerra
Rojas

ni
3
4
1
2
4
1
15

En este caso tenemos dos Mo:


Mo1= 2
Mo2 = 5

49

MODA
La moda para datos tabulados, se obtiene a partir de la
siguiente expresin:

1
M o Li
*a
1 2
Donde: Li : Limite real inferior del intervalo que contiene la Mo

que es

aquel que tiene mayor frecuencia

1 : Diferencia entre las frecuencias absolutas del intervalo modal y


el intervalo anterior.

2 : Diferencia entre las frecuencias absolutas del intervalo modal y


el intervalo posterior.
a : Amplitud del intervalo.

Prof.: David Becerra


Rojas

50

Ejemplo :
i
1
2
3
4

X
4- 5
6- 7
8- 9
10 - 11
T otal

ni
42
68
102
38
250

1 (102 68)
2 (102 38)

Prof.: David Becerra


Rojas

Calcule la Moda

1
M o Li
*a
1 2

34
M o 7.5
*2

34 64

8.19

51

MEDIANA
La denotaremos como : Md
Puntuacin que divide la distribucin de los
datos ( la muestra) en dos partes iguales.
Es decir nos indica el punto hasta donde se
tiene acumulado el 50% de las observaciones.
Nota: - Para su determinacin, los datos se
ordenan previamente.
- No tiene sentido cuando la
variable
es categrica nominal.

Prof.: David Becerra


Rojas

52

MEDIANA
Si el nmero de observaciones impar,
entonces la Md estar dada por la
observacin central.
Si el nmero de observaciones par,
entonces la Md estar dada por el
promedio de las dos observaciones
centrales.

Prof.: David Becerra


Rojas

53

MEDIANA
Ejemplo: 1

2 3 5 5 7 9 10 27 29 30 38 40 98
En este caso la Md = 10

n=13

Ejemplo: 2

2,1 2,3 2,6 3,6 5,8 6,8 7,9 10,3

n=8

Luego ; Md =

Prof.: David Becerra


Rojas

(3,6+5,8)/2 = 4,7

54

MEDIANA
Ejemplo: dado los siguientes datos:
i

1
2
3
4
5
6

Xi

ni
3
2
2
3
4
3
17

Ni
3
5
7
10
14
17

Fi
.18
.29
.41
.59
.82
1.0

4
5
6
7
8 Determine;
9
Prof.: David Becerra
Rojas

10

11

12

13 14

15

16

17

4 4 4 5 5 6 6 7 7 7 8 8 8 8 9 9 9

Md = 7

Md
55

MEDIANA
La mediana para datos tabulados, se obtiene a partir de
la siguiente expresin:

a
n

M d Li N d 1 *
2
nd
Donde:

Li : Limite real inferior del intervalo que contiene la Md, que es aquel
donde por primera vez la frecuencia acumulada pasa el 50%.
n : Tamao de la muestra

N d-1 : Frec. acumulada anterior al intervalo que contiene la Mediana.


n d : Frec. Absoluta del intervalo que contiene la Md
a : Amplitud del intervalo.
Prof.: David Becerra
Rojas

56

Ejemplo de Mediana
i

ni
4
8
15
18
2
3
50

fi
.08
.16
.30
.36
.04
.06
1.0

1 4 - 5
2 6 - 7
3 8- 9
4 10 - 11
5 12 - 13
6Determine;
14 - 15
Prof.: David Becerra
Rojas

Ni
4
12
27
45
47
50

Fi
.08
.24
.54
.90
.94
1.0

n
2
M d 7.5 12 *
2
15
Luego la Md = 9.23

y la Moda Mo = 9.82

M d , Mo
57

Ejercicio.
4.8

3.6

5.2

6.1

6.0

2.9
3.5
4.8
4.3
4.2
4.8
3.1
4.8
2.9
5.5
5.0
4.8
5.6
6.0
1. Calcular Mo , Md
2. Construya una tabla de frecuencia
3. Calcule de la tabla Mo , Md.
4. Comente.
Prof.: David Becerra
Rojas

58

MEDIA ARITMTICA
La media Aritmtica tambin llamada Promedio
simplemente Media, y esta dada para datos no
tabulados por : (Se calcula solamente en variables numricas)
Poblacional

Muestral

X
i 1

X
i 1

Donde: Xi : Corresponde a las Observaciones


n : Tamao de la Muestra
N : Tamao de la Poblacin
Prof.: David Becerra
Rojas

59

MEDIA ARITMTICA
Para datos Tabulados la Media est dada por :
k

n
i 1

Xi

fx
i 1

i i

Donde: Xi : Observacin Marca de Clase


n : Tamao de la muestra
ni : Frecuencia Absoluta de la observacin o del
intervalo
k : Nmero de intervalos
Prof.: David Becerra
Rojas

60

Ejemplo:

La tabla siguiente representa una muestra de


los
aos de servicio de trabajadores.

i Xi ni Xi*ni fi
fixxi
----------------------------------------------1 5 4 20 0.167
0.835
2 10 7 70 0.292
2.920
3 12 8 96 0.333
3.996
4 15 3 45 0.125
1.875
20 2 40
5----------------------------------------------0.083
1.660
Total 24 271 1.000
11.292

Determine la Media:
5

n x

i i

i 1

271
X
11.292
24

X f i xi = 11.292
i 1

Prof.: David Becerra


Rojas

61

Ejemplo 2:

Se toma una muestra de 21


observaciones,
calcule la Media.

i
1
2
3
4
5
6

X
2.3 - 2.4
2.5 - 2.6
2.7 - 2.8
2.9 - 3.0
3.1 - 3.2
3.3 - 3.4
Total

ni
4
5
3
2
4
3
21

Luego como

xi
2.35
2.55
2.75
2.95
3.15
3.35
6

X
k

X A
Prof.: David Becerra
Rojas

n u

i i

i 1

n x

i i

i 1

ni*xi
9.40
12.75
8.25
5.90
12.60
10.05
58.95

ui
-3
-2
-1
0
1
2

ni*ui
-12
-10
-3
0
4
6
-15

58.95
2.807
21

15
2.95
0.2 =
21

2.807
62

MEDIA PONDERADA
n1 * x1 n2 x 2 ... nk x k
X P XT

n1 n2 ... nk

i 1

ni * x i

Ejemplo: En una empresa donde se distinguen tres tipos de trabajadores, el


salario medio es de 290. Los 100 trabajadores de la categora A
tienen un salario medio de 480, los 300 de la categora B tienen un
salario medio de 320, Cunto es el salario medio de los 400 de la
categora C?

_
100x480 + 300x320 + 400x Xc
290 = --------------------------------------100 + 300 + 400
Prof.: David Becerra
Rojas

_
Luego Xc = 220
63

Tarea N
Ventajas y Desventajas de: Moda,
Mediana y Media.
Defina y de un ejemplo de :
Media Geomtrica :
(G)
Media Armnica
:
(H)
Sesgo
Curtosis
Ocupando los datos de la tarea anterior;
a) Calcule; Moda, Mediana y Media, con los
datos; no tabulados y tabulados.
b) Construya un grafico de caja y bigotes
Prof.: David Becerra
Rojas

64

Media Geomtrica:

Gn

xi

i 1

x1 * x2 * ..... * xn

Media Armnica:

n
n

i 1 xi

Prof.: David Becerra


Rojas

i 1

n
1
* ni
xi
65

MEDIDAS DE DISPERSIN
Rango:
(R)
Desviacin Intercuartlica: (K)
Desviacin Media:

(DM)

Varianza:

( s2 )

Desviacin Tpica:

(s)

Prof.: David Becerra


Rojas

66

MEDIDAS DE
DISPERSIN
Rango: (R)
R = V. Mximo V. Mnimo

Prof.: David Becerra


Rojas

1 Unidad de Medida

67

MEDIDAS DE DISPERSIN
Desviacin Intercuartlica: (K)

K
Prof.: David Becerra
Rojas

K 3 K1
2
68

MEDIDAS DE DISPERSIN
Desviacin Media:
Para datos No Tabulados

(DM)

DM

i 1

Para datos Tabulados


k

DM
Prof.: David Becerra
Rojas

n
i 1

Xi X
n
69

MEDIDAS DE DISPERSIN
Varianza: (s2 , 2)

X
i 1

Prof.: David Becerra


Rojas

2
(
x

)
i

2
x
i

i 1

i 1

Para datos No Tabulados

S2

Poblacional
Muestral

n 1

i 1

xi
2

i 1

n ( n 1)

xi

70

MEDIDAS DE
DISPERSIN
Muestral
k

S
2

Para datos Tabulados

ni X i X
i 1

Prof.: David Becerra


Rojas

n 1

n ni xi
i 1

n x

i 1
n(n 1)

i i

71

Ejemplo
Sean las edades ( en ao) de 5 nios

Obs. :
Xi :

x1 x2 x3 x4 x5
2 5 6 8 9

Determinar: Desv Media

Total
30

Varianza

___

xi - x : - 4 -1
_
| xi x | : 4 1
_
(xi - x)2 : 16 1
X 2i

S
2

i 1

10

4 25 36 64 81

n 1

Prof.: David Becerra


Rojas

30

7.5
4

S2

DM

30

X
i 1

10
2
5

210
n

30
6
5

n xi

i 1

i 1
n(n 1)

5 * 210 30

7.5
5* 4
2

72

MEDIDAS DE
DISPERSIN
Desviacin Tpica: (S , )
Poblacional:
Muestral :
n

Prof.: David Becerra


Rojas

(x )
i 1

2
i

i 1

Para datos No Tabulados

Xi
i 1

n 1

n xi
i 1

i 1
n(n 1)

73

MEDIDAS DE DISPERSIN
Para datos Tabulados

ni X i X
i 1

Prof.: David Becerra


Rojas

n 1

n ni xi
i 1

n x

i 1
n( n 1)

74

COEFICIENTE DE
VARIACIN
CV

S
X

Mide la homogeneidad que existe en los datos


Respecto a la variable en estudio.
Mientras ms pequeo, ms homogneo.

Prof.: David Becerra


Rojas

75

Ejemplo 2
i
1
2
3
4
5
6

Calcule: la Media , Desv. Tpica


ni
4
5
3
2
4
1
19

X
2.3 - 2.4
2.5 - 2.6
2.7 - 2.8
2.9 - 3.0
3.1 - 3.2
3.3 - 3.4

xi
2.35
2.55
2.75
2.95
3.15
3.35

nixxi
9.40
12.75
8.25
5.90
12.60
3.35
52.25

nixxi2
22.09
32.51
22.69
17.41
39.69
11.22
145.61

Sabemos que : X
n

n ni xi
i 1

n x

i 1
n(n 1)

Prof.: David Becerra


Rojas

i i

n x

i i

i 1

52.25
2.75
19

CV

s 0.327

0.119
x 2.75

19(145.61) 52.25

19(19 1)

= 0.327
76

Calcule: la Media , Desv. Tpica


por el Medio Provisorio

Ejemplo 2
i
1
2
3
4
5
6

ni
4
5
3
2
4
1
19

X
2.3 - 2.4
2.5 - 2.6
2.7 - 2.8
2.9 - 3.0
3.1 - 3.2
3.3 - 3.4
k

X A
n

S a

n u

i i

i 1

n ni ui

Prof.: David Becerra


Rojas

i 1

n u

i 1
n(n 1)

i i

xi
2.35
2.55
2.75
2.95
3.15
3.35

ui
-3
-2
-1
0
1
2

2.95

(19)
0.2
19

ni*ui
-12
-10
-3
0
4
2
-19

ni*ui2
36
20
3
0
4
4
67

= 2.75

19(67) 19
0.2
19(19 1)

= 0.327
77

Coeficiente de Asimetra ( Sesgo )

de Pearson

1
1 3
S

3
ni ( xi x) 3

S
i 1
k

de Fisher

Su valor es cero cuando la distribucin es simtrica, positivo


cuando existe asimetra a la derecha y negativo cuando existe
asimetra a la izquierda.

Prof.: David Becerra


Rojas

78

Coeficiente de Curtosis:

1
4
4
2 4 ni ( xi x) 3 4 3
S i 1
S
k

Prof.: David Becerra


Rojas

2 0 : Leptocrtica
2 0 : Mesocrtica
2 0 : Platicrtica

79

Estadstica Descriptiva
Bivariante

Prof.: David Becerra


Rojas

80

Estadstica Descriptiva Bivariante

Sean las siguientes variables:


X : A1, A2, ...................Af
Y : B1, B2,.....................Bc
Estas variables, se pueden ordenar en una tabla de
doble entrada llamada Tabla de Contingencia:

Prof.: David Becerra


Rojas

81

Tabla de Contingencia
X \ Y B1
A1
n11
A2
n21

B2

..Bj ..
:
:

Bc

Total

n1.
n2.
Ai
. . nij
. ni.
:
:
:
Af
:
nf.
Total n.1
n.2 ... n.j ..... n.c
n

Prof.: David Becerra


Rojas

n12
n22

82

Frecuencia Absoluta
(Conjunta)
Se denota por nij y se define como: Cantidad de
elementos que cuentan simultneamente con la
caracterstica Ai de la variable X y Bj de la variable Y

Prof.: David Becerra


Rojas

83

Frecuencia Absoluta
Marginal
ni.: Total de la fila i

= nij
j=1

n.j : Total de la Columna j


n.. : Total General

=
nij
i=1

= nij =

( Tamao muestra)

i=1 j=1

Prof.: David Becerra


Rojas

84

Frecuencia Relativa
Conjunta

Se denota por fij =

Prof.: David Becerra


Rojas

nij
n

85

Frecuencia Marginal Relativa


fi. =

fij =
j=1

f.j
f..

=
f =
i=1 ij
f

= fij =

ni.
n
n.j
n

i=1 j=1

Prof.: David Becerra


Rojas

86

Frecuencia Condicional
De x dado y ( x/y):

fi
j

De y dado x ( y/x):

fj
i

Prof.: David Becerra


Rojas

f ij
f. j
f ij
f i.

nij
n. j
nij
ni.
87

Independencia de Variables
Diremos que dos variables X e Y son
independientes si y solo si, la conjunta es igual al
producto de las marginales, para todo i, y para todo j.
Es decir;

f ij f i . * f . j
o
Prof.: David Becerra
Rojas

nij

i , j
ni . * n. j
n
88

Estadstica Descriptiva Bivariante


Ejemplo: Considere una muestra de contenedores en un recinto portuario.
Sea X : Peso (toneladas)
Y : Pas de origen
X

\ Y

Francia

Alemania

Japn

Total

Espaa

5 10

10

23

10 - 15

10

27

15 - 20

10

25

20 - 25

10

24

25 - 30

12

22

24

33

24

40

121

Total

Determine e Interprete :

f 5= c =4 n51 = 8

f34 = 10/121 f4. =

24/121

0.083

0.20

Prof.: David Becerra


Rojas

f.2 =

33/121

0.27

n2. = 27

fi=4/j=3 = 7/24
0.29

n.3 = 24 n.. = 121

fj=4/i=3 =

10/25

0.40
89

Asociacin de Variables
Numricas
i
1
2
.
.
.
n

Prof.: David Becerra


Rojas

X
x1
x2
.
.
.
xn

Y
y1
y2
.
.
.
yn

90

Tipos de Asociacin
Favorable :

Inversa:

yj

..

yi

. .

..

..

yi

.. .
xi

Prof.: David Becerra


Rojas

... .
. ..

yj
xj

xi

..
xj

x
91

Ejemplo:
Sea X: Remuneracin
Y: Cargas
iFamiliares
x
y
( x x)

1
2
3
4
5
6
Total

1
1
3
4
4
5

2
3
3
5
2
6

18

21 0

Media 3.0
Prof.: David Becerra
Rojas

3.5

-2
-2
0
1
1
2

( y y)

-1.5
-0.5
-0.5
1.5
-1.5
2.5
0

---------

( x x)( y y )

3
1
0
1.5
-1.5
5
9

1.5
92

Covarianza ( cov (x,y) )


( x x)( y y )

Cov ( x, y )
n

9
Cov ( x, y ) 1.5
6
Cov ( x, y )

Prof.: David Becerra


Rojas

93

Coeficiente de Correlacin
Mide el grado de asociacin
entre las variables

Cov( x, y )
r
sx * s y
r

n xy x y

(n x ( x) )(n y ( y ) )
2

-1 r 1
r : Se expresa en porcentaje
Prof.: David Becerra
Rojas

94

En nuestro caso tenemos:

i
1
2
3
4
5
6

X
1
1
3
4
4
5

Y
2
3
3
5
2
6

XY
2
3
9
20
8
30

X2
1
1
9
16
16
25

Y2
4
9
9
25
4
36

Total

18

21

72

68

87

XY

n xy x y

(n x 2 ( x) 2 )(n y 2 ( y ) 2 )

Prof.: David Becerra


Rojas

6 * 72 18 * 21
(6 * 68 18 )(6 * 87 21 )
2

= 0.65

95

Tarea 4
Ejercicio de aplicacin del coeficiente de
correlacin
de Sperman. ( Variables Categricas )

Prof.: David Becerra


Rojas

96

Regresin Lineal

Consiste en ajustar a los datos (representados en el


diagrama de Dispersin, una lnea, que puede ser rect
o curvilnea .

En esta oportunidad analizaremos el caso de la lnea re


Esta recta, tambin sirve para marcar la tendencia
De los datos, para hacer proyecciones, y para estimar
algn valor de y dado un valor de x.

Y = a + bX
Prof.: David Becerra
Rojas

97

Error:

ei yi y i

e ( y y ) O
i

Varianza del Error: (2)


cuyo estimador est dado por:

S S
2
e

Prof.: David Becerra


Rojas

2
y

(
y

y
)
i i

n2

98

Debemos minimizar la varianza del Error


Para tal efecto debemos minimizar:

A ( yi y i ) ( yi a bxi )
2

Es decir derivar A

Prof.: David Becerra


Rojas

99

Sistema de Ecuaciones Normales

A
a
A
b

Prof.: David Becerra


Rojas

0
0

100

Luego tenemos:

A
2 ( yi a bxi )( 1) 0
a
na b xi yi

A
2 ( yi a bxi )( xi ) 0
b
2
a xi b xi xi yi
Prof.: David Becerra
Rojas

101

Por lo tanto, el sistema de Ecuaciones Normales


queda de la siguiente forma:

na b xi y

a xi b x xy
2
i

Prof.: David Becerra


Rojas

102

Por determinante tenemos;


x

x x
n

n x x
2

y x

y x x xy
xy x

a
a

n xy x y
x xy

b
b

Prof.: David Becerra


Rojas

103

Estimadores Mnimos Cuadrado

y x x xy

a
n x ( x )
2

xy x y
n x ( x )

Prof.: David Becerra


Rojas

a
Y bX

104

En el caso que estamos analizando tenem


(e)

i
1
2
3
4
5
6

X
1
1
3
4
4
5

Total

18

Luego tenemos que;

Y
2
3
3
5
2
6
21

X
1
1
9
16
16
25

Y
4
9
9
25
4
36

72

68

87

(21)(68) (18)(72)
1.57
2
n(68) 18

y la varianza del error es


Prof.: David Becerra
Rojas

XY
2
3
9
20
8
30

2
y x

Y
2.2
2.2
3.5
4.1
4.1
4.8

(Y Y)2
0.04
0.64
0.25
0.81
4.41
1.44

0.0
6(72) (18)(21) 7.59
b
0.64
2
n(68) 18

(
y

y
)
i i

n2

Y-Y
-0.2
0.8
-0.5
0.9
-2.1
1.2

( e2 )

7.59

1.898
4
105

Error Tpico: ( )

Sy x S
2
e

( y i yi )

n2

7.59

1.898 1.38
4

Tambin se puede obtener a partir de:

Se S y
x

Prof.: David Becerra


Rojas

a y b xy
n2

106

Coeficiente de
Determinacin
El coeficiente de Determinacin, nos
indica la variabilidad explicada por la recta
de regresin lineal, es decir que tan bueno
es el ajuste de la recta.
Esta dado por:

r2
0 r2 1

Nota: Referencia para el ajuste, tambin lo


el error tpico Sy/x
Prof.: David Becerra
Rojas

107

Ejemplo:

X : Aos de servicio de vendedore


Supongamos que tenemos dos variables:
Y : Ventas en M$

1. Confeccione un diagrama de dispersin


2. Determine el grado de asociacin entre las variables
3. Estime a travs de una recta de m. c. cuanto debiera vender
4.

un vendedor con siete aos de servicio?.


Estime a travs de una recta de m. c. cuanto aos de servicio
debera tener, un vendedor que vende m$ 4.0?.

Vendedor
1
2
3
4
5
6
Total
Prof.: David Becerra
Rojas

X
2
2
3
4
4
5
20

Y
1.2
2.4
4.1
3.1
2.4
3.8
17.0

XY
2.4
4.8
12.3
12.4
9.6
19.0
60.5

X2
4
4
9
16
16
25
74

Y2
1.44
5.76
16.81
9.61
5.76
14.44
53.82
108

Luego:
n xy x y
6(60.5) (20.)(17.)
r

(n x 2 ( x ) 2 )(n y 2 ( y) 2 )
(6(74.) (20.) 2 )(6(53.82.) (17.) 2 )

=.5954
x xy (17)(74) (20)(60.5)

1.09
6(74) (20)
n x ( x )
y

x2
2

xy x y 6(60.5) (20)(17) .523


6(74) (20)
n x ( x )

Prof.: David Becerra


Rojas

109

Varianza del Error:

S y2 x

(
y

y
)
i i

n2

2
y
a y b xy

n2

=.9124

Error Tpico:

Sy x

(
y

y
)
i i

Prof.: David Becerra


Rojas

n2

2
y
a y b xy

n2

=.9552

110

Luego:
r

n xy x y

(n x ( x) )(n y ( y ) )
2

2
x
y
y xy

n y ( y )
2

n xy x y
n y ( y )

Sx/ y
Prof.: David Becerra
Rojas

1.41

0.68

2
x
c x d xy

n2

0.5954

1.079
111

Las propiedades de la media son las siguientes:

- La Media de una constante es la propia constante.


- La media de la suma o diferencia de variables es igual a la suma
o diferencia de las medias de dichas variables.
- La media del producto de una constante por una variable, es
igual a la constante por la media de la variable.
- La media de una combinacin lineal de dos o ms variables es
igual a la combinacin lineal de las medias de dichas variables.
- La media es el centro de gravedad de la distribucin, ya que las
desviaciones respecto a la media suman 0.

- Mediana: La mediana es el valor del elemento que ocupa el


lugar central, si los datos estn ordenados, bien de forma creciente
o de forma decreciente.
- Moda: La moda es el valor ms frecuente, es decir es el valor de
la variable que se repite un mayor nmero de veces.
En el caso de una distribucin totalmente simtrica, la media y la
mediana coinciden. Si la media y la mediana difieren mucho
significa que hay heterogeneidad entre los datos y que la
distribucin, por tanto ser asimtrica.

Prof.: David Becerra


Rojas

112

Las propiedades de la varianza son:


- La varianza es siempre positiva o cero.
- La varianza de una constante es cero.
- La varianza de la suma o diferencia de una variable y una
constante es igual a la varianza de la variable.
- La varianza de un producto de una constante por una
variable es igual al cuadrado de la constante por la varianza
de la variable.
Las propiedades de la desviacin tpica son:
- La desviacin tpica es siempre positiva o cero.
- La desviacin tpica de una constante es cero.
- La desviacin tpica de una constante por una variable es
igual a la constante por la desviacin tpica de la variable.
- La desviacin tpica de la suma o diferencia de una variable
y una constante es igual a la desviacin tpica de la variable.
Prof.: David Becerra
Rojas

113

Ejercicio:

Se toma una muestra de 112 turistas registrando


el peso de equipaje y nacionalidad.

X\Y
5 10
10 15
15 20
20 25
25 - 30

Chilena

Argentina Peruana

Brasilea

Total

4
8

2
3

4
1

10
12

3
0
5

9
10
2

3
1
0

10
10
15

20
24
25
21
22

57

112

Total 20

26

Determine:
1.- Cuntos turistas chilenos app llevan un peso no superior a 12kr.
2.- Podemos decir que el comportamiento del peso que llevan los turistas
argentinos , es mas homogneo del que llevan los brasileros?
3.- Determine e interprete:
fj=1/i=2 =
4.- Determine el grado de asociacin respecto al peso de equipaje,
entre los turistas chilenos y argentinos.
5.- A travs de una recta de m. c. estime cuntos turistas deberan llevar un
peso 27.5kr
Prof.: David Becerra
Rojas

114

Cuartiles
a
k *n

K k Li
N k 1 *
4
nk
Li : Limite real inferior del intervalo que contiene el cuartil t, que es aquel
donde por primera vez la frecuencia acumulada pasa el (k/4x100)%.

Prof.: David Becerra


Rojas

115

Quintiles
( Qq )

q = 1,..,99

a
q*n

Qq Li
N q 1 *
5
nq
Li : Limite real inferior del intervalo que contiene el percentil q, que es aquel
donde por primera vez la frecuencia acumulada pasa el (q%)

Prof.: David Becerra


Rojas

116

Deciles
( Dd ) d = 1,.,9

a
d *n

Dd Li
N d 1 *
10
nd
Li : Limite real inferior del intervalo que contiene el decil d, que es aquel
donde por primera vez la frecuencia acumulada pasa el (d*10)%

Prof.: David Becerra


Rojas

117

Percentiles
( Pp )

p = 1,..,99

a
p*n

Pp Li
N p 1 *
100
np
Li : Limite real inferior del intervalo que contiene el percentil p, que es aquel
donde por primera vez la frecuencia acumulada pasa el (p%)

Prof.: David Becerra


Rojas

118

Teorema 3.5.5. (Propiedades de ) Para una distribucin


bien definida, el operador de valor esperado cumple:
Escala:
Adicin:
Independencia: si X e Y son independientes.
Composicin:
No desviado:

Prof.: David Becerra


Rojas

119

Teorema 3.5.6. (Propiedades de la


varianza) Para una distribucin
bien definida, la varianza cumple:
Origen:
Adicin: si X e Y son
independientes.
Escala:
Prof.: David Becerra
Rojas

120

También podría gustarte