100% encontró este documento útil (2 votos)
480 vistas138 páginas

Estadistica II - Unsa

Este documento presenta conceptos básicos de probabilidad. En menos de 3 oraciones: Introduce los conceptos clave de experimento, espacio muestral, suceso y probabilidad. Explica brevemente las reglas de probabilidad como la adición y probabilidad condicional con ejemplos. Concluye resumiendo los principios para asignar probabilidades a los puntos del espacio muestral.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPT, PDF, TXT o lee en línea desde Scribd

Temas abordados

  • Análisis de Correlación,
  • Cálculo de Z,
  • Desviación Estándar,
  • Muestreo Aleatorio,
  • Experimentos,
  • Análisis de Supervivencia,
  • Cálculo de p,
  • Distribuciones de Frecuencia,
  • Pruebas de Significancia,
  • Errores de Muestreo
100% encontró este documento útil (2 votos)
480 vistas138 páginas

Estadistica II - Unsa

Este documento presenta conceptos básicos de probabilidad. En menos de 3 oraciones: Introduce los conceptos clave de experimento, espacio muestral, suceso y probabilidad. Explica brevemente las reglas de probabilidad como la adición y probabilidad condicional con ejemplos. Concluye resumiendo los principios para asignar probabilidades a los puntos del espacio muestral.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPT, PDF, TXT o lee en línea desde Scribd

Temas abordados

  • Análisis de Correlación,
  • Cálculo de Z,
  • Desviación Estándar,
  • Muestreo Aleatorio,
  • Experimentos,
  • Análisis de Supervivencia,
  • Cálculo de p,
  • Distribuciones de Frecuencia,
  • Pruebas de Significancia,
  • Errores de Muestreo

ESTADISTICA II

Dra. Ilse Janine Villavicencio Ramírez

Dra. Ilse Janine Villavicencio Ramírez


NOCIONES DE PROBABILIDAD
2

Importancia de las Probabilidades


Las probabilidades están presentes en nuestras vidas más a menudo de que
podríamos sospechar. Todos tenemos una gran intuición probabilística.
Por ejemplo, en días lluviosos, fríos y con mucha humedad es alta la
probabilidad de coger un resfrío. Si ingerimos alimentos en lugares poco
higiénicos, en ambulantes es muy probable que contraigamos una infección
estomacal.

¿Cómo es la probabilidad de ganar el premio mayor en Tinka?. Muy baja,


pues hay muchas alternativas en juego. Pero aún sabiendo esto, compramos
uno que otro número. La decisión creo yo que es racional.
Si escuchamos una predicción de 80% que lluvia, y Ud. tiene planeado un
paseo al campo con la familia. ¿Qué hace?. Lo mas racional es que cancele
su paseo y se quede en su casa viendo en video.

Dra. Ilse Janine Villavicencio Ramírez


Conceptos básicos
3 (A) Experimento: Ejecución voluntaria de un fenómeno.
Se caracteriza por:
a) Tener varios resultados posibles
b) Existir incertidumbre sobre el resultado
Ejemplos:
Lanzar una moneda
Seleccionar de un lote un frasco de medicamentos
Extraer una muestra de sangre a una persona
(B) Espacio Muestral: conjunto de todos los resultados posibles de un experimento. Se
simboliza por  (omega).
Ejemplos:
Lanzar una moneda
 = {cara, sello}
Seleccionar de un lote, un frasco de medicamentos.
 ={adecuado, inadecuado}
Extraer una muestra de sangre a una persona.
 = {grupo sanguíneo}
Dra. Ilse Janine Villavicencio Ramírez
Ejemplo:
Se 4lanzan tres monedas simultáneamente. Los
ochos resultados posibles de este experimento
pueden detallarse de manera conveniente mediante
un diagrama de árbol:
Primera Segunda Tercera Resultado
Moneda Moneda Moneda Posible

C C CCC
S CCS
C
C CSC
S
S CSS
C C SCC
S SCS
S S C SSC
S SSS
={CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS}
Dra. Ilse Janine Villavicencio Ramírez
(C) Suceso: Podemos considerar los siguientes
subconjunto del espacio muestral, sucesos:
5
seleccionado de acuerdo a una condición.
A: la suma de puntajes es 7, es decir
Se representan por letras latinas
mayúsculas. A={(1,6) (2,5) (3,4) (4,3) (5,2)
(6,1)}
Ejemplo:
Se lanzan dos dados. El espacio muestral B: la suma de puntajes es 11, es decir
de este experimento es: B={(5,6) (6,5)}

W= { (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) C: la suma de puntajes es 7 u 11, es


(2,1) (2,2) (2,3) (2,4) (2,5) (2,6) decir
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6) C={(1,6) (2,5) (3,4) (4,3) (5,2)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (6,1) (5,6) (6,5)}
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6) }

Dra. Ilse Janine Villavicencio Ramírez


Probabilidad
6
(A) Concepto: Ponderación asignada a cada punto muestral que mide la verosimilitud de
su ocurrencia.
(B) Principios para asignar probabilidad:
a) La probabilidad de cada punto muestral debe estar entre 0 y 1
b) La suma de las probabilidades de todos los puntos muestrales deben ser iguales a 1.
0 0,5 1
Tan probable
Improbable Probable
como improbable

Dra. Ilse Janine Villavicencio Ramírez


Ejemplos:
1. Se lanza una moneda
7

W={cara, sello}
P(cara) = 0,5 P(sello) = 0,5

2. Se lanzan 3 monedas
W = {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS}
1/8 1/8 1/8 1/8 /8 1/8 1/8 1/8
A: obtener exactamente 2 caras
A = {CCS, CSC, SCC}
1/8 + 1/8 + 1/8
P(A) = 3/8

Dra. Ilse Janine Villavicencio Ramírez


8

(C) Conclusiones: De acuerdo a la definición de probabilidad de un suceso, y a los dos


principios, tenemos las siguientes conclusiones:

(1º) P(W) = 1

(2º) P() = 0

(3º) P(A´) = 1 - P(A)

Dra. Ilse Janine Villavicencio Ramírez


PROBABILIDADES - EJEMPLOS
9
1. Un investigador trabaja con un nuevo fármaco para insensibilizar a los pacientes
frente a picaduras de abejas. De 200 sujetos sometidos a prueba, 180
presentaron una disminución en la gravedad de los síntomas tras sufrir una
picadura, después de ser sometidos al tratamiento.
2. Un paciente sufre de cálculos renales, y no se ha conseguido mejora alguna a
partir de métodos ordinarios. Su medico ésta planteándose el llevar a cabo una
intervención quirúrgica y debe responder a la siguiente pregunta: ¿Cuál es la
probabilidad de que la operación sea un éxito?.

PROBABILIDAD DEL PUNTO ESTADISTICO


... Quien emplea la estadística aplicada prefiere pensar en la probabilidad como el
numero de veces en las que se presentará determinada situación si una experiencia
fuera repetida indefinidamente en situaciones de naturaleza repetitiva o que
pudiera concebirse de esa manera ...

Dra. Ilse Janine Villavicencio Ramírez


Reglas de probabilidad
10
Regla de la Adición A B
Ejemplo:
U
P(AUB) = P(A) + P(B) - P (A B) U
(A B)

Un cliente ingresa a una farmacia. La probabilidad de que compre (a) un antibiótico


es 0,60 (b) analgésico 0,50, y c) antibiótico y analgésico es 0,30 ¿Cuál es la
probabilidad de que compre un antibiótico, analgésico o ambos?.
Datos
P(P) = 0,60 U
P(L) = 0,50 P(PUL) = P(P) + P(L) - (P L)
P (P L) = 0,30
U P(PUL) = 0,60 + 0,50 - 0,30
P(PUL) = 0,80

Dra. Ilse Janine Villavicencio Ramírez


Regla de adición para sucesos mutuamente excluyentes
11

Dos sucesos son mutuamente excluyentes, si no tienen


elementos comunes

A B  P(AUB) = P(A) + P(B)

Si : (A B) = 
U
U
Por lo tanto : P(A B) = 0

Dra. Ilse Janine Villavicencio Ramírez


12
Ejemplo:

Se extrae una carta de una baraja. ¿Cuál es la


probabilidad de que sea un as o un rey?

P(AUR) = P(A) + P(R)


4 4
4 = 
P(A) = 52 52
52
8
4 =
P(R) = 52
52

Dra. Ilse Janine Villavicencio Ramírez


Probabilidad Condicional
Ejemplo 1: Se dispone de 11 historias clínicas, pertenecientes a pacientes
masculinos
13 y femeninos agrupados por su nivel de hemoglobina.

Sexo M F
Estado (Masculino) (femenino) Total
A (Anémico) 5 3 8
N (Normal) 1 2 3
Total 6 5 11

a) ¿Cuál es la probabilidad de extraer una historia perteneciente a un paciente


anémico? 8
P(A) =
11
b)¿Cuál es la probabilidad de extraer una historia correspondiente a un paciente
anémico y que sea mujer? 3
P(A F) =
11

c) Dado que la historia corresponde a un paciente anémico, ¿cuál es la probabilidad


que sea mujer? 3
P(F ) =
A 8
Dra. Ilse Janine Villavicencio Ramírez
14

Derivación de la fórmula:

P(F B)
P(F )=
A P(A)

3
comprobando: P(F ) = 11
A 8
11
3
P(F ) =
A 8
Dra. Ilse Janine Villavicencio Ramírez
Ejemplo 2
15

Se recolectó información sobre el peso del recién nacido y si la madre


fumó o no durante el embarazo. Los datos se presentan a continuación:

CONDICIÓN PESO R.N.


TOTAL
DE FUMADORA BAJO NORMAL
SI 30 10 40
NO 20 140 160
TOTAL 50 150 200

Dra. Ilse Janine Villavicencio Ramírez


16

A. ¿Cuál es la probabilidad que el recién nacido


tenga bajo peso?
50
P(bajo )   0,25
200
B. ¿Cuál es la probabilidad que una gestante
fume?
40
P(si)   0,20
200

C. ¿Cuál es la probabilidad que el niño


seleccionado tenga un peso normal?
150
P(normal)   0,75
Dra. Ilse Janine Villavicencio Ramírez 200
17

D. ¿Cuál es la probabilidad de que un recién nacido


tenga bajo peso o sea normal?
Como son mutuamente excluyentes:
P(bajoónormal )  P (bajo)  P (normal )
50 150
  1
200 200
E. ¿Cuál es la probabilidad de que el recién nacido
tenga bajo peso o la madre haya fumado
durante el embarazo?
P (bajoósi)  P (bajo)  P ( si )  P (bajoysi)

50 40 30 60
     0,30
200 200 200 200
Dra. Ilse Janine Villavicencio Ramírez
18
Aplicación:
La probabilidad de que el personal
administrativo que labora en una clínica local,
llegue tarde el día lunes es 0,50 y la probabilidad
de que llegue retrasado los días lunes y martes
es 0,20. Dado que cierto trabajador llegó tarde el
día lunes, ¿cuál es la probabilidad de que llegue
tarde el día siguiente?.
TM P(TM TL )
P(TL ) = 0,50 P( )=
TL P(TL )
P(TL TM ) = 0,20
0,20
= = 0,40
0,50
Dra. Ilse Janine Villavicencio Ramírez
Regla de la Multiplicación
P(A  B)
19 A partir de P( B ) 
A P(A)
Se despeja
P(A  B)  P(A)  P B ( A)
Aplicación:
Se sabe que en un lote de medicamentos de 50 frascos, hay 4 que no están
adecuadamente empacados (defectuosos). Si se extraen al azar 2 frascos, uno a
continuación del otro, ¿cuál es la probabilidad de que ambos sean defectuosos?.

4
P(D1 ) 
50
(D
P(D1  D 2 )  P(D1 )  P 2
D1
)
D2 3 4 3 12
P( ) =  
D1 49 50 49 2450

Dra. Ilse Janine Villavicencio Ramírez


20

Ejercicio
En una población de pacientes hospitalizados, la
probabilidad de que uno de ellos, elegido
aleatoriamente tenga problemas cardiacos es 0,35. La
probabilidad de que un paciente con problemas
cardiacos sea un fumador es de 0,86. ¿Cuál es la
probabilidad de que el paciente elegido al azar de entre
la población sea fumador y tenga problemas
cardiacos?.

Dra. Ilse Janine Villavicencio Ramírez


Regla de la multiplicación para sucesos independientes.
21
Los sucesos A y B se consideran independientes cuando la ocurrencia de uno no influye sobre
la probabilidad de ocurrencia del otro; esto significa que, independientemente de que A haya
ocurrido o no, la probabilidad asignada a B es siempre la misma.

P (B )  P ( B)
Entonces, A
 P ( A  B)  P ( A)  P ( B)
Ejemplo:
¿Cuál es la probabilidad de que en una familia con dos hijos, ambos sean 
varones? P(V V )  P(V )  P(V )
1 2 1 2

P (V1 )  0,5
= (0,5) (0,5)
P (V2 )  0,5
P(V1  V2 )  0,25
Dra. Ilse Janine Villavicencio Ramírez
22

4.4 El teorema de Bayes


Consiste en una partición de la probabilidad total.
Ejemplo 1:
La Compañía de Seguros JL ha desarrollado un novedoso seguro
médico familiar. De acuerdo con una investigación hecha en el
mercado, la probabilidad de que el producto tenga éxito es 0,80 si
una compañía competidora no introduce un plan similar en el
mercado, en tanto que la probabilidad de éxito es 0,30 si la
empresa competidora lanza al mercado un seguro similar. Además,
la compañía JL estima que hay una probabilidad de 0,40 de que la
firma competidora comercialice el producto.

Dra. Ilse Janine Villavicencio Ramírez


Dado
23 que el producto de la Compañía JL tuvo éxito, ¿cuál es la
probabilidad de que la firma competidora haya comercializado su
novedoso plan de seguro?

Solución:

P(C) = probabilidad de que la compañía competidora


comercialice el producto,
P(C´) = probabilidad de que la compañía competidora no
comercialice el producto,
P(E) = probabilidad de que el plan de seguro familiar de la
compañía JL tenga éxito.

Dra. Ilse Janine Villavicencio Ramírez


24

P. Marginal P. Condicional P. Conjunta

4 0 P(E/C) = 0,30 P(C  E) = 0,40  0,30 = 0,12


= 0 ,
P(C)
P(C
´) =
0 ,6
0 P(E/C´) = 0,80 P (C  E) = 0,60  0,80 = 0,48
'

P. Total P( E) = 0,60

Dra. Ilse Janine Villavicencio Ramírez


25

Luego, de acuerdo con el Teorema de Bayes

P (C  E)
P(C )=
E P (C  E) + P (C '  E)

0.12 0.12
   0.20
0.12  0.48 0.60

La probabilidad que la compañía de seguros haya


participado en el mercado, dado que JL tuvo éxito es
de 0,20.
Dra. Ilse Janine Villavicencio Ramírez
26
Ejemplo 2:
El Director de la Clínica Santa Teresa está considerando
comprar un lote de 10000 equipos de venoclisis de un
proveedor nacional. El fabricante de estos equipos estima la
proporción de equipos defectuosas en el lote, en la siguiente
forma.
Proporción de Probabilidad
piezas defectuosas () P()

1 = 0,10 P(1) = 0,20


2 = 0,15 P(2) = 0,30
3 = 0,25 P(3) = 0,50
Dra. Ilse Janine Villavicencio Ramírez
27
Esto significa que el proveedor no está seguro acerca de la proporción
de equipos defectuosos en el lote, sin embargo, basándose en
experiencias anteriores, cree que hay una probabilidad de 0,20 de que el
lote tenga 10% de piezas defectuosas, una probabilidad de 0,30 de que
tenga 15%. Y finalmente, de 0,50 de que tenga 25% de piezas
defectuosas. Supongamos que elige un equipo de venoclisis al azar en
el lote:
A) ¿Cuál es la probabilidad de qué esta sea defectuosa?
B) Dado que el equipo resulta defectuoso, ¿cuál es la probabilidad de que el
lote tenga 25% de piezas defectuosas?

Dra. Ilse Janine Villavicencio Ramírez


28
P. Marginal P. Condicional P. Conjunta

P(D/1)= 0,10
1=0,10 P( 1  D) = 0,20  0,10 = 0,0200
20
0,
)=
1

P(

P(D/2)= 0,15
P(2) = 0,30 2=0,15 P( 2  D) = 0,30  0,15 = 0,045
P(
3
)=
0,
50

P(D/3)= 0,25
3=0,25 P( 3  D) = 0,50  0,25 = 0,1250
P(D) = 0,1900
Dra. Ilse Janine Villavicencio Ramírez
Respuesta A:

Hay tres
29
maneras posibles de obtener un equipo defectuosa del lote. Por lo tanto, la
probabilidad de obtener una pieza defectuosa, cualquiera que se la tasa porcentual de
defectuosos 10, 15 ó 25 es:
P( D)  P( 1  D)  P( 2  D)  P( 3  D)
 0,0200  0,0450  0,1250

 0,19
Respuesta B:

De acuerdo con el Teorema de Bayes, la probabilidad de que el lote contenga 25%


de piezas defectuosas, dado que la pieza elegida es defectuosa, es:

P( 3  D) 0.1250
P( 3 / D)    0.6579
P( D ) 0.1900

Dra. Ilse Janine Villavicencio Ramírez


Ejercicio
30
Un médico ha decidido recetar dos nuevos medicamentos a 200 pacientes enfermos
del corazón de la manera siguiente: 50 pacientes tomarán el medicamento A, otros 50
tomarán el medicamento B y los otros 100 restantes tomarán ambos medicamentos

El medicamento A reduce la probabilidad de un infarto en 0,35 , el medicamento B


reduce la probabilidad de un infarto en 0,20 y los dos medicamentos, cuando se les
toma juntos, actúan de manera independiente.
Los 200 pacientes fueron escogidos entre los que tenían 0,80 de probabilidad de
sufrir un infarto. Si un paciente elegido al azar sufre un infarto, ¿cuál es la
probabilidad de que haya tomado ambos medicamentos?

Dra. Ilse Janine Villavicencio Ramírez


Variables Aleatorias
31

Una variable es aleatoria si toma diferentes


valores como resultado de un experimento .
Puede ser discreta o continua

Ejemplo: Se lanzan 3 monedas


X : variable aleatoria (ej : número de caras)
x : valores que puede tomar la variable
(ej : 0, 1, 2, 3)

Dra. Ilse Janine Villavicencio Ramírez


Esperanza matemática : E (X)

32
Es el promedio de la variable aleatoria, si el experimento se repite un
número infinito de veces.
Ejemplo : Se lanzan 3 monedas
1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8
 = {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS}

3 caras. 2 caras 1 cara 0 caras => x


x
Número P(x) XP(x) ( X) =  XP( x )
de Cara
0 1/8 0 12
3/8 =
1 3/8 8
2 3/8 6/8
3 1/8 3/8 = 1,5
12/8
caras
Dra. Ilse Janine Villavicencio Ramírez
DISTRIBUCIONES DE PROBABILIDAD
(A)  Concepto:  Es  una  distribución  de  frecuencias  teórica  que  describe 
la forma en que se espera que varíen los resultados.
Resultan  útiles  para  realizar  inferencias  y  tomar  decisiones  bajo 
incertidumbre.
Ejemplo:
Se seleccionan en forma consecutivas dos bebes del servicio de
Neonatología . El número de varoncitos será:

Nº de Probabilidad
Resultados Probabilidad
varones 0.50
0 MM 0,25
1 VM,MV 0,50 0.25
2 VV 0,25

0 1 2 Nº de
caras
Dra. Ilse Janine Villavicencio Ramírez 33
(B) TIPOS DE DISTRIBUCIONES

34

a) DISCRETAS: La variable toma un número limitado de valores. Abarca :


- Distribución binomial
- Distribución de Poisson
- Distribución hipergeométrica

b) CONTINUAS: La variable puede tomar cualquier valor dentro de un


intervalo dado. Abarca:
- Distribución normal
- Distribución normal estándar o Z
- Distribución t
- Distribución Ji-cuadrada 2
- Distribución F

Dra. Ilse Janine Villavicencio Ramírez


Esperanza matemática : E (X)
Es el promedio de la variable aleatoria, si el experimento se repite un
número infinito de veces.
Ejemplo : Se lanzan 3 monedas
1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8

35
 = {CCC, CCS, CSC, SCC, CSS, SCS, SSC,
SSS}
3 caras. 2 caras 1 cara 0 caras => x
x
Número P(x) XP(x) ( X) =  XP( x )
de Cara
0 1/8 0 12
3/8 =
1 3/8 8
2 3/8 6/8
3 1/8 3/8 = 1,5
12/8
caras
Dra. Ilse Janine Villavicencio Ramírez
Distribuciones Discretas de Probabilidad
La distribución binomial
Se utiliza para describir variables discretas.
Es una de las distribuciones mas utilizadas en la estadística aplicada. La
distribución se deriva de un procedimiento llamado ensayo de Bernoulli,
nombrado así en honor del matemático Suizo James Bernoulli (1654 - 1785).

36
a) Características:
 El experimento consiste en una serie de ensayos repetidos.
 Cada ensayo sólo tiene dos resultados posibles: éxito y fracaso.

La probabilidad de éxito, designado por p es la misma para cada ensayo, la probabilidad de 
fracaso q (igual a 1­p) es también constante.

1. Los ensayos sucesivos son independientes.

  2. Puede ser simétrica o sesgada.

  3. La información de la muestra se obtiene con reposición de una población finita.

Dra. Ilse Janine Villavicencio Ramírez


b) Formula: n!
P(X = x) = p xq n-x
x! (n - x)!
donde:
n : número de ensayos
x : número de éxitos

37
p : probabilidad de éxitos en un ensayo
q : probabilidad de fracaso en un ensayo
n - x : número de fracaso en el ensayo

Se aplica a la selección de una muestra, sólo cuando el resultado de cada


solución es independiente de los resultados de las selecciones anteriores.

Dra. Ilse Janine Villavicencio Ramírez


c) Aplicación:
Una muestra de 4 frascos se selecciona sin restitución de un lote de 5,000 
frascos  de  cierto  laboratorio  farmacéutico.  Suponiendo  que  20%  de  los 
frascos  de  lote  no  cumplen  con  las  especificaciones  médicas,  ¿cuál  es  la 
probabilidad de que la muestra contenga exactamente 2 frascos malos?

n!
P(X = x ) = p xq n-x
Datos: x! (n - x)!
n=4
x=2 4!
p = 0,20
P(X = 2) =  0.2  0.80
2 2

2! (4 - 2)!
q = 0,80
 0,1536

Dra. Ilse Janine Villavicencio Ramírez 38


d) La distribución X
Cierto proceso de (Número de P(X = x )
producción se repite procesos deficientes)
cuatro veces. 0 4
4!  1   1 
Suponga que existe la 0      116
probabilidad de 0.50 0!4!  2   2 

39
que el proceso resulte 1 3
deficiente. En cuatro 4!  1  1
repeticiones se puede 1      416
1!3!  2  2
obtener 0,1,2,3 ó 4
2 2
procesos deficientes. 4!  1   1 
Se puede calcular la 2      616
probabilidad de cada
2!2!  2   2 
uno de estos posibles 3
4!  1   1 
1

resultados mediante 3      416


la distribución 3!1!  2   2 
binomial. 4 0
4 4!  1   1 
     116
4!0!  2   2 
A estos resultados se denomina distribución de probabilidad.
Dra. Ilse Janine Villavicencio Ramírez
e) La media y la desviación estándar

Consideramos la distribución del ejemplo


anterior
(p = 1/2, n =
X 4) 0 1 2 3 4
P(X = x ) 1/16 4/16 6/16 4/16 1/16

40
La media
 =  XP ( x)

Dra. Ilse Janine Villavicencio Ramírez


X P(x) XP(x) 32
0 1/16 0
 XP( x)  16
1 4/16 4/16  = 2 procesos
2 6/16 12/16

41
3 4/16 12/16
También:
4 1/16 4/16  = np
32/16
 = 4( 1 2 )  2

Interpretación: Si seleccionamos 4 procesos


médicos al azar, se espera encontrar 2 procesos
deficientes, si este experimento se repite un
número infinito de veces.
Dra. Ilse Janine Villavicencio Ramírez
La desviación estándar
   ( x   ) 2
P( x)

x P( x) (x   ) (x   )2 ( x   ) 2 P( x)

42
0 1/16 -2 4 4/16
1 4/16 -1 1 4/16
2 6/16 0 0 0
3 4/16 +1 1 4/16
4 1/16 +2 4 4/16

16/16

Dra. Ilse Janine Villavicencio Ramírez


16
 (X   ) P( x) 
2

16
16
   (X   ) P( x)  2
 1 proceso deficiente
16

43
También:
  npq

 4(0,5)(0,5)  1

La distribución binomial (p = 1/2, n = 4) tiene


una media de 2 y una desviación estándar de 1.

Dra. Ilse Janine Villavicencio Ramírez


44
Ejemplo:
Supóngase que en cierta población el 52 por ciento de
todos los nacimientos que se registraron son varones. Si
aleatoriamente se escogen cinco registros de nacimientos
dentro de esa población, ¿cuál es la probabilidad de que
exactamente tres de ellos pertenezcan a varones?.

P = 0.52
q = 1 - 0.52 = 0.48
n=5 5!
P(3,5)  0.523 0.48(53)  0.32  32%
r=3 3!(5  3)!

Dra. Ilse Janine Villavicencio Ramírez


Distribución
45
de Poisson:
Es una distribución muy usada en medicina y biología.
Se deriva del proceso de Poisson en honor al
matemático francés Simeon Denis Poisson (1781-1840).
Debe cumplir las siguientes condiciones:
La ocurrencia de los eventos son independientes.
El número promedio de veces () que ocurre un
éxito por cada unidad de tiempo o de espacio es
constante.
La probabilidad de un suceso es una unidad de
tiempo o de espacio muy pequeña.

Dra. Ilse Janine Villavicencio Ramírez


Si el tamaño de la muestra es bastante grande (n>50) y
la probabilidad de un evento particular es muy pequeño
(p < 0,1) y se desea hallar la probabilidad de un número
determinado de éxitos, se puede aplicar la distribución
de Poisson, dada por la siguiente ecuación .

46
P(X = x) =
x e
x!
donde
 (lambda): media = np = variancia
e : base de logaritmos naturales =2.71828
x! : factorial de x
Dra. Ilse Janine Villavicencio Ramírez
47
Ejemplo:
Supongamos que estamos investigando la seguridad de
una peligrosa intersección de calles, los registros
policíacos indican un media de 5 accidentes mensuales
en esta intersección. El número de accidentes esta
distribuido de acuerdo con una distribución de Poisson y
el departamento de seguridad vial desea que calculemos
la probabilidad de que en cualquier mes ocurra
exactamente 3 accidentes.

X = 3 acc/mes 53 2.71835
P( x 3)   0.14042  14.04%
 = 5 acc/mes 3!

Dra. Ilse Janine Villavicencio Ramírez


La distribución hipergeométrica
48
Se utiliza para describir variables discretas

a)Características
La información de la muestra se obtiene sin
reposición de una población finita, por lo tanto la probabilidad
de éxito varía.
b) Formula
donde:
 M  N  M  M : número de éxitos en la población
   k : número de éxitos en la muestra

P(X = k ) =
 k  n  k  N : tamaño de la población
N-M: número de fracasos en la población
N n : tamaño de la muestra
  n-k : número de fracasos en la muestra
n
Dra. Ilse Janine Villavicencio Ramírez
c)
49
Aplicación

Calcular la probabilidad de obtener 10 tubos


defectuosos en una muestra de 20 tubos de radio
tomados sin reemplazo de un lote de 30 tubos, de lo
cuales 15 son defectuosos.
Datos:  15  30 15 
k = 10   
P(X = 10) =  10  20 10 
n = 20  30 
N= 30  
 20 
M= 15 (3003)(3003) 9018009
=  = 0,3001
30045015 30045015

Dra. Ilse Janine Villavicencio Ramírez


Si erróneamente
50 se usa la distribución binomial con n =
20 y p =15/30 = 1/2 para calcular la probabilidad de tener
10 defectuosos, el resultado será:

P(X = x) 
20! 1
10!(20 - 10)! 2
10
1
2
   
10

184756
  0,1762
1048576

Una probabilidad considerablemente menor que la


probabilidad real.

Dra. Ilse Janine Villavicencio Ramírez


d) Forma

Puede se r simétrica o sesgada. Cada vez que p = 0.5, la distribución


51
hipergeométrica será simétrica sin tener en cuenta qué tan grande o pequeño
sea el valor de n; sin embargo, cuando p  0,5 la distribución será sesgada. El
grado de sesgo variará, dependiendo de la proximidad del p a 0,5 y del
tamaño de n.

e) La media y la desviación estándar

La media:   E ( X )  np

La desviación estándar: N n
  np (1  p ) 
N n
N 1
Donde N 1 es un factor de corrección de población finita
que se produce debido al proceso de muestreo sin reposición
de poblaciones finitas.

Dra. Ilse Janine Villavicencio Ramírez


Distribuciones continuas de probabilidad
52
La distribución normal
También conocida como campana de Gauss en honor al
matemático Karl Gauss ( siglo 19).
Es importante por:
Es muy aplicable para inferencia estadística
Se ajusta (casi) a las distribuciones de frecuencias
reales observadas.
Se utiliza para describir el comportamiento de una variable
continua.
(a) Características
1. Tiene un sólo pico (unimodal). Forma acampanada.
2. La media cae en el centro
3. La media, media y moda coinciden
4. Es asintótica al eje horizontal
Dra. Ilse Janine Villavicencio Ramírez
53
Media
Mediana
Moda

La distribución normal de
probabilidad es simétrica con
respecto a una línea vertical que
pase por la media

El extremo izquierdo se extiende de


manera indefinida y nunca toca el eje
El extremo derecho se extiende de
horizontal
manera indefinida y nunca toca el
eje horizontal

Dra. Ilse Janine Villavicencio Ramírez


b) Fórmula
54
La función de densidad: f(x), para la distribución normal tiene la siguiente
formula:
 x  2
1 1  
2 
f (x)  e 

2
donde:
e : constante matemática: 2.71828
 :constante matemática: 3.14159
 : media de la población
 : desviación estándar de la población
x : cualquier valor de la variable aleatoria continua
Areas debajo de la curva normal

No importa cuales son los valores de  y , para una distribución de


probabilidad normal el área total bajo la curva es 1.00, de manera que
podemos pensar en áreas bajo la curva como si fuesen probabilidades.
Matemáticamente es verdad que:

Dra. Ilse Janine Villavicencio Ramírez


1: Aproximadamente 68% de 2: Aproximadamente 95.5% de
55
todos los valores de una todos los valores de una
población normalmente población normalmente distribuida
distribuida se encuentra datos se encuentra datos 2 desviación
1 desviación estándar de la estándar de la media.
media .

  
   
  
     2 
      
2  

68% datos 94.6% datos

3: Aproximadamente 99.7% de
todos los valores de una
población normalmente
distribuida se encuentra
datos 3 desviación estándar 
  3
  
  
  3


de la media
99% datos
Dra. Ilse Janine Villavicencio Ramírez
La distribución normal estándar ( Z )

56
La distribución normal tiene diferente  y  para calcular probabilidades habría que integrar la función
de densidad. Por este motivo se estandariza la variable.
La estandarización es un proceso estadístico que consiste en restar la media a la variable y el
resultado dividirlo por la desviación estándar.

Distribución
normal estándar

  50
 1

Dra. Ilse Janine Villavicencio Ramírez


57
Ejercicio:
Un terapista físico piensa que los
puntajes en una prueba de
destreza manual tiene una
  2.5
distribución aproximadamente
normal, con una media de 10 y
una desviación estándar de 2,5.
Si a un individuo, elegido               10  15
      
aleatoriamente, se le aplica el
examen, ¿cuál es la probabi-
lidad de que logre un puntaje de
15 o mas puntos?.
Dra. Ilse Janine Villavicencio Ramírez
58
Obtenemos la siguiente información:

     2.5   2.5
x   15  10
Calculando Z: z  2
 2.5

  
  
   
   
  
  
  
 
  10 15
Para Z=2, buscamos en la tabla cual es la
probabilidad (o área) que le corresponde:
Área = .4772
  2.5
Como deseamos conocer esta área:
P ( x  15)  0.5  0.4772  0.0228  2.28%

 10 15
                     

Dra. Ilse Janine Villavicencio Ramírez


59

¿Cuál es la probabilidad de que se logre un pontaje entre 11 y 14?

Calculando Z:

11  10
Cuando x  11  z   0.4  A  0.1554
2.5
14  10
Cuando x  14  z   1.6  A  0.4452
2.5
              11
  14
        

El área sombreada se encuentra restando del área mayor (0.4452) el área


menor (0.1554)

P (11  x  14)  0.4452  0.1554  0.2898  28.98%

Dra. Ilse Janine Villavicencio Ramírez


Aplicaciones
60

Una empresa aplica un programa de entrenamiento


diseñado para mejorar la habilidades de
supervisión en los diferentes procesos que se
desarrollan en un hospital. Debido a que el
programa es autoadministrado, los supervisores
requieren un número diferente de horas para
concluirlo Un estudio de los participantes anteriores
indica que el tiempo medio que se lleva completar el
programa es de 500 horas y que esta variable
aleatoria normalmente distribuida tiene una
desviación estándar de 100 horas.

Dra. Ilse Janine Villavicencio Ramírez


Pregunta 1. ¿Cuál es la probabilidad de que un
61
participante elegido al azar requiera más de 500 horas
para completar el programa?

Solución:
En la figura, podemos ver que la
mitad del área bajo la curva está
P(X>500)=0.5
localizada a ambos lados de la media
de 500 horas. Por lo tanto podemos
deducir que la probabilidad de que la
variable aleatoria tiene un valor
mayor a 500 es el área sombreada,
es decir, 0.5.

Dra. Ilse Janine Villavicencio Ramírez


Pregunta 2:¿Cuál es la probabilidad de que un
62
supervisor elegido al azar se tome entre 500 y 650
horas para completar el programa de entrenamiento.

Solución:
La gráfica se muestra la
respuesta como zona
P(500 X 650)=0.4332 sombreada, representada por el
área entre la media (500 horas)
y el valor de X, en el cual
estamos interesados (650
horas). Estandarizando la
variable tenemos un valor para
Z

Dra. Ilse Janine Villavicencio Ramírez


x
63
Z

650  500
Z  1.5
100

Si buscamos Z = 1.5 en la tabla, encontraremos una


probabilidad de 0,4332. En consecuencia, la
probabilidad de que un candidato escogido al azar
requiera entre 500 y 650 horas para terminar el
programa de entrenamiento es ligeramente mayor a
0,4.

Dra. Ilse Janine Villavicencio Ramírez


Pregunta
64 3:¿Cuál es la probabilidad de que un
supervisor elegido al azar se tome más de 400 horas en
completar el programa?

Solución:
Estamos interesados en el área a la derecha de 700.

Estandarizamos
x P(X >700)= 0..0228
Z

700  500
Z  2
100

Dra. Ilse Janine Villavicencio Ramírez


65

Tabla: si Z = 2.0  Area: 0.4772

En consecuencia, la probabilidad mayor a 700 será


0,5 - 0,4772 = 0,0228

Por lo tanto hay un poco más de 2 oportunidades en


100 de que un participante elegido al azar se lleve más
de 700 horas en completar el curso.

Dra. Ilse Janine Villavicencio Ramírez


Pregunta 4:Suponga que el director del programa desea
saber
66 la probabilidad de que un participante escogido al azar
requiera entre 550 y 650 horas para completar el trabajo
requerido en el programa.
Solución:
Primero calculamos el valor de Z para 650
x
Z

650  500 P(550 X 650)
Z  1. 5
100
A este valor le
corresponde un área de
0,4332
Dra. Ilse Janine Villavicencio Ramírez
67

Después calculamos un valor de Z para 550

x
Z

550  500
Z  0.5
100

Correspondiéndole un área de 0,1915

Dra. Ilse Janine Villavicencio Ramírez


Para responde la pregunta debemos estar restar
las áreas:
68

Probabilidad de que la variable aleatoria esté entre 0,4332


(-) la media y 650 horas

Probabilidad de que la variable aleatoria esté entre 0,1915


la media y 550 horas

(=) Probabilidad de que la variable aleatoria esté 550 y 0,2417


650 horas

Dra. Ilse Janine Villavicencio Ramírez


69
Ejemplo

Supóngase que la estancia promedio de internación


en un hospital es de 5,5 días con una desviación
estándar de 1,8 días. Si se supone que la duración
de la internación se distribuye normalmente,
encuentre la probabilidad de que un paciente
seleccionado al azar de dicho grupo, tenga una
duración de internación :
 de más de 6 días
 entre 4 y 7 días

Dra. Ilse Janine Villavicencio Ramírez


70

Dra. Ilse Janine Villavicencio Ramírez


La distribución t
71
a) Características
Al igual que la normal, también es simétrica es algo más plana que la
distribución normal hay una distribución t para cada tamaño de muestra
cuando el tamaño de la muestra es mayor a 30, la distribución t se
asemeja tanto a la normal que se prefiere utilizar ésta.

Dra. Ilse Janine Villavicencio Ramírez


CUANDO
72 UTILIZAR Z o t
b) Fórmula
SI
¿S E C O N O C E  ? U S A R Z

N O
c) Grados de libertad
Se definen como el número de
valores que podemos escoger
SI libremente.
¿es n  30? U S A R Z

N O

U S A R t

Dra. Ilse Janine Villavicencio Ramírez


73

Dra. Ilse Janine Villavicencio Ramírez


La distribución Ji-Cuadrada

74
a) Características
n
Es una distribución asimétrica a la izquierda    Z i2
2

Sólo considera valores positivos


i 1

b) Definición

La distribución Ji-cuadrada esta definida por


c) Aplicaciones

Las aplicaciones más importantes están en


la prueba de bondad de ajuste la prueba de independencia estadística

d) Distribución

Dra. Ilse Janine Villavicencio Ramírez


75

Dra. Ilse Janine Villavicencio Ramírez


La Distribución F
76 Características
Es una distribución asimétrica a la derecha
Sólo tiene valores positivos
Se utiliza para comparar variancias de dos poblaciones, con distribución
normal
Fórmula

 Existe una “familia” de distribuciones F.
 Cada miembro de la familia está  determinado por dos parámetros: 
los grados de libertad (gl) en el numerador y los grados de libertad 
en el denominador.
 El valor de F no puede ser negativo y es una distribución continua.
 La distribución F  tiene sesgo positivo.
 Sus valores varían de 0 a  . Con forme 
F   la curva se aproxima al eje X. 

Dra. Ilse Janine Villavicencio Ramírez


77

Dra. Ilse Janine Villavicencio Ramírez


MUESTREO Y DISTRIBUCIONES DE MUESTREO
78 Importancia del muestreo
En lugar de levantar un censo “completo” se realiza un
muestreo, debido a que un censo:

1. requiere demasiado tiempo


2. es muy costoso
3. muy laborioso e ineficiente

Dra. Ilse Janine Villavicencio Ramírez


Tipos de Muestreo
79

A) MUESTREO NO PROBABILÍSTICO: No
permite inferencia estadística.

1. M. de Juicio: Abarca el juicio del experto,


opiniones de especialista
2. M. de Cuotas: Se decide la estructura del
marco muestral, sin tener en cuenta la
estructura del marco poblacional.
3. M. de Trozo: La elección de los “racimos”
no se hace al azar.

Dra. Ilse Janine Villavicencio Ramírez


Muestreo probabilistico
80
1. M. Aleatorio simple: muestreo formulado de manera que cada elemento
tiene la misma probabilidad de ser elegido.

2. M. Sistemático: Los artículos o individuos de la población son elegidos de


acuerdo a un factor. Se elige un punto de partida aleatorio y después se
selecciona uno cada k-esimo elemento de la población.

3. M. Estratificado: El marco poblacional se divide  en grupos homogéneos 
(estratos); de cada uno se extrae una submuestra, proporcional al tamaño 
del estrato. Muestreo por tipo de servicio

4. M. por Conglomerado: El marco poblacional se encuentra agrupado en 
conglomerados  o  racimos  Se  selecciona  en  forma  aleatoria,  el  o  los 
racimos. Todos los pacientes que ingresaron un determinado día.

Dra. Ilse Janine Villavicencio Ramírez


Tamaño de la muestra: Depende de:
81

1. La magnitud del máximo error permisible (e) y,


2. el grado de confianza de que el error en la
estimación no exceda del máximo error
permisible (1-)

Dra. Ilse Janine Villavicencio Ramírez


A. Para estimar una media poblacional:
82
Se calcula a partir de la formula siguiente
Z S 2e
n 2
 2

donde
Z 2 : Valor tabular para un nivel de confianza.
Depende del nivel de confianza utilizado
por la estimación del parámetro
desconocido. Toma un valor de 1,96
para un nivel de confianza de 0,95.

s 2e : Variancia obtenida de revisión


bibliográfica o estudio piloto.
Dra. Ilse Janine Villavicencio Ramírez
Ejemplo 1:
A fin de83conocer el gasto mensual en medicinas por familia, el Gerente de Marketing de un
laboratorio farmacéutico desea determinar el tamaño de la muestra que le proporcione un nivel de
confianza de 0,95 (Z = 1,96). Además conoce por estudios anteriores que las compras medias por
familia eran de S/. 120 mensuales, con una desviación estándar de 30. El Gerente busca un
tamaño de muestra que le permita estimar el nivel de gasto con un error de 10.

Dra. Ilse Janine Villavicencio Ramírez


Si se conoce N:
84

n
nf 
n
1
N

Ejemplo 1:
En una población grande, se desea estimar la
prevalencia de DM con 0,95 de confianza. De la
literatura se sabe que p = 0,10 si se asume un
error muestral de 5%, calcular n

Dra. Ilse Janine Villavicencio Ramírez


85
Datos Z2 2p e qe
n
2
Z 2  1,96
n
1,96  2  0,1 0,9 
p e  10%  0,10
qe  90%  0,90
 0,05  2

  0,05 0,345744
n  138,3  139
0,0025

Interpretación: Si se desea estimar la prevalencia



poblacional con 0,95 de confianza y un de 5%
se deberá evaluar 139 sujetos.

Dra. Ilse Janine Villavicencio Ramírez


El
86 error estándar

Es una medida de dispersión de una distribución muestral. Es


equivalente a la desviación estándar.

Desviación estándar de la Error estándar


distribución de medias de muestra de la media

Desviación estándar de la Error estándar distribución de


proporciones de muestra de la proporción

Dra. Ilse Janine Villavicencio Ramírez


87

Distribuciones de muestreo
La totalidad de datos de una población,
constituye la distribución de población original
(PO)
PO
X1 Media : 
X2
Varianza : x2

X3
. x-
. z
. x
XN
Dra. Ilse Janine Villavicencio Ramírez
De la88PO se extraen muestras de tamaño n. A cada una se
calcula su media. El conjunto de ese total de medias se
denomina población derivada de medias (PDM)

PO PDM
X1 x1
X2 x2
X3 n x3
. .
..
.
XN
Media : xm
x
Varianza :  x 2
 
2
x
n
x x
x -  
z  x 
Dra. Ilse Janine Villavicencio Ramírez
x n
Si se busca comparar dos poblaciones, se deriva de cada población 
una población de medias y luego se comparan 
89

PO1 PDM1 PO2 PDM2 PDDM


X1 x1 X1 x1 ( x1  x 2 )
X2 x2 X2 x2 (x  x )
X3 x3 X3 x3 (x  x )
. .
. . .
. .
. . . . .
XN xm XN xm ( )
Media 1  x1 2  x2 d  1  2
 12  22
Varianza  2

x1  x 2 
n1 n2
( x  x )  ( 1  2 )
z  1 22
1  22

n1 n2
Dra. Ilse Janine Villavicencio Ramírez
El teorema del límite central
90
Muestra la relación entre la forma de la distribución de la
población y la forma de la distribución de muestro. Se basa
en dos aspectos:

(1) La media de la PDM será igual a la media de la PO,


sin importar el tamaño de la muestra(n) incluso si la
población no es normal

(2) Al incrementarse el tamaño de la muestra, la PDM se


acercará a la normalidad, sin importar la forma de la distribución de la
población.
El teorema del límite central nos permite utilizar las propiedades de
la distribución normal en muchos casos en los que los datos
subyacentes pueden no estar distribuidos normalmente.

Dra. Ilse Janine Villavicencio Ramírez


91 ESTIMACION DE PARAMETROS
Introducción

La estadística se divide en DESCRIPTIVA e INFERENCIAL

Dra. Ilse Janine Villavicencio Ramírez


Tipos de estimaciones

92 A) Estimación puntual

Un sólo número se utiliza para estimar un


parámetro desconocido. Para ser útil debe de
estar acompañado del error.

Ejemplo:
Para el próximo mes se espera que las ventas
sean 700 unidades con un error de 10%.

Dra. Ilse Janine Villavicencio Ramírez


B)
93 Estimación por intervalo
Un intervalo de valores se utiliza para estimar un
parámetro desconocido. El error se indica de dos
manera: por la extensión del intervalo y por la
probabilidad de obtener el verdadero parámetro
de la población que se encuentra dentro del
intervalo.
Ejemplo:
Para el próximo mes se espera que el número de
consultas en el Servicio de Reumatología sean
entre 670 y 730 pacientes, con un error 5%.

Dra. Ilse Janine Villavicencio Ramírez


94
CRITERIOS PARA SELECCIONAR UN ESTIMADOR: CESI.
 Coherencia: si al aumentar n, el
estimador se aproxima al parámetro.
 Eficiencia: proporciona menor error
estándar que otros estimadores.
 Suficiente: utiliza mayor cantidad de la
información contenida en la muestra que
otro estimador.
 Insesgado (o imparcial): si el
estimador tiende a tomar valores por
encima y por debajo del parámetro que
estima, con la misma frecuencia.

Dra. Ilse Janine Villavicencio Ramírez


Las 95estimaciones puntuales
(A) De la media poblacional
x
La media muestral estima a la media poblacional

(B)De la varianza y la desviación estándar
S2 estima 
S estima 
estima
(C) De la proporción poblacional
p 

Dra. Ilse Janine Villavicencio Ramírez


Los intervalos de confianza
Conceptos
96

 Nivel de confianza: probabilidad que


asociamos con una estimación del intervalo. Se
representa con (1 -). Los niveles más utilizados
son 0,90 0,95 y 0,99.

 Intervalos de confianza: es el alcance de la


estimación que estamos haciendo.

Dra. Ilse Janine Villavicencio Ramírez


Intervalo para la media
97

A partir de muestras grandes


x-
pero Z =

n
-Z0 Z0
Pr  Z 0  Z  Z 0   1  
 x 
Pr  Z 0   Z0   1  
 x 
   
Pr  x  Z0    x  Z0   1  
 n n 

Dra. Ilse Janine Villavicencio Ramírez


EJEMPLO
En 
98 un  estudio  de  mercado,  se  realizó  una  encuesta  a 
400  familias  calculando  un  gasto  medio  anual  en 
zapatos de S/. 740 por familia. La desviación estándar 
fue  S/.  400.  Construya  e  interprete  un  intervalo  de 
confianza  al  0,95  de  la  estimación  del  gasto  medio 
anual de zapatos por familia en esa ciudad.

Dra. Ilse Janine Villavicencio Ramírez


99
Interpretación:
Hay 0,95 de confianza que el intervalo hallado se
encuentre dentro del grupo de intervalos que
contienen a la verdadera media poblacional (

 Ls

LI

muestra
1 2 3 4 5 6 7 8
Dra. Ilse Janine Villavicencio Ramírez
A partir de muestras pequeñas
100

Pero, x -
t =
S
-t0 t0 n
Pr  t 0  t  t 0   1  
 
 x 
Pr  t 0   t0   1  
 S 
 n 
 s s 
Pr  x  t 0    x  t0   1
 n n
Dra. Ilse Janine Villavicencio Ramírez
Ejemplo
Se desea estimar el tiempo medio de estancia hospitalaria para cierto tipo
de101
pacientes. Se selecciona una muestra aleatoria de 25 HC y se calculó
y S = 4,5 días. Estimar  con 0,95 de confianza.

x  5,7
 S S 
Pr x  t n1    x  t n1   1 
 n n
 4,8 4,8 
Pr 5,7  2,064    5,7  2,064   1  0,1
 25 25 
Pr  3,72    7,68  0,90

Dra. Ilse Janine Villavicencio Ramírez


Ejemplo 2
102  S S 
n=9 Pr x  t n1    x  t n1   1 
 n n
x  41,27
 16,23 16,23 
S= Pr
16,23  41,27  2,306    41,27  2,306   0,95
 9 9 
 = 0,05
Pr  28,80    53,74  0,95

Interpretación:
Hay 0,95 de confianza que el intervalo construido se encuentre dentro 
del  grupo  de  intervalos  que  contienen  a  la  verdadera  media 
poblacional (

Dra. Ilse Janine Villavicencio Ramírez


Ejemplo:
103

Solución: GL= n - 1 = 8 t = 2,306

Dra. Ilse Janine Villavicencio Ramírez


104 Intervalo para la proporción

Pero
p 
Z 
p
-Z0 Z0
donde
Pr{ Z o  Z  Z }  1  
p (1  p )
p 
p  n
Pr{ Z o   Z}  1  
 `p
Pr{ p  Z p    p  Z o p }  1  

Dra. Ilse Janine Villavicencio Ramírez


Ejemplo:
105

1600 (0,80)(1  0,80)


p  0.80 p 
2000 2000
Z  1,96  p  0,00894
Pr{0,80-1,96(0,00894) < < 0,80 +1,96(0,00894) }= 0,95

Pr{0,782 <  < 0,818} = 0,95

Dra. Ilse Janine Villavicencio Ramírez


Ajuste para poblaciones finitas
106

El error estándar de la estimación sufre un ajuste,


cuando se trata de una población finita.
 N n
X  .
n N 1
Error estándar de la media
p (1  p ) N  n
p  .
Error estándar de la proporción n N 1

Si la proporción n/N es menor a 0,05 se omite el


ajuste.

Dra. Ilse Janine Villavicencio Ramírez


107

Ejemplo 1

Hay 250 familias en un pequeño poblado. Una


encuesta con 40 familias reveló que la
contribución media anual a obras comunitarias
es de US $450, con una desviación estándar de
US $ 75. Establezca un intervalo de confianza
de 0,95 para la contribución media anual.
Interprételo.

Dra. Ilse Janine Villavicencio Ramírez


Solución:
Como
108 la muestra es mayor a 5%, procede el ajuste.

  N  n    N  n 
Pr{ x  Z      xZ    1  
n  N 1  n  N 1 
 75  250  40   75  250  40 
Pr{450  1,96      450  1,96  }  0,95
 40  250  1   40  250  1 
Pr{450  23,24( 0,8433 )    450  23,24( 0,8433 )}  0,95
Pr{428,66    471,34}  0,95
Interpretación:
Hay 0,95 de confianza que el intervalo elaborado pertenezca 
al grupo de intervalos que contienen a la verdadera media 
poblacional.

Dra. Ilse Janine Villavicencio Ramírez


Ejemplo 2
Hay  300  técnicos  en  una  gran  empresa  metal  mecánica.  Una  muestra  de  50 
reveló 
109 que  18  cuentan  con  una  experiencia  previa  en  otra  empresa  similar. 
Establezca  un  intervalo  de  confianza  al  0,95  para  la  proporción  de  técnicos 
con experiencia en otra empresa.
Solución:
(036)(1  0,36)
p
18
 0,36 p 
50 50
 p  0,06788

Hay 0,95 de confianza que el intervalo construido pertenezca 
Interpretación:
al grupo de intervalos que contienen a la verdadera 
proporción poblacional.
Dra. Ilse Janine Villavicencio Ramírez
El tamaño de la muestra y el IC
110

A.¿De qué depende el tamaño de la muestra (n)?


Depende de:
1. La magnitud del máximo error
permisible (e) y,
2. El nivel de confianza de que el error en
la estimación no exceda del máximo error
permisible (1-)

Dra. Ilse Janine Villavicencio Ramírez


111
Ejemplo 1
A fin de conocer el gasto mensual en medicinas por
familia, el Gerente de Marketing de un laboratorio
farmacéutico desea determinar el tamaño de la
muestra que le proporcione un nivel de confianza de
0,95 (Z = 1,96). Además conoce por estudios
anteriores que las compras medias por familia eran
de S/. 120 mensuales, con una desviación estándar
de 30. El Gerente busca un tamaño de muestra que
le permita estimar el nivel de gasto con un error de
10.

Dra. Ilse Janine Villavicencio Ramírez


Solución
112
Datos:
1 -  = 0,95
Z = 1,96
 = 30
e = 10

2
Z p(1-p)
n= 2
e
Dra. Ilse Janine Villavicencio Ramírez
Ejemplo 2
Un congresista desea determinar su popularidad en zona norte del
país. 113
Especifica que la proporción de electores que lo apoyarán debe
calcularse dentro del ± 2% de la proporción de la población, además,
desea tener un grado de confianza de 0,95. En las elecciones pasadas
recibió 40% de los votos en esa parte del país. Duda que esto haya
sufrido muchos cambios. ¿De cuántos electores debe ser la muestra?.

Solución
Datos:
1 -  = 0,95 (1,96) 2 (0,40)(0,60)
n
Z = 1,96 (0,02) 2
p = 0,40 0,921984
e = 0,02 n
(0,02) 2
n  2305

Dra. Ilse Janine Villavicencio Ramírez


HIPÓTESIS CON UNA SOLA
MUESTRA
114

CONCEPTOS BÁSICOS
(A) Hipótesis: Suposición acerca del parámetro.
 Hipótesis planteada o nula. H p ó H0
Es la suposición que el parámetro tome un
determinado valor.

Ejemplo: La hipótesis nula es que la media


de la población es igual a 200.
Ho :  = 200

Dra. Ilse Janine Villavicencio Ramírez


 Hipótesis alternativa (Ha o H1)
Es
115el complemento de la hipótesis nula. Se acepta cuando se rechaza
la hipótesis nula.
Formas
Si Ho :  = 200 Ha :  200
Si Ho :   200 Ha :  > 200
Si Ho :   200 Ha :  < 200
La condición “igual” siempre se considera en la hipótesis nula

Las siguientes afirmaciones son hipótesis estadísticas.


 La vida media de los peruanos es de 72 años.
 La eficacia de dos medicamentos para curar el cáncer es similar.
 Las notas de la el aula sigue un modelo normal de media de 12 y desviación
estándar de 2.5
Una prueba de hipótesis permite aceptar o rechazar si determinadas
afirmaciones son ciertas o falsas en función de los datos observados en una
muestra.
Dra. Ilse Janine Villavicencio Ramírez
(B) Objetivo de la prueba de hipótesis.
El 116
propósito  de  la  prueba  de  hipótesis  no  es  cuestionar  el  valor  calculado  del 
estadístico  (muestral),  sino  hacer  un  juicio  con  respecto  a  la  diferencia  entre 
estadístico de muestra y un valor planteado  del parámetro.

(C) Nivel de significación ()

 (1 -  
Zona de
Aceptación
-Z0 Z0

Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de


significación indicará la probabilidad de no aceptarla, es decir, estén fuera de
área de aceptación.

El  nivel  de  confianza  (1­),  indica  la  probabilidad  de  aceptar  la 
hipótesis planteada, cuando es verdadera en la población.
Dra. Ilse Janine Villavicencio Ramírez
117

(D) Tipos de errores

Cualquiera sea la decisión tomada a partir de una prueba


de hipótesis, ya sea de aceptación de la Hp o de la Ha,
puede incurrirse en error:

La muestra seleccionada conduce a


EN LA POBLACIÓN ACEPTAR Hp RECHAZAR Hp

Hp es cierta Decisión correcta Error tipo I ó 

Hp es falsa Error tipo II ó  Decisión correcta

Dra. Ilse Janine Villavicencio Ramírez


118

(1 -  Zona de rechazo
si Hp es cierta 

o
Hp o
Poder de la prueba
Ha o
(1 - 


Zona de aceptación Hp
1
Zona de Rechazo Hp

Dra. Ilse Janine Villavicencio Ramírez


Si la hipótesis planteada, Hp :   0 , es cierta, la zona de rechazo, , medirá la
probabilidad de que se rechace dicha hipótesis siendo cierta, incurriendo en Error Tipo I o
. 119
Supongamos que la hipótesis planteada es falsa, Hp:   0 , y que la alternante Ha:  > 
0 es verdadera, y si los resultados de la muestra nos conducen a aceptar la hipótesis
planteada, estamos cometiendo el Error Tipo II ó 
La magnitud del Error  depende de la magnitud del Error  y de la discrepancia entre 
0 y  1

Se observa la existencia de una relación inversa entre la magnitud de los errores  y  :


conforme  aumenta,  disminuye.
Esto obliga a establecer con cuidado el valor de  para las pruebas estadísticas. Lo
ideal sería establecer  y .
En la práctica se establece el nivel  y para disminuir el Error  se incrementa el
número de observaciones en la muestra, pues así se acortan los limites de confianza
respecto a la hipótesis planteada.
La meta de las pruebas estadísticas es rechazar la hipótesis planteada. En otras
palabras, es deseable aumentar  cuando ésta es verdadera, o sea, incrementar lo que
se llama poder de la prueba (1- )

La aceptación de la hipótesis planteada debe interpretarse como que la información


aleatoria deIlse
Dra. la Janine
muestra disponible
Villavicencio no permite detectar la falsedad de esta hipótesis.
Ramírez
E) Tipos de prueba
120

a) Prueba bilateral o de dos extremos: la hipótesis


planteada se formula con la igualdad

Ejemplo
 (1 -  
Hp :  = 200 Zona de
Aceptación
Ha :   200 -Z0 Z0

Dra. Ilse Janine Villavicencio Ramírez


b)
121 Pruebas unilateral o de un extremo: la

hipótesis planteada se formula con  o 

Hp :   200 Hp : 200


Ha :  < 200 Ha :> 200


 (1 -  (1 - 

Dra. Ilse Janine Villavicencio Ramírez


Prueba de hipótesis acerca de la media
122

poblacional
(A) Con varianzas conocidas (muestras grandes)
Ejemplo:
Se afirma que el salario diario medio de los técnicos de una cierta zona
minera es de S/.65,42, con una desviación estándar S/. 2,32. Una muestra
de 144 técnicos que laboran en esa zona reciben un salario diario medio
de 64,82 soles. ¿Puede considerarse este resultado como sustento para
afirmar que técnicos de esa zona tienen un salario diario diferente de S/.
65,42 a un nivel de significación  = 0,05 ?.

Dra. Ilse Janine Villavicencio Ramírez


Procedimiento
123

1) Plantear las hipótesis:


Hp :  = 65,42
Ha :   65,42
2) Seleccionar el nivel de significación:  = 0.05
3) Elegir la prueba estadística:
x -
c 
x
Los supuestos son:
• la población está normalmente distribuida.
• la muestra ha sido seleccionada al azar.

Dra. Ilse Janine Villavicencio Ramírez


124 Determinación de los criterios de decisión
4)

 
(1 - 

-Z0 Z0
-1.96 1,96

Si { -1.96  Zc  1.96 } se acepta la Ho, en caso contrario se rechaza.


5) Cálculos:

64,82  65,42
c   3,10
2,32
144
Dra. Ilse Janine Villavicencio Ramírez
6) Conclusiones
125

(1) Se rechaza la hipótesis planteada y se acepta la hipótesis


alternante a un nivel de significación de 0,05. La prueba
resultó ser significativa.
(2) La evidencia estadística permite rechazar la hipótesis
planteada.
(3) Por lo tanto los datos muestrales confirman que el
promedio de salarios diarios de los técnicos de la zona de
estudio es menor de S/.65,42.

Dra. Ilse Janine Villavicencio Ramírez


126
EJEMPLO
El administrador de un centro de salud desea saber si el
tiempo medio invertido por los pacientes en la sala de
espera es mayor que 20 minutos. Una muestra de 100
pacientes permanecieron, en promedio, 23 minutos en la
sala de espera entre el registro y la atención por algún
médico del centro de salud. La desviación estándar de la
muestra fue de 10. Sea =0.05
1. Plantear las hipótesis Ho :   20
Ha :   20
2.Definir la prueba estadística: Como n = 100,
entonces se aplica PRUEBA Z
Dra. Ilse Janine Villavicencio Ramírez
Seleccionar el nivel de significación  = 0,05
3. 127

4. Determinar el valor crítico: Como  = 0,05 y es de


una sola cola, entonces Z = 1.645
Criterios de decisión
Si prueba Z es mayor que
1,645, se rechaza Ho.
Si prueba Z es menor o igual
     que 1,645, se acepta Ho.
0   
1,645

Dra. Ilse Janine Villavicencio Ramírez


5. Realizar
128 el cálculo del estadístico Z
x   23  20 3
Z   3
sx 10 1
100
6. Conclusiones
(A) Se rechaza la hipótesis planteada, se acepta la
hipótesis alternante a un nivel de significación de
0,05. La prueba resultó significativa
(B) Los datos disponibles como evidencia empírica,
han permitido rechazar la hipótesis planteada.
(C) El tiempo que espera un paciente muy
probablemente sea mayor a los 20 minutos.
Dra. Ilse Janine Villavicencio Ramírez
129

EJEMPLO

Una encuesta en 64 laboratorios médicos reveló que


el precio medio cobrado por realizar cierta prueba es
de S/. 12.00 con una desviación estándar de S/.
6.00. ¿ Proveen estos datos la suficiente información
para indicar que la media de la población es mayor
que 10?. Sea  = 0.01

Dra. Ilse Janine Villavicencio Ramírez


EJEMPLOS
Los siguientes datos son los consumos de oxígeno (en ml) durante la
130
incubación de una muestra aleatoria de 15 suspensiones celulares: 14.0,
14.1, 14.5, 13.2, 11.2, 14.0, 14.1, 12.2, 11.1, 13.7, 13.2, 16.0, 12.8, 14.4, 12.9.
¿Proporcionan estos datos suficiente evidencia, aun nivel de 0.05 de
significación , de que la media de la población no es igual a 12 ml.?.
El administrador de una clínica quiere saber si la población que concurre a una
clínica A tiene un ingreso medio familiar mayor al de la población que concurre
a una clínica B. Los datos consisten en los ingresos familiares de 75 pacientes
internados en la clínica A y 80 pacientes internados en la clínica B. Las medias
de las muestra son S/ 6800 y S/ 5450 respectivamente, y varianzas de S/ 600
y S/ 500 respectivamente.
Doce individuos participaron en un experimento para estudiar la efectividad de
cierta dieta, combinada con un programa de ejercicios, para la reducción de los
niveles de colesterol en suero. ¿ proporcionan estos datos la evidencia suficiente
para concluir que el programa de ejercicios y dieta es efectivo para la reducción
de los niveles de colesterol en el suero?.
Antes: 201, 231, 221, 260, 228, 237, 326, 235, 240, 267, 284, 201
Después: 200, 236, 216, 233, 224, 216, 296, 195, 207, 247, 210, 209
Dra. Ilse Janine Villavicencio Ramírez
(B) Con varianzas desconocidas (muestras chicas)

Ejemplo:
131 En un programa de mejoramiento del desempeño en un centro de
salud los participantes miden su progreso mediante el tiempo que les toma
realizar cierto proceso.
Se tomó una muestra de 25 sujetos de esta empresa para medirles el tiempo
que requieren para culminar el proceso (en minutos) de otorgar una cita a un
paciente, encontrándose una media muestral de 11,7 minutos y una
desviación de estándar de 2,3 minutos.
¿Se puede afirmar que el tiempo medio para culminar este proceso es inferior
de 12 minutos?. Utilice un nivel de significación  = 0,05.
Solución
1) Hipótesis: Hp : m ³ 12
Ha : m < 12
2) Nivel de significación: a = 0,05 x -
3) Prueba estadística: tc 
S
Los supuestos son: n
•la población se distribuye normalmente.
•la muestra elegida al azar.

Dra. Ilse Janine Villavicencio Ramírez


4) Criterios de decisión
132
 (1 - 

-t0
-1.711
to con GL = 24 y  = 0,05
Si { tc>-1,711} se acepta la Hp en caso contrario se rechaza

5) Cálculos:

6) CONCLUSIONES

 Se acepta la hipótesis planteada a un nivel de significación de


 = 0,05. La prueba resultó no significativa.
 Los datos muestrales no permiten afirmar que el tiempo
requerido para culminar la tarea es inferior a 12 minutos .

Dra. Ilse Janine Villavicencio Ramírez


133 Ejemplo

Se hizo un estudio de una muestra de 25 registros


de pacientes de un hospital de enfermedades
crónicas tomando como base pacientes externos. El
número medio de visitas por paciente fue 4,8 y la
desviación estándar muestral fue de 2. ¿Puede
concluirse a partir de estos datos que la media de la
población es mayor que cuatro visitas por paciente?.
Suponga que la probabilidad de cometer error del
tipo I es de 0,05.

Dra. Ilse Janine Villavicencio Ramírez


Prueba de hipótesis acerca de la proporción poblacional ()
Ejemplo:
134
El Gerente de la Clínica Santa María afirma que por lo menos 55% de los
pacientes se encuentra plenamente satisfecho con los servicios recibidos.
¿Qué conclusión puede obtenerse si de una muestra aleatoria de 500
pacientes 245 manifestaron su preferencia?. Utilice un nivel de significación 
= 0,01 para comprobar la afirmación.
Proporción 245
muestral : p=  0,49
500

Dra. Ilse Janine Villavicencio Ramírez


1) Planteo de Hipótesis:
135
Hp : 0,55
Ha : 0,55
2) Nivel de significación: = 0,01
3) Prueba estadística: p -
c 
p
Los supuestos son:
• la población se distribuye normalmente.
• la muestra ha sido seleccionada al azar.

Dra. Ilse Janine Villavicencio Ramírez


4) Criterios de decisión
136

(1 - 

Z 
-2,33
Si { Zc>-2,33} se acepta la hipótesis planteada, en caso contrario se rechaza.

 (1   )
p 
n
5) Cálculos

(0,55)(0, 45)
p   0,022
500

Reemplazando valores en Z:

0,49  0,55 0,06


Z    2,73
0,022 0,022
Dra. Ilse Janine Villavicencio Ramírez
137

6) Conclusiones
1) Se rechaza la hipótesis planteada y se acepta la hipótesis
alternante a un nivel de significación  = 0,01. La prueba
resultó ser altamente significativa.
2) La evidencia empírica nos permite rechazar la hipótesis
planteada.
3) El Gerente de Clínica está equivocado en su afirmación,
puesto que el resultado de la prueba indica que los
pacientes que se encuentran plenamente satisfechos es
menor a 55%.

Dra. Ilse Janine Villavicencio Ramírez


138

Ilse
Janine

Gracias

Dra. Ilse Janine Villavicencio Ramírez

También podría gustarte