0% encontró este documento útil (0 votos)
1K vistas169 páginas

Practica Estadística 2

Este documento contiene una guía de estudio para la asignatura Estadística II en un sistema semipresencial. Incluye nueve tutorías que cubren temas como introducción a la teoría de probabilidades, experimentos aleatorios y determinísticos, espacio muestral, eventos, y definiciones relacionadas con la teoría de probabilidades. El documento proporciona ejemplos y actividades para aplicar los conceptos teóricos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
1K vistas169 páginas

Practica Estadística 2

Este documento contiene una guía de estudio para la asignatura Estadística II en un sistema semipresencial. Incluye nueve tutorías que cubren temas como introducción a la teoría de probabilidades, experimentos aleatorios y determinísticos, espacio muestral, eventos, y definiciones relacionadas con la teoría de probabilidades. El documento proporciona ejemplos y actividades para aplicar los conceptos teóricos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

ESTADISTICA II

SISTEMA SEMIPRESENCIAL
tabla de contenido
GUIA DE ESTUDIO SEMIPRESENCIAL.........................................................................................................................3

IDENTIFICACION DE LA ASIGNATURA.......................................................................................................................4

TUTORIA 1......................................................................................................................................................................5

TUTORIA 2....................................................................................................................................................................19

TUTORIA 3....................................................................................................................................................................21

TUTORIA 4....................................................................................................................................................................23

TUTORIA 5....................................................................................................................................................................25

TUTORIA 6....................................................................................................................................................................27

TUTORIA 7....................................................................................................................................................................29

TUTORIA 8....................................................................................................................................................................31

TUTORIA 9....................................................................................................................................................................33
UNIDAD I: INTRODUCCIÓN A LA TEORÍA DE PROBABILIDADES

Experimento Aleatorio, espacio Muestral y sucesos elementales, sucesos y álgebra de


sucesos, Axiomas de Probabilidad, Espacio de Probabilidad, Teoremas básicos, espacio de
Probabilidad Finito y Definición de Laplace, Espacio de Probabilidad Numerable, Espacio
de Probabilidad Continuo, Probabilidad Condicional, Interdependencia de Sucesos, fórmula
de Bayes.

TEORÍA DE PROBABILIDADES

La teoría de probabilidades se ocupa de asignar un cierto número a cada posible resultado


que pueda ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y
saber si un suceso es más probable que otro.

1. EXPERIMENTO

Un experimento es un procedimiento por el cual se obtiene uno o más resultados. En


estadística la palabra experimento se utiliza para describir un proceso que genera un
conjunto de datos cualitativos o cuantitativos. Los resultados del experimento pueden ser
determinísticos o probabilísticos (los que dependen del azar).

EJEMPLO – 1.

a) Sumar dos números impares y observar el resultado si es par o impar.


b) El cuadrado de un número impar y observar el resultado, par o impar.
c) En un triángulo equilátero, observar la longitud de sus lados
d) Lanzar una moneda una vez y observar que lado saldrá.
e) Lanzar un dado una vez y observar que lado saldrá.
f) Contar objetos defectuosos producidos diariamente por cierto proceso.
g) Aplicar una encuesta para obtener opiniones, etc..

2. EXPERIMENTO DETERMINISTICO

En estadística, un experimento determinístico es cuando el resultado de la observación se


puede predecir con certeza.

EJEMPLO - 2.

Son experimentos determinísticos:

a) Sumar dos números impares y observar el resultado si es par o impar.


5, 3 impares: 5+3 = 8 7, 11 impares: 7+11 = 18

Se puede predecir con certeza que: La suma de dos impares es par

b) El cuadrado de un número impar y observar el resultado, par o impar.


7 es impar: 72= 49 11 es impar: 112= 49

Se puede predecir con certeza que: El cuadrado de un impar es impar

En un triángulo equilátero, observar la longitud de sus lados


Se predice con certeza: Los tres lados son iguales

3. EXPERIMENTO ALEATORIO

DEFINICIÓN. Un experimento aleatorio es todo proceso que consiste de la ejecución de


una prueba una o más veces, cuyo resultado en cada prueba depende del azar y en
consecuencia no se puede predecir con certeza.

EJEMPLO – 3.

Por ejemplo, son experimentos aleatorios:

d) Lanzar una moneda una vez y observar que lado saldrá.

No se puede predecir con certeza el resultado:

e) Lanzar un dado una vez y observar que lado saldrá.

No se puede predecir con certeza el resultado:

f) Contar objetos defectuosos producidos diariamente por cierto proceso.

Cantidad de impresiones defectuosas que saldrán

g) Aplicar una encuesta para obtener opiniones, etc.

Obtener opiniones

4. ESPACIO MUESTRAL

DEFINICIÓN. Se denomina espacio muestral al conjunto que consiste de todos los


resultados posibles de un experimento aleatorio. Este conjunto se denotará por S, algunos
autores usan el símbolo Ω. A cada elemento del espacio muestral se denomina también
punto muestral: S = {w / w, es un punto muestral}

Si el espacio muestral tiene un número finito de elementos, entonces es posible enlistar a


todos estos, y si el número de elementos es grande o infinito, entonces el espacio muestral
se describirá mediante un enunciado o propiedad.

EJEMPLO – 4.

Hallar el espacio muestral de:


Lanzar una moneda una vez y observar que lado saldrá.
E = lado escudo S= lado sello de 5 Bs.
S= {E, S}
El espacio muestral es finito

Nota el sello indicaremos con $ para no confundir con S= desviación estándar de la


muestra
Lanzar un dado una vez y observar que lado saldrá.

S= { }

S= {1, 2, 3, 4, 5, 6}

El espacio muestral es finito

EJEMPLO – 5

Hallar el espacio muestral de:

Si el experimento aleatorio es: medir la vida útil de una computadora en horas.

S= {h R / h > 0} El espacio muestral es infinito

ACTIVIDAD N° 1 Hallar el espacio muestral de los experimentos aleatorios:

1.- Lanzar una moneda dos veces.


2.- Lanzar una moneda tres veces.
3.- Lanzar tres monedas.
4.- Lanzar dos dados.
5.- Lanzar un dado dos veces.
6.- Lanzar un dado y un moneda.
7.- Determinar la ubicación de clavado de un dardo que es arrojado
en un blanco circular de 10 cm. de diámetro.
8.- Lanzar dos dados y observar la suma de los dos.
9.- Obtener una carta de una baraja de cartas inglesa, sin comodines.

CARDINALIDAD DEL ESPACIO MUESTRAL

Se refiere a la cantidad de elementos del espacio muestral o al número de puntos


muestrales que tiene dicho espacio muestral, se representa n(S).

EJEMPLO - 6

Hallar la cardinalidad del espacio muestral del experimento:

a) Lanzar un dado una vez y observar que lado saldrá.

S= { }

La cardinalidad es n(S)= 6

Se interpreta que el espacio muestral tiene 6 elementos o puntos muestrales.

b) Si el experimento aleatorio es: medir la vida útil de un televisor en horas.


S= {t R / t > 0} n(S)= 

EVENTOS

DEFINICIÓN. Se denomina EVENTO O SUCESO ALEATORIO a cualquier subconjunto


generado del espacio muestral

EJEMPLO – 7

Lanzar un dado una vez y observar los valores pares.


El experimento aleatorio es lanzar un dado
El evento es obtener un valor par
El nombre del evento o suceso se identifica por una letra mayúscula o con una mayúscula
con sub indice.
A= “obtener valor par” o E1= “obtener valor par”

S= { } n(S)= 6

A={ } n(A)= 3

E1={ } n(E1)= 3

EJEMPLO – 8

Una bolsa contiene esferas blancas y negras. Se extraen sucesivamente tres esferas.
Calcular:

1. El espacio muestral es:


S = {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b); (n, n,n)}

2. El suceso A = {extraer tres bolas del mismo color}.


A = {(b,b,b); (n, n,n)}

3. El suceso B = {extraer al menos una bola blanca}.


B= {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b)}

4. El suceso C = {extraer una sola bola negra}.


C = {(b,b,n); (b,n,b); (n,b,b)}

EVENTO O SUCESO ELEMENTAL O PUNTO MUESTRAL .-

Suceso elemental es cada uno de los elementos que forman parte del espacio muestral.

EJEMPLO – 9 al tirar un dado un suceso elemental es sacar 5.

EVENTO O SUCESO COMPUESTO.-


Suceso compuesto es cualquier subconjunto del espacio muestral.

EJEMPLO – 10 al tirar un dado un suceso sería que saliera impar, otro, obtener múltiplo de
2.

SUCESO O EVENTO SEGURO.-


Suceso seguro, S, está formado por todos los posibles resultados (es decir, por el espacio
muestral).

EJEMPLO – 11 al tirar un dado obtener una puntuación que sea menor que 7.

EVENTO O SUCESO IMPOSIBLE.-

Suceso imposible, , es el que no tiene ningún elemento.

EJEMPLO – 12 al tirar un dado obtener una puntuación igual a 9.

EVENTOS O SUCESOS COMPATIBLES.-

Dos sucesos, A y B, son compatibles cuando tienen algún suceso elemental común.

EJEMPLO – 13

Si A es sacar puntuación par al tirar un dado y B es obtener múltiplo de 3, A y B son


compatibles porque el 6 es un suceso elemental común o se que existe A  B.

S={1,2,3,4,5,6} A={2,4,6} B={3,6}

A  B = {2,4,6}  {3,6}={6 } 6 está en A y en B

SUCESOS INCOMPATIBLES O MUTUAMENTE EXCLUYENTES

Dos sucesos, A y B, son incompatibles o mutuamente excluyentes cuando no tienen ningún


elemento en común. Ai  Bi = 

EJEMPLO – 14

Si A es sacar puntuación par al tirar un dado y B es obtener múltiplo de 5, A y B son


incompatibles.

S={1,2,3,4,5,6} A={2,4,6} B={5}

A  B = {2,4,6}  {5}={ }= 

SUCESOS O EVENTOS INDEPENDIENTES.-

Dos sucesos, A y B, son independientes cuando la probabilidad de que suceda A no se ve


afectada porque haya sucedido o no B.

EJEMPLO – 15 Al lazar dos dados los resultados son independientes.

EVENTOS O SUCESOS DEPENDIENTES.-

Dos sucesos, A y B, son dependientes cuando la probabilidad de que suceda A se ve


afectada porque haya sucedido o no B.

EJEMPLO – 16 Extraer dos cartas de una baraja de 52 cartas, sin reposición, son sucesos
dependientes.

SUCESO CONTRARIO O COMPLEMENTO.-


El suceso contrario a A es otro suceso que se realiza cuando no se realiza A. Se denota por
A’.

EJEMPLO – 17 Son sucesos contrarios sacar par e impar al lanzar un dado.

S={1,2,3,4,5,6} A={2,4,6} A’={1,3,5}

PARTICIÓN O ESPACIO DE SUCESOS.-

P, es el conjunto de todos los sucesos aleatorios. Si tiramos una moneda el espacio


de sucesos está formado por: P= {, {E}, {$}, {E, $} }. Observamos que el primer
elemento es el suceso imposible y el último el suceso seguro.

EJEMPLO – 18

Una moneda S= {E, $}. Número de eventos o sucesos = 21 =2

Dos monedas E= {(E,E); (E,$); ($,E); ($,$)}.Número de eventos o sucesos = 22 =4

Cuatro monedas. Número de eventos o sucesos = 24 =16

EVENTO UNITARIO

Es aquel evento que tiene un solo punto muestral.

EJEMPLO – 19 Lanzar una moneda una vez y obtener escudo

El experimento aleatorio es lanzar una moneda

El evento es obtener un escudo

A= “obtener un escudo”

A={ } A={E}

Las cardinalidades son: n(S)= 2 n(A)= 1

EVENTO COMPUESTO Es aquel evento que tiene dos o más eventos.

EJEMPLO – 20

Obtener una carta As o diamante de una baraja de cartas inglesa, sin comodines..

El espacio muestral es:


A= “obtener As”

s, s, s, s }

B= {s, J, Q, K}


A o B son los eventos compuestos y Las cardinalidades son:

n(S) = 52 n(A)= 4 n(B)= 13 n(AoB)= 16


NOTA Un evento seguro es S, un evento imposible es 

OPERACIONES CON EVENTOS

Conceptualmente un evento es un conjunto, un espacio muestral es el conjunto universo,


entonces los eventos poseen las propiedades de los conjuntos, entonces para las
operaciones de eventos se recurren a las técnicas de conjuntos.

DEFINICIONES:

1.- Se dice que un evento A ocurre, si contiene por lo menos un punto muestral de algún
experimento aleatorio. Esto es, Un evento A ocurre si y sólo si existe w  A.

2.- Un evento A no ocurre si y sólo si w  A.

3.- El evento A es un subevento o está contenido en el evento B, simbolizado, A  B, si


toda vez que ocurre A ocurre también B.

4.- Los eventos A y B son iguales, A = B, si y sólo si A  B y B  A.

5.- Se denomina complemento del evento A al evento que se denota por Ac o A' o A, que
consiste de todos los puntos muestrales que no están en el evento A pero están en el
espacio muestral, esto es,

El evento A' describe el evento de que no ocurra A.

A' = {w S / w A}.

6.- Se denomina unión de los eventos A y B, al evento A  B que consiste de todos los
puntos muestrales que pertenecen a A o a B, o a ambos, esto es,

El evento A  B describe el evento de que ocurra por lo menos uno de ellos.

Gráficamente:

A  B = {w S / w A  w B}.

7.- Se denomina intersección de los eventos A y B al evento A  B que consiste de todos


los puntos muestrales que son comunes a A y a B, esto es,

El evento A B describe el evento de que ocurran ambos A y B.


A  B = {w S / w  A  w  B}.

8.- Dos eventos A y B son mutuamente excluyentes o disjuntos, si no tienen elementos en


comú n, esto es,

A  B = .

9.- La diferencia del evento A menos B es el evento A - B, que consiste de todos los puntos
muestrales que pertenecen al evento A y no pertenecen al evento, esto es,

A–B = { w S / w  A  w  B }

A – B = A  B’

5.- El producto cartesiano de los eventos A y B, es el evento AxB que consiste de todos los
pares, ordenados de puntos muestrales (w, v), siendo:

wA y v  B, esto es, A x B = {(w, v } / wA  vB).

El espacio muestral S asociado a un experimento aleatorio compuesto de dos experimentos


aleatorios El Y E2 cuyos espacios muestrales respectivos son S 1 y S2, se puede expresar
como un producto cartesiano, esto es, S= S1 x S2

EJEMPLO – 21

Si se lanzan 2 monedas, a la vez o en forma consecutiva, y si S1 y S2 son los espacios


muestrales de las monedas 1 y 2 respectivamente, entonces, el espacio muestral S del
experimento compuesto es:

S= S1 x S2 = {E, S} x {E, S} = { (E, E), (E, S), (S, E), (S, S) }

1 S= Sello dinero E= escudo

Cuando se mencione entre eventos o se asume que se trata de unión de eventos y significa la operación de suma,
si se menciona y se asume la intersección y la operación es multiplicación; ambos, también significa intersección

EVENTOS MUTUAMENTE EXCLUYENTES

Dos o más eventos son excluyente, si la ocurrencia de uno de ellos, anula la ocurrencia de los demás; caso
contrario son eventos no mutuamente excluyentes.

EVENTOS INDEPENDIENTES

Dos eventos son independientes si ambos no tienen relación entre sí; es decir, si la ocurrencia de uno de ellos, no
influye en la ocurrencia del otro; caso contrario son eventos dependientes.
ALGEBRA DE EVENTOS

Las siguientes propiedades se verifican para los eventos

Conmutativa A  B = B  A AB=BA AB=BA

Asociativa A  (B  C) = (A  B)  C A  (B  C) = (A  B)  C

A  (B  B) = (A  B)  A

Complemento AAc= c = U AAc=U U c= 

(A c)c = A A c= U - A

Idempotencia AA=A AA=A

Distributiva A  (B  C) = (A  B)  (A  C) A  (B  C) = (A  B) 
(A  C )

A  (B  C) = (A  B)  (A  C )

Identidad AU=A AU=U A= A=A A


=A

De Morgan (A  B)c = A c  B c (A  B)c = A c  B c

Diferencia A-B=ABc A–A=

Diferencia Simétrica A  B = (A – B)  (B – A) A B = (A  B) – (B  A) AA=

Absorción A  (A  C) = A A  (A  C) = A

CARDINALIDAD DE EVENTOS

CARDINALIDAD DE UN EVENTO

La cardinalidad se refiere al nú mero de elementos que tiene un conjunto finito. La cardinalidad


de un evento A se denota: card(A) o n(A) se lee Número de elementos o puntos
muestrales del evento A.

EJEMPLO – 22

Sea el evento A ={ i, e, o, u, a} hallar n(A)=? i e o


Solución u a 5

A ={ i, e, o, u, a}

A A

n(A) = 5

El evento tiene 5 puntos muestrales


CARDINALIDAD DE DOS EVENTOS:

Para resolver problemas aplicando ecuaciones:

n(A) = x + y n(A  B) = y

n(B) = z + y n(A  B) = x + y + z

n(B - A) = z n(A B) = n(A) + n(B) - n(A  B)

n(A - B) = x

Caso: A  B =

Si A  B =, entonces, n(A B) =n(A) + n(B))

Caso: A  B  

Si A  B   entonces, n(A B) = n(A) + n(B) - n(A  B)

DIFERENCIA: n(A – B) = n(solo A) = n(A) – n(A  B)

NOTA: Lo que no está rayado puede omitirse

CARDINALIDAD DE TRES EVENTOS:

La gráfica que le corresponde a tres conjuntos en forma general es:


Para resolver aplicando ecuaciones tenemos:

n(A)= x + y + u + v n(A  C)= u + v

n(C)= u + v + w + t n(A  B)= y + v

n(B)= y + z + v + w n(B  C)= w + v

n(A  B  C) = v

n(A  B  C) = x + y + z + u + v + w + t

Las fórmulas para resolver aplicando conteo es:

n(ABC) = n(A)+n(B)+n(C)+ n(ABC) –[ n(AB)+ n(AC)+ n(BC)]

EJEMPLO

De 800 lectores, para enterarse de noticias, se obtiene que: 240 leen EL NUEVO DÍA, 500
leen EL DEBER, 100 leen ambos periódicos. Hallar el número de los que leen solo EL
DEBER, leen EL DEBER y EL NUEVO DÍA, el número de los que leen EL DEBER o EL
NUEVO DÍA.

Solución

Primero identificamos eventos A= Los que leen EL DEBER

B= los que leen EL NUEVO DÍA

Recopilamos datos desde el planteo del problema

n(A)= 500 n(B)= 240 n(AB)= 100 n(U)= 800

Nos piden encontrar: n(solo A)=? n((AB)= ? n(AB)= ?

Construimos la primera gráfica (con los datos recopilados)

n(A)= 500 n(B)= 240 n(AB)= 100 n(U)= 800

500 se anota afuera de A, porque es el

Total de los subconjuntos que tiene A.

Los subconjuntos de A son: x y 100

Calculamos las incógnitas para graficar el segundo diagrama

500 = x + 100  x = 500 – 100  x = 400

240 = z + 100  z = 240 – 100  z = 40

800 – 400 - 100 – 40 = q  q = 260

Graficamos el segundo diagrama


En este diagrama se completan las

Incógnitas x, z y q. Es decir, debe

Tener la cardinalidad de todos los

Subconjuntos

Resolvemos el planteo del problema desde el segundo diagrama

n(solo A) = 400 leen EL BEBER

n((AB) = 100 leen AMBOS

n(AB) = 400 + 100 + 40= 540 leen EL DEBER O EL NUEVO DÍA

EJEMPLO – 26

En la modalidad de semi presencial de una universidad se recopilo la siguiente información


con el fin de determinar cuántos estudiantes estaban cursando solo contabilidad básica,
solo economía, y solo macroeconomía. El resultado recopilado fue: Contabilidad básica 75
alumnos, Macroeconomía 50, Economía 55, las tres materias 5, Contabilidad y economía
20, Economía y macroeconomía 10, Contabilidad y macroeconomía 20.

Solución: Identificamos conjuntos: A= Los que estudian Contabilidad básica; B=


Los que estudian Economía; C= Los que estudian Macroeconomía

Datos: n(A)= 75 n(AB)= 20 n(ABC)= 5

n(B)= 55 n(AC)= 20 n(C)= 50 n(BC)= 10

Primer diagrama
Segundo diagrama

Respuestas:

Solo contabilidad básica n(soloA)= 40


Solo economía n(soloB)= 30
Solo macroeconomía n(soloC)= 25

ACTIVIDAD 2

1.- Hallar las incógnitas respectivas:

n(A – B) =? n(B)=? n(A  B)=?

Si se conoce: n(A) = 100 n(A  B) = 70 n(B – A) = 30

2.- Hallar las incógnitas respectivas desde un diagrama de Venn; n(solo A)=?

n[(A  B) – C] =? n[(A B  C)c] =? n(solo C)=? n(A  B  C)=?

n([A B C]c) =? n(solo B)=? n(Ac)=?

Si se conocen los datos:

n(A) = 400 n(A  B) = 70 n(A B  C) =30 n(C) =150

n(A  C) = 40 n(B) = 200 n(BC) = 80 n(U)=1500

3.- (B) De 250 personas para enterarse de noticias, se obtiene que: 140 ven TV, 50
escuchan radio y ven TV. Hallar el número de los que escuchan radio y el número de los
que solo escuchan radio? R:160 y 110.
4.- (B) En una fiesta infantil se obtiene que 150 beben Pepsi y Coca cola, 700 beben Pepsi
o Coca cola, 400 beben Pepsi, hallar el número de los beben solo Coca cola y las que
beben solo Pepsi.

5.- (B) En el departamento de contabilidad de una empresa trabajan el contador, el auxiliar


y la secretaria, estos decidieron realizar el inventario, obtenido los siguientes datos: Conteo
del contador 1000, Conteo del auxiliar 1050, Conteo de la secretaria 1100, 50 unidades
fueron contadas tanto por el contador como por el auxiliar, 100 unidades fueron contadas
tanto por el contador como por la secretaria, 75 unidades fueron contadas tanto por el
auxiliar como por la secretaria, 50 unidades fueron contadas por las tres personas,
¿Cuántas unidades fueron contadas por contador solamente? ¿Por el auxiliar únicamente?
¿Por la secretaria únicamente? ¿Cuál fue el inventario total del departamento?

AUTO EVALUACIÓN

Indicar V si es verdadero o F si es falso o encerrar el resultado correcto, además justificar la


respuesta; en los siguientes casos:

1.- Experimento aleatorio es un proceso de observación, donde el resultado exacto no se


conoce, prevaleciendo la duda. V F

Justificación:

2.- “Resultado del examen final de un curso de Álgebra por parte de un alumno”.

a) Es un experimento determinístico b) Es un experimento aleatorio

Justificación:

3.- Sea el experimento: Dejar libre una calculadora en el aire”

a) Es un experimento deterministico b) Es un experimento aleatorio

Justificación:

4.- Un trabajo de investigación científica:

a) Es un experimento determinístico b) Es un experimento aleatorio

Justificación:

5.- Hallar el espacio muestral en los experimentos siguientes:

a) Resultado del lanzamiento de cuatro monedas.


b) Resultado final de un curso de Estadística.
c) Selección de un alumno de acuerdo a su rendimiento académico.
d) Selección de dos personas, en relación a su situación de empleo.
6.- Que es un evento seguro, de un ejemplo.

7.- Que es un evento imposible, de un ejemplo.

8.- Para los votantes de una pequeña comunidad de 300 personas se tiene que 110 son
mayores de 20 años, 120 son mujeres y 50 son mujeres mayores de 20 años: Cuantos
votantes son: 1.-Hombres 2.- Hombres mayores de 20 años 3.- Mujeres con 20 años o
menos años 4.- Hombres con 20 años o menos años 5.- Tienen 20 años o menos.

9.- En un grupo de 100 estudiantes, 49 no estudian psicología y 53 no estudian filosofía. Si


27 alumnos no estudian filosofía ni psicología, ¿ Cuantos alumnos estudian exactamente
uno de los cursos mencionados ? R: 48

10.- En una biblioteca hay n estudiantes de los cuales 560 leen el libro A, 210 estudiantes
leen el libro B y A; 1060 solamente uno de los libros y 660 no leen el libro B Hallar cuantos
alumnos hay en la biblioteca. R:1580

11.- Un grupo de 270 estudiantes que llevan las materias de Álgebra, Estadística y
Contabilidad, de estos se recopilaron los siguientes datos: 90 cursan Álgebra, 95 cursan
Estadística, solo Estadística cursan 40, Álgebra y estadística 25, 15 cursan Álgebra y
Contabilidad, 5 cursan las tres asignaturas, calcular los que cursan: Estadística y
Contabilidad, solo Álgebra, solo Contabilidad, Álgebra y Contabilidad pero no estadística,
Álgebra o Contabilidad, Álgebra o Estadística pero no Contabilidad, ninguna asignatura, los
que cursan solo una asignatura.

12.- De un cierto número de personas interrogadas, el 50% son aficionados al fútbol, 30%
al básquet y el 60% a la natación; 20% al fútbol y al básquet, 12% a la natación y al básquet
y el 15% a la natación y al fútbol. Si el 5% es indiferente a los tres deportes. Qué porcentaje
de aficionados tienen gusto por los tres deportes.
R:2%

13.- (B) En la encuesta realizada a un colegio de 1500 alumnos, se obtuvo que: 540
estudian álgebra, 890 estudian inglés, 800 estudian química, 600 estudian inglés y química,
100 estudian álgebra solamente, 200 estudian química y álgebra, 150 estudian las tres
materias simultáneamente. Hallar Cuantos estudian: Inglés y álgebra pero no química; Solo
una materia; y a lo sumo dos materias.

14.- (B) Entre 1900 personas aficionadas al fútbol se obtienen los siguientes datos: 350 son
hinchas de Blooming solamente, 350 son hinchas de Blooming y Oriente; 400 de Oriente
solamente; 200 de Oriente y Real; 100 de Real solamente; 400 de Blooming y Real; 150
son hinchas de Oriente, Real y Blooming. Hallar los hinchas que son de Blooming y Oriente
pero no de Real y los Hinchas que no son de ningún equipo nombrado
15.- (B) En un instituto de 250 alumnos, 60 estudian Pascal, 70 estudian Visual Basic, 80
estudian Visual Fox, 15 estudian Visual Basic y Pascal, 25 estudian Visual Basic y Visual
Fox, 30 Pascal y Visual Fox. Cuantos alumnos estudian por lo menos uno los lenguajes de
programación. Si diez estudian simultáneamente los tres lenguajes.

16.- (M) Una universidad con 2700 estudiantes de la carrera de administración, algunos
llevan las materias de Álgebra, Estadística y Contabilidad, se recopilaron los siguientes
datos: 900 cursan Álgebra, 950 cursan Estadística, 1050 cursan Contabilidad, solo
Estadística 400, Álgebra y estadística 250, 150 cursan Álgebra y Contabilidad, 50 cursan
las tres asignaturas, calcular los que cursan: Estadística y Contabilidad, solo Álgebra, solo
Contabilidad, Álgebra y Contabilidad pero no estadística, Álgebra o Contabilidad, Álgebra o
Estadística pero no Contabilidad, ninguna asignatura, los que cursan solo una asignatura

DEFINICIÓN DE PROBABILIDAD

La probabilidad nos da la ley del azar o ley empírica del azar. La probabilidad es un número
que mide la creencia o no de que llegue a ocurrir un evento o suceso. El número (p) que
representa la probabilidad de ocurrencia de un evento puede ser fraccionario, racional o
porcentual.

0<p<1

Si p0 entonces el evento es más probable que ocurra

Si p0 entonces el evento es menos probable que ocurra

ENFOQUE PROBABILISTICO

La probabilidad de un evento A se calcula con la formula:

n( A)
O es lo mismos decir: p ( A )=
n(S )

Los enfoques probabilísticos son OBJETIVA Y SUBJETIVA

PROBABILIDAD OBJETIVA. Está basada en la probabilidad a priori o clásica y en la


probabilidad a posteriori o frecuencia relativa.

PROBABILIDAD CLÁSICA. Se basa en que los resultados del experimento aleatorio:

Si en un experimento los eventos son igualmente posibles, colectivamente exhaustivos y


mutuamente excluyentes, entonces la suma de las probabilidades de cada evento es 1

EVENTOS IGUALMENTE POSIBLES. Nos dice que todo evento Ei tiene la misma
posibilidad de ocurrir

EVENTOS COLECTIVAMENTE EXHAUSTIVOS. Nos dice que el experimento incluye a


todos los resultados posibles

EVENTOS MUTUAMENTE EXCLUYENTES. Nos dice que la ocurrencia de un evento


excluye la ocurrencia de otros
PROBABILIDAD BASADA EN FRECUENCIA RELATIVA

Se define si: 1.- La frecuencia relativa se observa en un gran número de ensayos

2.-Las condiciones deben ser estables

PROBABILIDAD SUBJETIVA

Está basada en la experiencia personal

EJEMPLO

En cada caso identificar el enfoque probabilístico

1. En el lanzamiento de un dado se quiere obtener 5 puntos


2. Se inoculan con un veneno a 20 ratas, de las cuales sobreviven 3
3. Me duelen los huesos, va a llover más tarde
SOLUCIÓN

El evento de 1. Es un enfoque objetivo clásico o a priori

El evento de 2. Es un enfoque objetivo a posteriori basada en frecuencia relativa

El evento de 3. Es un enfoque subjetivo

NOTASe puede remplazar el cardinal por otra medida de conjuntos, por ejemplo por una
probabilidad, si A y B son eventos probabilísticos:

Donde: p(A  B) es la probabilidad de que se dé A ó B.

p(A) es la probabilidad de que se dé A.

p(B) es la probabilidad de que se dé B.

p(A  B) es la probabilidad de que se dé A y B simultáneamente

AXIOMAS DE LA PROBABILIDAD

La probabilidad es positiva y menor o igual que 1. 0 ≤ p(A) ≤ 1

La probabilidad del suceso seguro es 1. p(S) = 1

Si A y B son incompatibles, es decir A  B =  entonces: p(A  B) = p(A) + p(B)

PROPIEDADES DE LA PROBABILIDAD

1 La suma de las probabilidades de un suceso y su contrario vale 1, por tanto la


probabilidad del suceso contrario es:

2 Probabilidad del suceso imposible es cero.

3 La probabilidad de la unión de dos sucesos es la suma de sus probabilidades restándole


la probabilidad de su intersección.

4 Si un suceso está incluido en otro, su probabilidad es menor o igual a la de éste.


5 Si A1, A2, ..., Ak son incompatibles dos a dos entonces:

6 Si el espacio muestral S es finito y un suceso es E = {x1, x2, ..., xn} entonces:

EJEMPLO la probabilidad de sacar par, al tirar un dado, es: P(par) = P(2) + P(4) + P(6)

REGLA DE LAPLACE.-

Si realizamos un experimento aleatorio en el que hay n sucesos elementales, todos


igualmente probables, equiprobables, entonces si A es un suceso, la probabilidad de que
ocurra el suceso A es:

EJEMPLOS

1.- Hallar la probabilidad de que al lanzar dos monedas al aire salgan dos lados escudo.

Solución

Casos posibles: {EE, E$, $E, $$}.

Casos favorables: 1.

2.- En una baraja de 52 cartas, hallar la P(as) y P(trébol).

Solución

Casos posibles: 52.

Casos favorables de ases: 4.

Casos favorables de tréboles: 13.

3.- Calcular la probabilidad de que al echar un dado al aire, salga:

Solución 3.1 Un número par.

Casos posibles: {1, 2, 3, 4, 5, 6}.

Casos favorables: {2, 4, 6}.

3.2 Un múltiplo de tres.


Casos posibles: {1, 2, 3, 4, 5, 6}.

Casos favorables: {3, 6}.

3.3 Mayor que 4.

Casos posibles: {1, 2, 3, 4, 5, 6}.

Casos favorables: {5, 6}.

REGLAS DE LA PROBABILIDAD

PROBABILIDAD DE LA UNIÓN DE SUCESOS INCOMPATIBLES

AB =  p(AB) = p(A) + p(B)

Calcular la probabilidad de obtener un 2 ó un 5 al lanzar un dado.

PROBABILIDAD DE LA UNIÓN DE SUCESOS COMPATIBLES

AB ≠  p(AB) = p(A) + p(B) − p(AB)

p(AB C)=p(A)+p(B)+p(C)−p(A B)−p(AC)−p(B C)+p(AB C)

EJEMPLO. Calcular la probabilidad de obtener un múltiplo de 2 ó un 6 al lanzar un dado.

PROBABILIDAD CONDICIONAL

Sean A y B dos sucesos de un mismo espacio muestral S.

Se llama probabilidad del suceso A condicionada al B y se representa por P(A/B) a la


probabilidad del suceso A una vez ha ocurrido el B.

EJEMPLO

Calcular la probabilidad de obtener 6 al tirar un dado sabiendo que ha salido par.

SUCESOS INDEPENDIENTES

Dos sucesos A y B son independientes si p(A/B) = p(A)

SUCESOS DEPENDIENTES
Dos sucesos A y B son dependientes si p(A/B) ≠ p(A)

PROBABILIDAD DE INTERSECCIÓN DE SUCESOS INDEPENDIENTES

p(A B) = p(A) · p(B)

EJEMPLO

Se tiene una baraja de 40 cartas, se saca una y se vuelve a meter. ¿Cuál es la probabilidad
de extraer dos ases?

PROBABILIDAD DE INTERSECCIÓN DE EVENTOS DEPENDIENTES

p(A B) = p(A) · p(B/A)

EJEMPLO

Se tiene una baraja de 40 cartas, se extraen dos cartas. ¿Cuál es la probabilidad de extraer
dos ases?

PROBABILIDAD DE LA DIFERENCIA DE SUCESOS

TABLAS DE CONTINGENCIA

Un método útil para clasificar los datos obtenidos en un recuento es mediante las tablas de
contingencia. Se trata de tablas en cuyas celdas figuran probabilidades, y en la cual
podemos determinar unas probabilidades conociendo otras de la tabla.

EJEMPLO. Se sortea un viaje a Roma entre los 120 mejores clientes de una agencia de
automóviles. De ellos, 65 son mujeres, 80 están casados y 45 son mujeres casadas. Se
pide:

1 ¿Cuál será la probabilidad de que le toque el viaje a un hombre soltero?

2 Si del afortunado se sabe que es casado, ¿cuál será la probabilidad de que sea una
mujer?
MAS EJEMPLOS Tablas contingentes

Una empresa que se dedica a la venta de sus productos por internet está interesada en
conocer cuáles son sus clientes potenciales. Para ello realiza una encuesta a 1000
personas atendiendo a su edad y al número de horas semanales que navegan en la red,
obteniendo los resultados que se dan en la tabla siguiente. Construir la tabla de
probabilidades.

Solución

A partir de la información de esta tabla se van a definir los siguientes eventos:


A1: persona menor de 25 años A2: persona de 25 a 45 años
A3: persona mayor de 45 años B1: navegar menos de 7 horas a la
semana
B2: navegar entre 7 y 14 horas a la semana B3: navegar más de 14 horas a la
semana
Con esta notación, la tabla anterior se puede expresar como:
Llegados a este punto se obtiene la siguiente tabla de probabilidades, siempre y cuando
admitamos que la muestra anterior es representativa de la población de la que se ha
extraído:

La lectura del contenido de esta tabla es sencilla e inmediata. Supongamos ahora que
queremos determinar la probabilidad de que, seleccionada una persona al azar, ésta
navegue más de 14 horas a la semana sabiendo que es menor de 25 años. Para
determinar esa probabilidad no tiene sentido que trabajemos con todo el espacio muestral
(las 1000 personas de la muestra), pues sabemos que es menor de 25 años. Así pues
nuestro nuevo espacio muestral será el formado por el evento A1. Ahora el denominador de
esa frecuencia relativa, que es la probabilidad, no es 1000, sino que es A1=300. A su vez el
numerador deja de ser B3=200, pues dentro de ese colectivo de 200 personas que navegan
más de 14 horas a la semana hay algunas que tienen más de 25 años, pero nosotros
sabemos que nuestra persona seleccionada es menor de 25. Ahora el numerador es
(A1B3)=100. Todo ello lleva a que la nueva probabilidad viene dada por el cociente:

A1: persona menor de 25 años A2: persona de 25 a 45 años

A3: persona mayor de 45 años B1: navegar menos de 7 horas a la


semana

B2: navegar entre 7 y 14 horas a la semana B3: navegar más de 14 horas a la


semana

Ejemplo. Una empresa dedicada al montaje de ordenadores recibe procesadores


procedentes de tres fabricantes distintos. Los procesadores que recibe pueden ser buenos
o defectuosos y, por experiencia anterior, esta empresa trabaja con los siguientes datos:
a) Si se elige un procesador al azar de entre todos los recibidos, ¿cuál es la
probabilidad de que sea defectuoso?

b) Si se elige un procesador al azar de entre todos los recibidos, ¿cuál es la


probabilidad de que proceda de la empresa H1?

c) ¿Cuál es la probabilidad de que un procesador procedente de la empresa H1 sea


defectuoso?

d) ¿Cuál es la probabilidad de que un procesador defectuoso elegido al azar proceda


de la empresa H1?

e) ¿Es la calidad del procesador independiente del proveedor?

f) Teniendo en cuenta la calidad, ¿cuál de las empresas es más fiable? En este


ejemplo la información viene dada en forma de tabla de doble entrada que se
puede completar en la manera siguiente:

En este ejemplo la información viene dada en forma de tabla de doble entrada que se
puede completar en la manera siguiente:

Con esta información las respuestas a cada uno de los apartados anteriores serían las
siguientes:
DIAGRAMAS DE ÁRBOL

Colocar el evento en el nodo y la probabilidad en la rama. Para la construcción de un


diagrama en árbol se partirá poniendo una rama para cada una de las posibilidades,
acompañada de su probabilidad. En el final de cada rama parcial se constituye a su vez, un
nodo del cual parten nuevas ramas, según las posibilidades del siguiente paso, salvo si el
nodo representa un posible final del experimento (nodo final). Hay que tener en cuenta:
que la suma de probabilidades de las ramas.

EJEMPLOS

1.- Una clase consta de seis niñas y 10 niños. Si se escoge un comité de tres al azar, hallar
la probabilidad de:

a) Seleccionar tres niños.

b) Seleccionar exactamente dos niños y una niña.

c) Seleccionar exactamente dos niñas y un niño.

2.- Calcular la probabilidad de que al arrojar al aire tres monedas, salgan:

Tres escudos (E).


EXPERIMENTOS COMPUESTOS

Un experimento compuesto es aquel que consta de dos o más experimentos aleatorios


simples. Es decir, si tiramos un dado, o una moneda, son experimentos aleatorios simples,
pero si realizamos el experimento de tirar un dado y posteriormente una moneda, estamos
realizando un experimento compuesto. En los experimentos compuestos es conveniente
usar el llamado diagrama en árbol para hacerse una idea global de todos ellos.

TEOREMA DE LA PROBABILIDAD TOTAL

Si A1, A2 ,... , An son: Sucesos incompatibles. Y cuya unión es el espacio muestral (A 1 A2
 ... An = S). Y B es otro suceso. Incluido en S

Resulta que: p(B) = p(A1) · p(B/A1) + p(A2) · p(B/A2 ) + ... + p(An) · p(B/An )

EJEMPLO Se dispone de tres cajas con bombillas. La primera contiene 10 bombillas, de


las cuales hay cuatro fundidas; en la segunda hay seis bombillas, estando una de ellas
fundida, y la tercera caja hay tres bombillas fundidas de un total de ocho. ¿Cuál es la
probabilidad de que al tomar una bombilla al azar de una cualquiera de las cajas, esté
fundida?

TEOREMA DE BAYES
Si A1, A2 ,..., An son: Sucesos mutuamente excluyentes o incompatibles 2 a 2. Y cuya
unión es el espacio muestral (A1  A2  ...  An = S) y B es otro suceso incluido en S.

Resulta que:

Las probabilidades p(Ai) se denominan probabilidades a priori.


Las probabilidades p(Ai/B) se denominan probabilidades a posteriori.
Las probabilidades p(B/Ai) se denominan verosimilitudes.

EJEMPLOS

1.- El 20% de los empleados de una empresa son ingenieros y otro 20% son economistas.
El 75% de los ingenieros ocupan un puesto directivo y el 50% de los economistas también,
mientras que los no ingenieros y los no economistas solamente el 20% ocupa un puesto
directivo. ¿Cuál es la probabilidad de que un empleado directivo elegido al azar sea
ingeniero?

Solución

2.- La probabilidad de que haya un accidente en una fábrica que dispone de alarma es 0.1.
La probabilidad de que suene esta sí se ha producido algún incidente es de 0.97 y la
probabilidad de que suene si no ha sucedido ningún incidente es 0.02. En el supuesto de
que haya funcionado la alarma, ¿cuál es la probabilidad de que no haya habido ningún
incidente?

Solución: Sean los sucesos: I = Producirse incidente. A = Sonar la alarma.


RESUMEN DE LAS REGLAS DE LA PROBABILIDAD

ACTIVIDAD 1 RESUMEN DE PROBABILIDADES

1.- Sean A y B dos sucesos aleatorios con:

Hallar:   1 2 3
4 5 6

2.- Sean A y B dos sucesos aleatorios con:


Hallar:

1 2 3 4

3.- Se sacan dos bolas de una urna que se compone de una bola blanca, otra roja, otra
verde y otra negra. Escribir el espacio muestral cuando:
1 La primera bola se devuelve a la urna antes de sacar la segunda.
2 La primera bola no se devuelve.
4.- Una urna tiene ocho bolas rojas, 5 amarilla y siete verdes. Si se extrae una bola al azar
calcular la probabiliidad de:
1 Sea roja. 2 Sea verde.
3 Sea amarilla. 4 No sea roja.
5 No sea amarilla.
5.- Una urna contiene tres bolas rojas y siete blancas. Se extraen dos bolas al azar. Escribir
el espacio muestral y hallar la probabilidad de los sucesos:
1 Con reemplazo. 2 Sin reemplazo.
6.- Se extrae una bola de una urna que contiene 4 bolas rojas, 5 blancas y 6 negras, ¿cuál
es la probabilidad de que la bola sea roja o blanca? ¿Cuál es la probabilidad de que no sea
blanca?
7.- En una clase hay 10 alumnas rubias, 20 morenas, cinco alumnos rubios y 10 morenos.
Un día asisten 45 alumnos, encontrar la probabilidad de que un alumno:
1 Sea hombre. 2 Sea mujer morena.
3 Sea hombre o mujer.
8.- Un dado está trucado, de forma que las probabilidades de obtener las distintas caras
son proporcionales a los números de estas. Hallar:
1 La probabilidad de obtener el 6 en un lanzamiento.
2 La probabilidad de conseguir un número impar en un lanzamiento.
9.- Se lanzan dos dados al aire y se anota la suma de los puntos obtenidos. Se pide:
1 La probabilidad de que salga el 7.
2 La probabilidad de que el número obtenido sea par.
3 La probabilidad de que el número obtenido sea múltiplo de tres.
10.- Se lanzan tres dados. Encontrar la probabilidad de que:
1 Salga 6 en todos. 2 Los puntos obtenidos sumen 7.
11.- Hallar la probabilidad de que al levantar unas fichas de dominó se obtenga un número
de puntos mayor que 9 o que sea múltiplo de 4.
12.- Busca la probabilidad de que al echar un dado al aire, salga:
1 Un número par. 2 Un múltiplo de tres.
3 Mayor que cuatro.
13.- Hallar la probabilidad de que al lanzar al aire dos monedas, salgan:
1 Dos caras. 2 Dos cruces.
3 Una cara y una cruz.
14.- En un sobre hay 20 papeletas, ocho llevan dibujado un coche las restantes son
blancas. Hallar la probabilidad de extraer al menos una papeleta con el dibujo de un coche:
1 Si se saca una papeleta. 2 Si se extraen dos papeletas.
3 Si se extraen tres papeletas.
15.- Los estudiantes A y B tienen respectivamente probabilidades 1/2 y 1/5 de suspender
un examen. La probabilidad de que suspendan el examen simultáneamente es de 1/10.
Determinar la probabilidad de que al menos uno de los dos estudiantes suspenda el
examen.
16.- Dos hermanos salen de caza. El primero mata un promedio de 2 piezas cada 5
disparos y el segundo una pieza cada 2 disparos. Si los dos disparan al mismo tiempo a
una misma pieza, ¿cuál es la probabilidad de que la maten?
17.- A class consists of 10 men and 20 women, half men and half of women have brown
eyes. Determine the probability that a randomly selected person is a man or having brown
eyes.

18.- La probabilidad de que un hombre viva 20 años es ¼ y la de que su mujer viva 20


años es 1/3. Se pide calcular la probabilidad:
1 De que ambos vivan 20 años.
2 De que el hombre viva 20 años y su mujer no.
3 De que ambos mueran antes de los 20 años.

ACTIVIDADES 2 RESUMEN DE PROBABILIDAD CONDICIONADA


1 sean A y B dos sucesos aleatorios con p(A) = 1/2, p(B) = 1/3, p(A B)=
1/4. Determinar:
1 2 3

4 5

2 Sean A y B dos sucesos aleatorios con p(A) = 1/3, p(B) = 1/4, p(A B) =
1/5. Determinar:

1 2 3

4 5 6

3 En un centro escolar los alumnos pueden optar por cursar como lengua
extranjera inglés o francés. En un determinado curso, el 90% de los alumnos estudia
inglés y el resto francés. El 30% de los que estudian inglés son chicos y de los que
estudian francés son chicos el 40%. El elegido un alumno al azar, ¿cuál es la
probabilidad de que sea chica?

4 De una baraja de 48 cartas se extrae simultáneamente dos de ellas.


Calcular la probabilidad de que:

1 Las dos sean copas. 2 Al menos una sea copas.

3 Una sea copa y la otra espada.

5 Ante un examen, un alumno sólo ha estudiado 15 de los 25 temas


correspondientes a la materia del mismo. Éste se realiza extrayendo al azar dos
temas y dejando que el alumno escoja uno de los dos para ser examinado del
mismo. Hallar la probabilidad de que el alumno pueda elegir en el examen uno de
los temas estudiados.

6 Una clase está formada por 10 chicos y 10 chicas; la mitad de las chicas
y la mitad de los chicos han elegido francés como asignatura optativa.
1 ¿Cuál es la probabilidad de que una persona elegida al azar sea chico o
estudie francés?

2¿Y la probabilidad de que sea chica y no estudie francés?

7 Un taller sabe que por término medio acuden: por la mañana tres automóviles con
problemas eléctricos, ocho con problemas mecánicos y tres con problemas de chapa, y por
la tarde dos con problemas eléctricos, tres con problemas mecánicos y uno con problemas
de chapa.

1 Hacer una tabla ordenando los datos anteriores.

2 Calcular el porcentaje de los que acuden por la tarde.

3 Calcular el porcentaje de los que acuden por problemas mecánicos.

4 Calcular la probabilidad de que un automóvil con problemas eléctricos


acuda por la mañana.

8 Una clase consta de seis niñas y 10 niños. Si se escoge un comité de tres al


azar, hallar la probabilidad de:

1 Seleccionar tres niños.

2 Seleccionar exactamente dos niños y una niña.

3 Seleccionar por lo menos un niño.

4 Seleccionar exactamente dos niñas y un niño.

9 Una caja contiene tres monedas. Una moneda es corriente, otra tiene dos caras
y la otra está cargada de modo que la probabilidad de obtener cara es de 1/3. Se
selecciona una moneda lanzar y se lanza al aire. Hallar la probabilidad de que salga
cara.

10 Una urna contiene 5 bolas rojas y 8 verdes. Se extrae una bola y se reemplaza
por dos del otro color. A continuación, se extrae una segunda bola. Se pide:

1 Probabilidad de que la segunda bola sea verde.

2 Probabilidad de que las dos bolas extraídas sean del mismo color.

11 En una clase en la que todos practican algún deporte, el 60% de los alumnos
juega al fútbol o al baloncesto y el 10% practica ambos deportes. Si además hay un
60% que no juega al fútbol, cuál será la probabilidad de que escogido al azar un
alumno de la clase:

1 Juegue sólo al fútbol. 2 Juegue sólo al baloncesto.

3 Practique uno solo de los deportes.

4 No juegue ni al fútbol ni al baloncesto.

12 En una ciudad, el 40% de la población tiene cabellos castaños, el 25% tiene ojos
castaños y el 15% tiene cabellos y ojos castaños. Se escoge una persona al azar:
1 Si tiene los cabellos castaños, ¿cuál es la probabilidad de que tenga
también ojos castaños?

2 Si tiene ojos castaños, ¿cuál es la probabilidad de que no tenga


cabellos castaños?

3 ¿Cuál es la probabilidad de que no tenga cabellos ni ojos castaños?

13 En un aula hay 100 alumnos, de los cuales: 40 son hombres, 30 usan gafas, y
15 son varones y usan gafas. Si seleccionamos al azar un alumno de dicho curso:

1 ¿Cuál es la probabilidad de que sea mujer y no use gafas?

2 Si sabemos que el alumno seleccionado no usa gafas, ¿qué


probabilidad hay de que sea hombre?

14 Disponemos de dos urnas: la urna A contiene 6 bolas rojas y 4 bolas blancas, la


urna B contiene 4 bolas rojas y 8 bolas blancas. Se lanza un dado, si aparece un
número menor que 3; nos vamos a la urna A; si el resultado es 3 ó más, nos vamos
a la urna B. A continuación extraemos una bola. Se pide:

1 Probabilidad de que la bola sea roja y de la urna B.

2 Probabilidad de que la bola sea blanca.

15 Un estudiante cuenta, para un examen con la ayuda de un despertador, el cual


consigue despertarlo en un 80% de los casos. Si oye el despertador, la probabilidad
de que realiza el examen es 0.9 y, en caso contrario, de 0.5.

1 Si va a realizar el examen, ¿cuál es la probabilidad de que haya oído


el despertador?

2 Si no realiza el examen, ¿cuál es la probabilidad de que no haya oído


el despertador?

16 En una estantería hay 60 novelas y 20 libros de poesía. Una persona A elige un


libro al azar de la estantería y se lo lleva. A continuación otra persona B elige otro
libro al azar.

1 ¿Cuál es la probabilidad de que el libro seleccionado por B sea una


novela?

2 Si se sabe que B eligió una novela, ¿cuál es la probabilidad de que el


libro seleccionado por A sea de poesía?

17 Se supone que 25 de cada 100 hombres y 600 de cada 1000 mujeres usan
gafas. Si el número de mujeres es cuatro veces superior al de hombres, se pide la
probabilidad de encontrarnos:

1 Con una persona sin gafas. 2 Con una mujer con gafas.

18 En una casa hay tres llaveros A, B y C; el primero con cinco llaves, el segundo
con siete y el tercero con ocho, de las que sólo una de cada llavero abre la puerta
del trastero. Se escoge al azar un llavero y, de él una llave para abrir el trastero. Se
pide:

1 ¿Cuál será la probabilidad de que se acierte con la llave?


2 ¿Cuál será la probabilidad de que el llavero escogido sea el tercero y
la llave no abra?

3 Y si la llave escogida es la correcta, ¿cuál será la probabilidad de que


pertenezca al primer llavero A?

PRINCIPIOS DE CONTEO

La teoría de las probabilidades requiere saber contar Los puntos


muestrales de un espacio muestral.
Si el número de posibles resultados de un experimento es pequeño, resulta
relativamente fácil identificar y contar todos los eventos posibles.

Ejemplo

En el experimento del lanzamiento de un dado, hay seis eventos resultantes


que son.

Si se da el caso de contar un gran número de posibles resultados, debemos


facilitar el conteo, para esto se examinarán las fórmulas respectivas de:

1) Principio de adición

2) Principio de la multiplicación

3) La variación (con y sin repetición)

4) La permutación (con y sin repetición)

5) La fórmula de la combinación (con y sin repetición)

PRINCIPIO DE ADICIÓN

Si una actividad A puede realizarse de n1 formas diferentes y otra actividad


B se realiza de n2 formas diferentes, y la operación consiste en hacer A ó B,
(exclusiva), la una o la otra, entonces podrá ocurrir de (n1 + n2) formas
distintas:

Si la actividad A tiene n1 formas distintas, la actividad B de n2 formas


distintas, entonces: A ó B (o exclusivo) se hace de (n1 +n2) formas distintas.
n
Luego generalizamos: A ó B= n1+n2+…+nn= ∑ ni
i=1

Ejemplo
Una persona quiere viajar de Santa Cruz a Sucre, usando dos líneas de
transporte aéreo o vía terrestre, a través de cuatro líneas de flotas ¿De
cuantas formas puede realizar el viaje de Santa cruz a Sucre?

Solución
La actividad “viaje” es exclusivo; es decir: Por vía aérea, implica no usar
vía terrestre, por vía terrestre, implica no usar la aérea

Utilizando el principio de conteo tenemos: Por vía aérea hay 2 formas, Por
vía terrestre hay 4 formas.
Se podrá ir por avión o por flota de (4+2)= 6 formas distintas

PRINCIPIO DE MULTIPLICACIÓN

O regla del producto de opciones. Si un evento puede ocurrir de n1


maneras y cuando esto ha ocurrido; otro evento puede ocurrir de n 2
maneras; otro evento puede ocurrir de n3 maneras y así sucesivamente.
Entonces, el número de maneras que todos puedan ocurrir es:
k
n1· n2 · n3 ·.....· n k
∏ ni
i =1
Ejemplo:

1. Si hay 3 candidatos para prefecto y 5 candidatos para alcalde, los dos


cargos de cuantas maneras pueden ocuparse?

Solución De 3 · 5 = 15 maneras

FACTORIAL

Definición.- Se llama factorial de un número entero positivo, al producto


sucesivo desde uno hasta el número considerado inclusive. El factorial de
un número n se representa con el símbolo n! y se define como:
[Link].5.6.7...n ; donde n ∈ Ν

n! = [Link].5.....n (Notación americana) n = [Link].5......n (notación


inglesa)

Se define por convenio que 0!=1. Si n  N, (N = conjunto de los números


naturales) implica que no existe factorial de números negativos ni números
racionales o irracionales y se considera que:

0!= 1
1!= 1
2!= 1.2 = 2
3!= 1.2.3 = 6
:
n!= [Link].5.....n

Propiedad fundamental: n! = n(n -1) (n -2) (n -3 ).....(n-k)!


Ilustración: 9!= [Link].5.4! Se multiplica en forma decreciente y
sucesiva desde 9 hasta 4, como se paro en 4, se coloca 4!; 5!=5.4.3! Se
multiplica en forma decreciente y sucesiva desde 5 hasta 3, como se paro
en 3, se coloca 3! Etc.
De aquí se derivan otras propiedades, como ser:
n! = n(n - 1)! (n + 1)! = (n + 1)n!

a! = b!  =a=b

Ejemplos calcular:

1.- 5! 5! = [Link].1 = 120 5! = 1 2 3 4 5 = 120 5! = 5( 5 - 1)! = 5 4!


= 120

10!
2.- 6! Aplicamos la propiedad fundamental:
10! 10. 9 .8. 7 . 6 !
= =10.9 . 8 .7=5040
6! 6!
3.- Hallar x tal que: (2x – 3 )! = ( x + 1 )!
Por propiedad a! = b!  a=b
(2x – 3 ) = x + 1 )
2x – x = 1 + 3
x=4

NÚMEROS COMBINATORIOS.
Sean dos números enteros positivos tal que r < n el número combinatorio
n n n!
(¿ )r )¿ (¿ )r )= ¿
r !(n−r )!
se escribe ¿ y se lee n sobre r; se define: ¿
7 7 7! 7 . 6 .5 . 4 !
(¿ )3 )=¿ (¿ )3 )= = =35 ¿
3 !(7−3)! 1. 2. 3 . 4 !
Ejemplo: calcular: ¿ ¿

Antes de ver las variaciones y combinaciones es necesario observar el


siguiente ejemplo:
Ejemplo
Dado el conjunto A: A= { a b c d }
Encontrar todas las posibles ternas de A

Solución
Debemos escribir todas las muestras posibles de
3 elementos en orden, de los 4 elementos que tiene
el conjunto A

a b c a b d a c d b c d
a c b a d b a d c b d c
b a c b a d c a d c b d
b c a b d a c d a c d b
c a b d a b d a c d c d
c b a d b a d c a d d c

Si observamos hay 24 muestras ordenadas de A

Si el orden no nos interesa entonces tenemos:

a b c a b d a c d b c d

Si observamos hay 4 muestras no ordenadas de A

VARIACIONES

Una variación de un conjunto de n objetos tomados de k en K. es decir, es


una selección ordenada de k objetos tomados entre los n (no todos a la
vez: r < n).

Conjunto
Selección ordenada de r en r
de n
objetos

NOTA. Para que se trate de una variación, el orden de los objetos para
cada posible resultado es diferente.

Para hallar las variaciones, tenemos ahora una fila de r posiciones, nos
detenemos tras colocar r elementos. Es decir: n V r =n( n−1 ). ..(n−(r−1)) de
aquí sale la fórmula:
n n!
n V r =V r =
( n−r )!
Ejemplo

1.- Hay diez candidatos de una organización social y se desea presentar


denominaciones de presidente, secretario y tesorero, hallar el número de
los diferentes arreglos a estos cargos.

Solución
En este caso los cargos a ocupar están regidos por una prioridad (orden)
que es presidente, secretario y tesorero. Luego se trata de una variación o
permutación donde n > r:

n!
r=3 n = 10 (n V r = n P r)
nVr=
(n−r)!
10 ! 10! 10.9 .8 .7 !
= = =10 .9.8=720
10V3=
(10−3 )! 7 ! 7!

Luego hay 720 maneras para organizar la mesa directiva.


VARIACIÓN CON REPETICIÓN

Si en una variación se permite la repetición de sus elementos, la fórmula


de permutación queda de la siguiente manera:

nVRr = nr

EJEMPLO

Cuántos números de
a) Cuatro cifras significativas podemos escribir con los dígitos 1, 2, 3, 4,
5, 6. Si se permite la repetición de cifras.

b) Tres cifras significativas podemos escribir con los seis dígitos del
inciso a).

Solución:

a) Si se permiten las repeticiones, significa que cada una de las cuatro


posiciones tiene las mismas posibilidades.

El conjunto tiene n= 6 elementos, k= 4 cifras

12345 Seleccionamos de 4 en
6

nVRr = nr 6VR4 = 64 = 1296

Se pueden escribir 1296 números de 4 cifras con los 6 dígitos: ”1, 2,


3, 4, 5, 6”

b) Ahora del conjunto de seis elementos debemos extraer 3 elementos.

12345 Seleccionamos de 3 en 3
6
VRr = nr
n 6 VR3 = 63 = 216

Se pueden escribir 216 números de 3 cifras con los 6 dígitos: ”1, 2, 3,


4, 5, 6”

PERMUTACIONES (DE ELEMENTOS DISTINTOS)

Se llama permutación de n elementos distintos a las diferentes formas


en que se pueden ordenar en fila. “Se extraen r elementos de n, pero n=r”

Cuando digamos simplemente permutaciones, sin más, nos referimos


siempre a permutaciones de elementos distintos.

Una permutación es una variación cuando n = r, y es el número de


permutaciones tomados todos a la vez; es decir de n objetos tomamos de n
en n (tomar todos a la vez, o sea n = r).

En la formula de variación si n = r, obtendremos la fórmula de


permutación:
n!
n V r=
(n−r)!

n! n!
= =n!
Reemplazamos: n=r y obtenemos nVn =
(n−n)! 0 !

Hacemos nVn = Pn = Pn
n Se representa: P n = n!

Ejemplo

1.- Si en una fila hay 3 personas A, B, C ¿De cuantas maneras podremos


colocarlas y cuáles será esa ordenación?

Solución
Al conjunto tiene 3 elementos, los tomamos de 3 en 3
(todos a la vez, luego esto es una permutación.

Luego hay Pn= n! P3= 3! = 1· 2· 3= 6 maneras.

Esa ordenación es: ABC, ACB, BAC, BCA, CAB, CBA Seis
en total y cada uno está en diferente orden

2.- Tres miembros de una organización social se ofrecieron servir de


oficiales asumiendo las posiciones de presidente, secretario y tesorero; cuál
es el número de posiciones que pueden asumir los tres personajes?
Solución
En este caso los cargos a ocupar están regidos por una prioridad. Luego el
problema se trata de una permutación: donde n = r, n = 3 significa que son
los tres miembros, r = 3 significa las tres posiciones que van a ocupar los 3
miembros
Datos:

n=r=3 P n = n! P3 = 3! = 6

PERMUTACIONES CON ELEMENTOS INDISTINGUIBLES (“CON


REPETICIÓN”)

En la anterior permutación hemos supuesto que los n elementos dados


eran todos diferentes. Así con las letras de la palabra PIO son posibles 6
permutaciones que son: PIO, POI, IOP, IPO, OIP, OPI, todas distintas entre
sí.

Pero qué ocurre si varios de los elementos dados son iguales. Veamos un
ejemplo para intuir la respuesta general.

Con las letras de ORO podríamos formar también 6 permutaciones si


distinguiéramos las dos letras O poniendo ORO o sea :

ORO, OOR, ROO, ROO, OOR, ORO

Pero en realidad las dos letras O de la palabra ORO son iguales,


indistinguibles entre sí.
Por esa razón, solo hay 3 permutaciones verdaderamente distintas (o sea,
distinguibles) entre sí:
 ORO que engloba a dos de las de antes ORO y ORO, ahora
indistinguibles.
 ROO que engloba a dos de las de antes ROO y ROO, ahora
indistinguibles.
 OOR que engloba a dos de las de antes OOR y OOR , ahora
indistinguibles.

En general, consideremos n elementos de los cuales k son iguales entre sí,


otros m son iguales entre sí, otro r son iguales entre sí, etc.

A este tipo de permutaciones se le llama también:

PERMUTACIÓN CON REPETICIÓN.- Si en una permutación se permite la


repetición, la fórmula de permutación queda de la siguiente manera:
n!
nPk m r…s= k! m!r !...s!
k, m, r, ..., s son las repeticiones permitidas de los distintos
elementos.

Ejemplo

Cuántas palabras distintas se pueden formar con la palabra: FALLAS

Solución: Obtenemos las letras repetidas que son:

F=1 A=2 L=2 S=1


6!
6P1 2 2 1 =
1 !2 !2!1 ! = 180

PERMUTACIONES CIRCULARES

Si en una reunión se sientan cinco personas alrededor de una mesa. ¿De


cuántas maneras distintas podrían ubicarse?
Para este tipo de problemas siempre debemos tomar uno de los lugares
como fijo, por eso sólo podremos realizar las permutaciones en un sentido.
En consecuencia, el número de permutaciones es (5-1)! 4!= 24
En general el número de permutaciones circulares es:
PCn= (n – 1)!

NOTA

Se llama permutación a una biyección de un conjunto A en sí mismo.


Biyección significa una función biyectiva en un mismo conjunto; es decir,
Sea uan función definida f: A A, f es es biyeciva si y sólo si es inyectiva y
exhaustiva. Si tenemos una permutación en un conjunto finito A, entonces,
la sucesión de sus elementos es sólo un reordenamiento de los elementos de
A.

PERMUTACIONES CON LUGARES FIJOS

Si tenemos un conjunto de n elementos donde r elementos tienen lugares


fijos, el número de permutaciones que se pueden formar con los demás
elementos es:

Pn,r= (n – r)!

Ejemplo
Sea el conjunto A={a, b, c, d, e} se establece que , a deben ocupar el primer
y b el segundo lugar en forma fija. Con estas condiciones, cuantas formas
de agrupar los elementos hay.

Solución

Tendremos dos lugares fijos:

a b c d e

La Permutación es con lugares fijos: Pn,r= (n – r)!= (5 – 2)!= 3!=6

COMBINACIONES

Con frecuencia el orden en una composición no es importante, si no nos


interesa el orden en la disposición de los elementos entonces, se trata de
una COMBINACIÓN.

Se llama combinación de n elementos distintos tomados de r en r a las


distintas selecciones de r elementos que se pueden efectuar de entre esos
n. Su número se denota con el número combinatorio
n
n C r =( ¿ )r ) ¿
¿
Otra definición. Una combinación de n objetos tomados de r en r es una
selección SIN ORDENAR de r objetos entre los n objetos que hay. La
fórmula que permite hallar la cantidad de esta selección es:

n!
n Cr =
r !( n−r )!
nVr nVr n!
n Cr = = =
Pr r! r !( n−r )!

Ejemplo
l presidente de una empresa tiene que seleccionar 4 de sus 7
vicepresidentes para que estos se ocupen de los problemas laborales que
surjan en la institución. ¿Hallar el número de las composiciones diferentes
de vicepresidentes que puede contemplar el presidente?
7!
7 C 4= =35
Solución 4 !( 7−4 )! Composiciones

COMBINACIONES CON REPETICION

Dado un conjunto de n elementos, se llama permutación con repetición


tomados de r en r a todas las agrupaciones que se puedan formar tomando
r elementos iguales o distintos, considerando que dos agrupaciones son
distintas cuando difieren en algún elemento.
( n+r−1 ) !
nCRr=
r ! ( n−1 ) !

Ejemplo
Hallar las combinaciones de dos elementos con repetición que se pueden
formar con el conjunto A= {a, b, c, d}

Solución
( 4+2−1 ) ! 5!
4 CR 2= = =10
2 ! ( 4−1 ) ! 2 ! ( 5−2 ) !

Las combinaciones son: aa, ab, ac, ad, bb, bc, bd, cc, cd, dd

1. DESARROLLO
UNIDAD III VARIABLES ALEATORIAS

VARIABLE ALEATORIA

Definición

Una variable aleatoria (va) es una variable generalmente representada por


“x” que tiene un solo valor numérico determinado por el azar para cada
resultado de un experimento aleatorio.
Interpretación.- Una variable aleatoria es una variable cuyo valor es el
resultado de un evento aleatorio. Por ejemplo el experimento de lanzar una
moneda al aire y anotar el resultado. El resultado de un solo lanzamiento:
escudo o sello (valor de la moneda), es una observación. En un sentido más
general el resultado del lanzamiento es la variable aleatoria. El valor de la
variable aleatoria es escudo o sello y es resultado del azar. Las
distribuciones de probabilidad se basan en los valores de las variables
aleatorias.

Definición matemática

Dado un experimento aleatorio de espacio muestral S. Una función X que


asigna a cada uno de los elementos s del S, un número real X(s), se llama
variable aleatoria. A las variables aleatorias se les llama también variables
estocásticas o variables del azar o función variable aleatoria.

Interpretación.- Se llama variable aleatoria, a toda función que asocia un


numero real a cada punto muestral (elemento) de un espacio muestral. Es
decir, una variable aleatoria X es una función real valorada y definida en un
espacio muestral. Es decir: X: S  R (se lee la función X se define del S en
los R)

S R

X x
s

Dominio= DX Rango= RX

DX={s/s  S) RX={x/xR; x= X(s), sS}

X= {(s, x); x  R, s  S  X(s) = x}

VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

Variable Aleatoria Discreta

Es aquella variable que solo puede tomar valores numerables o un numero


originado de conteo. En términos matemáticos: Si el rango de X es un
conjunto contable se dice que la v. a. X es discreta; es decir, x es el valor de
la va X que puede tomar valores como: 0, 1, 2, 3, …..

Ejemplo

X1= Número de hijos de las familias de la UV_100


X2= Número de mascotas de las familias de la UV_100
X3= Número de habitaciones de las casas de la UV_100
Ejemplo

Se da el experimento de lanzar una moneda dos veces, y el evento de


obtener sellos. Ilustrar la función variable aleatoria:

Solución

Nota. Nuestra moneda tiene dos estados en un lado es escudo y en el otro


lado es el sello del valor de la moneda; por esta razón diremos el lado
escudo y el lado sello.

El espacio muestral es: S= {ss, es, se, ee}


S X R
S R
ss 2
ss X(s1)= 2 sellos cs 1
se X(s2)= 1 sello sc
es Notación sagital ee 0
X(s3)= 1 sello
ee
X(s4)= 0 sello

Los valores de x son x= 0, 1, 1, 2, luego X es una variable aleatoria discreta


porque se cuentan: 2 estados con sello, 1 estado sello en el primer
lanzamiento, otra vez 1 estado sello en el segundo lanzamiento, 0 estado
sello.

Variables Aleatorias Continuas

Es aquella variable que toma valores numéricos originados de mediciones


en una escala continua. Es decir si el rango RX de una va X es de valores
reales (otros autores dicen si es un intervalo sobre la recta real), entonces se
llama variable aleatoria continua.

Ejemplo

X1= Estatura de los jugadores de básquet de Blooming


X2= Ingresos por familia de la UV_100
X3= tiempo de llegar al centro de trabajo
Ejemplo
El experimento consiste en obtener la vida útil de una bombilla tomada al
azar de un lote de producción.
Solución
Si definimos el tiempo de duración en minutos de un foco, el rango será un
tiempo igual o mayor que cero y lo expresamos xR / x > O, luego X es una
variable aleatoria continua.
FUNCION DE PROBABILIDAD
Definición Si x es el valor de va X discreta, una función real valorada f
definida en el rango de la va X, será una función de cuantía o una función
de probabilidad, si:
1) f(x) > 0, x RX= Df
2) ∑ f ( x )=1
∀ x ∈D f
Donde f(x) representa la probabilidad de la función va X que toma el valor x.
Es decir: F(x)= P(X(s)= x) y 0 < f(x) < 1
Probabilidad de un evento
Sea xi i=1, n todos los valores de una va discreta X, llamaremos evento A, a
cualquier subconjunto de valores del conjunto Xi. La probabilidad de un
evento A se define: p ( A )= ∑ f ( x )
∀x ∈ A
Ejemplo
Hallar la función de probabilidad si el experimento es: lanzar una moneda
dos veces, y el evento es obtener a lo sumo un sello. Ilustrar la función de
probabilidad o de cuantía:
S X RX= Df R
f

ss 2 1/4
se 1 2/4
es 1/4
ee 0

Interpretación:
Estamos hallando el resultado que se obtiene del experimento aleatorio:
0 implica que no se obtiene ningún estado sello, f(0)= P(x=0)= ¼
1 implica que se obtiene un sello en el primer lanzamiento (se) ¼ y un sello
en el segundo lanzamiento (es) ¼ total 2/4= ½, f(1)= P(x=1)= ½
2 implica la probabilidad que aparezcan dos sellos ¼

Esto se puede representar en una tabla:

ee es es ee
xi 1 1 1 0
f(x)=P(x) ¼ 2/4= ½ ¼

La función de probabilidad se puede expresar como un par ordenado:

f= {(0, ¼), (1, ½)(2, ¼ ) }

La función de probabilidad se puede expresar en una tabla:


x 0 1 2 Total
f(x) ¼ ½ ¼ 1

En el ejemplo f es una función de probabilidad porque está definida en el


rango de la va X y los valores de f satisfacen:

1) f(x) > 0, x RX= Df  x= 0, 1, 2


2
2) ∑
∀ x ∈D f
f ( x )=1  ∑ f ( x )=f ( 0 )+ f ( 1 ) +f ( 2 )= 14 + ¿ 12 + 14 =1 ¿
x=0

Sea A= {obtener a lo sumo un sello}= {0,1}


1
1 1 3
P(A)=∑ f ( x )=f ( 0 )+ f ( 1 )= +¿ = ¿
x=0 4 2 4

Grafica de la función de probabilidad

FUNCIÓN DE DISTRIBUCIÓN ACUMULADA DE LA va DISCRETA

Definición

La Función de distribución acumulada (f. d. a.) de probabilidades de la va


discreta X, cuya función de probabilidad es f(x) se define:
F ( x )= p [ X ≤ x ] =∑ p [ X =k ] =∑ f ( k ) , para−∞ < x <∞
k≤ x k≤ x

Ejemplo hallar la gráfica de f. d. acum. del ejemplo anterior:

x f(x) F(x) acum.

0 1/4 1/4

1 1/2 3/4

2 1/4 1

  1  

La gráfica de la función acumulada es:

VARIABLE ALEATORIA CONTINUA: FUNCIÓN DE DENSIDAD Y FUNCIÓN


DE DISTRIBUCIÓN ACUMULADA

Definición

Se dice que la función f(x) es una función de densidad (ley i distribución) de


probabilidad de la va continua X si satisface las siguientes condiciones:

1) f(x) > 0  xR Esta condición indica que f(x) no tiene puntos debajo
del eje x

2) ∫ f ( x ) dx=1
−∞

3) p ( A )= p [ x ∈ A ] =∫ f ( x ) dx A R
A

Donde A es un intervalo
definida en los números
reales, la última condición
significa que la probabilidad
es equivalente a Área. En la
gráfica adjunta A es el
Intervalo dado por: a  x 
b. La Probabilidad de dicho
intervalo p(A) es el área
sombreada.

El Área total debajo de la


curva debe ser l.

Ejemplo

Sea f(x) un función de densidad definida por cx2 en el rango R X= [0,2] de


una variable aleatoria X e igual a cero fuera del rango. Esto es, la función de
densidad probabilística está definida en todo número real por:

cx2, si x [0, 2]

La función es f(x)=

0, si x  [0, 2]

a) Determinar el valor de c
b) Calcular P(0 > X  1)

Solución

a) Determinar el valor de c, el área debajo la curva debe ser igual a 1,


luego
∞ 2 2
x3 8
−∞ 0
2
[ ]
I = ∫ f ( x ) dx=∫ c x dx=c
3 0
=c
3
Luego c= 3/8 , ahora tendremos:

3x2/8, si x [0, 2]

La función es f(x)=

0, si x  [0, 2]

La gráfica es:
b) Calcular P(0 > X  1)
1 2 3 1
3x x 1
I =∫
0
8
dx = [ ]
8 0 8
=

VALOR ESPERADO

Al efectuarse cualquier Experimento aleatorio, es indudable que ciertos


resultados son los esperados, a un valor esperado se lo llama Esperanza
matemática.

Definición La Esperanza matemática de una Variable aleatoria X, se define


como:
N
E ( X ) =∑ x i f ( x i) Cuando X es la va discreta, f(x) es su función de
i=1

probabilidad

E ( X ) =∫ xf ( x ) dx Cuando X es la va continua, f(x) es su función de densidad
−∞

de probabilidad

A la Esperanza matemática se la llama también Media o Valor esperado. "A


la Esperanza matemática de una variable discreta, se la interpreta como la
Media ponderada de sus posibles valores. Es decir cada valor de X se
multiplica por-su respectiva Probabilidad.

Ejemplo

Si se lanza un dado, la Variable aleatoria es el número que se pueda


obtener, asociando con su Probabilidad se tiene:

Solución
x f(x)=p(X=x)

1 1/6

2 1/6

3 1/6

4 1/6

5 1/6

6 1/6

Luego la esperanza matemática es:


N 6
1 1 1 1 1 1 7
E ( X ) =∑ x i f ( x i)=∑ x i f ( x i )=1 ∙ +2 ∙ +3 ∙ +4 ∙ +5 ∙ +6 ∙ =
i=1 i=1 6 6 6 6 6 6 2

La esperanza matemática de este experimento es: 7/2

Interpretación

Se puede interpretar este resultado como el promedio que debería obtenerse


luego de lanzar infinitas veces un dado. (Es decir sumando todos los
números que salgan y dividiendo entre el número de lanzamientos). Sin
embargo en la práctica solo será posible lanzar el dado un número finito de
veces el promedio deberá acercarse a 7/2.

PROPIEDADES DE LA ESPERANZA MATEMÁTICA

E(c)= c Esperanza de una constante

E(X +c)= E(x)+c Esperanza de variable más constante c

EcX)= c E(X) Esperanza de constante c por variable.

VARIANZA Y DESVIACIÓN TÍPICA.

LA VARIANZA

Si X es una Variable aleatoria discreta con Distribución de probabilidad f(x)


La

Varianza de X se denota por 2, V(X), Var(X); se calcula:


N
2=V(X)= E((X – E(X))2= ∑ ¿¿
i=1

 =V(X)= E((X – E(X)) = ∫ ¿ ¿


2 2

−∞

Si 2 es la Varianza, entonces “  ” es la Desviación estándar de la Variable


X

Ejemplo La Variable aleatoria es obtener un número al lanzar un dado.


calcular su Varianza:

Solución Lo mejor es realizar una tabla:

Columna de la esperanza matemática

x f(x)=p(X=x) x f(x) (x - E(X))2 (x- E(X))2 f(x)

1 1/6 1/6 25/4 25/24

2 1/6 1/3 9/4 9/24

3 1/6 1/2 1/4 1/24

4 1/6 2/3 1/4 1/24

5 1/6 5/6 9/4 9/24

6 1/6 6/6 25/4 25/24

Total 1 7/2   70/24

Se observa que la Esperanza actúa como una Media, para el


correspondiente cálculo. Si la Varianza es 2 = 70/24 = 2,9167, la
Desviación estándar es  = 1,7078

PROPIEDADES DE LA VARIANZA

V(X)= E(X2) – (E (X))2 Regla práctica para calcular la Varianza


V(X+ c) = v(X) + c Varianza de variable más constante c
V(c X)= c V(X) Varianza de constante c por variable.

Ejemplo

Calcular la Varianza de la tabla anterior, mediante la Propiedad:

V(X)= E(X2) – (E (X))2

Solución
V(X)= E(X2) – (E (X))2 =
V(X)= x2 f(x) – (xf(x))2 =
x f(x) x f(x) x2 x2 f(x)

1 1/6 1/6 1 1/6

2 1/6 1/3 4 2/3

3 1/6 1/2 9 1 1/2

4 1/6 2/3 16 2 2/3

5 1/6 5/6 25 4 1/6

6 1/6 1 36 6

Total 3 1/2 15 1/6

Luego

V(X)= E(X2) – (E (X))2 =


V(X)= x2 f(x) – (xf(x))2 =
V(X)= 91/6 – (7/2)2 = 35/12= 2,9167, la varianza coincide.

DESIGUALDAD DE CHEBYSHEV

Si conocemos la distribución de probabilidad de una va X (La función de


densidad (en continua) o la función de probabilidad (en discreta) se ha visto
que podemos determinar la varianza 2 y la esperanza , si existen. Pero lo
recíproco no es cierto. Es decir, conociendo  y 2 no podemos determinar
la distribución de probabilidad X. Sin embargo se puede dar una cuota
inferior o superior para la probabilidad del tipo p(/X – / > k); este
resultado se conoce como desigualdad de chebyshev.

Teorema

Si la va X tiene media () y varianza (2) finita, entonces para cualquier k >
1
1 se cumple: p(X –  > k) < 2 La cuál indica que la probabilidad que X
k
tome algún valor fuera del intervalo: ( - k,  + k) es a lo más 1/k2

Consecuencias

σ2
a) Si  = k, se tiene p(X –  > ) <

b) Puesto que (X –  > k) y (X –  < k) son eventos
complementarios, entonces:
1
p(X –  < k) > 1−
k2

Indica que la probabilidad de que X tome valores dentro del intervalo abierto

1
( - k,  + k) es por lo menos 1−
k2

Ejemplo

Sea X una va con media 33 y varianza 16, hallar una cota inferior para:

p [23 < X < 43]

Solución

Aplicamos ley de desigualdad para tener X – , con = 33

p [23 < X < 43]= p [23– 33 < X – 33 < 43– 33]

p [23 < X < 43]= p [ – 10 < X – 33 < 10 ] propiedad de inecuaciones

=p[  X –   < 10 ]

Tenemos: p[  X –   < k]

Para obtener: k= 10, =4 entonces k= 10/4= 5/2

1
Luego p [23 < X < 43]= p[X –  < k ] > 1−
k2

1
1−
= p[X –  < (5/2)(4) ] > 5 2
( )
2

21
Por lo tanto: p [23 < X < 43] >
25

Propiedades básicas para resolver inecuaciones


1. a = 0  a = 0

2. a = b  [ b  0  (a = b v a = - b) ]
3. a = b  a = b v a = - b

4. Si b > 0 Entonces:
4.1 a < b  -b < a < b
4.2 a  b  -b  a  b
5.
1.1 a > b  a < b v a < - b
1.2 a  b  ab v a-b

6. Si b > 0, entonces: a2 < b  - √b <a< √b


7. Si b > 0, entonces: a2 > b  a > √b v a>- √b
8.
8.1 a = a2
8.2 a2 = a 2 ; a + b2 = (a + b)2 = (a + b)2

OTRAS MEDIDAS DE TENDENCIA CENTRAL

Moda (Mo= xmo)

Definición.- Se llama moda de una va discreta X a su valor más probable.

Se llama moda de una va continua X a su valor con función de densidad


máxima. E decir, al valor x0 de lava X es una moda si:

p(x0) > p(x),  xRX, si X es discreta

f(x0) > f(x),  xRX, si X es continua

Geométricamente la moda es la abscisa cuyo punto de la curva (polígono) de


distribución de probabilidad con máxima ordenada.

Mediana (Me= xme)

Definición.- La mediana de una va X es un número x0 talque:

f(x0) = p(X < x0) > 1/2  p(X > x0) > ½ es equivalente a:

p(X < x0) = p(X > x0) = ½, para X continua

Es decir, que la mediana tienen la propiedad de que la va tiene la misma


probabilidad de estar a cualquiera de los dos lados de este.

Geométricamente es la ordenada trazada por el punto abscisa x= Me, (x=


xme) que divide en dos el área acotada por la curva (polígono) de distribución
de probabilidad.

Ejemplo

1 Hallar al moda de la función de densidad de la va X:

x3
x− , 0≤ x ≤ 2
4
f(x)= , 0 en otros casos

Solución

Para hallar la moda debemos hallar el máximo de la función f(x); es


decir, debemos hallar la primera y segunda derivada de f(x)
La primera derivada: f’(x)=1 – ¾ x2

La segunda derivada: f’’(x)= – 3/2 x

2
Luego de f’(x)= 1 – ¾ x2= 0 obtenemos x=±
√3
2
Entre las dos raíces de ± elegimos solo la que está comprendida en
√3
2
el intervalo cerrado [0, 2]. Es decir: x=
√3
'' 2 −3 2
En la segunda derivada f’’(x)= – 3/2 x tenemos: f ( )= ∙ =−√ 3
√3 2 √3
<0

2 2
Entonces en x= la función f(x) presenta su máximo, o sea x mo=
√3 √3
Ejemplo Hallar al mediana de la va X cuya función de densidad es:

2/9 x, x  [0, 3]

f(x)= 0 , en otro caso

Solución Por la definición de mediana tenemos: p(X < x0) = p(X > x0) = ½,
x0
2
para X continua P [ X ≤ x 0 ] =∫ x dx=¿ ¿
0
9

X O2 1 3
Luego de = obtenemos x 0=±
9 2 √2

De estas dos raíces ±


√3 elegimos la que está comprendida en el
2
3
intervalo cerrado [0, 3]. Luego x 0=±
√2
3
x me =
√2
Ejemplo Hallar la moda de la va X, donde la tabla de distribución de
probabilidades es:

x -3 -1 1 3

p(x) 1/5 1/8 1/8 1/5

Solución

La moda es p(x) mayor, cuando x= – 3 y x= 3, entonces x 0= 3 Luego


tenemos dos modas xmo1= – 3 y xmo2= 3

Ejemplo

Hallar la mediana de la va X, donde la tabla de distribución de


probabilidades es:

x p(x)

-2 1/3

-1 1/6
Mediana
1 1/6

2 1/3

Solución

Para halar la mediana recurrimos a la definición:

f(x0) = p(X < x0) =1/2

La mediana está entre (- 1, 1), podemos asumir que la mediana es cero, xme=
0

UNIDAD IV DISTRIBUCIONES PROBABILISTICAS


DISTRIBUCIONES DE PROBABILIDAD DISCRETAS:
BINOMIAL, HIPERGEOMÉTRICA Y DE POISSON

DISTRIBUCIONES DE PROBABILIDAD
Cuando se asignan valores de probabilidad a todos los valores posibles de
una variable aleatoria X, ya sea por inclusión en una lista o por una
función matemática, el resultado es una distribución de probabilidad.

Variable aleatoria es aquella cuyo valor se determina por procesos


accidentales que no están bajo el control del observador. La suma de las
probabilidades de todos los resultados posibles debe ser igual a 1. En el
contexto de las distribuciones de probabilidad, los valores individuales de
probabilidad pueden designarse por el símbolo f(x), que reconoce la
inclusión de una función matemática, por P(x = X), que admite que la
variable aleatoria puede tener varios valores, o simplemente por P(X).

Para una variable aleatoria discreta, todos los valores posibles de la


variable aleatoria pueden incluirse en una tabla con las probabilidades
correspondientes. Los modelos específicos de probabilidad discreta en este
capítulo son las distribuciones de probabilidad binomial, hipergeométrica y
de Poisson.

Para una variable aleatoria continua, no se pueden enumerar todos los


valores fraccionales posibles y de esta manera las probabilidades
determinadas por una función matemática son representadas por una
función de densidad, o curva de probabilidad.

EJEMPLO
En la tabla 6.1 se identifica el número de camionetas que fueron
solicitadas en una agencia de alquiler de automóviles durante un período
de 50 días. Las frecuencias observadas se convirtieron en probabilidades
para este período de 50 días, en la última columna de la tabla. De esta
manera, podemos observar que la probabilidad de que se soliciten siete
camionetas exactamente en un día aleatoriamente escogido en este período
es 0,20y la probabilidad de que se soliciten seis o más es 0,56.
EL VALOR ESPERADO y LA VARIANZA DE VARIABLES
ALEATORIAS DISCRETAS

Sólo para recopilaciones de datos de muestra y de población, es a menudo


útil descubrir una distribución de probabilidad en términos de su media y'
de su varianza.
La media se llama valor esperado de la distribución de probabilidad. El
valor esperado de una variable aleatoria discreta se designa por E(X); es el
promedio ponderado de todos los valores posibles con las probabilidades
respectivas empleadas como ponderaciones. Puesto que la suma de las
ponderaciones (probabilidades) es siempre igual a 1, la fórmula (3.5) para
la media ponderada puede simplificarse. El valor esperado de una
distribución de probabilidad discreta es:
E(X) = X P(X) (6.1)

EJEMPLO Basada en la información de la tabla 6.1, la tabla 6.2 presenta


el cálculo del valor esperado para la distribución de probabilidad. El valor
esperado es 5,66 camionetas. Obsérvese que el valor esperado para la
información discreta puede ser un valor fraccionario pues representa el
valor promedio a largo plazo, y no el valor específico para cualquier
observación dada.

La varianza de una variable aleatoria X se designa Var (X); se calcula con


respecto a E (X) como la media de la distribución de probabilidad. La forma
general de desviación de la fórmula para la varianza de una distribución de
probabilidad discreta es

Var(X) =  [X - E(X) ]2 p(X) (6.2)

La forma para calcular la varianza de una distribución de probabilidad


discreta, que no requiere la determinación de desviaciones de la media, es
Var(X) = X2p{X) – E [ XP(X) 2 = E(X2) – [E(X)]2 (6.3)
EJEMPLO La hoja de trabajo para el cálculo de la varianza para la
distribución de probabilidad de la demanda respecto del alquiler de
camionetas se presenta en la tabla 6.3, empleando la versión de cálculo de
la fórmula. Como se indica a continuación, la varianza tiene un valor de
1,74.

Var(X) = E(X2) – [E(X)]2 = 33,78 – (5,66)2 = 33.78 – 32,04= 1,74

LA DISTRIBUCION BINOMIAL
La distribución binomial es una distribución de probabilidad discreta,
aplicable cada vez que se suponga que un proceso de muestreo conforma
un proceso de Bernoulli. Proceso de Bernoulli es un proceso de muestreo en
el cual:

 Hay dos resultados posibles mutuamente excluyentes en cada ensayo


u observación.
 Para mayor conveniencia estos se denominan éxito y fracaso.
 La serie de ensayos u observaciones constituye eventos
independientes.
 La probabilidad de éxito, designada por p, permanece constante de
ensayo a ensayo. Es decir, el proceso es estacionario. .

La distribución binomial se puede emplear para determinar la probabilidad


de obtener un número designado de éxitos en un proceso de Bernoulli.

Se requieren tres valores: el número designado de éxitos (X); el número de


ensayos y observaciones (n); y la probabilidad de éxito en cada ensayo (p).
La fórmula para determinar la probabilidad de un número designado de
éxitos (X) en una distribución binomial es:
P(X) = nCx px qn –x (6.4)
Características de la Distribución Binomial. Sus características son:
 Es un experimento aleatorio que consiste en efectuar n ensayos
independientes y repetitivos.
 La probabilidad de éxito p es la probabilidad de conseguir un éxito en un ensayo, esta
probabilidad se mantiene constante en cada uno de los ensayos.
 Es un experimento aleatorio que selecciona una muestra aleatoria de tamaño n, una a
una , con reposición, de una población particionada en dos clases: Una de Éxitos y
otra de Fracasos.

E F
El experimento binomial genera un
N = Población espacio muestral como:

n E= Éxito F= Fracaso

Con x n S = {FFF,EFF,EEF,...EEE}
Reposición
0E 1E 2E ....nE

La v. a. X toma valores como:


x Es el valor de la v. a. X, n = Tamaño muestra
x =0,1,2,3,...,n
x = Representa el número de éxitos N = Tamaño población
La probabilidad de obtener x éxitos en
E = Clase de éxitos F = Clase de Fracasos un experimento binómico es:

E(x) = n p (Esperanza) X ~ b(x, n, p) P(x) = nCx px qn-x


V(x) = n p q (Varianza )

EJEMPLO
La probabilidad de que un presunto cliente escogido aleatoriamente haga
una compra es 0,20. Si un vendedor visita a seis presuntos clientes, la
probabilidad de que haga exactamente cuatro ventas se determina' de la
siguiente manera:
Datos

P= 0,20
n=6
x= 4 P(X) = nCx px qn –x = P(X = 4) = 6C4 (0,20)4(0,80)2 = 0.01536

Generalmente existe un interés en la probabilidad acumulada de "X o más"


éxitos o "X o menos" éxitos en n ensayos. En tal caso, debe determinarse la
probabilidad de cada resultado incluido dentro del intervalo designado y
luego se suman estas probabilidades.

EJEMPLO
En el ejemplo anterior, la probabilidad que el vendedor haga cuatro o más
ventas se determina de la siguiente manera:
P(X > 4) = P(X =4) + P(X = 5) + P(X = 6)
P(X > 4) = 0,01536 +0,001536 + 0,000064 = 0,016960 = 0,017

Donde P(X = 4) = 0,01536 (del ejemplo anterior)


P(X = 5) = 6C5 (0,20)5 (0,80)1 = 0,001536
P(X = 6) = 6C6 (O,20)8(O,80)0 = 0,000064

Debido a que el uso de la fórmula binomial exige bastantes operaciones


aritméticas cuando la muestra es relativamente grande y particularmente
cuando queremos determinar la probabilidad de que el resultado ocurra
dentro de un rango de valores, se utilizan generalmente las tablas de
probabilidades.
EJEMPLO Si la probabilidad de que un presunto cliente escogido
aleatoriamente haga una compra es 0,20, la probabilidad de que un
vendedor que visita a 15 presuntos clientes haga menos de tres ventas es:

Los valores de p que aparecen en la tabla no exceden de p = 0,50. Si el


valor de p en una aplicación particular excede 0,50, debe transformarse el
problema para que el evento se defina en términos del número de
"fracasos" y no de éxitos, El valor esperado (media) y la varianza de una
distribución binomial dada podrían determinarse enumerando en una
tabla la distribución de probabilidades y aplicando las fórmulas
presentadas. Sin embargo, el número esperado de éxitos puede calcularse
directamente:

E(X) = np (6.5)

La varianza del número de éxitos también se puede calcular directamente:


Var(X) = np(1 - p} (6.6)

EJEMPLO En el ejemplo 6, el número de ventas esperado (como un


promedio a largo plazo) y la varianza asociada con las visitas a 15
presuntos clientes son:

E(X) = np = 15(0,20) = 3,0 ventas


Var(X) = np (1 - p) = 15(0,20)(0,80) = 2,4

LA DISTRIBUCION BINOMIAL EXPRESADA POR PROPORCIONES


En lugar de expresar la variable aleatoria binomial como el número de
éxitos X, podemos designarla en términos de la proporción de éxitos, p, que
es la relación entre el número de éxitos y el número de ensayos:
En tales casos, la fórmula (6.4) se modifica sólo respecto de la definición de
la proporción. De esta manera, la probabilidad de observar exactamente la
proporción p de éxitos en n ensayos de Bernoulli es

En la fórmula (6.9),  ("pi" del griego) es el equivalente de p excepto que


indica específicamente que la probabilidad de éxito en un ensayo individual
es un parámetro de población.
EJEMPLO
La probabilidad de que un empleado seleccionado aleatoriamente participe
en un programa de inversiones de acciones de una compañía es 0,40. Si se
seleccionan aleatoriamente cinco empleados asalariados, la probabilidad de
que la proporción de participantes sea exactamente 0,60 es

Cuando la variable binomial se expresa como una proporción, la


distribución es aún discreta y no continua. Sólo pueden ocurrir las
proporciones para las que el número de éxitos X es un número entero. En
el caso del ejemplo 8 no es posible que haya una proporción de 0,60
participantes de una muestra de cinco. El uso de la tabla binomial respecto
de las proporciones exige simplemente la conversión de la proporción
designada p al número de éxitos X.

EJEMPLO
La probabilidad de que un empleado seleccionado aleatoriamente participe
en un programa de inversión de acciones en una compañía es 0,40. Si se
escogen 10 empleados aleatoriamente, la probabilidad que la proporción de
participantes sea por lo menos 0,70 es:

El valor esperado para una distribución de probabilidad binomial


expresada por proporciones es igual a la proporción de la población, que
puede designarse ya sea por p o :

La varianza de la proporción de éxitos para una distribución de


probabilidad binomial es:
LA DISTRIBUCION HIPERGEOMETRICA

Cuando el muestreo se hace sin el reemplazo de cada artículo muestreado


tomado de una población finita de artículos, no se aplica el proceso de
Bernoulli porque hay un. Cambio sistemático en la probabilidad de éxitos a
medida que se retiran items de la población. Al usar muestreos sin
reemplazo en una situación que de otra manera se calificaría como un
proceso de Bernoulli, la distribución hipergeométrica es la distribución de
probabilidad discreta apropiada.

Si X es el número designado de éxitos, N es el número total de ítems en la


población, XT es el número total de "éxitos" incluidos en la población y n es
el número de ítems en la muestra, la fórmula para determinar las
probabilidades hípergeornétricas es

Distribución Hipergeométrica
Sus características son:

 Es un experimento aleatorio que consiste en efectuar n pruebas no


independientes.
 La probabilidad de éxito no se mantiene constante a través de los n
intentos; se modifica en cada prueba.

La extracción de la muestra aleatoria de tamaño n, es una a una sin
reposición, de una población finita. de tamaño N, partida en dos clases: Una
de Éxitos (E) y otra de fracasos (F).

Si x = 0 significa ausencia de éxitos


E F N en la muestra.
a N-a El espacio muestral que se
n
genera es igual que el
Sin n binómico.

Reposición X aCx N-aC n-x


P(x) = --------------------
NCn
x El valor de la v. a. X a = # elem’ de la clase éxitos
E Clase de éxitos n = Tamaño de la muestra
X ~ H( x; a, n, N )
F Clase de lo fracasos N–a = # elem’ de la clase fracasos
Considerando p = a / N
N Tamaño de la población
(proba’ de éxito)

E(x) = n p
V(x) = n p q(N-n / N-1)
Otros autores toman a = S, x= r

Si x = 0 significa ausencia de éxitos en la muestra. El espacio muestral que


se genera es igual que el binómico. X ~ H( x; a, n, N )
EJEMPLO
De seis empleados, tres han estado con la compañía cinco o más años. Si
se escogen aleatoriamente cuatro empleados del grupo de seis, la
probabilidad de que exactamente dos tengan cinco o más años de
antigüedad es:
Datos: S=a r= x
N=6
n= 4
a= 3
r= 2
CSr C Nn−r C32 C64−2
−S −3
9
p ( r=2 ; N=6 , a=3 , n=4 )= N
= 6
= =0,60
Cn C4 15

Observe que en el ejemplo el valor de probabilidad requerido se calcula


determinando el número de combinaciones diferentes que incluirían dos
empleados de mayor antigüedad y dos de menor antigüedad como una
relación del número total de combinaciones de cuatro empleados de los
seis. De esta manera, la fórmula hipergeométrica es una aplicación directa
de las reglas de análisis de combinación descritas en temas anteriores.
Cuando la población es grande y la muestra es relativamente pequeña, el
hecho de que el muestreo se efectúe sin reemplazo tiene poco efecto en la
probabilidad de éxito de cada ensayo. Un método empírico conveniente es
que se puede utilizar una distribución binomial como aproximación de un
valor de probabilidad hipergeométrica cuando n < 0,05N. Es decir, el
tamaño de la muestra debe ser menor que el 5 por ciento del tamaño de la
población. Algunos textos emplean reglas algo diferentes para determinar
cuándo es apropiada tal aproximación.

LA DISTRIBUCION DE POISSON

La distribución de Poisson se puede utilizar para determinar la probabilidad


de un número designado de éxitos cuando los eventos ocurren en un
espectro continuo de tiempo y espacio. Tal proceso se denomina proceso de
Poisson; es semejante al proceso, de Bernoulli excepto que los eventos
ocurren en un espectro continuo en vez de ocurrir en ensayos u
observaciones fijas. Un ejemplo de tal proceso es la entrada de llamadas a
un conmutador telefónico. Como en el caso del proceso de Bernoulli, se
supone que los eventos son independientes y que el proceso es
estacionario.
Sólo se requiere un valor para determinar la probabilidad de un número
designado de éxitos en un proceso de Poisson: el número promedio de
éxitos para la dimensión específica de tiempo o espacio de interés. Este
número promedio se representa generalmente por  "lambda", del griego o
“mi” .
La fórmula para determinar la probabilidad de un número designado de
éxitos X en una distribución de Poisson es:
X −μ −¿
μ e X e
p ( X ; μ )= o por p ( X ; ) =❑ ¿
X! X!
EJEMPLO
Un departamento de reparación de motores recibe un promedio de cinco
llamadas de servicio por hora. La probabilidad de que se reciban
exactamente tres llamadas en una hora aleatoriamente escogida es:
53 e−5
p ( X=3 ;=5,0 ) = =0,1404
3!
Por otra parte, se pueden emplear las probabilidades de una tabla de
Poisson.

EJEMPLO
Podemos determinar la respuesta al ejemplo utilizando tabla para las
probabilidades de Poisson, de la siguiente manera:
P(X = 3,  = 5,0) = 0,1404

Cuando hay un interés en la probabilidad de "X o más" o "X o menos"


éxitos, se aplica la regla de suma para eventos mutuamente excluyentes.

EJEMPLO
Si se recibe un promedio de cinco llamadas de servicio por hora en un
departamento de reparaciones, la probabilidad de que se reciban menos de
tres llamadas durante una hora escogida aleatoriamente se determina de la
siguiente manera: donde

p(X< 3 ; = 5,0)=p(X  2)=p(X= 0)+p(X=1)+p(X=2)+….


P(X = 0; = 5.0)= 0,0067 P(X = 1; = 5.0)= 0,0337 P(X = 2; =
5.0)= 0,0842

p(X< 3 ; = 5,0)= p(X  2)= 0,0067 + 0,0337 + 0,0842


p(X< 3 ; = 5,0)= p(X  2)= 0,1246

Puesto que se supone que un proceso de Poisson es estacionario, se


concluye que la media del proceso es siempre proporcional a la longitud del
espectro continuo de tiempo o espacio. Por lo tanto, si se dispone de la
media para un tamaño de intervalo, se puede determinar la media para
cualquier otro tamaño de intervalo requerido. Esto es importante porque el
valor de  que se utiliza debe aplicarse al intervalo de interés.

EJEMPLO
En promedio, 12 personas por hora consultan a un especialista en
decoración en un almacén de tela. La probabilidad de que tres o más
personas se acerquen al especialista durante un período de 10 min se
determina así:
Promedio por hora = 12
 = promedio por 10 min = - = 12/6= 2 min

P(X  3; = 2)= P(X =3) + P(X= 4) + P(X = 5) + ...


Donde:
P(X = 3) = 0,1804 P(X = 4) = 0,0902 P(X = 5) = 0,0361
P(X = 6) = 0,0120 P(X = 7) = 0,0034 P(X = 8) = 0,0009 P(X = 9)
= 0,0002

= 0,1804 + 0,0902 + 0,0361 + 0,0120 + 0,0034 + 0,0009 + 0,0002 = 0,3232


El valor esperado para una distribución de probabilidad de Poisson es igual
a la media de la distribución: E(X)=  o E(X) = 

APROXIMACION DE POISSON DE PROBABILIDADES BINOMIALES

Cuando el número de observaciones o ensayos n en un proceso de


Bernoulli es muy grande, los cálculos son bastante tediosos. Mas aún, en
general no se encuentran tablas de probabilidad para valores muy
pequeños de p. Afortunadamente, la distribución de Poisson es conveniente
como una aproximación de probabilidades binomiales cuando n es grande
y p ó (1 - p) es pequeño.
Una regla empírica conveniente es que tal aproximación se puede hacer
cuando n 2: 30, y n p < 5 ó n (1 - p) < 5. Otros textos emplean reglas
diferentes para determinar cuándo es apropiada tal aproximación.
La media de la distribución de probabilidad de Poisson, utilizada para
aproximar probabilidades binomiales es:  = np (6.18)

EJEMPLO
Se sabe que el 1 por ciento de los transistores incluidos en un gran
embarque son defectuosos. Si se selecciona aleatoriamente una muestra de
30 transistores la probabilidad de que dos o más de ellos sean defectuosos
se puede determinar por medio de las probabilidades binomiales que
aparecen en el Apéndice 1:

P(X  2, n = 30, p = 0,01) = P(X = 2) + P(X = 3) + ...


P(X  2, n = 30, p = 0,01) = (0,0328) + (0,0031)+ (0,0002) = 0,0361

La aproximación de Poisson del valor de probabilidad anterior es

P(X ~ 2 I A = 0,3) = P(X = 2) + P(X = 3) + ... = (0,0333)+ (0,0033) + (0,0002) =


0,0368
De esta manera, la diferencia entre la aproximación de Poisson y el valor de
probabilidad binomial real es 0,0007. Cuando n es grande pero ni np ni n
(1 - p) son menores que 5,0, se pueden aproximar las probabilidades
binomiales por medio de la distribución de probabilidad normal.

DISTRIBUCIONES PROBABILISTICAS CONTINUAS

Continuaremos el estudio de las distribuciones probabilísticas en este


capítulo, examinando una distribución de probabilidad continua muy
importante, que es la distribución probabilística normal. Según se observó
en el capítulo anterior, una variable aleatoria continua es la que puede
tomar un número infinito de valores posibles. Puede ser el resultado de
medir algo, como el peso de una persona. El peso (en kilogramos) podría
ser 112.0, 112.1, 112.12, etc., dependiendo de la exactitud del instrumento
de pesaje. Otras variables aleatorias continuas son la esperanza o
expectativa de vida de pilas del tipo alcalino, el volumen de un recipiente
de embarque y el peso de las impurezas en un lingote de acero.

Las distribuciones probabilísticas de la duración de algunos productos,


como acumuladores (o baterías), neumáticos y bombillas o lámparas,
tienden a seguir un patrón "normal". Lo mismo sucede con los pesos de los
envases de un cereal, la longitud de rollos de papel tapiz y otras variables
que se miden en una escala continua.
En este capítulo se examinan primero las características principales de una
distribución probabilística normal y la llamada curva normal. Después se
presentan la distribución normal estándar y sus aplicaciones. Por último, se
considera la forma como puede emplearse la distribución normal para
estimar probabilidades binomiales.

CARACTERISTICAS DE UNA DISTRIBUCION PROBABILÍSTICA


NORMAL

La distribución probabilística normal y su curva normal acompañante


tienen las características que siguen:
1. La curva normal tiene perfil de campana, y presenta un solo pico en el
centro exacto de la distribución. La media aritmética, la mediana y la moda
de la distribución son iguales y están en el punto central. De esta forma, la
mitad del área bajo la curva se halla a un lado (o por encima del valor
central) de ese punto, y la otra mitad, al otro lado (o por debajo).
2. La distribución probabilística normal es simétrica con respecto a su
media. Si se corta la curva normal verticalmente por este valor central, las
dos mitades serán como imágenes reflejadas en un espejo.
3. La curva normal decrece uniformemente en ambas direcciones a partir
del valor central. Es asintótica, lo cual significa que la curva se acerca cada
vez más al eje X, pero en realidad nunca llega a tocarlo. Esto es, las colas o
extremidades se extienden indefinidamente en ambas direcciones. Sin
embargo, aplicado a problemas del mundo real esto no resulta verdadero.
Por ejemplo, la duración de las pilas alcalinas no podría ser de 300 años.
CARACTERÍSTICAS DE UNA DISTRIBUCIÓN NORMAL

FAMILIA DE DISTRIBUCIONES PROBABILÍSTICAS NORMALES

No existe sólo una distribución probabilística normal. Hay una "familia " de
curvas. Existe una distribución de probabilidad normal para las
duraciones de servicio de los empleados en una planta industrial (A), en
donde la media = 20 años, y la desviación estándar, = 3,1 años. Existe
otra distribución probabilística normal para los tiempos de servicio en otra
planta, en donde = 20 años y = 3.9 años. En la gráfica se presentan tres
de tales distribuciones normales, en las que las medias son iguales, pero
las desviaciones estándares son distintas.

DISTRIBUCIONES PROBABILISTICAS NORMALES CON MEDIAS


IGUALES PERO DESVIACIONES ESTÁNDARES DISTINTAS
En la siguiente gráfica se muestran los pesos de tres cereales distintos. con
distribuciones normales y medias diferentes, pero desviaciones estándares
idénticas:

DISTRIBUCIONES PROBABILISTICAS NORMALES CON DISTINTAS


MEDIAS PERO DESVIACIONES ESTÁNDARES IGUALES

En la gráfica siguiente se muestran las curvas para tres distribuciones


normales con medias y desviaciones estándares diferentes. Muestran la
distribución de resistencias a la tensión medidas en libras por pulgada
cuadrada (lb/plg2 o psi) para tres tipos de cables:
DISTRIBUCIONES PROBABILISTICAS NORMALES CON DISTINTAS
MEDIAS Y DIFERENTES DESVIACIONES ESTÁNDARES

AREAS BAJO LA CURVA NORMAL

En temas anteriores se analizaron en forma breve ciertas áreas bajo la


curva normal. Ampliamos ahora ese examen. Para una distribución
probabilística normal:

1. Aproximadamente 68% del área bajo la curva normal está dentro de más
una y menos una desviación estándar respecto de la media. Esto es:  ±
1.
2. Aproximadamente 95% del área bajo la curva normal está dentro de más
dos y menos dos desviaciones estándares respecto de la media, es decir:  ±
2.
3. Toda el área (99.73%) bajo la curva normal está dentro de tres
desviaciones estándares respecto de la media (a uno y otro lados), lo cual
se escribe  ± 3.
Mostrando esto en un diagrama y utilizando porcentajes más precisos:
Estos conceptos pueden expresarse de manera algo distinta: el área bajo la
curva normal dentro de más y menos una desviación estándar respecto de
la media es, aproximadamente, 0.6827. El área dentro de más y menos dos
desviaciones estándares respecto de la media es, aproximadamente,
0.9545. El área dentro de tres desviaciones estándares respecto de la
media es en forma aproximada 0.9973. El área total bajo la curva normal
es, obviamente, 1.

EJEMPLO Una prueba acelerada de duración en un gran número de pilas


alcalinas tipo D, reveló que la duración media para un uso especifico antes
de que falle es 19.0 horas. La distribución de las duraciones se aproxima a
una distribución normal. La desviación estándar de la distribución fue 1.2
horas.

1. ¿Entre qué par de valores ocurrió la falla de aproximadamente, 68.27%


de las pilas?
2. ¿Entre qué par de valores ocurrió la falla de aproximadamente, 95.45%
de las pilas?
3. ¿Entre qué par de valores ocurrió la falla de aproximadamente, 99.73%
de las pilas?

SOLUCIÓN

1. Aproximadamente 68.27% falló entre 17.8 horas y 20.2 horas, valor


obtenido por 19.0 ± 1(1.2).
2. Aproximadamente 95.45% falló entre 16.6 horas y 21.4 horas, valor
calculado por 19.0 ± 2(1.2).
3. Aproximadamente 99.73% falló entre 15.4 horas y 22.6 horas, valor
calculado por 19.0 ± 3(1.2).
Mostrado esto en un diagrama queda:
DISTRITRIBUCION PROBABILISTICA NORMAL ESTANDAR
Se observó que existe una familia de distribuciones normales cada
distribución tiene media () o desviación estándar () diferentes. Por tanto,
el número de distribuciones normales es ilimitado. Resultaría físicamente
imposible proporcionar una tabla de probabilidades (como para la binomial
y la de Poisson) para cada combinación de  y . Por fortuna, puede
utilizarse un elemento de la familia de distribuciones normales para todos
los problemas donde esta distribución resulte aplicable. Tiene una media
igual a 0 y una desviación estándar igual a 1, y se denomina distribución
normal estándar.
Como ejemplo de su aplicación, supóngase que la media de una
distribución normal es 1 libra, y la desviación estándar, 2 libras.
Considérese que está interesado en determinar el área entre un valor de
103 libras y la media de 100 libras. Primero se convierte la distribución, a
lo que se conoce como estandarización, de una distribución normal
estándar utilizando el llamado valor z, también denominado puntuación z,
estadística z, desvío normal estandarizado, o desvío normal z, simplemente.
Valor z o desvío normal z, Diferencia (desviación) entre un valor
seleccionado, denotado por X y la media poblacional, , dividida entre la
desviación estándar de la población, .
X −μ
Se expresa con la fórmula: z=
σ
En donde: X es el valor de cualquier observación específica.
 es la media de la distribución.
 es la desviación estándar de la distribución.
El valor z mide la distancia entre el valor específico X y la media , en
unidades de desviación estándar .
EJEMPLO La media de un grupo de ingresos semanales con distribución
normal para un gran conjunto de gerentes de nivel medio, es $us 1000
(dólares); la desviación estándar es $100. ¿Cuál es el desvío normal o valor
z para un ingreso X = $us1100? ¿Para uno de $us 900?
SOLUCION
X −μ 1100−1000
Para X= $us 1100 z= = =1 $ us
σ 100
X −μ 900−1000
Para X=$us 900 z= = =−1 $ us
σ 100
Interpretación El desvío z de +1,00 $us indica que un ingreso semanal de
$us 1100 para un gerente de nivel medio está una desviación estándar por
encima de la media; una z de –1,00 indica que un ingreso de $900 está una
desviación estándar por abajo de la media. Obsérvese que ambos ingresos
($1 100 Y $900) están a la misma distancia ($100) de la media.
El transformar las mediciones a desvíos normales z cambia la escala. Las
conversiones se muestran en la gráfica que sigue. Por ejemplo,  + 1 se
convierte a z de + 1.00. De manera semejante,  – 2  se transforma en z
de - 2.00.
Obsérvese que el centro de la distribución z es cero, lo cual indica que no
existe desviación respecto a la media, .

APLICACIONES DE LA DISTRIBUCIÓN NORMAL ESTÁNDAR

La aplicación de la distribución normal estándar se relaciona con la


determinación del área bajo la curva entre la media y un valor
seleccionado, denotado por X.

EJEMPLO La media de un grupo de ingresos semanales con distribución


normal para un gran conjunto de gerentes de nivel medio, es $us 1000
(dólares); la desviación estándar es $100. ¿Cuál es el área bajo la curva
normal desvío normal entre $us 1000 y $us1100

SOLUCION Ubicamos los datos $us1000 y 1100 en la curva normal


X −μ 1100−1000
Luego hallamos z para X=1100 z= = =1,00
σ 100
Con z=1.00 nos vamos a la tabla
La gráfica es:

Interpretación
El área total bajo la curva es 1 y área bajo la curva normal entre $1000 y
$1100 es 0.3413. También puede decirse que 34.13% de los ingresos
semanales están entre $1000 y $1 100, y la probabilidad que un ingreso
específico se halle entre $1000 y $1100 es 0.3413.

EJEMPLO Con los datos del ejemplo anterior ( = $1 000, = $100).


1. ¿Cuál es la probabilidad que un ingreso semanal específico
seleccionado al azar esté entre $790 y $1000
2. ¿Cuál es la probabilidad que el ingreso sea menor de $790
3. ¿cuánto vale el área bajo la curva normal entre $840 y $1
200?

SOLUCIÓN
X −μ 790−1000
Calculando el valor z para $790: z= = =−2,10
σ 100

1. El área bajo la curva normal entre  y X para un valor z de - 2.10 es


0.4821 (tomado de la tabla). Puesto que la curva normal es simétrica, el
signo negativo antes de 2.10 indica que el área está a la izquierda de la
media.

2. La media divide a la curva normal en dos mitades idénticas. El área de


la mitad a la izquierda (o sea, "abajo") de la media es 0.5, y el área a la
derecha (o sea, "arriba") de la media también es 0.5. Como el área bajo
la curva entre $790 y $1 000 es 0.4821, el área por abajo de $790 se
determina restando 0.4821 de 0.5. De esta forma, 0.5 - 0.4821= 0.0179.
Mostrado esto en un diagrama:

3. Construyendo la curva normal y los ingresos se tiene:

Entre 840 y 1000, z= –1 ,60 Entre 1000 y 1200, z= 2,00

X −μ 840−1000 X −μ 1200−1000
z= = =−1,60 z= = =2,00
σ 100 σ 100

El área bajo la curva para una z de -1.60 es 0.4452 (tomada de tabla). El


área bajo la curva para una z= 2,00 es 0.4772. Sumando las dos áreas
queda:

0.4452 + 0.4772 = 0.9224. De esta forma, la probabilidad de seleccionar un


ingreso entre $840 y $1 200 es 0.9224. En otras palabras, 92.24% de las
personas tienen un ingreso semanal entre $840 y $1 200.

4. ¿qué porcentaje de los ejecutivos tienen ingresos de $1 245 o más?


Primero es necesario determinar el área entre la media de $1000 y un X
de $1245.

X −μ 1245−1000
z= = =2,45
σ 100
Consultando la tabla; el área asociada a un z= 2.45 es 0.4929. Este es el
área entre $1000 y $1245. Resulta lógico que el área a partir de $1245 y
que llega hasta el final de la curva, se obtenga al restar 0.4929 de 0.5000
(área total bajo la curva más allá de $1000). El área a partir de $1245 es
0.0071, lo cual indica que sólo 0.71% de los ejecutivos tienen un ingreso
semanal de $1245 o más. En el diagrama que sigue se muestran los
diversos aspectos de este problema.

APROXIMACION NORMAL A LA BINOMIAL


En el temas anteriores se analizó la distribución probabilística binomial,
que es una distribución discreta. La tabla de probabilidades binomiales va
en forma sucesiva desde una n = 1 hasta una n = [Link]óngase que un
problema se relaciona con obtener una muestra de tamaño 60. El generar
una distribución binomial para un número de ese tamaño tomaría mucho
tiempo. Un enfoque más eficiente consiste en aplicar la aproximación
normal a la binomial. Utilizar la distribución normal (una distribución que
es continua) como sustituto de una distribución binomial (que es una
distribución discreta) para valores grandes de n, parece razonable, porque
conforme n aumenta una distribución binómica se acerca cada vez más a
una distribución normal. Este cambio en la forma de la distribución
binómica desde una n = 1 hasta una n = 20, se presenta en el siguiente
gráfico:

DISTRIBUCIÓN BINOMIAL PARA n=1, n=2 y n=20


¿Cuándo es posible utilizar la aproximación normal a la binomial?

La distribución probabilística normal por lo común se considera una buena


aproximación a la distribución probabilística binomial cuando np y n( 1 - p)
son mayores que 5. Sin embargo, antes de aplicar la aproximación normal,
es necesario asegurarse que la distribución de interés en realidad sea una
distribución binomial. Recuérdese, que en temas anteriores, que para que
esto suceda deben cumplirse cuatro criterios:

1. Existen sólo dos resultados mutuamente excluyentes para el


experimento:
"éxito" y "fracaso".
2. Una distribución binomial es el resultado de contar el número de éxitos.
3. Cada ensayo es independiente.
4. La probabilidad p debe permanecer igual de un ensayo a otro y debe
haber un número fijo de ensayos, n.

FACTOR DE CORRECCIÓN POR CONTINUIDAD

Para mostrar la aplicación de la aproximación normal a la binomial, y la


necesidad de un factor de corrección, lo veremos en el siguiente ejemplo:

EJEMPLO

Supóngase que la gerencia de una cadena de pizzerías reveló que 70% de


sus nuevos clientes vuelven en otra ocasión. En una semana en la que 80
nuevos clientes (de primera vez) cenaron en el establecimiento, ¿cuál es la
probabilidad que 60 o más regresen en otra ocasión?

SOLUCION
Se podría utilizar la fórmula binomial p(r)= nCr pr q n–r para calcular esta
probabilidad. Sin embargo, significaría evaluar las probabilidades de 60,
61,62, 63,64, 68, ... ,80 y sumarias para obtener la probabilidad de 60 o
más. Sin duda el lector estará de acuerdo en que utilizar la aproximación
normal a la binomial es un método mucho más eficiente para calcular la
probabilidad de 60 o más.

Puesto que se va a determinar la probabilidad de 60 o más éxitos utilizando


la curva normal, en este caso es necesario restar 0.5 de 60. El valor 0.5 se
denomina factor de corrección por continuidad. Debe hacerse este pequeño
ajuste porque se está utilizando una distribución continua (distribución
normal) para aproximar una distribución discreta (binomial). De modo que
60 - 0.5 = 59.5.
Los pasos para determinar la probabilidad que 60 o más de los clientes
nuevos del establecimiento, con respecto a 80, regresen son:

Paso 1 Determinar el valor z que corresponde a una X de 59.5, en donde:

= n*p= 80*0,70= 56
2= n-p*(1-p)= 90*0,70*(1-0,70)= 16,8

= √ 16,8=4,1

X −μ 59,5−56
z= = =0,85
σ 4,1

Paso 2 Determinar el área bajo la curva normal entre =56 y X= 59.5. En la


tabla lea hacia abajo en el margen izquierdo hasta llegar a 0.8, y después
recorra horizontalmente hasta el área bajo la columna con el encabezado
0.05. Esa área es 0.3023.
Paso 3 Calcule el área más allá de 59,5 al restar: 0,5 – 0,30230= 0,1977.
Luego la probabilidad de 60 o más clientes nuevos de 80, regresen en otra
ocasión, es 0,1977
La gráfica es:
METODOS Y DISTRIBUCION DE MUESTREO

¿POR QUE MUESTREAR LA POBLACION?

Como se observó con anterioridad, a menudo no es posible estudiar la


población completa. Algunas de las principales razones por las que es
necesario muestrear son:
1. La naturaleza destructiva de ciertas pruebas.
Si los catadores de vino tuvieran que beberse todo el vino para
evaluarlo, consumirían toda la producción y no quedaría producto
para vender. En el área de producción industrial, las placas,
alambres de acero y productos similares deben tener determinada
resistencia mínima a la tensión. Para asegurar que el producto
cumpla con el estándar mínimo, se selecciona una muestra
relativamente pequeña. Cada pieza se estira hasta que se rompe y se
registra el punto de ruptura (por ejemplo, medido en libras por
pulgada cuadrada). Obviamente si todo el alambre o las placas se
sometieran a pruebas de resistencia a la tensión, no quedaría ningún
producto para su venta o uso. Por esta misma razón sólo se
selecciona una muestra de película fotográfica para determinar la
calidad de la película producida. En una compañía sólo se prueba la
germinación de unas cuantas semillas antes de la temporada de
siembra.
2. La imposibilidad física de revisar todos los integrantes de la
población.
Las poblaciones de peces, aves, serpientes, mosquitos y similares son
grandes y están en movimiento constantemente, nacen y mueren. En
vez de intentar siquiera contar todos los patos de Canadá o todos los
peces de un lago, se hacen estimaciones utilizando varias técnicas,
como contar todos los patos de un estanque seleccionado
aleatoriamente, haciendo revisiones con nasas, o colocando redes en
lugares predeterminados en el lago.
3. El costo de estudiar a todos los integrantes de una población a
menudo es prohibitivo.
Las organizaciones para el escrutinio de la opinión pública y pruebas
a consumidores, como Gallup Polls y Marketing Facts, ubicadas en
Chicago, comúnmente entrevistan a menos de 2 000 familias de
aproximadamente 50 millones en Estados Unidos. Una organización
de tipo panel para estudios de consumo cobra aproximadamente $40
000 (dólares) por enviar por correo muestras y tabular las respuestas
con la finalidad de probar un producto (como cereal, alimento para
gatos o perfumes). La misma prueba de un producto utilizando a 50
millones de familias costaría aproximadamente 1000 millones de
dólares.
4. Lo adecuado de los resultados de la muestra.
Incluso si se contara con fondos, es dudoso que la precisión
adicional de una muestra de 100%; es decir, la población completa
resulte fundamental en la mayoría de los problemas. Por ejemplo, el
gobierno usa una muestra de tiendas de abarrotes dispersas en el
territorio de Estados Unidos para determinar el índice mensual de
precios de artículos alimenticios. Los precios de pan, frijol, leche y
otros productos básicos se incluyen en el índice. Probablemente
dicho índice no diferiría una décima de 1% de la estimación
publicada si se registraran mensualmente los precios y se agregaran
al cálculo del índice productos menores que ahora no se incluyen,
como aguacate, granada y berro. Además, es poco probable que la
inclusión de todas las tiendas de abarrotes de Estados Unidos
afectara significativamente el índice, ya que los precios de la leche,
pan y otros productos básicos por lo general no varían en más de un
centavo de una cadena de tiendas a otra.
5. En ocasiones se necesitaría mucho tiempo para entrevistar a toda la
población.
Un candidato a un puesto público desearía determinar las
probabilidades de que lo elijan. Sólo serán necesarios uno o dos días
para determinar una muestra de escrutinio utilizando al personal
existente y las entrevistas de campo de una organización
especializada en escrutinios. ¡Si se empleara el mismo personal de
encuestadores y trabajando siete días a la semana, se precisarían
casi 200 años para entrar en contacto con toda la población votante.
Incluso si pudiera contratarse a un gran número de investigadores,
el costo del contacto con todos los votantes probablemente no
ameritaría el gasto. Si el candidato fuera muy popular, el escrutinio
muestreado podría indicar que tal vez recibiría entre 79% y 81% del
voto popular. No se justificaría el gasto adicional para averiguar que
tal persona podría recibir exactamente 80% de los votos.

¿QUE ES UNA MUESTRA PROBABILÍSTICA?

En general, hay dos tipos de muestras: la muestra probabilística y la


muestra no probabilística. ¿Qué es una muestra de esta clase?-
Muestra probabilística Muestra que se selecciona de modo que cada
integrante de la población en estudio tenga una probabilidad conocida (no
igual a cero) de ser incluido en la muestra.

Si se realiza un muestreo de probabilidad, cada integrante de la población


tiene probabilidad de ser seleccionado. Al utilizar métodos no
probabilísticos, no todos los integrantes tienen probabilidad de ser
incluidos en la muestra. En estos casos los resultados pueden estar
sesgados, lo que significa que tales resultados de la muestra pueden no ser
representativos de la población. El muestreo por panel o por acción directa
son métodos no probabilísticos. Por ejemplo, un panel puede constar de
2000 propietarios de gatos o de madres de bebés recién nacidos. El panel
se forma para solicitar las opiniones acerca de un alimento para gatos o de
pañales recientemente producidos para bebés. La selección de los
miembros del panel se basa en el juicio de la persona que realiza la
investigación y, por tanto, los resultados de la muestra pueden no ser
representativos de toda la población de propietarios de gatos y de madres
de recién nacidos (ya que no todos los propietarios de gatos o todas las
madres de recién nacidos tienen oportunidad de ser seleccionados).
Los procedimientos estadísticos que se emplean en este libro para evaluar
los resultados muestrales se basan en el muestreo probabilístico. En
consecuencia, sólo se analizarán los métodos del citado muestreo en la
siguiente sección.

METODOS DE MUESTREO PROBABILÍSTICO

No hay un "mejor" método para seleccionar una muestra probabilística de


una población de interés. El que se emplea para seleccionar una muestra
de facturas de un archivador podría no ser el más apropiado para elegir
una muestra nacional de electores. Sin embargo, los métodos de muestreo
probabilístico tienen un objetivo similar: permitir que el azar determine los
integrantes que se incluirán en la muestra.

MUESTREO ALEATORIO SIMPLE.

El primer método que se presenta es el muestreo aleatorio simple.


Muestra aleatoria simple Muestra formulada de manera que cada
integrante de la población tenga la misma probabilidad de quedar incluido.

Para ilustrar el muestreo aleatorio simple y su selección, supóngase que


una población consta de 845 trabajadores de una industria. Se
seleccionará una muestra de 52 a partir de esta población. Una forma de
asegurar que todos los empleados en la población tengan la misma
oportunidad de ser elegidos es escribir primero el nombre de cada uno en
una papeleta y depositar en una caja todos los papeles.
Después que se han mezclado bien se realiza la primera selección. Este
proceso se repite hasta que se eligen 52, el tamaño de la muestra.

Un método más adecuado de definir una muestra aleatoria es emplear el


número de identificación de cada empleado y una tabla de números
aleatorios. Como su nombre lo indica, estos números han sido generados
por un proceso aleatorio (en este caso, con una computadora). Para cada
dígito de un número, la probabilidad de O, 1,2, ... ,9 es la misma. Así, la
probabilidad de que el empleado número 011 sea elegido, es la misma que
la del 722 o e1 338. Por tanto, se eliminan por completo los sesgos en el
proceso de selección.

En la siguiente ilustración se muestra parte de una tabla de números


aleatorios.
Para utilizar dicha tabla a fin de seleccionar una muestra de trabajadores,
primero debe elegirse un punto de inicio en la tabla. Supóngase que la hora
es 3:04. Debe ver la tercera columna y después bajar al cuarto conjunto de
números. El resultado es 03759. Como sólo hay 845 empleados, 037 es el
número del primer empleado que será elemento de la muestra. Para
continuar seleccionando, se puede ir en cualquier dirección. Supóngase
que se decide recorrer a la derecha. Los primeros tres dígitos del número a
la derecha de 03759 son 4, 4, 7, el número del empleado que se escogerá
como segundo elemento de la muestra. El tercer número de tres dígitos a la
derecha es 961. No puede usar 961 ya que sólo hay 845 empleados.
Se continúa hacia la derecha y se selecciona al trabajador 784, al 189, y
así sucesivamente. Otra forma de elegir el punto de inicio es cerrando los
ojos y señalando un número de la tabla. En el apéndice E se presenta una
tabla de números aleatorios.

En un gran depósito de pertrechos y repuestos del ejército de Estados


Unidos hay 18 almacenes donde se tienen 186810 artículos diferentes
como neumáticos, tuercas, pernos, bandas para tanques y cadenas para
ruedas. En cada bodega hay naves y en cada una de éstas existen
compar1imentos. Por ejemplo, en la bodega número 17 se guardan partes
de vehículos. En la nave 260, compartimento 2, se encuentran los
cigüeñales de "jeep". En la nave 260, compartimento 3, están los tapones
de radiador para "jeep".

El problema fue seleccionar al azar un compartimento de un almacén y


contar todos los artículos que había en él. Este conteo físico se comparó
con el conteo que indicaban los registros realizados automáticamente sobre
las existencias disponibles. Así, en esencia el problema era un inventario
físico que implicaba métodos de muestreo. El objetivo del proyecto de
investigación fue determinar qué tan precisos eran los registros
automatizados.

Para asegurarse de que cada compartimento tuviera la misma probabilidad


de ser seleccionado, se utilizó una tabla de números aleatorios para elegir
el almacén, la nave y el compartimento.

Si se hubieran seleccionado el almacén 5, la nave 455 y el compartimento


6, un revisor se dirigiría a ese lugar y contaría el número de artículos en tal
sitio.
¿Por qué se utilizó un método tan tardado para seleccionar los
compartimentos que se muestrearon?

La alternativa hubiera sido dejar que los revisores contaran los artículos en
los sitios que ellos desearan. Sin duda los revisores habrían eludido contar
los artículos en los compartimentos que contenían partes pesadas o
grasosas y, probablemente, hubieran evitado los superiores a 6 metros de
altura sobre el piso de un almacén. La omisión de los artículos en tales
compartimentos para este proyecto de investigación acerca de un
inventario físico, habría producido sesgos en los resultados, es decir, su
omisión daría una imagen falsa acerca de la exactitud de los registros
automatizados.

MUESTREO ALEATORIO SISTEMÁTICO


El procedimiento de muestreo aleatorio simple puede ser difícil de usar en
algunos casos de investigación. Por ejemplo, supóngase que la población de
interés consta de 2 000 facturas colocadas en gavetas de archivos. Para
tomar una muestra aleatoria simple en primer lugar se necesitaría
numerar las facturas de 0000 a '1999.

Utilizando una tabla de números aleatorios, una muestra de, por ejemplo,
100 números, tendría que seleccionarse después. Habría que localizar en
las gavetas una factura que correspondiera a cada uno de estos 100
números. Esto sería una prolongada tarea. En su lugar, puede
seleccionarse una muestra aleatoria sistemática simplemente
seleccionando una factura de cada 20 de las que se encuentran en el
archivo. La primera factura se elegiría utilizando un proceso al azar o
fortuito, por ejemplo una tabla de números aleatorios. Si se selecciona la
factura número 10, la muestra constaría de las facturas números 10, 30,
50, 70, ...
MUESTRA ALEATORIA SISTEMÁTICA
Los integrantes de la población se ordenan alfabéticamente, en un archivo
según la fecha en que se reciben, o por algún otro método. Se selecciona al
azar un punto de inicio y después se elige cada k-ésimo elemento de la
población para la muestra.

Sin embargo, no debe utilizarse una muestra sistemática si hay un patrón


predeterminado en la población. Por ejemplo, en el estudio sobre un
inventario físico que se mencionara anteriormente, algunos de los
almacenes del depósito de pertrechos tienen naves de seis compartimentos
de alto. En la hilera inferior de compartimentos hay artículos de
movimiento rápido, como grasa, pintura en aerosol y objetos de ferretería.
Estos artículos se almacenan al nivel del piso para acelerar el trabajo de los
encargados de surtir los pedidos. En los compartimentos de la parte
superior se encuentran artículos que se mueven poco, como aros para
neumáticos, cadenas de semioruga y percutores. En los cuatro
compartimentos intermedios se guardan artículos de movimiento
moderado, como neumáticos, faros y chavetas. Si se usara una muestra
sistemática para revisar el inventario, sería muy probable que se
seleccionara una muestra sesgada. Supóngase que el procedimiento de
muestreo requiriera la selección de cada tercer compartimento y primero se
eligiera el 1. Después se seleccionarían sistemáticamente los
compartimentos 1, 4, 7, 10, 13, 16, 19 y 22.

Con el procedimiento sistemático se seleccionarán automáticamente cuatro


compartimientos que contienen artículos de movimiento moderadamente
rápido y un total de cuatro con artículos de movimiento rápido o lento.
Esta división de 50 -50 de la muestra no coincide con las características de
la población real. La población consta de 16 compartimentos con artículos
de movimiento moderadamente rápido, cuatro con artículos de movimiento
rápido y cuatro con artículos de movimiento lento. Los resultados de la
muestra sin duda estarían sesgados hacia los artículos de movimiento lento
y rápido.
MUESTREO ALEATORIO ESTRATIFICADO

Muestreo aleatorio estratificado Una población se divide primero en


subgrupos, denominados estratos, y se selecciona una muestra de cada
estrato.
Después que la población se ha dividido en estratos, puede seleccionarse
una muestra proporcional o no proporcional. Como el nombre lo dice, un
procedimiento de muestreo proporcional exige que el número de elementos
en cada estrato tenga la misma proporción que se encuentra en la
población. Por ejemplo, el problema puede ser estudiar los gastos de
propaganda de las 352 compañías más grandes en Estados Unidos.
Supóngase que el objetivo del estudio es determinar si las empresas que
pagan altos dividendos (una medida de rentabilidad) gastan más o menos
de cada dólar de ventas en propaganda, que lo que destinan a eso las
empresas con bajos dividendos o con déficit. Considere que las 352
empresas se dividieron en cinco estratos. Si se han de seleccionar 50
empresas para un estudio intensivo, entonces se estudiaría una empresa
con un nivel de rentabilidad de 30% o mayor, se seleccionarían
aleatoriamente cinco compañías en el estrato 20-30, y así sucesivamente.

En una muestra estratificada no proporcional, el número de integrantes


estudiado en cada estrato es desproporcionado respecto a su número en la
población. Entonces se ponderan los resultados de la muestra de acuerdo
con la proporción del estrato respecto a la población total. Por ejemplo, si
se utiliza el muestreo no proporcional en el caso anterior, se deberían
ponderar los resultados del estrato 1 en 2/100, del estrato 2 en 10/100,
del estrato 3 en 54/100, etc. Independientemente de si se usa un
procedimiento de muestreo proporcional o no proporcional, cada artículo o
persona de la población tiene probabilidad de ser seleccionado para la
muestra.

El muestreo estratificado tiene la ventaja, en algunos casos, de reflejar con


mayor precisión las características de la población que el muestreo
aleatorio simple o el aleatorio sistemático. Obsérvese en la tabla que 2% de
las empresas pagan dividendos de 30% o más (estrato 1) y 1% tienen
déficit (estrato 5). Si se tomara una muestra aleatoria simple de 50, no
habría posibilidad de seleccionar alguna compañía de los estratos 1 o 5.
Sin embargo, una muestra aleatoria estratificada aseguraría que al menos
una empresa en el estrato 1y una en el estrato 5 estuvieran representadas
en la muestra.

MUESTREO POR CONGLOMERADOS

Otro tipo común de muestreo es el muestreo por conglomerados, se emplea


a menudo para reducir el costo de muestrear una población dispersa en un
área geográfica grande. Supóngase que se desea efectuar un
reconocimiento para determinar los puntos de vista de industriales
respecto a las políticas estatales y gubernamentales sobre el ambiente. Si
se seleccionara una muestra aleatoria de industriales y personalmente se
comunicara con cada uno tomaría mucho tiempo y sería sumamente
costoso. En su lugar podría emplearse el muestreo por conglomerados
subdividiendo la región en áreas pequeñas o distritos. A menudo se
denomina a éstas como unidades primarias. Supóngase que divide la región
en 12 unidades primarias. Después selecciona aleatoriamente cuatro áreas
menores: 2, 7, 4 y 12, y se concentran los esfuerzos en estas unidades
primarias. Se podría tomar una muestra aleatoria de los industriales de
cada una de estas unidades y entrevistarlos. (Obsérvese que ésta es una
combinación del muestreo por conglomerados y el muestreo aleatorio
simple.)

El análisis de los métodos de muestreo en las secciones anteriores no


incluye a todos los métodos de muestreo de los que dispone un
investigador, y la presentación ha sido sumamente simplificada. Si realiza
un proyecto de investigación o de mercadotecnia, finanzas, contabilidad u
otras consideraciones, será necesario que se consulten libros que hayan
sido escritos exclusivamente en relación a la teoría del muestreo y diseño
de muestras.

ERROR DE MUESTREO
En el análisis anterior se subrayó la importancia de seleccionar una
muestra de manera que cada elemento de la población tenga una
probabilidad real de ser seleccionado. Para lograr esto, podría elegirse un
muestreo aleatorio simple, uno sistemático, uno estratificado, un muestreo
por conglomerados, o una combinación de estos métodos. Lógicamente es
poco probable que una media muestral sea idéntica a la media poblacional.
De igual forma la desviación estándar u otra medida calculada a partir de
la muestra, probablemente no sería exactamente igual al valor
correspondiente de la población. Por tanto, podemos esperar que haya
alguna diferencia entre una estadística de muestra, como la media
muestral o la desviación estándar, y el parámetro correspondiente de la
población. La diferencia entre una estadística de muestra y un parámetro
de población se denomina error de muestreo.
Este error se debe simplemente al azar.

Error de muestreo Diferencia entre una estadística de muestra y su


parámetro de población correspondiente.

Supóngase que una población de cinco trabajadores de producción tiene


tasas de eficiencia (o producción) de 97, 103, 96, 99 Y 105. Considere
además, que se selecciona una muestra de dos tasas (97 y 105) de la
población para calcular la tasa media de la población. Tal media sería 101,
obtenida por (97 + 105)/2. Se selecciona otra muestra de dos: 103 Y 96,
con una media muestral de 99.5. La media de todas las tasas (la media de
la población) es 100, obtenida por (97 + 103 + 9G + 99 + 105)/5 = 500/5 =
100. El error de muestreo para la primera muestra es de 1, determinado
por x́ -  = 101 – 100= 1. La segunda muestra tiene un error de muestreo
de - 0.5. Cada una de estas diferencias, 1.0 y - 0.5, es el error que habría al
calcular la media poblacional con base en la media muestral y estos errores
de muestreo se deben al azar.

Ahora que se ha descubierto la posibilidad de un error de muestreo cuando


se usan los resultados de la muestra para calcular un parámetro de
población, ¿cómo puede el departamento de investigación en
mercadotecnia realizar una predicción acertada sobre el éxito posible de un
dentífrico recientemente producido o algún otro producto, únicamente con
base en resultados muestrales? ¿Cómo puede el departamento de control
de calidad de una industria de producción en masa enviar un cargamento
de microchips basado únicamente en una muestra de 10 chips?¿Cómo
pueden las empresas de sondeos Gallup o Harris realizar una predicción
acertada sobre una campaña electoral con base en una muestra de 2 000
electores registrados de una población votante de casi 90 millones? Para
responder a estas preguntas primero debe desarrollarse una distribución
muestral (o de muestreo) de medias.

DISTRIBUCION MUESTRAL DE MEDIAS


En el ejemplo sobre tasas de eficiencia se mostró que las medias
muestrales de un tamaño específico varían de una muestra a otra. La tasa
de eficiencia media de la primera muestra de dos empleados era 101, Y la
media de la segunda muestra fue 99.5. Probablemente una tercera muestra
daría como resultado una media diferente. La media de la población era
100. Si se organizaran las medias de todas las muestras posibles de
tamaño dos en una distribución probabilística, se obtendría la distribución
muestral de medias.
Distribución muestral de medias es una distribución probabilística que
consta de una lista de todas las medias muestrales posibles de un tamaño
de muestra dado de una población y la probabilidad de ocurrencia
asociada con cada media muestral.

En el siguiente ejemplo se ilustra la elaboración de una distribución


muestral de medias. .

EJEMPLO

Una empresa industrial “Tartus” tiene siete trabajadores de producción


(considerados como la población). La retribución (salario por hora) de cada
empleado se presenta en la tabla
TABLA Salarios (por hora) de los trabajadores de producción de la industria
Tartus
Trabajador Salario
Javier $7
Saúl 9
Susana 8
Berta 8
Juan 7
Aura 8
Carlos 9

1. ¿Cuál es la media de la población?


2. ¿Cuál es la distribución muestral de medias?
3. ¿Cuál es la media de la distribución muestral?
4. ¿Qué observaciones pueden formularse respecto a la población y a la
distribución muestra!?

SOLUCIÓN
1. La media de la población es $ 8 obtenida por:
= (7 + $9 + $8 + $8 + $7 + $8 + $9)/7 = $8.
2. Para determinar la distribución muestral de las medias, se seleccionaron
todas las muestras posibles de tamaño cuatro sin reposición en la
población, y se calcularon sus medias (véase la tabla).

3. Se obtuvo la media de la distribución muestral de medias, sumando las


diferentes medias muestrales y dividiendo la suma entre el número de
muestras. La media de todas las medias muestra les en general se expresa
como μ x́. El símbolo  recuerda que es un valor poblacional, ya que sean
considerados todas las muestras posibles. El subíndice x́ indica que es una
distribución muestral de medias.
Suma de todaslas medias muestra les
μ x́ =
Númerototal de muestras

Obsérvese que hay 35 muestras (combinaciones) posibles, que se obtienen


aplicando la fórmula 7C4= 35

DISTRIBUCION MUESTRAL DE MEDIAS


Suma: 280

280
μ X́ = =8
35

Las distintas medias muestrales de todas las muestras posibles de tamaño


cuatro que pueden obtenerse de la población se presentan en la tabla
anterior. Esta distribución probabilística es la distribución muestral de
medias.
4. Pueden hacerse las siguientes observaciones:
a) La media de las medias muestrales ($8) es igual a la media
poblacional (también $8): μ=μ x Esto siempre es cierto si todas las
muestras posibles de un tamaño dado se seleccionan a partir de la
población de interés.
b) Observe en el diagrama que la dispersión en la distribución de las
medias muestrales es menor que la dispersión de la población. Las
medias muestrales varían de $7.50 a $8.50, los valores de la
población de $7.00 a $9.00.
TABLA Distribución muestral de medias para n= 4

Media muestral Número de medias Probabilidad


$7.50 3 3/35 = 0.0857
7.75 8 8/35 = 0.2286
8.00 13 13/35 = 0.3714
8.25 8 8/35 = 0.2286
8.50 3 3/35 = 0.0857
35 35/35 = 1

Tenemos dos conceptos: 1) μ=μ x 2) El gráfico que representa la


distribución de las medias muestrales tiende a aproximarse a la curva
normal:
¿Cuál es la importancia de estos dos conceptos?
Son la base de uno de los teoremas más importantes de la Estadística: el
teorema de límite central.

TEOREMA DE LIMITE CENTRAL


Teorema de limite central en el caso de una población con media  y
varianza 2, la distribución muestral de las medias de todas las muestras
posibles de tamaño n generadas a partir de la población, tendrá una
distribución aproximadamente normal (siendo la media de la distribución
muestral igual a  y la varianza igual a 2/n) considerando que el tamaño
de la muestra es bastante grande.

Hay que destacar los aspectos importantes del teorema central de límite.

1. Si el tamaño de la muestra n es suficientemente grande, la


distribución muestral de las medias será más o menos normal. Esto
se cumple ya sea que la población esté o no distribuida
normalmente. Esto es, el teorema se verifica, ya sea que la población
esté distribuida en forma normal, o bien sea sesgada o uniforme.
2. Como se mostró con anterioridad, la media de la población, , y la
media de todas las medias muestrales posibles, μ=μ x , son iguales.
Si la población es grande y se selecciona un número grande de
muestras de la población, la media de las medias muestrales se
aproximará a la media poblacional.
3. La varianza de la distribución de medias muestrales se determina
por 2/n. No existe acuerdo general sobre lo que constituye un
tamaño de muestra "suficientemente grande". Algunos estadígrafos
consideran que es 30; otros piensan que un número pequeño como
12 es adecuado. El ejemplo sobre los salarios por hora de todos los
empleados de la industria “Tartus” funcionó bastante bien con una
muestra de 4. Sin embargo, a menos que la población sea
aproximadamente normal, los tamaños de muestra así de pequeños,
por lo general no dan como resultado una distribución muestral que
se distribuya normalmente. A medida que el tamaño de la muestra se
vuelve cada vez más grande, la distribución de la media muestral se
aproxima más a la distribución normal con forma de campana.

ESTIMACIONES PUNTUALES Y DE INTERVALO

ESTIMACIÓN PUNTUAL
Los vigilantes de caza y pesca calculan el peso promedio y otras
características de la población de peces o presas de caza empleando
revisiones con jaulas o nasas u otros dispositivos. Con base en estos datos
muestrales, un guarda puede estimar que el peso medio del salmón Coho
que se pesca en el Lago Michigan es de 2 1/2 libras.
Una muestra de cinco "expertos" en finanzas puede dar como resultado
una estimación de 11.9% de rendimiento para certificados de depósito a
fines de año. Estos números únicos (2 1/2 libras y 11.9%) son
estimaciones de un parámetro poblacional desconocido y se denominan
estimaciones puntuales.
Estimación puntual Un número (denominado punto) que se emplea para
estimar un parámetro poblacional.
La media muestral X́ es el mejor estimador de la media poblacional, .
Recuérdese, que la media muestral se calcula mediante:
x́=
∑x
n
En donde X es el valor de una observación y n es el número total de
observaciones.

EJEMPLO
Se realizará un estudio sobre la potencia de arranque en frío de baterías o
acumuladores de 12 V (Longlast) para estimar el número de veces que un
motor con desplazamiento de 440 plg3 arrancará antes de que falle la
batería. Una muestra de 40 dispositivos seleccionados aleatoriamente dio
los siguientes números de arranques:
26 27 26 20 21 42 30 22 22 21 26 9 21
22
28 26 19 16 20 32 18 23 32 28 21 41 19
31
21 22 16 23 30 21 37 28 39 30 21 23

¿Cuál es la mejor estimación del número de la media poblacional de


arranques?

x́=
∑ x = 1000 =25 arranques
n 40

La varianza muestral, S2, y la desviación estándar de la muestra, S, se


utilizan para estimar la varianza de la población, 2, y la desviación
estándar de la población, . Recuérdese temas anteriores que:
Varianza de la muestra:
2
2 (∑ x)
x−
2 ∑ ( x−x́)2 ∑ n
S= =
n−1 n−1

Desviación estándar:
2


(∑ x )
2
2 ∑ x−
∑ x
S=
(

n−1
−x́)
=
n−1
n

En donde x representa el valor de un elemento seleccionado para la


muestra, x́ es la media de la muestra, y n es el tamaño de la muestra.
De igual manera, la proporción de la población que está a favor de medidas
más estrictas para la protección ambiental puede estimarse utilizando una
proporción muestral Si p es la proporción poblacional desconocida y ṕ es la
proporción muestral, la estimación puntual para la proporción de
población es:

Númeor de exitos en la muestra x


ṕ= =
Número muestreado n

En donde x representa el número de éxitos en la muestra y n es el tamaño


de la muestra.

EJEMPLO
De 2000 personas muestreadas, 1600 están a favor de medidas más
estrictas de protección ambiental. ¿Cuál es la proporción poblacional
estimada?

SOLUCIÓN

Númeor de exitos en la muestra x 1600


ṕ= = = =0,80
Número muestreado n 2000

Ochenta por ciento de la población está a favor de medidas más estrictas.

En resumen, con base en la distribución muestral de medias- y el teorema


de límite central, la media muestral puede utilizarse como un buen
estimador de la media poblacional. Por supuesto, se supone que el tamaño
de la población es lo suficientemente grande. Puede decirse lo mismo
acerca de una proporción poblacional (que es un caso especial de media
muestral), la varianza poblacional, la desviación estándar de la población y
otros parámetros de la población. Cada uno de estos estimadores es una
estimación de punto.

ESTIMACIÓN DE INTERVALO
Ahora se analizará otro tipo de estimación, la estimación de intervalo.

Estimación de intervalo. Expresa la amplitud dentro de la cual


probablemente se encuentra un parámetro poblacional.

El intervalo dentro del que se espera esté un parámetro poblacional, por lo


general se denomina intervalo de confianza.
EJEMPLO
El intervalo de confianza para la media poblacional es el intervalo que tiene
una mayor probabilidad de contener a la media poblacional, . Se utilizan
con frecuencia dos intervalos de confianza para la media poblacional:
1.- El intervalo de confianza de 95%
El intervalo de confianza de 99%.
1.- Este intervalo indica que 95% de las medias muestrales de un tamaño
de muestra específico seleccionadas de una población se hallará dentro de
más o menos 1.96 desviaciones estándares de la media poblacional
hipotética.
(95% se refiere a 95% de los valores centrales.)

2.- El intervalo de confianza de 99% se establece abarcando más o menos


2.58 desviaciones estándares a partir de la media poblacional hipotética.
Esto se muestra a continuación en el diagrama de la página siguiente.

¿De dónde provienen los valores 1.96 y 2.58?

El 95% central de las medias muestrales se encuentra a cualquiera de los


lados de la media y, lógicamente:

0.95/2 = 0.4750, O sea 47.5%. Entonces, el área a la derecha de la media


es 0.4750, y el área a la izquierda de la media también es 0.4750. Debido a
que estas áreas se refieren a la curva normal, puede usarse tabla para
determinar el número de desviaciones estándares (valores z) de la medía
para 0.4750.

 Primero se encuentra 0.4750 en el cuerpo de la tabla.


 Segundo hay que ir al margen izquierdo y a la columna
correspondiente para hallar z, que es 1.96.
 Tercero el valor z a la derecha de la media se denota como +1.96 y el
situado a la izquierda es -1.96. Lo anterior se muestra en el siguiente
diagrama:

Se utiliza el mismo procedimiento para determinar 2.58.

Para ampliar el concepto de intervalo de confianza; suponga que hay


tiempo para seleccionar 100 muestras de tamaño 256 de una población, y
calcular las medias rnuestrales y los intervalos de confianza para cada
muestra. Se descubriría que 95 de los 100 intervalos de confianza
contienen la media poblacional, aproximadamente
5 de los intervalos no la contienen. Esto se representa en el esquema de la
siguiente manera:
¿Cómo se elabora un intervalo de confianza?

Primero es necesario calcular el error estándar de la media.

ERROR ESTANDAR DE LA MEDIA

Error estándar de la media. Es la desviación estándar de la distribución


muestral de las medias muestrales.
σ
El error estándar de la media se calcula mediante: σ x́ =
√n
En donde:

σ x́ =¿ El error estándar de la media.


 = La desviación estándar de la población.
n = Es el tamaño de la muestra.

En la fórmula del error estándar de la media se supone conocida la


desviación estándar de la población, . Si no se conoce, y n = 30 o mayor
(se considera una muestra grande), la desviación estándar de la media,
denotada por S, sirve para aproximar la desviación estándar de la
población, CJ. Entonces la fórmula para el error estándar queda ( S x́, se
sustituye por σ x para indicar que el error estándar se basa en estadísticas
muestrales):

S
S x́ =
√n
Obsérvese que el error estándar de la media variará de acuerdo con el
tamaño de la muestra que está en el denominador. A medida que aumenta
cada vez más el tamaño de la muestra, n, la variabilidad de las medias
muestrales se vuelve cada vez más pequeña. Lógicamente, una estimación
de la media poblacional basada en una muestra grande es más confiable
que una estimación realizada con una muestra pequeña. En otras
palabras, el error en la estimación de la media poblacional disminuye a
medida que aumenta el tamaño de muestra. Si el tamaño de muestra se
volviera cada vez más grande y, por último, fuera igual al tamaño de la
población, no habría error en la predicción de la media poblacional ¡debido
a que el tamaño de la muestra y el tamaño de la población serían iguales!

Cálculo del Tamaño de la Muestra para Estimar una Media


¿Qué tan grande debe ser una muestra si la media muestral se va a usar para
estimar la media poblacional?. La respuesta depende del error estándar de la
media, si este fuera cero, entonces se necesitaría una sola media que será igual
necesariamente a la media poblacional desconocida , porque = 0. Este caso
extremo no se encuentra en la práctica, pero refuerza el hecho de que mientras
menor sea el error estándar de la media, menor es el tamaño de muestra
necesario para lograr un cierto grado de precisión.
Se estableció antes que una forma de disminuir el error de estimación es
aumentar el tamaño de la muestra, si éste incluye el total de la población,
entonces x � sería igual a cero. Con esto en mente, parece razonable que
para un nivel de confianza fijo, sea posible determinar un tamaño de la muestra
tal que el error de estimación sea tan pequeño como queramos, para ser mas
preciso, dado un nivel de confianza y un error fijo de estimación , se puede
escoger un tamaño de muestra n tal que P( x � <) = Nivel de confianza. Con
el propósito de determinar n. El error máximo de estimación esta dado por:
z()
=
n
Si se eleva al cuadrado ambos lados de esta ecuación y se despeja n de la
ecuación resultante, obtenemos:
z() 2
n 
 
E 
Como n debe de ser un número entero, redondeamos hacia arriba todos los
resultados fraccionarios.
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el
error de estimación se convierte en:
z() N
= n
n N
1

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:


z () N
2 2
n
 E2 2 N −1 z
2

Ejemplos: 1.- Un biólogo quiere ()estimar el peso promedio de los ciervos


cazados en el estado de Maryland. Un estudio anterior de diez ciervos cazados
mostró que la desviación estándar de sus pesos es de 12.2 libras. ¿Qué tan
grande debe ser una muestra para que el biólogo tenga el 95% de confianza
de que el error de estimación es a lo más de 4 libras?
Solución:

z()  2 1.96 12.2  


2

n    35.736


 E  
4 
En consecuencia, si el tamaño de la muestra es 36, se puede tener un 95% de
confianza en que difiere en menos de 4 libras de x .

1. Una empresa eléctrica fabrica focos que tienen una duración


aproximadamente normal con una desviación estándar de 40 horas. ¿De qué
tamaño se necesita una muestra si se desea tener 96% de confianza que la
media real esté dentro de 10 horas de la media real?
z()  2 2.05340  
2

n    67.43


 E   10 
Se necesita una muestra de 68 focos para estimar la media de la población y
tener un error máximo de 10 horas.
¿Qué pasaría si en lugar de tener un error de estimación de 10 horas sólo se
requiere un error de 5 horas?
z()  2 2.05340  
2

n    269.74


 E   5 
Se puede observar como el tamaño de la muestra aumenta, pero esto tiene
como beneficio una estimación más exacta.
2. Suponga que en el ejercicio anterior se tiene una población de 300 focos,
y se desea saber de que tamaño debe de ser la muestra. El muestreo
se realizará sin reemplazo.
Solución: Como se tiene una población finita y un muestreo sin
reemplazo es necesario

utilizar la formula con el factor de corrección.


z 2() 2 N 2.0532 40 2 300
  55.21
n E 2  N 1 z 2() 10 2 300 1  2.0532 40 2
2

Si se tiene una población finita de 300 focos sólo se tiene que extraer de la
población una muestra sin reemplazo de 56 focos para poder estimar la duración
media de los focos restantes con un error máximo de 10 horas.

Cálculo del Tamaño de la Muestra para Estimar una Proporción


Se desea saber que tan grande se requiere que sea una muestra para asegurar
que el error al estimar P sea menor que una cantidad específica .
pq
E z
n
Elevando al cuadrado la ecuación anterior2se despeja n y nos queda:
z pq
n
2
E
Esta fórmula está algo engañosa, pues debemos utilizar p para determinar el
tamaño de la muestra, pero p se calcula a partir de la muestra. Existen
ocasiones en las cuales se tiene una idea del comportamiento de la proporción
de la población y ese valor se puede sustituir en la fórmula, pero si no se sabe
nada referente a esa proporción entonces se tienen dos opciones:
· Tomar una muestra preliminar mayor o igual a 30 para proporcionar una
estimación de P. Después con el uso de la fórmula se podría determinar
de
forma aproximada cuántas observaciones se necesitan para proporcionar el
grado de precisión que se desea.
· Tomar el valor de p como 0.5 ya que sustituyendo este en la fórmula se
obtiene el tamaño de muestra mayor posible. Observe el siguiente ejemplo:

Se desconoce el valor de P, por lo que se utilizarán diferentes valores y se


sustituirán en la formula para observar los diferentes tamaños de muestras. El
nivel de confianza que se utilizará es del 95% con un error de estimación de
0.30.
2
z
p pq n

1.96E 20.10
2

0.10 3.8
0.90 4

1.960.30 2 
 0.20
2

0.20 6.8
0.80 2
1.90.6
2

0.30 8.9
0.300.70 6
1.960.0.40
2

0.40 10.
0.60 24
1.90.6
2

0.50 10.
0.500.50 67
0.30
1.96
22

0.60 10.
0.600.40 24
1.960.0.70
2

0.70 8.9
0.30 6
1.960.0.80
2

0.80 6.8
0.20 2
1.960.0.90
2

0.90 3.8
0.10 4
0.
Como se puede observar en la tabla anterior cuando P vale 0.5 el tamaño de la
muestra alcanza su máximo valor.
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el
error de estimación se convierte en:
pq N n
E z
N 1
n
De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

z 2 pqN
n
E 2  N 1 z 2 pq
Ejemplos:

1. En una muestra aleatoria de 500 familias que tienen televisores en la ciudad


de Hamilton, Canadá, se encuentra que 340 están suscritas a HBO. ¿Qué
tan grande se requiere que sea una muestra si se quiere tener 95% de
confianza de que la estimación de P esté dentro de 0.02?

Solución:

Se tratarán a las 500 familias como una muestra preliminar que proporciona una
estimación de p=340/500=0.68.
z 2 pq 1.96 2 0.680.32 
n  2090
2
0.02 2
E
Por lo tanto si basamos nuestra estimación de P sobre una muestra aleatoria de
tamaño 2090, se puede tener una confianza de 95% de que nuestra proporción
muestral no diferirá de la proporción real por más de 0.02.

2. Una legisladora estatal desea encuestar a los residentes de su distrito para


conocer qué proporción del electorado conoce la opinión de ella, respecto al
uso de fondos estatales para pagar abortos. ¿Qué tamaño de muestra se
necesita si se requiere un confianza del 95% y un error máximo de
estimación de 0.10?

Solución
:

En este problema, se desconoce totalmente la proporción de residentes que


conoce la opinión de la legisladora, por lo que se utilizará un valor de 0.5 para p.
z 2 pq 1.96 2 0.50 0.50
n  96.04
2
 0.10
2

E
Se requiere un tamaño de muestra de 97 residentes para que con una confianza
del 95% la estimación tenga un error máximo de 0.10.

Cálculo del Tamaño de la Muestra para Estimar la Diferencia de Medias


Si se recuerda a la distribución muestral de diferencia de medias se tiene que
error esta dado por:
2
() 1 () 2
E z  2

n1 n2

En esta ecuación se nos pueden presentar dos casos:


· Los tamaños de muestra son iguales.
· Los tamaño de muestra son diferentes .
Para el primer caso no se tiene ningún problema, se eleva al cuadrado la
ecuación y se despeja n ya que n1 es igual a n2.

z
2
() 2
1 ()
2
2 
n 
E
2

Para el segundo caso se pondrá una n en función de la otra. Este caso se utiliza
cuando las poblaciones son de diferente tamaño y se sabe que una es K veces
mayor que la otra.

Poblaci
ón 1 Población 2

n1=Kn2

z ()
2 2 2
1 k() 2

n2  
kE 2
Ejemplo:

Un director de personal quiere comparar la efectividad de dos métodos de


entrenamiento para trabajadores industriales a fin de efectuar cierta operación
de montaje. Se divide un número de operarios en dos grupos iguales: el primero
recibe el método de entrenamiento 1, y el segundo, el método 2. Cada uno
realizará la operación de montaje y se registrará el tiempo de trabajo. Se espera
que las mediciones para ambos grupos tengan una desviación estándar
aproximadamente de 2 minutos. Si se desea que la estimación de la diferencia
en tiempo medio de montaje sea correcta hasta por un minuto, con una
probabilidad igual a 0.95, ¿cuántos trabajadores se tienen que incluir en cada
grupo de entrenamiento?
z () 1 () 2  1.96 2 2
2 2 2 2 2 2

 31
n 
E2 12
Cada grupo debe contener aproximadamente 31 empleados.
Cálculo del Tamaño de la Muestra para Estimar la Diferencia de
Proporciones

Si se recuerda a la distribución muestral de diferencia de medias se tiene que


error esta dado por:
p1q1 p2 q 2
E z 
n1 n2

En esta ecuación se nos pueden presentar dos casos:


· Los tamaños de muestra son iguales.
· Los tamaño de muestra son diferentes .

Para el primer caso no se tiene ningún problema, se eleva al cuadrado la


ecuación y se despeja n ya que n1 es igual a n2.
z  p q p q 
2

n
1 1 2 2

2
E
Para el segundo caso se pondrá una n en función de la otra. Este caso se utiliza
cuando las poblaciones son de diferente tamaño y se sabe que una es K veces
mayor que la otra.

Poblaci
ón 1 Población 2

n1=Kn2

z
2
 p q kp q 
n  1 1 2 2

2
kE 2
Ejemplo:
Una compañía de productos alimenticios contrató a una empresa de
investigación de mercadotecnia , para muestrear dos mercados, I y II, a fin de
comparar las proporciones de consumidores que prefieren la comida congelada
de la compañía con los productos de sus competidores. No hay información
previa acerca de la magnitud de las proporciones P1 y P2. Si la empresa de
productos alimenticios quiere estimar la diferencia dentro de 0.04, con una
probabilidad de 0.95, ¿ cuántos consumidores habrá que muestrear en cada
mercado?
z  p q p q  1.96 2 0.50.5 0.50.5
2

n 1 1 2 2
 1200.5
2
0.04
E
Se tendrá que realizar encuestas a 1201 consumidores de cada mercado para
tener una estimación con una confianza del 95% y un error máximo de 0.04.

Problemas propuestos
1. Se probó una muestra aleatoria de 400 cinescopios de televisor y se
encontraron 40 defectuosos. Estime el intervalo que contiene, con un
coeficiente de confianza de 0.90, a la verdadera fracción de elementos
defectuosos.

2. Se planea realizar un estudio de tiempos para estimar el tiempo medio de un


trabajo, exacto dentro de 4 segundos y con una probabilidad de 0.90, para
terminar un trabajo de montaje. Si la experiencia previa sugiere que  = 16
seg. mide la variación en el tiempo de montaje entre un trabajador y otro al
realizar una sola operación de montaje, ¿cuántos operarios habrá que incluir
en la muestra?

3. El decano registró debidamente el porcentaje de calificaciones D y F


otorgadas a los estudiantes por dos profesores universitarios de
matemáticas. El profesor I alcanzó un 32%, contra un 21% para el profesor II,
con 200 y 180 estudiantes, respectivamente. Estime la diferencia entre los
porcentajes de calificaciones D y F otorgadas por los dos profesores. Utilice
un nivel de confianza del 95% e interprete los resultados.

4. Suponga que se quiere estimar la producción media por hora, en un proceso


que produce antibiótico. Se observa el proceso durante 100 períodos de una
hora, seleccionados al azar y se obtiene una media de 34 onzas por hora
con una desviación estándar de 3 onzas por hora. Estime la producción
media por hora para el proceso, utilizando un nivel de confianza del 95%.

5. Un ingeniero de control de calidad quiere estimar la fracción de elementos


defectuosos en un gran lote de lámparas. Por la experiencia, cree que la
fracción real de defectuosos tendría que andar alrededor de 0.2. ¿Qué
tan grande tendría que seleccionar la muestra si se quiere estimar la
fracción real, exacta dentro de 0.01, utilizando un nivel de confianza fe 95%?

6. Se seleccionaron dos muestras de 400 tubos electrónicos, de cada una de


dos líneas de producción, A y B. De la línea A se obtuvieron 40 tubos
defectuosos y de la B 80. Estime la diferencia real en las fracciones de
defectuosos para las dos líneas, con un coeficiente de confianza de 0.90 e
interprete los resultados.

7. Se tienen que seleccionar muestras aleatorias independientes de n1=n2=n


observaciones de cada una de dos poblaciones binomiales, 1 y 2. Si se
desea estimar la diferencia entre los dos parámetros binomiales, exacta
dentro de 0.05, con una probabilidad de 0.98. ¿qué tan grande tendría que
ser n?. No se tiene información anterior acerca de los valores P1 y P2, pero
se quiere estar seguro de tener un número adecuado de observaciones en la
muestra.

8. Se llevan a cabo pruebas de resistencia a la tensión sobre dos


diferentes clases de largueros de aluminio utilizados en la fabricación de
alas de aeroplanos comerciales. De la experiencia pasada con el proceso
de fabricación se supone que las desviaciones estándar de las resistencias
a la tensión son conocidas. La desviación estándar del larguero 1 es de
1.0 Kg/mm2 y la del larguero 2 es de 1.5 Kg/mm2. Se sabe
que el
comportamiento de las resistencias a la tensión de las dos clases de
largueros son aproximadamente normal. Se toma una muestra de 10
largueros del tipo 1 obteniéndose una media de 87.6 Kg/mm2, y otra de
tamaño 12 para el larguero 2 obteniéndose una media de 74.5 Kg/mm2 .
Estime un intervalo de confianza del 90% para la diferencia en la resistencia
a la tensión promedio.
9. Se quiere estudiar la tasa de combustión de dos propelentes sólidos
utilizados en los sistemas de escape de emergencia de aeroplanos. Se sabe
que la tasa de combustión de los dos propelentes tiene aproximadamente la
misma desviación estándar; esto es 1=2 = 3 cm/s. ¿Qué tamaño de
muestra debe utilizarse en cada población si se desea que el error en la
estimación de la diferencia entre las medias de las tasas de combustión sea
menor que 4 cm/s con una confianza del 99%?.

Respuesta a los Problemas propuestos

1. 0.07532 P 0.1246


2. n= 44
3. 0.0222 P1- P2 0.1978
4. 33.412 34.588
5. n= 6147
6. 0.059 PB-PA 0.141
7. n= 1086
8. 12.22 1-2 13.98
9. n= 8
PRUEBA DE HIPOTESIS

Las secciones anteriores han mostrado cómo puede estimarse un parámetro a


partir de los datos contenidos en una muestra. Puede encontrarse ya sea un
sólo número (estimador puntual) o un intervalo de valores posibles (intervalo de
confianza). Sin embargo, muchos problemas de ingeniería, ciencia, y
administración, requieren que se tome una decisión entre aceptar o rechazar
una proposición sobre algún parámetro. Esta proposición recibe el nombre de
hipótesis. Este es uno de los aspectos más útiles de la inferencia estadística,
puesto que muchos tipos de problemas de toma de decisiones, pruebas o
experimentos en el mundo de la ingeniería, pueden formularse como problemas
de prueba de hipótesis.

Una hipótesis estadística es una proposición o supuesto sobre los parámetros


de una o más poblaciones.

Suponga que se tiene interés en la rapidez de combustión de un agente


propulsor sólido utilizado en los sistemas de salida de emergencia para la
tripulación de aeronaves. El interés se centra sobre la rapidez de combustión
promedio. De manera específica, el interés recae en decir si la rapidez de
combustión promedio es o no 50 cm/s. Esto puede expresarse de manera formal
como
Ho; = 50 cm/s
H1; 50 cm/s
La proposición Ho ; = 50 cm/s, se conoce como hipótesis nula , mientras que
la proposición H1 ;   50 cm/s, recibe el nombre de hipótesis alternativa.
Puesto que la hipótesis alternativa especifica valores de  que pueden ser
mayores o menores que 50 cm/s, también se conoce como hipótesis
alternativa bilateral. En algunas situaciones, lo que se desea es formular una
hipótesis alternativa unilateral, como en
Ho; = 50 cm/s Ho; = 50 cm/s
ó
H1; < 50 cm/s H1; > 50 cm/s

Es importante recordar que las hipótesis siempre son proposiciones sobre la


población o distribución bajo estudio, no proposiciones sobre la muestra. Por lo
general, el valor del parámetro de la población especificado en la hipótesis nula
se determina en una de tres maneras diferentes:

1. Puede ser resultado de la experiencia pasada o del conocimiento del


proceso, entonces el objetivo de la prueba de hipótesis usualmente es
determinar si ha cambiado el valor del parámetro.
2. Puede obtenerse a partir de alguna teoría o modelo que se relaciona con el
proceso bajo estudio. En este caso, el objetivo de la prueba de hipótesis es
verificar la teoría o modelo.

3. Cuando el valor del parámetro proviene de consideraciones externas, tales


como las especificaciones de diseño o ingeniería, o de obligaciones
contractuales. En esta situación, el objetivo usual de la prueba de hipótesis
es probar el cumplimiento de las especificaciones.

Un procedimiento que conduce a una decisión sobre una hipótesis en particular


recibe el nombre de prueba de hipótesis . Los procedimientos de prueba
de hipótesis dependen del empleo de la información contenida en la muestra
aleatoria de la población de interés. Si esta información es consistente con la
hipótesis, se concluye que ésta es verdadera; sin embargo si esta información
es inconsistente con la hipótesis, se concluye que esta es falsa. Debe hacerse
hincapié en que la verdad o falsedad de una hipótesis en particular nunca puede
conocerse con certidumbre, a menos que pueda examinarse a toda la población.
Usualmente esto es imposible en muchas situaciones prácticas. Por tanto, es
necesario desarrollar un procedimiento de prueba de hipótesis teniendo en
cuenta la probabilidad de llegar a una conclusión equivocada.

La hipótesis nula, representada por Ho, es la afirmación sobre una o más


características de poblaciones que al inicio se supone cierta (es decir, la

“creencia a priori”).

La hipótesis alternativa, representada por H1, es la afirmación contradictoria a


Ho, y ésta es la hipótesis del investigador.

La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la


evidencia muestral sugiere que Ho es falsa. Si la muestra no contradice
decididamente a Ho , se continúa creyendo en la validez de la hipótesis nula.

Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis son
rechazar H o o no rechazar H o.

Prueba de una Hipótesis Estadística

Para ilustrar los conceptos generales, considere el problema de la rapidez de


combustión del agente propulsor presentado con anterioridad. La hipótesis nula
es que la rapidez promedio de combustión es 50 cm/s, mientras que la hipótesis
alternativa es que ésta no es igual a 50 cm/s. Esto es, se desea probar:

Ho; = 50
cm/s H1;
50 cm/s
Supóngase que se realiza una prueba sobre una muestra de 10 especímenes, y
que se observa cual es la rapidez de combustión promedio muestral. La media
muestral es un estimador de la media verdadera de la población. Un valor de la
media muestral x que este próximo al valor hipotético = 50 cm/s es una
evidencia de que el verdadero valor de la media  es realmente 50 cm/s; esto
es, tal evidencia apoya la hipótesis nula Ho. Por otra parte, una media
muestral muy diferente de 50 cm/s constituye una evidencia que apoya la
hipótesis alternativa H1. Por tanto, en este caso, la media muestral es el
estadístico de prueba.

La media muestral puede tomar muchos valores diferentes. Supóngase que si


48.5x 51.5, entonces no se rechaza la hipótesis nula Ho;  = 50 cm/s, y que si
x <48.5 ó x >51.5, entonces se acepta la hipótesis alternativa H1 ; 50 cm/s.
Los valores de x que son menores que 48.5 o mayores que 51.5 constituyen la
región crítica de la prueba, mientras que todos los valores que están en el
intervalo 48.5x 51.5 forman la región de aceptación. Las fronteras entre las
regiones crítica y de aceptación reciben el nombre de valores críticos. La
costumbre es establecer conclusiones con respecto a la hipótesis nula Ho. Por
tanto, se rechaza Ho en favor de H1 si el estadístico de prueba cae en la región
crítica, de lo contrario, no se rechaza Ho .

Este procedimiento de decisión puede conducir a una de dos conclusiones


erróneas. Por ejemplo, es posible que el valor verdadero de la rapidez promedio
de combustión del agente propulsor sea igual a 50 cm/s. Sin embargo, para
todos los especímenes bajo prueba, bien puede observarse un valor del
estadístico de prueba x que cae en la región crítica. En este caso, la hipótesis
nula Ho será rechazada en favor de la alternativa H1cuando, de hecho, Ho en
realidad es verdadera. Este tipo de conclusión equivocada se conoce como
error tipo I.

El error tipo I se define como el rechazo de la hipótesis nula Ho cuando ésta es


verdadera. También es conocido como a ó nivel de significancia.

Si tuviéramos un nivel de confianza del 95% entonces el nivel de significancia


sería del 5%. Análogamente si se tiene un nivel de confianza del 90% entonces
el nivel de significancia sería del 10%.

Ahora supóngase que la verdadera rapidez promedio de combustión es diferente


de 50 cm/s, aunque la media muestral x caiga dentro de la región de
aceptación. En este caso se acepta Ho cuando ésta es falsa. Este tipo de
conclusión recibe el nombre de error tipo II.
El error tipo II ó error � se define como la aceptación de la hipótesis
nula cuando ésta es falsa.

Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones


diferentes que determinan si la decisión final es correcta o errónea.
Decisión Ho es verdadera H o es falsa
Aceptar Ho No hay error Error tipo II ó 
Rechazar Ho Error tipo I ó  No hay error

1. Los errores tipo I y tipo II están relacionados. Una disminución en la


probabilidad de uno por lo general tiene como resultado un aumento en la
probabilidad del otro.
2. El tamaño de la región crítica, y por tanto la probabilidad de cometer un error
tipo I, siempre se puede reducir al ajustar el o los valores críticos.
3. Un aumento en el tamaño muestral n reducirá y de forma simultánea.
4. Si la hipótesis nula es falsa,  es un máximo cuando el valor real del
parámetro se aproxima al hipotético. Entre más grande sea la distancia entre
el valor real y el valor hipotético, será menor .

PASOS PARA ESTABLECER UN ENSAYO DE HIPOTESIS


INDEPENDIENTEMENTE DE LA DISTRIBUCION QUE SE ESTE
TRATANDO

1. Interpretar correctamente hacia que distribución muestral se ajustan los datos


del enunciado.

2. Interpretar correctamente los datos del enunciado diferenciando los


parámetros de los estadísticos. Así mismo se debe determinar en este punto
información implícita como el tipo de muestreo y si la población es finita o
infinita.

3. Establecer simultáneamente el ensayo de hipótesis y el planteamiento gráfico


del problema. El ensayo de hipótesis está en función de parámetros ya que
se quiere evaluar el universo de donde proviene la muestra. En este punto se
determina el tipo de ensayo (unilateral o bilateral).

4. Establecer la regla de decisión. Esta se puede establecer en función del valor


crítico, el cual se obtiene dependiendo del valor de  (Error tipo I o nivel de
significancia) o en función del estadístico límite de la distribución muestral.
Cada una de las hipótesis deberá ser argumentada correctamente para
tomar la decisión, la cual estará en función de la hipótesis nula o Ho .

5. Calcular el estadístico real, y situarlo para tomar la decisión.

6. Justificar la toma de decisión y concluir.

Tipos de Ensayo
Se pueden presentar tres tipos de ensayo de hipótesis que son:
· Unilateral Derecho
· Unilateral Izquierdo
· Bilateral
Dependiendo de la evaluación que se quiera hacer se seleccionará el tipo de
ensayo.

· Unilateral Derecho. El investigador desea comprobar la hipótesis de un


aumento en el parámetro, en este caso el nivel de significancia se carga todo
hacia el lado derecho, para definir las regiones de aceptación y de rechazo.

Ensayo de hipótesis:
Ho H1
Ho; Parámetro x Región de
rechazo
H1; Parámetro x

Región de aceptación

Parámetro = x
· Unilateral Izquierdo: El investigador desea comprobar la hipótesis de una
disminución en el parámetro, en este caso el nivel de significancia se carga
todo hacia el lado izquierdo, para definir las regiones de aceptación y de
rechazo.
Ensayo de hipótesis: H1
Ho
Ho; Parámetro Región de
rechazo
x H1;
Parámetro x 
Región de aceptación

Parámetro = x

· Bilateral: El investigador desea comprobar la hipótesis de un cambio en el


parámetro. El nivel de significancia se divide en dos y existen dos
regiones
de rechazo.
Ensayo de hipótesis: Ho
H
1
H1
Ho; Parámetro = Región Región de
x H1; Parámetro de Rechazo
x rechazo
/2
/2
Región de aceptación

Parámetro = x
Para realizar los ejemplos y ejercicios de ensayo de hipótesis se recomienda
seguir los pasos mencionados anteriormente. Los ejemplos siguientes se
solucionarán por los pasos recomendados, teniéndose una variedad de
problemas en donde se incluirán a todas las distribuciones muestrales que se
han visto hasta aquí.

Ejemplos:
1. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año
pasado muestra una vida promedio de 71.8 años. Suponga una desviación
estándar poblacional de 8.9 años, ¿esto parece indicar que la vida media hoy
en día es mayor que 70 años? Utilice un nivel de significancia de 0.05.

Solución:
1. Se trata de una distribución muestral de medias con desviación estándar
conocida.
2. Datos:
=70 años
= 8.9 años
x = 71.8 años
n = 100
= 0.05
3. Ensayo de hipótesis
Ho; = 70 Ho
H1
Región de
años.
rechazo
H1; > 70
años.
= 0.05

Región de aceptación

= ZL = 1.645
4. Regla de decisión: 70
Si zR 1.645 no se rechaza
Ho.
Si zR> 1.645 se rechaza Ho.
5. Cálculos:
x �
Z  R 71.8 70
 8.9 2.02
() n
R
100
6. Justificación y decisión.
Como 2.02 >1.645 se rechaza Ho y se concluye con un nivel de significancia
del 0.05 que la vida media hoy en día es mayor que 70 años.

Existe otra manera de resolver este ejercicio, tomando la decisión en base


al estadístico real, en este caso la media de la muestra. De la formula de
la distribución muestral de medias se despeja la media de la muestra:
Z � x �  Z 70 (1.645)(8.9) 71.46
xL 
 l ()
L
()
L 100
n n H1
Región de
Ho rechazo
= 0.05
Región de aceptación

= 70 x L 71.46
Regla de decisión:
Si x R 71.46 No se rechaza Ho
Si x R > 71.46 Se rechaza Ho

Como la media de la muestral es de 71.8 años y es mayor al valor de la media


muestral límite de 71.46 por lo tanto se rechaza Ho y se llega a la misma
conclusión.

2. Una empresa eléctrica fabrica focos que tienen una duración que se
distribuye de forma aproximadamente normal con una media de 800 horas y
una desviación estándar de 40 horas. Si una muestra aleatoria de 30 focos
tiene una duración promedio de 788 horas, ¿muestran los datos suficiente
evidencia para decir que la duración media ha cambiado? Utilice un nivel de
significancia del 0.04.

Solución
:
1. Se trata de una distribución muestral de medias con desviación estándar
conocida.

2. Datos:
=800 horas
= 40 horas
x = 788 horas
n = 30
= 0.04

3. Ensayo de hipótesis Ho
Ho; = 800 horas H1
H1
H1; 800 horas
Región de Región de
rechazo Rechazo

/2 = 0.02
/2 = 0.02
Región de aceptación

4. Regla de
ZL = -2.052 = 800 ZL= 2.052
Decisión:
Si –2.052ZR2.052 No se rechaza Ho
Si ZR < -2.052 ó si Z R > 2.052 Se rechaza Ho

5. Cálculos:

x R � 788 800


Z   1.643
40
() n
R
30
6. Justificación y decisión:
Como –2.052-1.643 2.052 por lo tanto, no se rechaza Ho y se concluye
con un nivel de significancia del 0.04 que la duración media de los focos no
ha cambiado.

Solución por el otro método:


Z( (2.052)(40)
x L �  l 800  785.02 y 814.98
)  30
n Ho
H1
H1

Región Región
de de
rechazo Rechazo

/2 = 0.02 /2 = 0.02


Región de aceptación

x L 785.02 = 800 x L 814.98


Regla de
decisión:
Si 785.02 x R 814.98 No se rechaza Ho

Si x R < 785.02 ó x R > 814.98 se rechaza Ho

Como la x = 788 horas, entonces no se rechaza Ho y se concluye que la


R
duración media de los focos no ha cambiado.

3. Una muestra aleatoria de 64 bolsas de palomitas de maíz pesan, en pomedio


5.23 onzas con una desviación estándar de 0.24 onzas. Pruebe la hipótesis
de que = 5.5 onzas contra al hipótesis alternativa,  < 5.5 onzas en el nivel
de significamcia de 0.05.

Solución:
1. Se trata de una distribución muestral de medias con desviación estándar
desconocida, pero como el tamaño de muestra es mayor a 30 se
puede tomar la desviación muestral como un estimador puntual para la
poblacional.

2. Datos:
= 5.5 onzas
s= 0.24 onzas
x = 5.23 onzas
n = 64
= 0.05 H1
Ho
Región de
3. Ensayo de hipótesis rechazo

Ho; = 5.5 onzas


H1; < 5.5 onzas = 0.05
Región de aceptación

ZL= -1.645 = 5.5


4. Regla de decisión:
Si ZR -1.645 No se rechaza Ho
Si ZR < -1.645 Se rechaza Ho

5. Cálculos:
x �
Z R 5.23 5.5
  0.24
() n
R
9
6. Justificación y decisión: 64
Como –9 < -1.645 por lo tanto se rechaza Ho y se concluye con un nivel de
significancia del 0.05 que las bolsas de palomitas pesan en promedio menos
de 5.5 onzas.

Solución por el otro


método: Z (1.645)(0.24)
()
x L � 
l
5.5 5.45
 64
H1 n
Ho
Región de
rechazo

= 0.05
Región de aceptación

x L 5.45 = 5.5

Regla de decisión:
Si x R 5.45 No se Rechaza Ho
Si x R < 5.45 Se rechaza Ho

Como la x = 5.23 y este valor es menor que 5.45 pot lo tanto se rechaza Ho.
R

4. Un constructor afirma que se instalan bombas de calor en 70% de todas las


casas que se construyen hoy en día en la ciudad de Richmond. ¿Estaría de
acuerdo con esta afirmación si una investigación de casas nuevas en esta
ciudad muestra que 8 de 15 tienen instaladas bombas de calor? Utilice un
nivel de significancia de 0.10.

Solución:
1. Se trata de una distribución muestral de proporciones.
2. Datos:
P= 0.70
p = 8/15 = 0.5333
n = 15
= 0.10
3. Ensayo de hipótesis H1; P 0.70
Ho; P = 0.70
Ho
H 1
H1
Región de Región de
rechazo Rechazo

/2 = 0.05 /2 = 0.05


Región de aceptación

ZL= -1.645 P = 0.70 ZL = 1.645

4. Regla de
Decisión:
Si –1.645ZR1.645 No se rechaza Ho
Si ZR < -1.645 ó si Z R > 1.645 Se rechaza Ho

5. Cálculos
:
p P 0.533 0.70
Z R  Pq  (0.70)(0.30) 1.41
n 15
6. Justificación y decisión:
Como –1.645-1.411.645 No se rechaza Ho y se concluye con un nivel de
significancia de 0.10 que la afirmación del constructor es cierta.

Solución por el otro método:


Pq (0.70)(0.30)
p L P 0.70 1.645 = 0.505 y 0.894
n 15
z L
Ho
H1
H1

Región Región
de de
rechazo Rechazo

/2 = 0.05 /2 = 0.05


Región de
aceptación
pL = 0.894
pL = 0.505 P = 0.70
Regla de
decisión:
Si 0.505pR0.894 No se rechaza Ho
Si p R < 0.505 ó si ZR > 0.894 Se rechaza Ho

Como el valor del estadístico real es de 0.533 por lo tanto no se rechaza Ho y se


llega a la misma conclusión.

5. Un fabricante de semiconductores produce controladores que se emplean en


aplicaciones de motores automovilísticos. El cliente requiere que la fracción
de controladores defectuosos en uno de los pasos de manufactura críticos no
sea mayor que 0.05, y que el fabricante demuestre esta característica del
proceso de fabricación con este nivel de calidad, utilizando = 0.05. El
fabricante de semiconductores toma una muestra aleatoria de 200
dispositivos y encuentra que cuatro de ellos son defectuosos. ¿El fabricante
puede demostrar al cliente la calidad del proceso?

Solución:
1. Se trata de una distribución muestral de proporciones.

2. Datos:
P=
0.05
p = 4/200 = 0.02
n = 200
=
0.05

3. Ensayo de hipótesis
Ho; P = 0.05
H1
H1; P < 0.05 Ho
Región de
rechazo

= 0.05
Región de aceptación

ZL= -1.645 P = 0.05

4. Regla de decisión:
Si ZR -1.645 No se rechaza Ho
Si ZR < -1.645 Se rechaza Ho

5. Cálculos:
p P 0.02 0.05
Z R 
Pq  (0.05)(0.95) 1.946
n 200
6. Justificación y decisión:
Puesto que –1.946<-1.645, se rechaza Ho y se concluye con un nivel
de significancia del 0.05 que la fracción de artículos defectuosos es menor
que
0.05.

6. Un diseñador de productos está interesado en reducir el tiempo de secado de


una pintura tapaporos. Se prueban dos fórmulas de pintura; la fórmula 1 tiene
el contenido químico estándar, y la fórmula 2 tiene un nuevo ingrediente
secante que debe reducir el tiempo de secado. De la experiencia se sabe
que la desviación estándar del tiempo de secado es ocho minutos, y esta
variabilidad inherente no debe verse afectada por la adición del nuevo
ingrediente. Se pintan diez especímenes con la fórmula 1, y otros diez con la
fórmula 2. Los dos tiempos promedio de secado muestrales son 121 min y
112 min respectivamente. ¿A qué conclusiones puede llegar el diseñador del
producto sobre la eficacia del nuevo ingrediente, utilizando = 0.05?
Solución:
1. Se trata de una distribución muestral de diferencia de medias con desviación
estándar
conocida.

2. Datos:
1=2=
8
x1 121min
x 2 112 min
n1=n2= 10
=
0.05

3. Ensayo de hipótesis
Ho; 1-2 = 0
H1; 1-2 > 0 Se desea rechazar Ho si el nuevo ingrediente disminuye el
tiempo promedio de secado, por eso se pone la diferencia mayor a cero o
sea positiva para poder probar que 2 es menor que 1.
H1
Ho
Región de
rechazo

= 0.05

Región de aceptación

 1-2 =0 ZL = 1.645

4. Regla de decisión:
Si zR 1.645 no se rechaza Ho.
Si zR> 1.645 se rechaza Ho.

5. Cálculos:
(x 1 x 2) (� 1 �2 ) (121 112)  0
ZR   2.52
()
2
() 2 82 82
1
2 
n1 n2 10 10

6. Justificación y decisión:
Puesto que 2.52>1.645, se rechaza Ho , y se concluye con un nivel de
significancia de 0.05 que la adición del nuevo ingrediente a la pintura si
disminuye de manera significativa el tiempo promedio de secado.
Solución por el otro método:
2 2 2 2

( x1 x 2 ) (� � ) () 1 () 0 8 8 5.88


10 10
-

L 1 2 z 1
1.645
n1 n2
H1
Ho
Región de
rechazo

= 0.05

Región de aceptación

 1-2 =0
x1 x2 5.88

Regla de decisión:
Si ( x1 x 2 ) R 5.88 No se rechaza Ho
Si( x1 x 2 ) > 5.88 Se rechaza Ho
R

Puesto ( x1 x 2 ) R = 121-112 = 9 y este número es mayor a 5.88 por lo tanto


que
se rechaza Ho .

7. Se utilizan dos máquinas para llenar botellas de plástico con un volumen neto
de 16.0 onzas. Las distribuciones de los volúmenes de llenado pueden
suponerse normales, con desviaciones estándar 1= 0.020 y 2 = 0.025
onzas. Un miembro del grupo de ingeniería de calidad sospecha que el
volumen neto de llenado de ambas máquinas es el mismo, sin importar si
éste es o no de 16 onzas. De cada máquina se toma una muestra aleatoria
de 10 botellas. ¿Se encuentra el ingeniero en lo correcto? Utilice = 0.05

MAQUINA MAQUINA 2
16.03 1 16.01 16.0 16.03
16.04 15.96 15.9 16.04
16.05 15.98 7
15.9 16.02
16.05 16.02 6
16.0 16.01
16.02 15.99 115.99 16.00

Solución:
1. Se trata de una distribución muestral de diferencia de medias con desviación
estándar conocida.

2. Datos: 1.
1= 0.020
2= 0.025
x1 16.015
máquina
Este dato se obtuvo calculando la media de los datos en la
x 2 16.005 Este dato se obtuvo calculando la media de los datos en la
máquina
2.
n1=n2 = 10
= 0.05

3. Ensayo de hipótesis
Ho; 1-2 = 0
H1; 1-2 0 Si se cae en Ho se podrá probar que el volumen de llenado es el
mismo en las dos máquinas.

Ho
H
1
H1
Región Región de
de Rechazo
rechazo

/2 = 0.025 /2 = 0.025


Región de aceptación

ZL= -1.96 = ZL= 1.96


0
4. Regla de
Decisión:
Si –1.96ZR1.96 No se rechaza Ho
Si ZR < -1.96 ó si Z R > 1.96 Se rechaza Ho

5. Cálculos:
(x 1 x 2) (�1 �2 ) (16 .015 16.005)  0
ZR   0.987
0.020 2 0.025 2
2()
2
()
1
2 
n1 n2 10 10

6. Justificación y decisión:
Como –1.960.9871.96 entonces no se rechaza Ho y se concluye con un nivel
de significancia de 0.05 que las dos máquinas tienen en promedio la misma
cantidad de llenado.

Solución por el otro método:


2 2 2 2

() 1 () 0 0.020 0.025 -0.019 y 0.019


( x 2 ) (� � )
10  10
-

x1 L 1 2 z 1
1.96
n1 n2
Ho
H1
H1
Región de rechazo
egión de Rechazo
R

/2 = 0.025 /2 = 0.025


Región de aceptación

(x1 x2 ) = 0 ( x1 x 2 ) 0.019


0.019
Regla de decisión:
Si –0-019( x1 x 2 ) R 0.019 No se rechaza Ho
Si ( x1 x 2 ) R < -0.019 ó ( x1 x 2 ) R > 0.019 Se rechaza Ho

Como ( x x ) = 16.015 – 16.005 = 0.01, entonces cae en la región de


1 2 R

aceptación y no se rechaza Ho.

8. Existen dos tipos de plástico apropiados para su uso por un fabricante de


componentes electrónicos. La tensión de ruptura de ese plástico es un
parámetro importante . Se sabe que 1=2= 1.0 psi. De una muestra
aleatoria
de tamaño 10 y 12 para cada plástico respectivamente, se tiene una media
de 162.5 para el plástico 1 y de 155 para el plástico 2. La compañía no
adoptará el plástico 1 a menos que la tensión de ruptura de éste exceda a la
del plástico 2 al menos por 10 psi. Con base a la información contenida en la
muestra, ¿la compañía deberá utilizar el plástico 1? Utilice = 0.05 para
llegar a una decisión.

Solución:
1. Se trata de una distribución muestral de diferencia de medias con desviación
estándar
conocida.

2. Datos:
1=2= 1.0
psi
x1 162.5 psi
x 2 155 psi
n1=
10
n2=
12
=
0.05

3. Ensayo de hipótesis

Ho; 1-2 = 10
H1; 1-2 > 10 Se desea rechazar Ho si la media del plástico 1 supera a
la
media del plástico 2 en por lo menos 10
psi.

H1
Ho
Región de
rechazo

= 0.05

Región de aceptación

 1-2=10 ZL = 1.645
4. Regla de decisión:
Si zR 1.645 no se rechaza Ho.
Si zR> 1.645 se rechaza Ho.

5. Cálculos:
(x 1 x 2) (�1 �2 ) (162.5 155) 10
ZR   5.83
2()
2 2 2
() 1 1
1
 2 
n1 n 2 10 12

6. Justificación y decisión:
No existe evidencia suficiente para apoyar el uso del plástico 1 ya que
–5.831.645, por lo tanto no se rechaza Ho .

Solución por el otro método:


2 2 2 2

( x1 x 2 ) (� � ) () 1 () 10 1 1 10.70


10 12
-

L 1 2 z 1
1.645
n1 n2
H1
Ho Región de
rechazo

= 0.05

Región de aceptación

 1-2=10
x1 x 2 10.70

Regla de decisión:
Si ( x1 x 2 ) R 10.70 No se rechaza Ho
Si( x1 x 2 ) > 10.70 Se rechaza Ho
R

Puesto que ( x1 x 2 ) R = 162.5-155 = 7.5 y este número es no es mayor a 10.7


por lo tanto no se rechaza Ho.

9. Se evalúan dos tipos diferentes de soluciones para pulir, para su posible uso
en una operación de pulido en la fabricación de lentes intraoculares utilizados
en el ojo humano después de una cirugía de cataratas. Se pulen 300 lentes
con la primera solución y, de éstos, 253 no presentaron defectos inducidos
por el pulido. Después se pulen otros 300 lentes con la segunda solución, de
los cuales 196 resultan satisfactorios. ¿Existe alguna razón para creer que
las dos soluciones para pulir son diferentes? Utilice = 0.01
Solución:
1. Se trata de una distribución muestral de diferencia de proporciones.

2. Datos:
p1= 253/300= 0.8433
p2 = 196/300=
0.6533 n1=n2 = 300

3. Ensayo de hipótesis:
Ho; P1-P 2 = 0 Ho
H1; P1-P 2 0 H1
H1

Región Región
de de
rechazo Rechazo

/2 = 0.005 /2 = 0.005


Región de aceptación

ZL= -2.575 PP = 0 ZL = 2.575

4. Regla de Decisión:
Si –2.575ZR2.575 No se rechaza Ho
Si ZR < -2.575 ó si Z R > 2.575 Se rechaza Ho

5. Cálculos:
( p p ) (P P )
1 2 1 2
Z  R
P1 q1 P2 q 2
n1 n 2
En esta fórmula se puede observar que en el denominador se tienen a las
proporciones poblacionales o sea los parámetros, los cuales no se conocen,
por lo que en el ensayo de hipótesis la fórmula para poder calcular la
ZR cambia, estimando a el parámetro común P de la siguiente forma:

x x
1 2
ó bien P n1 p1 n2
P n n p 2 n n
1 2  1 2

Entonces la fórmula de Z R quedaría de la siguiente manera:


( p p
) - P)
(P
1 2 1 2
ZR 
 1 1 
Pq n n 
 1 2 

Se calculará el valor de P: x x


P  1 2
n1 n 2 253 196
 0.7483
300 300

( p1 p2 ) ( P P ) (0.8433 0.6533) 0


ZR  1
1
1
2
 5.36
  
Pq (0.7483)(0.2517)
 1  1 
  
n1 n2 300 300 

6. Justificación y decisión:
Puesto que 5.36>2.575, se rechaza la hipótesis nula y se concluye con un
nivel de significancia de 0.01 que los dos fluidos para pulir son diferentes.

[Link] tomará el voto entre los residentes de una ciudad y el condado


circundante para determinar si se debe construir una planta química
propuesta. El lugar de construcción está dentro de los límites de la ciudad
y por esta razón muchos votantes del condado consideran que la
propuesta pasará debido a la gran proporción
de votantes que favorecen la construcción.
Para determinar si hay una diferencia significativa en la proporción de
votantes de la ciudad y votantes del condado que favorecen la propuesta, se
realiza una encuesta. Si 120 de 200 votantes de la ciudad favorecen la
propuesta y 240 de 500 residentes del condado también lo hacen,
¿estaría de acuerdo en que la proporción de votantes de la ciudad que
favorecen la propuesta es más alto que la proporción de votantes del
condado? Utilice un nivel de significancia de 0.025.

Solución:
1. Se trata de una distribución muestral de diferencia de proporciones.

2. Datos:
p1 = 120/200=
0.60 p2 =
240/500= 0.48 n1
= 200
n2 =
500

3. Ensayo de
hipótesis: Ho; P1-P2
=0
H1; P1-P 2 > 0
H1
Región de
Ho rechazo

= 0.025
Región de aceptación

P1-P2=0 ZL = 1.96
4. Regla de decisión:
Si zR 1.96 no se rechaza Ho.
Si zR> 1.96 se rechaza Ho.

5. Cálculos:
Se calculará el valor de P:

x x x1 x 2 120


P  1 2 120 240 0.51
n1  0.51 P n1  240
n 2  n 2 200
200 500 500

( p1 p2 ) (P1 P2 ) ( 0.60 0.48) 0


ZR  1 1  2.9
Pq   (0.51)(0.49) 1  1 
 
n1 n 2  200 500 

6. Justificación y decisión:
Puesto que 2.9>1.96, se rechaza la hipótesis nula y se concluye con un nivel
de significancia de 0.025 que la proporción de votantes de la ciudad a favor
de la propuesta es más alta que la proporción de votantes del condado.

Uso de valores P para la toma de decisiones

Al probar hipótesis en las que la estadística de prueba es discreta, la región


crítica se puede elegir de forma arbitraria y determinar su tamaño. Si  es
demasiado grande, se puede reducir al hacer un ajuste en el valor crítico. Puede
ser necesario aumentar el tamaño de la muestra para compensar la disminución
que ocurre de manera automática en la potencia de la prueba (probabilidad de
rechazar Ho dado que una alternativa específica es verdadera).

Por generaciones enteras de análisis estadístico, se ha hecho costumbre elegir


un nivel de significancia de 0.05 ó 0.01 y seleccionar la región crítica en
consecuencia. Entonces, por supuesto, el rechazo o no rechazo estricto de
Ho dependerá de esa región crítica. En la estadística aplicada los usuarios
han adoptado de forma extensa la aproximación del valor P. La aproximación
se diseña para dar al usuario una alternativa a la simple conclusión de
“rechazo” o “no rechazo”.

La aproximación del valor P como ayuda en la toma de decisiones es bastante


natural pues casi todos los paquetes de computadora que proporcionan el
cálculo de prueba de hipótesis entregan valores de P junto con valores de la
estadística de la prueba apropiada.

· Un valor P es el nivel (de significancia) más bajo en el que el valor


observado de la estadística de prueba es significativo.
• El valor P es el nivel de significancia más pequeño que conduce al rechazo

de la hipótesis nula Ho.

• El valor P es el mínimo nivel de significancia en el cual Ho sería rechazada


cuando se utiliza un procedimiento de prueba especificado con un conjunto dado
de información. Una vez que el valor de P se haya determinado, la conclusión
en cualquier nivel  particular resulta de comparar el valor P con 

1. Valor P ≤⇒rechazar Ho al nivel .

2. Valor P > ⇒No rechazar Ho al nivel .

Ensayo Unilateral Derecho:

Valor P

Z= 0
ZR ó calculada

Ensayo Unilateral Izquierdo:

Valor P

Z= 0
ZR ó calculada

Ensayo Bilateral:

Valor P = Suma de las dos áreas


ZR , -ZR calculadas
Ejemplos:
1. Calcular el valor de P para el primer ejemplo de ensayo de hipótesis en
donde se quería probar que la edad media de los habitantes de Estados
Unidos es superior a 70 años.

Solución:

1. Ensayo de hipótesis
Ho; = 70 años. H1
H1; > 70 años. Región de
rechazo
Ho
= 0.05

Región de aceptación

= ZL = 1.645
2. Regla de decisión: 70
Si P0.05 se rechaza Ho.
Si P > 0.05 No se rechaza
Ho.

3. Cálculos:
x R �
Z  71.8 70
 8.9 2.02
() n
R
100
Esta es el valor de Z que se utilizará para calcular el valor de P, como es un
ensayo unilateral derecho se calculará el área a la derecha de este valor.

Valor P = 0.0217

Z= 0
ZR = 2.02
4. Justificación y decisión:
Como el valor de P es 0.217 y es menor al valor del nivel de significancia de
0.05 por lo tanto se rechaza H0 , y se concluye que la edad media de los
habitantes es mayor a 70 años.

2. Calcular el valor de P para el ejemplo 7 de esta sección en donde se tiene


dos máquinas y se quiere ver si tienen la misma cantidad promedio de
llenado en las botellas de plástico.

Solución:
1. Ensayo de hipótesis
Ho; 1-2 = 0
H1; 1-2 0 Si se cae en Ho se podrá probar que el volumen de llenado es el
mismo en las dos máquinas.

Ho
H1
H1
Región Región
de de
rechazo Rechazo

/2 = 0.025 /2 = 0.025


Región de aceptación

ZL= -1.96 = ZL= 1.96


2. Regla de 0
Decisión:
Si P0.05 Se rechaza Ho
Si P > 0.05 No se rechaza Ho

3. Cálculos:
(x 1 x 2) (�1 �2 ) (16 .015 16.005)  0
ZR   0.987
0.020 2 0.025 2
()
2
() 2
1
2 
n1 n2 10 10
Como este es un ensayo bilateral se procederá a calcular el valor de P mediante
el valor de la ZR, positiva y negativa y luego se sumarán las áreas.
Valor P = 0.1618 + 0.1618 = 0.3236

ZR = -0.987 ZR = 0.987
Como el valor de P es mayor al de , se no se rechaza H0, y se concluye que las
maquinas tienen el mismo llenado promedio.

3. Se afirma que un automóvil se maneja en promedio más de 20,000


kilómetros por año. Para probar esta afirmación, se pide a una muestra de
100 propietarios de automóviles que lleven un registro de los kilómetros que
viajen. ¿Está de acuerdo con esta afirmación si la muestra aleatoria tiene un
promedio de 23,500 kilómetros y una desviación estándar de 3900
kilómetros? Utilice un valor P para su conclusión.

Solución:
En este ejercicio no nos manejan ningún valor de por lo que se procederá a
plantear el ensayo y luego calcular z para poder conocer el valor de P y llegar a
una conclusión.
1. Ensayo de hipótesis
Ho; = 20,000 kilómetros.
H1; > 20,000 kilómetros.

2. Cálculos:
x R �
Z  23500 20000
 3900 8.97
() n
R
100
3. Decisión.
Se observa que este valor de Z es muy grande, ni siquiera se encuentra en la
tabla, entonces quiere decir que el área a la derecha de ese valor es cero y
este sería el valor de P, por lo que no apoya a la hipótesis nula y se
concluye que los automóviles se manejan en promedio más de 20,000
kilómetros por año.

4. Se estudia la fracción de circuitos integrados defectuosos producidos en un


proceso de fotolitografía. Para ello se somete a prueba una muestra de 300
circuitos, en la que 13 son defectuosos. Utilice los datos para probar
Ho: P=0.05 contra H1: P0.05. Utilice un valor de P para su conclusión.

Solución:
1. Ensayo de hipótesis
Ho; P = 0.05
H1; P 0.05
2. Cálculos:
ZR p P 0.043 0.05
 Pq  (0.05)(0.95) 0.53
n 300
Valor P = 0.298 + 0.298 = 0.596

ZR = -0.53 ZR = 0.53

3. Decisión:
Este valor de P de 0.596 es muy grande por lo que se concluye que la
fracción defectuosa de circuitos integrados es de 0.05, o sea no se rechaza
Ho.
ERROR TIPO II ó �

Al evaluar un procedimiento de prueba de hipótesis, también es importante


examinar la probabilidad del error tipo II, el cual se denota por . Esto es,

= P(error tipo II) = P(aceptar Ho / Ho es falsa)

Para calcular  se debe tener una hipótesis alternativa específica; esto es, debe
tenerse un valor particular del parámetro. Por ejemplo, supóngase que es
importante rechazar la hipótesis nula Ho: = 50 cada vez que la rapidez
promedio de combustión  es mayor que 52 cm/s o menor que 48 cm/s. Para
ello, puede calcularse la probabilidad  de un error tipo II para los valores  = 52
y = 48, y utilizar este resultado para averiguar algo con respecto a la forma en
que se desempeñará la prueba. De manera específica, ¿cómo trabajará el
procedimiento de prueba si se desea detectar, esto es, rechazar Ho , para
un
valor medio de = 52 ó = 48? Dada la simetría, sólo es necesario evaluar
uno
de los dos casos, esto es, encontrar la probabilidad de aceptar la hipótesis nula
Ho: = 50 cuando el valor verdadero es = 52.

Para hacer este cálculo se tendrá un tamaño de muestra de 10 y una desviación


estándar de la población de 2.5 cm/s. Además se evaluará el error tipo II con un
nivel de significancia de 0.06.

Ho: = 50
H1: 50

Como ya sabemos se trata de un ensayo bilateral por lo que se tendrá que


calcular el valor del estadístico x L de la siguiente manera:

Z (1.88)(2.5)
x L �  50  48.51 y 51.48
l () 10

n

Para facilitar los cálculos se redondearán estos números a 48.5 y 51.5


Ho
1H
H1
Región Región
de de
rechazo Rechazo

/2 = 0.03 /2 = 0.03


Región de aceptación xL
x L 48.5 = 50
51.5
Para poder comprender mejor el cálculo del error tipo II se delimitará el área de
la región de aceptación con dos líneas ya que es bilateral y se evaluará la
probabilidad de caer en esa área cuando la media tiene un valor de 52 y de 48.
Ho
H
1
H1
Región Región
de de
rechazo Rechazo

/2 = /2 = 0.03


0.03
Región de aceptación

48.5 52
x L 48.5 = 50 51. z 
5
4.43
xL 2.5
� = 0.2643
10

51.5 52
z  0.63
2.5
10

= 52
� = 0.2643 48.5 48
z  2.5 0.63
10
51.5 48
z  2.5 4.43
10
= 48
Como se puede observar en cada calculo del valor  se tuvieron que evaluar los
dos valores de z. En el primer calculo de  se tiene un valor de z=-4.43, esto
quiere decir que no existe área del lado izquierdo del 48.5, por lo que  sólo
será el área que corresponda a la z=-0.63. Lo mismo pasa con el segundo
cálculo de
. Como las medias de 52 y 48 son equidistantes del 50 por este motivo los
valores del error tipo II son los mismos.
En caso que no estén equidistantes se tienen que calcular por separado y
calcular los valores correspondientes de z porque en ocasiones se tiene un área
que no está dentro de la región de aceptación, la cual no se tiene que tomar en
cuenta para evaluar al error tipo II.
A continuación se procederá a generar algunas curvas características de
operación para evaluar al error tipo II, entre más se aleja el valor verdadero de la
media de la media de la hipótesis nula, menor es la probabilidad del error tipo II
para un tamaño de muestra y nivel de significancia dadas. A medida que
el tamaño de la muestra aumenta la probabilidad de cometer el error tipo II
disminuye. Esto se observará en los ejercicios siguientes.

Ejemplos:

1. Generar una curva característica de operación para el ejercicio número 1 de


la sección de ensayo de hipótesis con las siguientes medias supuestas:
= 70.5, 71, 71.5, 72, 72.5, 73, 73.5, y 74.
2. Datos:
=70 años
= 8.9 años
x = 71.8 años
n = 100
= 0.05

3. Ensayo de hipótesis
Ho; = 70 años. H1
H1; > 70 años. Ho Región de
rechazo

= 0.05

Región de aceptación

= ZL = 1.645
Se calculará el estadístico 70
límite:

Z (1.645)(8.9)
x L �  70 71.46
l () 100

n

H1
Ho Región de
rechazo

= 0.05

xL 71.46
Región de aceptación

=
70
�= 71.46 70.5
0.8599
z  8.9 1.08
100

= 70.5

�=
0.6974
71.46 71
z  8.9
0.517
100

= 71
71.46 71.5
�= z  8.9 0.044
0.4824
100

= 71.5

71.46 72
z  0.606
�= 8.9
0.2722
100

= 72

�=
0.1214 71.46 72.5
z  8.9 1.168
100

= 72.5

�= 71.46 73
0.0418 z  8.9 1.73
100

= 73

71.46 73.5
z  8.9 2.29
�= 0.011
100

= 73.5

�= 71.46 74
0.0021 z  8.9 2.85
100

= 74
CURVA CARACTERISTICA DE OPERACION

1
Probabilidad error tipo II 0.9 0.9
5 0.8599
0.8
0.7 0.6974
0.6
0.5
0.4824
0.4
0.3
0.2722
0.2
0.1 0.1214
0 0.0418
0.011 0.0021
70 70.5 71 71.5 72 72.5 73 73.5 74 74.5
Valor de la media

En la mayoría de los libros de estadística existen las curvas características de


operación para diferentes tamaños de muestra y éstas se proporcionan tanto
para = 0.05 como para = 0.01 (son las más comunes). Para poder utilizar
las
curvas se define un parámetro llamado d, que estandariza para cualquier valor
de y :
�  � o
d |o |
()  ()

Si se quisiera consultar en un libro, ¿cuál es la probabilidad de cometer el error


tipo II ó  cuando la media verdadera es de 72?; se tendría que calcular el
valor de d y buscar en las curvas la que pertenezca a un tamaño de muestra
de 100
con un =
0.05.

72 70
d | 2 = 0.2247
8.9 
|
8.9

Este valor se encuentra en el eje de las x. Si se transforma la curva


característica de operación con el valor de d quedaría de la siguiente manera:
Probabilidad error tipo II
CURVA CARACTERISTICA DE OPERACION

1
0.95
0.8 0.8599
0.6974
0.6
0.4824
0.4

0.2 0.2722
0.1214
0 0.0021
0 0.1 0.2 0.3 0.4 0.5

Se comentó anteriormente que si el tamaño de la muestra aumenta los dos tipos


de errores  y  disminuyen. Para probar esto y específicamente en lo que se
refiere al error tipo II se realizará el ejercicio anterior suponiendo que en lugar de
tener 100 personas, el tamaño de la muestra aumenta a 150 personas.

Se calculará el estadístico
límite:

Z (1.645)(8.9)
x L �  70 71.2
l () 150

n

H1
Ho
Región de
rechazo

= 0.05

Región de aceptación

= 70 x L 71.2

�= 71.2 70.5
0.8322 z  8.9 0.963
150

= 70.5
71.2 71
�= 0.6083 z  0.275
8.9
150

= 71

�= 0.3407
71.2 71.5
z  8.9 0.412
150

= 71.5

�= 0.1356 71.2 72


z  1.10
8.9
150

= 72

�= 0.0367

71.2 72.5
z  8.9
1.79
150
= 72.5

�= 0.0067
71.2 73
z  2.47
8.9
150
= 73

�= 0.0007
71.2 73.5
z  8.9 3.16
150

= 73.5
Probabilidad error tipo II
CURVA CARACTERISTICA DE OPERACION

1
0.9
0.8
0.7
0.6
0.5 n=100
0.4 n=150
0.3
0.2
0.1
0

70 70.5 71 71.5 72 72.5 73 73.5 74 74.5


Valor de la media

3. Generar una curva característica de operación (CCO) para el ejercicio 5 de


ensayo de hipótesis. Suponer los siguientes valores de P; 0.04, 0.03, 0.025,
0.02 y 0.01. Enseguida se proporciona la información necesaria para realizar
la CCO:

Datos:
P= 0.05
p = 4/200 = 0.02
n = 200
= 0.05

Ensayo de hipótesis
Ho; P = 0.05
H1
H1; P < 0.05 Ho
Región de
rechazo

= 0.05
Región de aceptación

ZL= -1.645 P = 0.05

Solución:
Se procederá a calcular el estadístico límite p L:
Pq (0.05)(0.95)
p L P 0.05 0.0246
1.645 200
z n
H1
Ho
Región de
rechazo

= 0.05
Región de aceptación

pL = 0.0246 P = 0.05
0.0246 1.11
z  �=0.8665
0.04
( 0.04)(
0.96)
200

P = 0.04

�=0.6725
0.0246 0.447
z 
0.03
(0.03)
(0.97)
200
P = 0.03

�=0.5143
0.0246 0.025
z  (0.025)(0.975)
0.036
200

P = 0.025

�=0.3213
0.0246
z  0.46
0.02 4
(0.02)(0.98)
200

P = 0.02
�=0.0189
0.0246 2.075
z 
0.01
(0.01)(0.99)
200
P = 0.01
En una distribución muestral de proporciones, para graficar la CCO, se
necesita calcular el valor de np, que es el que irá en el eje de las x para
estandarizar la curva.

Probabilidad error tipo II CURVA CARACTERISTICA DE OPERACION

1
0.9 0.95
0.8 0.8665
0.7
0.6725
0.6
0.5 0.5143
0.4
0.3 0.3213
0.2
0.1
0 0.0189
1 3 5 7 9

np

4. Genere un CCO para el ejercicio número 6 de la sección anterior. Suponga


las siguientes diferencias de medias: 1 -2 =2, 4, 6, 7, 9, 12 y 14.
Datos:
1=2=
8
x1 121min
x 2 112 min
n1=n2= 10
=
0.05

Ensayo de hipótesis
Ho; 1-2 = 0
H1; 1-2 >
0
H1
Ho Región de
rechazo

= 0.05

Región de aceptación

 1-2=0 ZL = 1.645

2 2
( x1 - x 2 ) (� � ) () 1 () 0 8 8 5.88
z 2
2
1.645 
1
L 1 2

n1 n2 10 10
H1
Ho
Región de
rechazo

= 0.05

Región de aceptación

 1-2=0
( x1 x 2 ) L 5.88

�=
0.8612 5.88 2
z  1.086
82 82

10 10

 1-
2=2
�= 0.70
5.88 4
z  8 2 8 2 0.526

10 10

 1-2 =4

5.88 0.033
z  2
6
�= 0.4868 8 82

10 10

 1-2 =6

5.88 0.313
z  2
7
8 82
�= 0.3768 
10 10

 1-2=7

5.88 9 0.873


z 
�= 0.1913 82 82

10 10
 1-2 =9
�= 0.0432 5.88 1.714
z 
12
82 82

10 10
 1-2=12

5.88 2.274
z  2
14
�= 0.011 8 82

10 10

 1-2 =14

Para graficar la curva se utilizará el valor de d, el cual para una distribución


muestral de diferencia de medias tiene la siguiente fórmula:
� 1 � 2 o
d 2 
() ()
2
() () 2
2
1 2 1 2
Probabilidad error tipo II

CURVA CARACTERISTICA DE OPERACION

1
0.9 0.95
0.8 0.8612
0.7 0.7
0.6
0.5
0.4868
0.4
0.3 0.3768
0.2
0.1913
0.1
0 0.0432 0.011
0 0.2 0.4 0.6 0.8 1 1.2 1.4

En los libros de estadística lo que se acostumbra en algunos de los ejercicios es


preguntar sólo un punto de la CCO, por lo que a continuación se resolverán
dos problemas tipo.

5. Se require que la tensión de ruptura de un hilo utilizado en la fabricación de


material de tapicería se al menos de 100 psi. La experiencia ha indicado que
la desviación estándar de la tensión de ruptura es de 2 psi. Se prueba una
muestra aleatoria de nueve especímenes, y la tensión de ruptura promedio
observada en ella es de 98 psi. ¿Cual es la probabilidad de aceptar la
hipótesis nula con un = 0.05 si la tensión promedio de ruptura verdadera de
la fibra es 104
psi?

Solución:
Ensayo de hipótesis:
Ho; = 100
H1; > 100

Se calcula el estadístico límite:

Z (1.645)(2)
x L �  100 101.09
l () 9

n

H1
Ho Región de
rechazo

= 0.05

Región de aceptación

= 100
xL
101.09
104 100
z  2
�= 0 6.32
10

= 104

6. Del ejercicio número 7 de la sección anterior encontrar el error tipo II ó 


suponiendo que la diferencia verdadera entre las medias de las máquinas es
fe 0.03

Datos:
1= 0.020
2= 0.025
x1 16.015
x 2 16.005
n1=n2 = 10
= 0.05
Solución:
Ensayo de hipótesis
Ho; 1-2 = 0
H1; 1-2 0

() () 0.020 2 0.025 2
( x 2 ) (� � ) 0 -0.019 y 0.019
10  10
- 2
x1 1 2 z 2 1
1 1.96
n1  n2
L

Ho
H
1
H1
Región Región
de de
rechazo Rechazo

/2 = 0.025 /2 = 0.025


Región de aceptación

(x1 x2 ) = 0 ( x1 x 2 ) 0.019


0.019

0.019 0.03 4.83


z
�= 0.1387 2 0.025 2
0.020

10 10

 1-2 =0.03
0.019 0.03
z 2 1.086
0.020 2 0.025

10 10

Por ser bilateral se calcularon dos valores de z, y como se puede observar del
lado izquierdo de –0.019 ya no se encuentra área, por lo que el error tipo II sólo
será el área a la izquierda del valor de la diferencia del estadístico límite 0.019.

Problemas propuestos
1. En un estudio para estimar la proporción de residentes de cierta ciudad y sus
suburbios que están a favor de la construcción de una planta de energía
nuclear, se encuentra que 63 de 100 residentes urbanos están a favor de la
construcción mientras que sólo 59 de 125 residentes suburbanos la
favorecen. ¿Hay una diferencia significativa entre la proporción de residentes
urbanos y suburbanos que favorecen la construcción de la planta nuclear?
Use un valor de P para su conclusión.

2. Una compañía petrolera afirma que un quinto de las casas en cierta ciudad
se calientan con petróleo. ¿Tenemos razón en dudar de esta afirmación si,
en una muestra aleatoria de 1000 casas en esta ciudad, se encuentra que
136 se calientan con petróleo? Utilice un nivel de significancia de 0.01.
3. Se sabe que la duración, en horas, de un foco de 75 watts tiene una
distribución aproximadamente normal, con una desviación estándar de 25
horas. Se toma una muestra aleatoria de 20 focos, la cual resulta tener una
duración promedio de 1014 horas.
a) ¿Existe evidencia que apoye la afirmación de que la duración promedio
del foco es mayor que 1000 horas? Utilice un = 0.05.
b) ¿Cual es el valor P para la prueba?
c) ¿Cuál es el valor de  para la prueba del inciso a) si la verdadera
duración promedio del foco es de 1050 horas?

4. Se estudia la tasa de combustión de dos propelentes sólidos utilizados en los


sistemas de escape de emergencia de aeroplanos. Se sabe que la tasa
de combustión de los dos propelentes tiene aproximadamente la misma
desviación estándar de 3 cm/s. Se prueban dos muestras aleatorias de 20
especímenes cada una, obteniéndose medias de 18 y 24 cm/s
respectivamente.
a) Pruebe la hipótesis de que los dos combustibles sólidos tienen la misma
rapidez promedio de combustión. Utilice un = 0.05.
b) ¿Cuál es el valor de P de la prueba?
c) ¿Cuál es el valor de  para la prueba del inciso a) si la verdadera
diferencia en la rapidez promedio de combustión es 2.5 cm/s?

5. Un artículo publicado en Fortune afirma que casi la mitad de todos los


ingenieros continúan sus estudios académicos después de obtener la
licenciatura. Un artículo publicado en Engineering Horizons indica que 117
de 484 recién graduados planean continuar sus estudios.
a) ¿Los datos publicados en Engineering Horizons son consistentes con los
publicados en Fortune?
b) Encuentre el valor de P de la prueba.

6. En un invierno con epidemia de gripe, una compañía farmacéutica bien


conocida estudió 2000 bebes para determinar si la nueva medicina de la
compañía era efectiva después de dos días. Entre 120 bebes que tenían
gripe y se les administró la medicina, 29 se curaron dentro de dos días. Entre
280 bebés que tenían gripe pero que no recibieron la medicina, 56 se curaron
dentro de dos días. ¿Hay alguna indicación significativa que apoye la
afirmación de la compañía de la efectividad de la medicina? Calcule el valor
P.

7. Se lanza 20 veces una moneda, con un resultado de cinco caras. ¿Esta es


suficiente evidencia para rechazar la hipótesis de que la moneda esta
balanceada a favor de la alternativa de que las caras ocurren menos de 50%
de las veces.? Realice la prueba con un nivel de significancia de 0.03 y cite
un valor P.
8. Se supone que los neumáticos para automóvil de cierto tipo recién comprados
deben llenarse a una presión de 30 lb/pulg 2 . Se representa con  el verdadero
promedio de presión. Encuentre el valor P asociado con cada
valor del estadístico z dado para probar Ho ; contra H1; 
a) 2.10 b) –1.75 c) –0.55 d) 1.41 e) –5.3

9. Se realizó un experimento para comparar la resistencia a la fractura del acero con


níquel maragizado, con el acero de pureza comercial del mismo tipo. Para 32
especímenes, la resistencia promedio muestral fue de 65.6 para el acero de alta
pureza, mientras que se obtuvo una media muestral de 59.8 en 38 especímenes del
acero comercial. Debido que el acero de alta pureza es más costoso, su uso para
cierta aplicación puede justificarse sólo si su resistencia a la fractura excede la del
acero de pureza comercial en más de
5. Suponga que ambas distribuciones de resistencias son normales.
a) Si se supone que 1 = 1.2 y 2 = 1.1, pruebe las hipótesis pertinentes
usando = 0.001.
b) Calcule para la prueba del inciso anterior cuando  

10. Se cree que la portada y la naturaleza de la primera pregunta de encuestas por


correo influyen en la tasa de respuesta. Un artículo probó esta teoría al experimentar
con diferentes diseños de portadas. Una portada sencilla, y la otra utilizó la figura de
un paracaidista. Los investigadores especularon que la tasa de devolución sería menor
para la portada sencilla.

Portada Número de envíos Número de devoluciones


Sencilla 2 104
Paracaidista 0
2 109
1
¿Esta información apoya la hipótesis de los investigadores? Haga la prueba con un
nivel de significancia de 0.10, calculando primero un valor P.

Respuesta a los Problemas propuestos


1. z= 2.40; sí, P=0.01
2. P<0.0001; concluir que menos de 1/5 de las casas se calientan con petróleo. 3. a) z
= 2.50; se rechaza Ho b) P = 0.0062 c) 0
4. a) Se Rechaza Ho, z= -6.32 b) 0 c) 0.248
5. a) Se rechaza Ho, z= -11.36 b) valor P = 0
6. No se rechaza Ho , z= 0.93, valor de P = 0.1762
7. Rechazar Ho. Valor P = 0.0207
8. a) 0.0358 b) 0.0802 c) 0.5824 d) 0.1586 e) 0
9. a) z=2.89, no se debe usar el acero de alta pureza o se no se rechaza Ho.
b) 0.2981
10. Valor P = 0.4247, no se rechaza Ho.

También podría gustarte