0% encontró este documento útil (0 votos)
48 vistas42 páginas

Modulo Completo Probabilidad

El documento presenta una introducción a la probabilidad, abordando conceptos fundamentales como experimentos aleatorios, sucesos, y técnicas de cálculo de probabilidades. Se explican las reglas para determinar probabilidades simples, conjuntas y condicionales, así como el uso de tablas de contingencia y el Teorema de Bayes. Además, se discuten diferentes enfoques de la probabilidad, incluyendo la clásica, empírica y subjetiva, junto con sus propiedades y ejemplos prácticos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
48 vistas42 páginas

Modulo Completo Probabilidad

El documento presenta una introducción a la probabilidad, abordando conceptos fundamentales como experimentos aleatorios, sucesos, y técnicas de cálculo de probabilidades. Se explican las reglas para determinar probabilidades simples, conjuntas y condicionales, así como el uso de tablas de contingencia y el Teorema de Bayes. Además, se discuten diferentes enfoques de la probabilidad, incluyendo la clásica, empírica y subjetiva, junto con sus propiedades y ejemplos prácticos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd

Universidad Nacional Autónoma de Nicaragua, Managua

Facultas Regional Multidisciplinaria, Matagalpa


UNAN FAREM MATAGLAPA

II Año de Banca y Finanzas


Modulo: Estadística I

Elaborado por:
Ing.: Adalberto Aurelio Membreño Mendoza.
Matagalpa, agosto 2021
ESTADÍSTICA

pág. 2
ESTADÍSTICA
Unidad II Probabilidad
Tema 3: Introducción al estudio de las Probabilidades.

Objetivos:
 Conocer el concepto de experimento y suceso aleatorio.
 Explicar los conceptos fundamentales del cálculo de probabilidades.

 Utilizar las reglas para determinar probabilidades simples, conjuntas y


condicionales.

 Distinguir entre eventos mutuamente excluyentes e independientes.

 Usar la tabla de contingencia o Diagrama de árbol para calcular probabilidades.

 Utilizar el Teorema de Bayes en el cálculo de probabilidades.

Contenido:

 Introducción.
 Conceptos Básicos: Experimento aleatorio, Espacio muestral, eventos,
Operaciones de eventos.

 Probabilidad.

 Técnicas de Conteo.

 Probabilidad Condicional.

 Tablas de Contingencia. Diagrama de Árbol.

 Teorema de Bayes.

A. Vivencia

INTRODUCCIÓN A LA PROBABILIDAD.

Las probabilidades constituyen una rama de las matemáticas que se ocupa de medir o
determinar cuantitativamente la posibilidad de que un suceso o experimento produzca un
determinado resultado. La probabilidad está basada en el estudio de la combinatoria y es
fundamento necesario de la estadística.

La creación de la probabilidad se atribuye a los matemáticos franceses del siglo XVII


Blaise Pascal y Pierre de Fermat, aunque algunos matemáticos anteriores, como

pág. 3
ESTADÍSTICA
Gerolamo Cardano en el siglo XVI, habían
aportado importantes contribuciones a su Experimentos o fenómenos aleatorios son
desarrollo. los que pueden dar lugar a varios resultados,
sin que pueda ser previsible enunciar con
La probabilidad matemática comenzó como un certeza cuál de éstos va a ser observado en
intento de responder a varias preguntas que la realización del experimento.
surgían en los juegos de azar, por ejemplo,
saber cuántas veces se han de lanzar un par de
dados para que la probabilidad de que salga
seis sea el 50 por ciento.

La probabilidad de un resultado se representa con un número entre 0 y 1, ambos


inclusive. La probabilidad 0 indica que el resultado no ocurrirá nunca, y la probabilidad 1
que el resultado ocurrirá siempre. Los problemas más sencillos estudian la probabilidad
de un suceso favorable en un experimento o acontecimiento con un número finito de
resultados, todos ellos con igual probabilidad de ocurrir.

La probabilidad matemática se utiliza mucho en las ciencias físicas, biológicas y sociales,


así como en el comercio y la industria. Se aplica a muchas áreas tan dispares como la
genética, la mecánica cuántica y los seguros. También estudia problemas matemáticos
teóricos de gran importancia y dificultad y está bastante relacionada con la teoría del
análisis matemático, que se desarrolló a partir del cálculo.

B. Fundamentación Científica
1. Experimentos aleatorios. Espacio muestral.

Si dejamos caer una piedra o la lanzamos, y conocemos las condiciones iniciales de


altura, velocidad, etc., sabremos con seguridad dónde caerá, cuánto tiempo tardará, etc.
Es una experiencia determinista. Si echamos un dado sobre una mesa, ignoramos qué
cara quedará arriba. El resultado depende del azar. Es una experiencia aleatoria.

La vida cotidiana está plagada de sucesos aleatorios. Muchos de ellos, de tipo sociológico
(viajes, accidentes, número de personas que acudirán a un gran almacén o que se
matricularán en una carrera...) aunque son suma de muchas decisiones individuales,
pueden ser estudiados, muy
ventajosamente, como
aleatorios. Espacio muestral es el conjunto formado por todos
los posibles resultados de un experimento aleatorio.
En adelante lo designaremos por S.

pág. 4
ESTADÍSTICA

A la colección de resultados que se obtiene en los experimentos aleatorios se le llama


espacio muestral.

Ejemplo 1:
Suceso aleatorio es un
acontecimiento que ocurrirá o no,
En un dado, del
dependiendo S={1,2,3,4,5,6}
azar.
En una moneda, S={C,+}

Para empezar, vamos a prestar atención a experiencias aleatorias sencillas como lanzar
dados o monedas, extraer cartas de una baraja, sacar bolas de urnas,...

Ejemplo 2:
Describe el espacio muestral asociado a cada uno de los siguientes experimentos
aleatorios:

a. Lanzar tres monedas.


b. Lanzar tres dados y anotar la suma de los puntos obtenidos.

c. Extracción de dos bolas de una urna que contiene cuatro bolas blancas y tres
negras.

d. El tiempo, con relación a la lluvia, que hará durante tres días consecutivos.

Solución:
a. Llamando C a obtener cara y X a la obtención de cruz, obtenemos el siguiente
espacio muestral:

S= {(CCC), (CCX), (CXC), (XCC), (CXX), (XCX), (XXC), (XXX)}

b. S={3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18}

c. Llamando B a sacar bola blanca y N a sacar bola negra, tenemos:

S={BB,BN,NN}

d. Si llamamos L al día lluvioso y N al día sin lluvia, para tres días consecutivos se
obtiene el siguiente espacio muestral:

S= {(LLL),(LLN),(LNL),(NLL),(LNN),(NLN),(NNL),(NNN)}

pág. 5
ESTADÍSTICA
2. Eventos o Sucesos. Operaciones con sucesos.
2.1. Sucesos.

En el Ejemplo 2 podemos ver que el espacio muestral asociado al lanzamiento de tres


dados y anotar la suma de los puntos obtenidos es:

S={3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18}

Podemos considerar algunos subconjuntos de S, por ejemplo:

A={5,10,15}
 Salir múltiplo de 5:
C={2,3,5,7,11,13,17}
 Salir número primo:
D={12,13,14,15,16,17,18}
 Salir mayor o igual que 12:
Todos estos subconjuntos

Los elementos de S se Suceso de un fenómeno o experimento aleatorio es cada


llaman sucesos uno de los subconjuntos del espacio muestral S.
individuales o sucesos
elementales.

También son sucesos el suceso vacío o suceso imposible, Ø, y el propio S, suceso


seguro.

Si S tiene un número finito, n, de elementos, el número de sucesos de S es 2 n.

2.2. Operaciones con sucesos.

Dados dos sucesos, A y B, se llaman:

Unión
es el suceso formado por todos los
elementos de A y todos los elementos de B.

Intersección
es el suceso formado por todos los
elementos que son, a la vez, de A y de B.

pág. 6
ESTADÍSTICA

Suceso
complemento El suceso =S - A se llama suceso
complemento de A.

Dos sucesos A y B, son mutuamente excluyentes cuando no tienen ningún elemento


común. Es decir, cuando = Ø (A y B son disjuntos)

Ejemplo 3:
Tenemos una urna con nueve bolas numeradas del 1 al 9. Realizamos el experimento,
que consiste en sacar una bola de la urna, anotar el número y devolverla a la urna.
Consideramos los siguientes sucesos: A="salir un número primo" y B="salir un número
cuadrado". Responde a las cuestiones siguientes:

a. Calcula los sucesos y .


b. Los sucesos A y B, ¿son mutuamente excluyentes?

c. Encuentra los sucesos complementos o contrarios de A y B.

Solución:

Los sucesos A y B están formados por los sucesos elementales que pueden verse a
continuación:

A = {2,3,5,7}

B = {1,4,9}

A partir de estos conjuntos, tenemos:

a. La unión e intersección de A y B son:

= {1,2,3,4,5,7,9}

b. Al ser = Ø, los sucesos A y B son mutuamente excluyentes.

c. El suceso complemento de A es = {1,4,6,8,9}


El suceso complemento de B es = {2,3,5,6,7,8}

pág. 7
ESTADÍSTICA
3. Definición de Probabilidad. Enfoques de Probabilidad. Propiedades.
 Definición de Probabilidad.
 Un experimento aleatorio se
caracteriza porque repetido muchas veces
y en idénticas condiciones el cociente
Probabilidad de un suceso es el
entre el número de veces que aparece un
número al que tiende la frecuencia
resultado (suceso) y el número total de
relativa asociada al suceso a medida
veces que se realiza el experimento tiende
que el número de veces que se realiza
a un número fijo. Esta propiedad es
el experimento crece.
conocida como ley de los grandes
números, establecida por Jakob
Bernouilli. Tiene el inconveniente de variar la sucesión de las frecuencias relativas de
unas series de realizaciones a otras, si bien el valor al que se aproximan a medida que
el número de realizaciones aumenta se mantiene estable.

Enfoques de Probabilidad

 Discutiremos dos enfoques de la probabilidad, el punto de vista objetivo y el punto


de vista subjetivo. La probabilidad objetiva se subdivide en clásica y empírica.

 La probabilidad clásica se basa en la suposición de que los resultados de un


experimento son igualmente probables. Usando el punto de vista clásico, la
probabilidad de que un evento ocurra se calcula dividiendo el número de resultados
favorables entre el número de resultados posibles:

Ejemplo: Considere el experimento de lanzar un dado de seis caras ¿Cuál es la


probabilidad de obtener un número par?

S= {1, 2, 3, 4, 5, 6} A = {2, 4, 6} P(A)= 3 / 6 = 0.5

La probabilidad de obtener un número para en el lanzamiento de un dado es del


50%.

 Enfoque Empírico

Otra manera de definir probabilidad es con base en la frecuencia relativa, es decir


la probabilidad de que un evento ocurra se determina observando el número de
veces que eventos similares ocurrieron en el pasado. Expresado en una fórmula:

Ejemplo 4: un estudio de 751 administradores de negocios graduados en una


universidad mostró que 383 de los 751 no fueron empleados en su área principal
de estudios en la escuela. Como ilustración una persona se especializó en
contabilidad es ahora gerente de marketing de una empresa procesadora de

pág. 8
ESTADÍSTICA
tomates. ¿cuál es la probabilidad de que un determinado graduado de negocios
sea empleado en un área distinta a su área principal en la escuela?

Como 383 de 751 es 0.51 en términos de probabilidad, están en un campo de


trabajo diferente a su área principal en la escuela, podemos usar este valor como
una estimación de la probabilidad. En otras palabras, según la experiencia pasada,
la probabilidad de que un nuevo graduado sea empleado en un campo distinto a
su área principal es de 51%

 Probabilidad Subjetiva.

Si hay poca o ninguna experiencia en la cual basar la probabilidad, se puede


obtener ésta subjetivamente. Esto significa esencialmente evaluar las opiniones
disponibles y otras formaciones y estimar o asignar la probabilidad. Esta
probabilidad es acertadamente llamada probabilidad subjetiva.

La probabilidad subjetiva de un que un evento particular ocurra, es asignada por


un individuo basándose en la información que tenga disponible.

Ejemplo 5:

1. Estimar la posibilidad de que usted pase este curso.


2. Apostar en carreras de caballo.

3. Estimar las ventas futuras de una empresa

Propiedades de
probabilidad:

pág. 9
ESTADÍSTICA
1. 0 P (A) 1 cualquiera que sea el suceso A.
2. P(S) = 1 P(Ø) = 0.

3. P(A´) = 1-P(A)

Regla General de la Adición:

P( ) = P( A ) + P( B ) - P( )

Si los eventos son mutuamente excluyentes entonces, P( ) = P( A ) + P( B )

Ejemplo 6: Un estudiante está tomando dos cursos: Historia y Matemática. La


probabilidad de que el estudiante pase el curso de historia es 0.60 y la probabilidad de
que pase el curso de Matemática es 0.70. La probabilidad que pase los dos cursos es 0.5

a. Cuál es la probabilidad de que pase cuando menos uno


b. Cuál es la probabilidad de que pase sólo Matemática o Sólo Historia

c. Cuál es la probabilidad de que no pase ninguna de las dos materias.

a. P(HM) = P(H) + P (M) – P (HM)


= 0.60 + 0.70 - 0.5 = 0.80 La probabilidad de que un
estudiante pase al menos una de las dos materias es de 80%

b. P( Sólo Matemática) = P(M) - P (HM) = 0.70 – 0.5 = 0.20 La probabilidad de


que el estudiante pase sólo matemática es de 20%

c. P(Sólo Historia) = P(H) - P (HM) = 0.60 – 0.5 = 0.10 La probabilidad de que el


estudiante pase sólo Historia es de 10%

d. P (Ninguna ) = 1 – P(HM) = 1 – 0.80 = 0.20 La probabilidad de que no


pase ninguna de las dos materias es de 20%

Ejemplo7 : En un estudio de 200 cadenas de tiendas de alimentos se encontraron


estos ingresos netos:

Ingreso Neto Número de empresas


A. Menos de un millón 102
61
B. De un millón a 20 millones 37

C. De 20 millones a más
Total 200
a. ¿Cuál es la probabilidad de que una cadena determinada tenga un ingreso neto de
menos de un millón?

P( A ) = 102 / 200 = 0.51 La probabilidad de que una cadena tenga un ingreso


neto menos de un millón es de 51 %

pág. 10
ESTADÍSTICA
b. ¿Cuál es la probabilidad de que una cadena de tiendas de alimentos seleccionada
al azar tenga un ingreso ya sea entre un millón o un millón a 20 millones?

Como los sucesos son mutuamente excluyentes aplicamos la regla de la adición


para este tipo de eventos: P(AB) = P(A) + P (B) = 102/200 + 61 / 200
= 0.51 + 0.31 = 0.82 La probabilidad de que la
empresa tenga un ingreso entre un millón o un millón a 20 millones es de 82%.

4. Probabilidad condicionada.

En el cálculo de las probabilidades de algunos sucesos, el valor de dicha probabilidad


varía en función del conocimiento de determinadas informaciones relativas a estos
sucesos. Veamos un ejemplo.

Si disponemos de una urna que contiene cuatro bolas numeradas del 1 al 4, extraemos
una bola y seguidamente la volvemos a introducir para realizar una segunda extracción, la
probabilidad de extraer, por ejemplo, la bola número 3 en la segunda extracción es la
misma que en la primera.
Si realizamos el mismo proceso sin reemplazar la bola extraída la probabilidad de extraer,
por ejemplo, la bola número 3 en la segunda extracción dependerá de la bola extraída en
primer lugar.

Sean A y B dos sucesos tal que P( A ) 0, se llama probabilidad de B condicionada


a A, P(B/A), a la probabilidad de B tomando como espacio muestral A, es decir, la
probabilidad de que ocurra B dado que ha sucedido A.

De esta igualdad se deduce: P( B A ) = P( B/A ) · P( A )

La fórmula anterior adopta la forma para tres sucesos, A, B y C:

P( A B C ) = P( A ) · P( B/A ) · P( C/A B )
Esta fórmula admite una generalización para un número cualquiera de sucesos.

Ejemplo 8:

Consideremos el experimento de "lanzar un dado al aire". Calculemos, por ejemplo, la


probabilidad de obtener un 3 sabiendo que ha salido un número impar:

Definimos los sucesos A="sacar 3" y B= {1,3,5}; entonces, P(A/B)=1/3 puesto que si
sabemos que ha salido un número impar, los casos posibles ahora son 3 y los casos
favorables al suceso A sólo 1.

pág. 11
ESTADÍSTICA

pág. 12
ESTADÍSTICA

Ejercicio 9:
Se lanzan dos dados:

a. ¿Cuál es la probabilidad de obtener una suma de puntos igual a 7?


b. Si la suma de puntos ha sido 7, ¿cuál es la probabilidad de que en alguno de los
dados haya salido un tres?

Solución:

Sean los sucesos A="la suma de los puntos es 7" y B="en alguno de los dados ha salido
un tres".

a. Los casos posibles al lanzar dos dados son 36 y los casos favorables al suceso A
son los seis siguientes: (1,6); (2,5); (3,4); (4,3); (5,2) y (6,1). Por tanto,
P( A )=6/36=1/6

b. En este caso, el suceso B/A es salir en algún dado 3, si la suma ha sido 7.


Observamos que esta situación ocurre en las parejas (3,4) y (4,3). Por tanto,
P( B/A )=2/6=1/3

El conocimiento de que ha ocurrido el suceso A modifica, en algunas ocasiones, la


probabilidad del suceso B, pero en otras no. Los sucesos en los que, conociendo que uno
ha ocurrido, no se modifica la probabilidad del otro, decimos que son independientes y,
si se modifica, decimos que son dependientes entre sí.

Decimos que dos sucesos A y B son independientes entre sí si la ocurrencia de uno


de ellos no modifica la probabilidad del otro, es decir, si

P( B/A ) = P( B ) ó P( A/B ) = P( A )

Decimos que dos sucesos A y B son dependientes entre sí si la ocurrencia de uno de


ellos modifica la probabilidad del otro, es decir, si

P( B/A ) P( B ) ó P( A/B ) P( A )

Como consecuencia inmediata de la definición se tiene:

 Dos sucesos A y B son independientes si se cumple:

P( A B ) = P( A ) · P( B )

Regla General de la Multiplicación:

pág. 13
ESTADÍSTICA
La regla general de la multiplicación de usa para encontrar la probabilidad conjunta de
que dos eventos ocurran, como seleccionar dos rollos defectuosos, uno después de
otro, de la caja de diez rollos.

P(A∩B) = P(A)*P(B/A)

Ejemplo 10: Suponga que hay diez rollo de película en una caja, y se sabe que tres
están defectuosos. Se toma dos rollos de película de la caja, uno detrás del otro.
¿Cuál es la probabilidad de tomar un rollo defectuoso seguido de otro rollo
defectuoso?

Solución. La probabilidad que el primer rollo salga defectuoso es 3/10, que el segundo
salga defectuoso es el evento P(B/A) = 2/9, porque al sacar un rollo de la caja quedan
9 y al sacar uno defectuoso quedan 2, ya que son 3 los rollos defectuosos por tanto:

P(A∩B) = P(A)*P(B/A)

= 3/10*2/9 = 6/90 aproximadamente 0.07

Incidentalmente se asumió que este experimento se llevó a cabo sin reemplazo, esto
es el rollo de película defectuoso no se devolvió a la caja antes de tomar el siguiente
rollo. La regla de la multiplicación se puede extender a más de dos eventos, con tres
eventos la fórmula sería:

P(A∩B∩C) = P(A)*P(B/A)*P(C/A∩B)

Como ilustración, la probabilidad de que los tres primeros rollos que se tomen de la
caja estén todos defectuosos es 0.00833, que se obtiene mediante:

P(A∩B∩C) = P(A)*P(B/A)*P(C/A∩B)

= 3/10 * 2/9 * 1/8

= 6/720 aproximadamente 0.00833

5. Tablas de contingencia y diagramas de árbol.

En los problemas de probabilidad y en especial en los de probabilidad condicionada,


resulta interesante y práctico organizar la información en una tabla de contingencia o en
un diagrama de árbol.
Las tablas de contingencia y los diagramas de árbol están íntimamente relacionados,
dado uno de ellos podemos construir el otro. Unas veces, los datos del problema permiten
construir fácilmente uno de ellos y a partir de él podemos construir el otro, que nos
ayudará en la resolución del problema.

 Conversión de una tabla en diagrama de árbol

pág. 14
ESTADÍSTICA
Las tablas de contingencia están referidas a dos características que presentan
cada una dos o más sucesos.

En el caso de los sucesos A, ,B


y , expresados en frecuencias A TOTAL
absolutas, relativas o probabilidades
la tabla, adopta la forma adjunta.
B P( A B) P( B) P( B )

P( A ) P( ) P( )
Dicha tabla adopta la forma del
diagrama de árbol del dibujo. En
éste, a cada uno de los sucesos A y TOTAL P( A ) P( ) 1
se les ha asociado los sucesos B
y .

Sobre las ramas del diagrama de árbol se han anotado las probabilidades
condicionadas correspondientes, deducidas de las relaciones análogas a:

 Conversión de un diagrama en tabla de contingencia

De manera recíproca, dado el diagrama de árbol podemos construir la tabla de


contingencia equivalente si más que utilizar la expresión

P( B A ) = P( B/A ) · P( A ),

para calcular las probabilidades de las intersecciones de sucesos que forman la


tabla.

pág. 15
ESTADÍSTICA
D. EJERCITACION

Ejercicio 11:

Un taller sabe que por término medio acuden: por la mañana 3 automóviles con
problemas eléctricos, 8 con problemas mecánicos y 3 con problemas de chapa, y por la
tarde 2 con problemas eléctricos, 3 con problemas mecánicos y 1 con problemas de
chapa.

a. Calcula el porcentaje de los que acuden por la tarde.


b. Calcula el porcentaje de los que acuden por problemas mecánicos.

c. Calcula la probabilidad de que un automóvil con problemas eléctricos acuda por la


mañana.

Solución:

En las tablas de contingencia, con las frecuencias absolutas y los porcentajes,


respectivamente, pueden verse recogidos los datos del enunciado.

Las respuestas a las cuestiones planteadas basta leerlas en las tabla. Así, se obtiene:

a. El 30% de los automóviles acude al taller por la tarde.


b. El porcentaje de vehículos ingresados con problemas mecánicos es el 55%.

c. La probabilidad buscada es:

P(acuda por la mañana/tiene problemas eléctricos) = 3/5 = 0.6

Ejercicio 12:

pág. 16
ESTADÍSTICA
Una compañía de seguros hace una investigación sobre la cantidad de partes de siniestro
fraudulentos presentados por los asegurados. Clasificando los seguros en tres clases,
incendio, automóvil y "otros", se obtiene la siguiente relación de datos:

El 6% son partes por incendio fraudulentos; el 1% son partes de automóviles fraudulentos;


el 3% son "otros" partes fraudulentos; el 14% son partes por incendio no fraudulentos; el
29% son partes por automóvil no fraudulentos y el 47% son "otros" partes no fraudulentos.

a. Haz una tabla ordenando los datos anteriores y hallando el porcentaje total de
partes fraudulentos y no fraudulentos.
b. Calcula qué porcentaje total de partes corresponde a la rama de incendios, cuál a
la de automóviles y cuál a "otros". Añade estos datos a la tabla.

c. Calcula la probabilidad de que un parte escogido al azar sea fraudulento. ¿Cuál


será, en cambio, la probabilidad de que sea fraudulento si se sabe que es de la
rama de incendios?

Solución:

a. y b. La tabla de porcentajes con los datos del enunciado y los totales es la


siguiente:

INCENDIO AUTOMÓVIL OTROS TOTAL


c. Es fácil ver sobre
FRAUDULENTOS 6 1 3 10 la tabla que la
probabilidad de
NO FRAUDULENTOS 14 29 47 90 escoger al azar un
parte fraudulento
TOTAL 20 30 50 100 es del 10%.

La probabilidad
condicionada que se pide es: P(FRAUDE/INCENDIO)=6/20=0.3

6. Probabilidad total.

Llamamos sistema completo de sucesos a una familia de sucesos A1,


A2, ...,An que cumplen:

1. Son incompatibles dos a dos, Ai Aj = Ø

2. La unión de todos ellos es el suceso seguro,

pág. 17
ESTADÍSTICA

Teorema de la probabilidad total

Sea A1, A2, ...,An un sistema completo de sucesos tales que la probabilidad de cada
uno de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen las
probabilidades condicionales P(B/Ai), entonces la probabilidad del suceso B viene dada
por la expresión:

Ejercicio 13:

Una compañía dedicada al transporte público explota tres líneas de una ciudad, de forma
que el 60% de los autobuses cubre el servicio de la primero línea, el 30% cubre la
segunda y el 10% cubre el servicio de la tercera línea. Se sabe que la probabilidad de
que, diariamente, un autobús se averíe es del 2%, 4% y 1%, respectivamente, para cada
línea. Determina la probabilidad de que, en un día, un autobús sufra
una avería.

Solución:

El suceso "sufrir una avería" (Av) puede producirse en las tres líneas,
(L1, L2, L3). Según el teorema de la probabilidad total y teniendo en
cuenta las probabilidades del diagrama de árbol adjunto, tenemos:

P(Av) = P(L1) · P(Av/L1) + P(L2) · P(Av/L2) + P(L3) · P(Av/L3) =


= 0.6 · 0.02 + 0.3 · 0.04 + 0.1 · 0.01 =
= 0.012 + 0.012 + 0.001 = 0.025

Ejercicio 14:

Una empresa del ramo de la alimentación elabora sus productos en cuatro factorías: F1,
F2, F3 y F4. El porcentaje de producción total que se fabrica en cada factoría es del 40%,
30%, 20% y 10%, respectivamente, y además el porcentaje de envasado incorrecto en
cada factoría es del 1%, 2%, 7% y 4%. Tomamos un producto de la empresa al
azar. ¿Cuál es la probabilidad de que se encuentre defectuosamente
envasado?

Solución:

Llamando M = "el producto está defectuosamente envasado",


se tiene que este producto puede proceder de cada una de
las cuatro factorías y, por tanto, según el teorema de la
probabilidad total y teniendo en cuenta las probabilidades del
diagrama de árbol adjunto, tenemos:

pág. 18
ESTADÍSTICA
P(M) = P(F1) · P(M/F1) + P(F2) · P(M/F2) + P(F3) · P(M/F3) + P(F4) · P(M/F4)
= 0.4 · 0.01 + 0.3 · 0.02 + 0.2 · 0.07 + 0.1 · 0.04 =
= 0.004 + 0.006 + 0.014 + 0.004 = 0.028

pág. 19
ESTADÍSTICA

Unidad II: Probabilidad

(Distribución de probabilidad de variable Continua)


Tema 4: Distribución normal

Objetivos

Conocer la importancia que tiene la Distribución Normal en su aplicación para la


investigación.

Conocer el uso de la tabla de distribución de la probabilidad normal.

Ejercitar la solución de ejercicios.

La distribución normal o distribución de Gauss es sin duda la más importante y la


de más aplicación de todas las distribuciones continuas. Esta distribución es
bastante adecuada para describir la distribución de muchos conjuntos de datos
que ocurren en la naturaleza, la industria y la navegación. Así pues, para los
siguientes conjuntos de datos, se puede considerar adecuada la distribución
normal:

- Datos meteorológicos correspondientes a temperaturas, lluvias, etc.

- Las clasificaciones correspondientes a pruebas de aptitud.

- Las alturas de individuos de una edad y sexo dado.

- Las medidas físicas de productos manufacturados.

- La vida media de un tipo de lámparas con un voltaje dado, etc.

Definición: Diremos que una variable aleatoria X, de tipo continuo, sigue una
distribución normal de parámetros μ y σ si su función de densidad es:

, -∞< x<+∞

donde μ , σ  y tales que -∞<μ<+∞ y σ>0. (π=3,14159... , e=2,71828 )

Abreviadamente la indicaremos por XN(μ,σ)

pág. 20
ESTADÍSTICA
Veamos ahora la representación gráfica de la función de densidad f(x) de la
N( μ,σ). Para ello veremos que se cumplen las siguientes propiedades:

1. f(x) es continua en toda la recta real.

2. f(x) es simétrica respecto de x = μ es decir es simétrica respecto del


parámetro μ.

3. f(x) tiene como asíntota horizontal el eje de abscisas.

4. f(x) es estrictamente creciente cuando x<μ, y estrictamente decreciente


cuando x>μ.

5. f(x) presenta un máximo cuando x=μ, ese máximo vale f(μ)=

El gráfico nos muestra la representación gráfica de la función de densidad, f(x), de


una distribución normal de parámetros μ y σ:

Se observa que tiene forma de campana, de aquí que frecuentemente se le llame


campana de Gauss. También se pone de manifiesto que el parámetro μ
corresponde al máximo y al centro de la distribución y el parámetro σ nos da idea
del grado de apertura o aplastamiento de la curva f(x).

Relación entre la N(μ,σ) y la N(0,1)

Veamos pues que la expresión nos da la función de


densidad de una familia de distribuciones normales para los diferentes valores de
los parámetros μ y σ. Dentro de esta familia de distribuciones normales hay una
muy importante, que corresponde a los valores de los parámetros μ=0 y σ=1, es
decir la distribución N(0, 1) y recibe el nombre de distribución tipificada o

pág. 21
ESTADÍSTICA
estándar, cuya correspondiente función de densidad se obtiene haciendo μ=0 y

σ=1 en la expresión :

Proposición: Si X es una variable aleatoria con distribución N(μ,σ), entonces la


variable aleatoria tipificada Z=(X-μ)/σ sigue una distribución N(0,1).

Características:

1. Función de distribución correspondiente a una variable aleatoria X distribuida


según una N(μ,σ) será:

F(x)=P(X ≤x) , -∞<x<+<∞

2. Media: E [X]=μ

El parámetro μ es la media de la distribución. Sabemos que la función de densidad


f(x) de una N(μ,σ) es simétrica respecto de su media μ, es decir P[X≤μ ]= P [X≥μ]
= 0,5 lo cual nos permite decir que el parámetro μ es la mediana de la
distribución.

La función de densidad f(x) presentaba un máximo para x= μ ,lo cual nos indica
que el parámetro μ es la moda de la distribución.

En consecuencia diremos que en una distribución N( μ,σ), la media, la mediana y


la moda coinciden con el parámetro μ.

3. Varianza. VAR[X] = σ²

Luego el parámetro σ que utilizamos en la N( μ,σ) es la desviación típica de la


distribución, y en el caso de la N(0,1) la desviación típica es la unidad.

pág. 22
ESTADÍSTICA
Utilización de las tablas:

En la tabla de tablas estadísticas aparece tabulada la función de distribución de


una N(0,1).

Como la función de densidad de la distribución normal es completamente


simétrica, en este caso respecto al parámetro de media μ=0, se da una sola tabla
de valores de Z, incluyendo solamente los valores positivos de Z.

Para indicar el uso de la tabla consideramos las siguientes reglas básicas:

1. P(X≤-a)=1-P(X≤a)

2. P(X>a)=1-P(X≤a)

3. P(a≤X≤b)=P(X≤b)-P(X≤a)

4. P(-a≤X≤a)=2P(X≤a)-1

5. P(-a≤X≤b)=P(X≤b)+P(X≤a)-1

6. P(-a≤X≤-b)=P(X≤a)-P(X≤b)

Propiedades

1. Propiedad reproductiva.

La suma de n variables aleatorias independientes, y distribuidas

según una N , i = 1, 2, ..., n, sigue una distribución N ( μ1 +....+ ,

2. Si son n variables aleatorias independientes e idénticamente


distribuidas, según una N(μ,σ), entonces la variable aleatoria suma de las n
variables Y= sigue una distribución N( nμ, )

pág. 23
ESTADÍSTICA

3. Si son n variables aleatorias independientes e idénticamente


distribuidas, según una N(μ,σ), entonces la variable aleatoria media aritmética de

estas n variables sigue una distribución N(μ ,σ/ ).

EJERCICIOS

1. De la parada del autobús que recorre la línea Algeciras-San Roque sale un


autobús cada 15 minutos. Un viajero llega de improviso en cualquier momento.
Obtener:
a) La función de distribución de la v.a. tiempo de espera hasta que salga el
próximo autobús.
b) Probabilidad de que el viajero espere menos de 5 minutos.
c) La media y la varianza de la v.a. tiempo de espera.
d) Probabilidad de que el viajero espere exactamente 10 minutos.
2. El tiempo que tarda un alumno para ir de su domicilio a la facultad varía entre
30 y 40 minutos. Diariamente debe llegar a clase a las 9 horas. Deseamos
saber:
a) El tiempo medio que tarda en ir a clase y la varianza.
b) A qué hora debe salir de su casa para tener una probabilidad de 0’8 de no
llegar tarde a clase.
3. Sea una v.a. X distribuida según una normal con media μ=50 y desviación
típica =8. Obtener:
a) Probabilidad de que X tome valores entre 38 y 58.
b) Probabilidad de que X tome un valor mayor que 66.
4. Supongamos que la demanda semanal de un artículo sigue una distribución
normal de media μ =100 y desviación típica =20. ¿Qué existencias deben
tener al principio de la semana para poder satisfacer la demanda con una
probabilidad de 0’95?
5. Una determinada compañía dedicada a la exportación de frutas y hortalizas ha
observado que el peso de los melones que cultiva para ser exportados sigue
una distribución normal con media μ =1’7 kgs. y desviación típica =100 grs.
Se desea conocer:
a) La proporción de melones que pesan menos de 2 kgs.
b) Sabiendo que son rechazados para la exportación aquellos melones cuyo
peso difiere en más de 300 grs. del peso medio, determinar la proporción
de melones que se rechazan.

pág. 24
ESTADÍSTICA
6. El sistema de control de calidad de una planta industrial consta de 3
subsistemas que deben funcionar simultáneamente para efectuar el control
completo. Si los tiempos de funcionamiento, de los 3 subsistemas, son
independientes y se distribuyen (en horas) respectivamente N(45,5), N(47,3) y
N(50,6), se pide calcular la probabilidad de que el sistema funcione las 40
horas laborables de una semana, si al comienzo de la semana se renuevan los
subsistemas.

“DISTRIBUCIONES MUESTRALES”

Para cada muestra podemos calcular un estadístico, que variará de muestra en muestra.
Si el estadístico usado es la media muestral, entonces se llamará distribución muestral de
la media o distribución de muestreo en la media. Análogamente podríamos tener
distribuciones de muestreo de la desviación típica, de la varianza, de la mediana, de
proporciones, etc.

En otras palabras, la distribución muestral de las medias de las muestras es la distribución


de la probabilidad de todas las medias posibles de las muestras de un tamaño de muestra
dado.

Medias muestrales

Cada muestra del tamaño n que podemos extraer de una población proporciona una
media que si consideramos cada una de estas como variables de una variable aleatoria
podemos estudiar su distribución que llamaremos: “Distribución muestral de medias”.

 Si tenemos una población normal y se extrae de una de ellas muestras de tamaño


n la distribución muestral de medias sigue también una distribución normal.

Media aritmética

Es el valor obtenido al sumar todos los datos y dividir el resultado entre el número
total de datos.

Donde:

M= Media

pág. 25
ESTADÍSTICA
X= Datos

N= Población

Si se trata de una población entonces el símbolo será μ y se utilizará la siguiente


fórmula:

Donde:

μ = Media

X= Datos

N= Población

Desviación estándar

La desviación estándar o desviación típica es la raíz cuadrada de la varianza, es


decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de
desviación. Utilizaremos la siguiente fórmula:

Consiste en elevar cada dato al cuadrado y multiplicarlo por 1 sobre el número


total de datos y sumarlo al siguiente dato elevado al cuadrado con la respectiva
multiplicación.

Posteriormente a ese resultado le sacaremos su raíz cuadrada y será el resultado


final

Propiedades de la distribución de muestreo de la media cuando la población


está normalmente distribuida

pág. 26
ESTADÍSTICA
1. La distribución de muestreo tiene una media igual a la media de la
población.

2. La distribución de muestreo tiene una desviación estándar igual a la


desviación estándar de la población dividida por la raíza cuadrada del
tamaño de la muestra.

Teorema central del límite

Este teorema nos proporciona información respecto a las 3 características de la


distribución muestral de las medias. La distribución muestral de las medias tiene
como media 0 (valor esperado, una varianza y una desviación estándar) Si se
extraen de la población todas las posibles muestras del mismo tamaño y se
calcula su estadístico, se observan:

a) La media poblacional = a la media de las medias muestrales

b) El error típico de la media = a la relación de la desviación estándar


poblacional y a la raíz cuadrada de la n

c) Si la población dela que se extraen las muestras es una distribución normal,


la distribución muestral de las medias será normal sin importar el tamaño de
la muestra.
Si la población no es normal entonces el tamaño de la muestra debe ser mayor o
igual a 30, para que la distribución normal tenga una forma de campana. Para
calcular la probabilidad del comportamiento de la media muestral ocuparemos la
siguiente fórmula:

Donde

= Media muestral

pág. 27
ESTADÍSTICA
μ = Media

σ = Desviación estándar

n = Tamaño de la muestra

Para poblaciones finitas y muestras con reemplazo Z se calcula:

= Media muestral

μ = Media

σ = Desviación estándar

n = Tamaño de la muestra

N= Población total

Ejemplos

Caso 1: Las ganancias que un vendedor de helados obtiene diariamente tienen


una media de $700 y una varianza de $15,129. El patrón de distribución de las
ganancias se desconoce pero se sospecha que no es normal. ¿Cuál es la
probabilidad de que la media muestral sea menor de 645 si se selecciona una
muestra de 64 vendedores?

Área entre 0 y 3.57 = 0.4998

0.5 + 0.4998 = 0.02%

645 700

Caso 2: La Escuela “Héroes de México” tiene una población total de 30 grupos de


primaria y secundaria de mismo tamaño. Un estudio indica que una muestra de 8
grupos, la distribución de días de ausentismo en 1 año tiene una media de 18 días
y una desviación estándar de 3 días. ¿Cuál es la probabilidad de que sea mayor a
18.5 días y menor a 16.75?

pág. 28
ESTADÍSTICA

= -1.62

Área entre 0 y -1.62= 0.4474

0.5 + 0.4474 = 94.74% 16.5 18

pág. 29
ESTADÍSTICA

Unidad III Introducción a la inferencia estadística


Tema 5: Intervalos de confianza

Objetivos:

 Conocer el concepto utilizados en la aplicación de la inferencia estadística.


 Explicar el uso de la tabla de la distribución Normal y T-student.

 Construir intervalos de confianzas para medias con desviación conocida y


desconocida.

 Construir intervalos de confianza para proporciones

Contenido:

 Introducción.
 Conceptos Básicos

 Propiedades de un estimador.

 Uso de la tabla normal

 Construir intervalos de confianza.

Introducción
Anteriormente vimos como manejar información de muestras aleatorias tomadas
de una población conocida; pero lo más importante es inferir información sobre la
población a partir de muestras suyas. Eso es lo que se conoce como estimación.

A un valor calculado con los datos de una muestra se le llama ESTADÍSTICO. A


la estadística que se usa para predecir el valor de un parámetro de la población se
le llama ESTIMADOR; si para estimar el parámetro se usa un valor único dicho
estimador es llamado ESTIMADOR PUNTUAL.
Propiedades de los estimadores puntuales
1. Insesgo: Si el valor esperado del estadístico muestral es igual al parámetro
poblacional que se estima, se dice que ese estadístico es un estimador insesgado
del parámetro poblacional.
Por consiguiente, el valor esperado o media de todos los valores posibles de un
estadístico insesgado es igual al parámetro poblacional que se estima. En el caso
de un estimador sesgado, se tiene una gran probabilidad de sobreestimar o
subestimar el parámetro poblacional.
A continuación, se presentan algunos estimadores insesgados:
 La proporción muestral ( ) como estimador de la proporción poblacional (p)

pág. 30
ESTADÍSTICA
 La media muestral ( ) como estimador del valor esperado poblacional (µ)
 La varianza de la muestra (σ n-12) como estimador de la varianza de la población
(σn2)

Sin embargo, puede demostrarse que la desviación estándar muestral es un


estimador sesgado de la desviación estándar poblacional; para muestras grandes,
este sesgo es poco significativo. Esa es la razón por la cual al encontrar una
desviación estándar muestral se divide por n-1 y no por n, ya que lo último haría
que el estimador fuese sesgado porque tendería a subestimar un poco la varianza
poblacional.

2. Eficiencia: Si se tienen dos estimadores puntuales para estimar un mismo


parámetro poblacional, se prefiere usar el estimador con la menor desviación
estándar porque tiende a proporcionar estimados más cercanos al parámetro. Al
tomar muestras de una población con distribución normal, la desviación estándar
de las medias muestrales es menor que la de las medianas muestrales. Por
consiguiente, la media muestral es más eficiente que la mediana muestral.

3. Consistencia: Un estimador puntual es consistente si sus valores tienden a


acercarse al parámetro poblacional conforme se incrementa el tamaño de la
muestra.. Se puede afirmar que la media de la muestra es un estimador
consistente de la media poblacional y que la proporción muestral es un estimador
consistente de la proporción poblacional.

Una estimación puntual no proporciona información sobre la variabilidad inherente


del estimador. En consecuencia, se opta por un segundo método de estimación
denominado estimación por intervalos, que indica la precisión de una estimación;
dicha idea de precisión es definida por el error estándar.

Una estimación por intervalo indica un rango dentro del cual se espera encontrar
el valor de algún parámetro. El intervalo que se estime recibe el nombre de
intervalo de confianza.

Un intervalo de confianza se expresa mediante dos valores: L (límite inferior) y U


(límite superior), de tal manera que la siguiente proposición de probabilidad es
verdadera:

donde α es un número entre 0 y 1 (preferiblemente pequeño).

pág. 31
ESTADÍSTICA
para el parámetro desconocido θ. Las cantidades L y U reciben los nombres de
límites de confianza inferior y superior, respectivamente, y 1-α es el nivel de
confianza.

Se tiene una probabilidad de 1 – α de seleccionar una muestra que produzca un


intervalo que contiene el valor verdadero de θ.

INCLUDEPICTURE "[Link] \* MERGEFORMATINET


INCLUDEPICTURE "[Link] \* MERGEFORMATINET
INCLUDEPICTURE "[Link] \* MERGEFORMATINET

Interpretación de un intervalo de confianza: Si se recopila un número infinito de


muestras aleatorias y se calcula un intervalo de confianza del 100(1 – α)% para θ
para cada una de las muestras, entonces el 100(1 – α)% de esos intervalos
contiene el verdadero valor de θ.

En la práctica se obtiene sólo una muestra aleatoria y se calcula un intervalo de


confianza. Puesto que ese intervalo puede o no contener el valor verdadero de θ,
no es razonable asociar un nivel de probabilidad a este evento específico. La
proposición adecuada es que el intervalo observado [l,u] contiene el verdadero
valor de θ con una confianza de 100(1-α). Esta proposición tiene una
interpretación de frecuencia, es decir, no se sabe si es correcta para la muestra
en particular, pero el método usado para obtener ese intervalo proporciona
proposiciones correctas el 100(1-α)% de las veces.

En algunas ocasiones, puede resultar más apropiado un intervalo de confianza


unilateral.
Un intervalo de confianza unilateral inferior del 100(1-α) para θ está dado por el
intervalo

donde el límite de confianza l se elige de modo que

De manera similar, un intervalo de confianza unilateral superior para θ está


dado por

pág. 32
ESTADÍSTICA

y el límite u se escoge de modo que

Entre más amplio sea el intervalo de confianza, mayor es la seguridad de que


realmente el intervalo contenga el verdadero valor de θ, pero menor información
se tiene acerca de ese valor. Lo ideal es, entonces, un intervalo de confianza
relativamente pequeño con una confianza grande, lo que se logra aumentando el
tamaño de la muestra evaluada.

En esta unidad se presentan métodos para encontrar intervalos de confianza


para medias, varianzas y proporciones.

1. ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN

A. Varianza conocida: Este caso que se plantea es más a nivel teórico que
práctico porque difícilmente vamos a poder conocer con exactitud
INCLUDEPICTURE "[Link] \*
MERGEFORMATINET INCLUDEPICTURE
"[Link] \* MERGEFORMATINET
INCLUDEPICTURE "[Link] \*
MERGEFORMATINET mientras que µ es desconocido. Sin embargo nos
aproxima del modo más simple a la estimación de medias.

Para estimar µ, el estadístico que mejor nos va a ayudar es INCLUDEPICTURE


"[Link] \* MERGEFORMATINET
INCLUDEPICTURE "[Link] \*
MERGEFORMATINET INCLUDEPICTURE
"[Link] \* MERGEFORMATINET , del que
conocemos su ley de distribución (referenciada en la unidad anterior).

Este es el modo más conveniente para hacer una estimación: Buscar una relación
en la que intervengan el parámetro desconocido junto con su estimador, de modo
que estos se distribuyan según una ley de probabilidad que es bien conocida y a
ser posible tabulada.

De este modo, fijado α (valor arbitrario y cercano a 1), se toma un intervalo que
contenga una masa de probabilidad de 1 - α. Lo ideal es que este intervalo sea lo
más pequeño posible; por ello lo mejor es tomarlo simétrico con respecto a la
media ya que allí es donde se acumula más masa en una distribución normal. Así,
las dos colas de la distribución (zonas más alejadas de la media) tendrán áreas
iguales.

pág. 33
ESTADÍSTICA
INCLUDEPICTURE "[Link] \*
MERGEFORMATINET INCLUDEPICTURE
"[Link] \* MERGEFORMATINET
INCLUDEPICTURE "[Link] \*

MERGEFORMATINET

Como

Ejemplo 3
La empresa que produce ciertos chips asegura que estos soportan, en promedio,
50 horas de funcionamiento, con una desviación estándar de 3 horas y una
distribución aproximadamente normal. Para verificar esa información, otra
empresa que utiliza esas baterías en grandes cantidades tomó una muestra
aleatoria de 25 unidades y registró sus tiempos de duración; las observaciones
fueron:

41.3 49.2 48.9 43.2 52.0 41.5 51.2 46.1 49.3 49.2 44.7 43.4
50.0 46.8 45.0 46.7 48.8 47.7 51.5 49.8 44.0 49.6 51.0 47.5
51.2

Construir un intervalo de confianza del 95% para μ, si se supone que la desviación


estándar de la población es la proporcionada por la empresa vendedora.

Solución:

Como , bajo la suposición de que los valores recibidos son


independientes, el intervalo de confianza es:

pág. 34
ESTADÍSTICA

Dicho intervalo implica que si se tomaran 100 muestras de 25 unidades y a partir


de ellas se establecieran intervalos de confianza, aproximadamente 95 de esos
intervalos contendrían el verdadero valor de la media poblacional; eso llevaría a
pensar que lo que dice la empresa vendedora no es cierto.

Nota: No podemos decir que existe un 95% de probabilidad de que µ se localice


entre 46.4 y 48.8 horas. La media poblacional es fija y se localiza en ese intervalo
o no lo hace (no hay probabilidades).

Algo muy importante es la elección del tamaño apropiado de la muestra que se ha


de tomar, porque si es demasiado grande se desperdicia tiempo y dinero y si es
muy pequeña, las conclusiones resultantes no son muy confiables.

Si se quiere establecer qué tan grande debe ser una muestra para asegurar que el
error al estimar μ sea menor a un error predeterminado, debe despejarse n del
intervalo de confianza, teniendo en cuenta que el error es la parte que se suma o
resta de la media muestral. Por lo tanto:

De esa relación, puede deducirse que:

 A medida que disminuye la longitud del intervalo (2e), el tamaño requerido


de la muestra (n) aumenta para un valor fijo de σ y una confianza
especificada.

 A medida que σ aumenta, el tamaño requerido de la muestra aumenta para


una longitud deseada y una longitud especificada. Dicho de otra forma, si la
población tiene una dispersión grande se requerirá una muestra mayor que
si la población es homogénea.

 Conforme aumenta el nivel de confianza, el tamaño requerido de la muestra


aumenta para una longitud fija deseada y una desviación estándar
determinada.

pág. 35
ESTADÍSTICA
Ejemplo 4.

¿Qué tan grande se requiere una muestra en el ejemplo 2.1. si queremos tener
95% de confianza de que el error de estimación no excederá de 0.5 horas?

Solución:

Esto implica que para satisfacer los requerimientos, debe tomarse una muestra de
139 elementos.

En algunas situaciones puede que lo importante sea plantear un límite superior


para μ o un límite inferior para ella, pero no ambos.

Es posible obtener intervalos de confianza unilaterales para μ haciendo o


y reemplazando por Zα.

El intervalo de confianza superior del 100(1-α)% para μ es:

Y el intervalo de confianza inferior del 100(1-α)% para μ es:

Ejemplo 5.
Determine los intervalos de confianza inferior y superior de 95% para μ en el
ejercicio 3.1.
El intervalo de confianza superior de 95% para μ es:

horas

El intervalo de confianza inferior de 95% para μ es:

pág. 36
ESTADÍSTICA

horas

B. Varianza poblacional desconocida: Como se ha mencionado, el caso anterior


se presentará poco en la práctica, ya que lo usual es que el valor exacto de los
parámetros µ y INCLUDEPICTURE "[Link] \*
MERGEFORMATINET INCLUDEPICTURE
"[Link] \* MERGEFORMATINET
INCLUDEPICTURE "[Link] \*
MERGEFORMATINET no sean conocidos; de lo contrario, no interesaría en
buscar intervalos de confianza para ellos.

Si la muestra tomada es grande, un procedimiento aceptable consiste en


reemplazar σ por el valor calculado de la desviación estándar muestral.

Cuando el tamaño de la muestra es pequeño debe emplearse otro procedimiento.


Para producir un intervalo de confianza válido debe hacerse una hipótesis más
fuerte con respecto a la población de interés y es que ella está distribuida
normalmente. Esto conduce a intervalos de confianza basados en la distribución t
de Student, que es una distribución continua que tiene una forma muy similar a la
distribución normal estándar (tiene forma de campana y es simétrica con una
media de 0); una distribución t específica depende de un parámetro llamado
grados de libertad, que para efectos de esta unidad equivale a n – 1. A medida
que aumenta la cantidad de grados de libertad, la diferencia entre la distribución t
y la distribución normal estándar se hace más y más pequeña.

Si se asume que la población está distribuida normalmente los intervalos de


confianza se basan en la distribución t de Student.

Cuando se revisaron las distribuciones muestrales se determinó que

con n – 1 grados de libertad.

Si se escoge un intervalo central en la distribución t, -t α/2,n-1 y tα/2,n-1 son los puntos


críticos y, por lo tanto:

INCLUDEPICTURE "[Link] \* MERGEFORMATINET


INCLUDEPICTURE "[Link] \* MERGEFORMATINET

pág. 37
ESTADÍSTICA
INCLUDEPICTURE "[Link] \* MERGEFORMATINET

De allí se obtiene un intervalo de confianza dado por:

pág. 38
ESTADÍSTICA
Ejemplo 6.
Se va a considerar un programa de adiestramiento en cierta empresa; su director
de manufactura desea contar con un software determinado para adiestrar a los
empleados de mantenimiento en las operaciones de reparación de máquinas. Se
estima que con el software se reduzca el tiempo necesario para el adiestramiento;
para evaluarlo, el director de manufactura pide un estimado del tiempo promedio
de adiestramiento necesario con el programa.

La gerencia aceptó adiestrar a 15 empleados con el nuevo método. A c ontinuación


se ven los días necesarios de adiestramiento por cada empleado de la muestra:

19 26 22 15 18 23 12 16 19 21 15 14 18 26 21

Estime el promedio poblacional con una confianza de 90% y con una de 95%.

Solución:

y S = 4.209;

Así, el estimado del intervalo de confianza de 90% para el promedio poblacional


de tiempo de adiestramiento es de 17.1 a 20.9 días.

Haciendo un cálculo similar se obtiene que el estimado para el promedio


poblacional con un nivel de confianza de 90% está entre 16.7 y 21.3 días.
Lo anterior demuestra que, a mayor nivel de confianza, mayor amplitud del
intervalo de confianza y, por ende, menor precisión en la estimación.
Debe tenerse muy presente que este intervalo de confianza supone que el
muestreo se hace sobre una población normal; esta hipótesis es válida en muchas
situaciones prácticas; pero si es muy alejada de la realidad deben emplearse
métodos no paramétricos, los cuales se evaluarán más adelante.

Lo anterior se cumple si la población es infinita o muy grande; pero si es finita, el


intervalo de confianza se debe calcular como:

pág. 39
ESTADÍSTICA
Para determinar el tamaño apropiado de la muestra a utilizar es necesario
encontrar una estimación preliminar de la desviación estándar de la población.
Una forma posible consiste en disponer de la dispersión de otro estudio
relacionado (obviamente, si se considera confiable); el método más común para
hacerlo consiste en la realización de un estudio piloto, basado en la utilización de
una muestra a la cual se le determina su desviación estándar y ese valor es usado
para determinar el tamaño apropiado de la muestra.

El tamaño de la muestra para estimar una media poblacional es:

(si la población es infinita o muy grande)

ó (si la población es finita)

Ejemplo 6.
En el caso del ejemplo 3.4., ¿de qué tamaño debe ser una muestra para poder
tener el 95% de confianza de que el error muestral sea de 1.5 o menor? Suponga
que la desviación estándar hallada para la muestra es una buena aproximación
para la poblacional.

Solución:

Lo anterior implica que se debe tomar una muestra de 31 elementos (16


adicionales).

pág. 40
ESTADÍSTICA

PROBLEMAS PROPUESTOS

I-Un productor decide probar el funcionamiento de su máquina y para ello, luego


de cosechar una parcela, cuenta en 10 unidades de 1 m2 la cantidad de semillas
que quedan en el suelo. Las normas técnicas indican que la desviación estándar
del número de semillas caídas por m2 no debería ser superior a 5. Los resultados,
en semillas/m2 , fueron:

77 73 82 82 79 81 78 76 76 75

a) Construir un intervalo de confianza para σ 2 con una confianza del 90%.

b) Concluir sobre el funcionamiento de la maquina

II- Considerar la variable rendimiento de maíz, cuya distribución es normal con


media µ y desviación estándar σ. Para estimar el rendimiento promedio del maíz
bajo el efecto de un herbicida, se toma una muestra de tamaño 40 y se obtiene un
promedio de 60 qq/ha. Se sabe por experiencias anteriores que la varianza
poblacional σ 2 es 25 (qq/ha)2 .

a) Construir los intervalos de confianza del 95% y 99% para µ


b) ¿Cómo cambia el intervalo anterior (95%) si el tamaño de la muestra fuese 100
y se obtiene el mismo promedio?

c) ¿Cómo se modifica el intervalo del 95% calculado en a) si la desviación


estándar fuese de 7 qq/ha?

III-Una empresa dedicada a la comercialización de semillas desea estimar la


altura promedio de un sorgo forrajero que ha desarrollado. Para ello toma una
muestra de 50 plantas y se calcula la media de la altura, la que resulta ser 130
cm. Se sabe por experiencias anteriores que la desviación estándar es 22 cm.
Construir los intervalos de confianza para µ con una confianza del 95% y 99%
respectivamente. Comparar ambos intervalos y concluir.

IV-Se desea establecer el contenido vitamínico de un alimento balanceado para


pollos. Se toma una muestra de 49 bolsas y se encuentra que el contenido
promedio de vitaminas por cada 100 g es X =12 mg. y que la desviación estándar

pág. 41
ESTADÍSTICA
S =2 mg. Encontrar el intervalo de confianza del 95%, para el verdadero promedio
del contenido de vitaminas

V-El espárrago es una planta perenne cuyo cultivo comercial puede tener una
duración de 15 años y su implantación es costosa. Dada la extensión del sistema
radicular, la profundidad del suelo es fundamental, considerándose indispensable
contar con un promedio mínimo de 80 centímetros de sustrato permeable. Se
realizan 14 determinaciones de la profundidad del sustrato permeable (en cm) en
puntos tomados al azar en dos campos (A y B). Los valores registrados fueron los
siguientes:

a) A partir de los intervalos de confianza al 95% determinar si estos campos son


aptos para el cultivo. B

b) ¿Hay diferencias en la profundidad del sustrato permeable entre ambos


campos?

BIBLIOGRAFIA

Freund, J. E., & Miller, I. (2000). Estadística matemática con aplicaciones (6 ed.).
(R. J. Palma, Trad.) México: Pearson Educación.

Johnson, R., & Kuby, P. (2008). Estadística Elemental: lo esencial (10 ed.).
Australia: Cengage Learning Editores, S.A.

pág. 42

También podría gustarte