0% encontró este documento útil (0 votos)
383 vistas173 páginas

Guía de Estadística para EST145 PUCP

Este documento presenta una guía sobre nociones básicas de estadística descriptiva. Fue escrita por tres profesores - Ana Valdivia, Sergio Pavletich y Walter Luna - con el objetivo de brindar una herramienta de apoyo para los estudiantes y profesores de la asignatura Estadística de la Pontificia Universidad Católica del Perú. La guía contiene capítulos sobre estadística descriptiva, probabilidad, variables aleatorias, distribuciones de probabilidad e introducción a la estadística inferencial
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
383 vistas173 páginas

Guía de Estadística para EST145 PUCP

Este documento presenta una guía sobre nociones básicas de estadística descriptiva. Fue escrita por tres profesores - Ana Valdivia, Sergio Pavletich y Walter Luna - con el objetivo de brindar una herramienta de apoyo para los estudiantes y profesores de la asignatura Estadística de la Pontificia Universidad Católica del Perú. La guía contiene capítulos sobre estadística descriptiva, probabilidad, variables aleatorias, distribuciones de probabilidad e introducción a la estadística inferencial
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ESTADÍSTICA

Walter Luna
Sergio Pavletich
Ana Valdivia
Presentación
La presente guía resume la teoría necesaria para llevar el curso Estadística
(EST145) de Estudios Generales Ciencias de la Pontificia Universidad Católica del
Perú. Se ha realizado con la finalidad de brindar a nuestros alumnos una ayuda en
su proceso educativo y una herramienta que colabore en el dictado de las clases.
Esta guía está realizada con el trabajo de la profesora Ana Valdivia, el profesor
Sergio Pavletich y el profesor Walter Luna.

Los autores de esta guía agradecerán sus críticas y comentarios a esta


publicación.

Los autores.

Pando, enero del 2013


Contenido
Capítulo 1. Nociones de Estadística Descriptiva ................................................................. 7
1.1. Conceptos básicos ....................................................................................................................... 7
1.2. Organización y tratamiento de datos ...................................................................................... 14
1.3. Gráficos y tablas estadísticas ................................................................................................... 15
1.4. Estadísticos de posición ............................................................................................................ 21
1.5. Medidas de tendencia central .................................................................................................. 26
1.6. Medidas de dispersión .............................................................................................................. 34
1.7. Indicadores de asimetría .......................................................................................................... 41
1.8. Estadística descriptiva bidimensional: Regresión lineal simple ........................................... 53
1.9. Regresión lineal simple ............................................................................................................ 55
Capítulo 2. Nociones de probabilidad ................................................................................ 63
2.1. Conceptos básicos ..................................................................................................................... 63
2.2. Definición clásica de probabilidad .......................................................................................... 70
2.3. Definición axiomática de probabilidad................................................................................... 73
2.4. Probabilidad condicional ......................................................................................................... 78
2.5. Eventos independientes ............................................................................................................ 82
Capítulo 3. Variables aleatorias y modelos o distribuciones de probabilidad ................... 91
3.1. Variable aleatoria ..................................................................................................................... 91
3.2. Variable aleatoria discreta ...................................................................................................... 91
3.3. Variable aleatoria continua ..................................................................................................... 93
3.4. Algunos modelos discretos importantes ............................................................................... 104
3.5. Algunos modelos continuos importantes .............................................................................. 115
3.6. Teorema central del límite ..................................................................................................... 126
Capítulo 4. Introducción a la Estadística Inferencial........................................................131
4.1. Muestra aleatoria ................................................................................................................... 131
4.2. Distribución de la media muestral ........................................................................................ 131
4.3. Distribución de la proporción muestral ............................................................................... 132
4.4. Distribución de la varianza muestral.................................................................................... 132
4.5. Estimación de parámetros ..................................................................................................... 136
4.6. Estimación puntual de parámetros ....................................................................................... 136
4.7. Estimación de parámetros por intervalo de confianza........................................................ 138
4.8. Nociones de prueba de hipótesis............................................................................................ 148
4.9. Pruebas de hipótesis ............................................................................................................... 152
Tablas estadísticas ......................................................................................................................... 167
Estadística EEGGCC 7

Capítulo 1. Nociones de Estadística Descriptiva

1.1. Conceptos básicos

Definición de Estadística

La Estadística se ocupa de la recolección, organización, presentación y análisis de datos que


corresponden a fenómenos o situaciones en donde está presente la variabilidad.

Estadística Descriptiva
Son métodos y técnicas de recolección, caracterización, resumen y presentación que permiten
describir, apropiadamente, las características de un conjunto de datos. Comprende el uso de gráficos,
tablas, diagramas y criterios para el análisis.

Estadística Inferencial
Son métodos y técnicas que hacen posible estimar una o más características de una población o tomar
decisiones sobre población basadas en el resultado de muestras. Muchas veces los datos recolectados
corresponden a sólo una parte de una población. La generalización a toda la población de las
propiedades estudiadas cae en el dominio de la Estadística Inferencial. En dicha generalización juega
un papel muy importante la Teoría de la Probabilidad.

Ejemplo 1
Indique cuál de las siguientes afirmaciones es de tipo inferencial:
a. El 32% de los encuestados cuenta con servicio de internet en casa.
b. La edad media de los estudiantes seleccionados es 19 años.
c. El 47% de las personas encuestadas es de sexo femenino.
d. El 23% de los peruanos ha visitado Machu Picchu por lo menos una vez.

Población

Es el conjunto de todos los elementos de interés en determinado estudio.


Los elementos que conforman la población pueden ser personas, cosas, animales, instituciones,
etc.
A cada elemento de la población se le llama unidad estadística.

Muestra

Es un subconjunto de elementos de la población.


Cuando el objetivo es hacer inferencia estadística es necesario que la muestra sea seleccionada de
acuerdo a un diseño aleatorio, es decir, que sus elementos sean escogidos al azar.
Capítulo 1. Nociones de Estadística Descriptiva 8
Ejemplo 2
El Programa para la Evaluación Internacional de Alumnos de la OCDE (PISA, por sus siglas en
inglés) es el estudio internacional en educación de mayor escala del mundo y más de 60 países
participan en él. Evalúa estudiantes de 15 años de edad que están cursando algún grado de secundaria
en comprensión lectora, matemática y ciencias. El Perú se reintegró a este programa para la evaluación
del 2009. Defina la población del estudio para el caso peruano.

Resultados del estudio PISA 2009 por países


Comprensión lectora Matemática Ciencias
Puesto Promedio PISA 493 496 501
1 Shanghai-China 556 600 575
2 Corea 539 546 538
3 Finlandia 536 541 554
4 Hong Kong-China 533 555 549
62 Panamá 371 360 376
63 Perú 370 365 369
64 Azerbaiyán 362 431 373
65 Kirguistán 314 331 330
Fuente: OECD PISA 2009 database

Ejemplo 3
Se desea determinar el porcentaje de mujeres en edad fértil que usa algún método anticonceptivo.
Defina la población para el caso peruano.

Variable estadística

Una variable estadística es una función que a cada elemento de la población le asigna un número.
Los números se asignan de acuerdo con una escala y representan la medición de una determinada
característica en cada unidad estadística.
En una población se pueden definir muchas variables estadísticas.

Rango de la variable estadística

Es el conjunto de valores posibles de la variable.

Dato

Es la medición de una variable, realizada en una unidad estadística.

Ejemplo 4
En una investigación, se quiere estimar el porcentaje de personas, por grupos de edades, que votarían
por cierto candidato a la presidencia del Perú. Indique la población y las variables a medir.
Ejemplo 5
En una investigación, se quiere estimar el gasto promedio semanal de los alumnos en fotocopias en
una universidad. Indique la población y la variable a medir.
Ejemplo 6
En una investigación, se quiere estimar el tiempo promedio diario, en horas, de sol durante los meses
de verano en la playa El Silencio. Indique la población y la variable a medir.
Estadística EEGGCC 9
Parámetro

Es un valor que describe una característica de la población.


Son ejemplos de parámetro los siguientes: edad promedio de todos los peruanos, proporción de
alumnos de la PUCP que trabajan y estudian a la vez.

Estadístico

Es un valor que describe una característica de la muestra.


Son ejemplos de estadísticos los siguientes: edad promedio de algunos peruanos elegidos al azar,
porcentaje muestral de personas que afirman teñirse el pelo regularmente.

Ejemplo 7
Según los Censos Nacionales X de Población y V de Vivienda 2007 ejecutados por el INEI, el 50,06%
de los peruanos es mujer. Indique si este valor es un parámetro o un estadístico.

Ejemplo 8
En octubre del 2011, Ipsos Apoyo presentó los resultados de una encuesta sobre sexualidad,
reproducción y desigualdades de género, en la cual se indica que el 55% de los entrevistados afirma
que la violencia física es el principal problema de la mujer peruana. Indique si este valor es un
parámetro o un estadístico.

Ejemplo 9
El siguiente gráfico muestra la evolución de la inflación desde el año 1980 al 2012. Indique si el índice
de precios al consumidor IPC que obtiene el INEI es un parámetro o un estadístico.
Capítulo 1. Nociones de Estadística Descriptiva 10
Tipos de variables

Las variables se pueden clasificar en cualitativas o cuantitativas.

Variables cualitativas

Son las variables que miden una cualidad. Son de carácter no numérico.
Son ejemplos de variables cualitativas las siguientes: género de una persona, sector industrial al que
pertenece una empresa, tipo de material de construcción de una vivienda.

Variables cuantitativas

Son variables que miden una cantidad. Son de carácter numérico.


A su vez, las variables cuantitativas se pueden clasificar en discretas y continuas.

Variables cuantitativas discretas


Son las variables que tienen un número finito o infinito numerable de posibles valores; es decir, que en
un intervalo determinado, sólo pueden tomar ciertos valores.
Son ejemplos de variables discretas las siguientes: número de personas que asistirán a un concierto,
número de veces que un alumno lleva el curso de Estadística, número de trabajadores de una empresa,
número de accidentes laborales durante el mes en una empresa.

Variables cuantitativas continuas


Son las variables que tienen un número infinito no numerable de posibles valores; es decir, que en un
intervalo determinado, pueden tomar cualquier valor.
Son ejemplos de variables continuas las siguientes: tiempo que demora un estudiante en resolver un
examen, peso de un estudiante, área de terreno construida de una vivienda en Lima.

Ejemplo 10
Indique el tipo de las siguientes variables.

a. Nombre de una persona


b. Nivel socioeconómico de una persona (bajo, medio, alto)
c. Área, en metros cuadrados, de jardín de una casa
d. Número de bytes que puede almacenar una memoria USB
e. Cantidad de dinero gastado en un fin de semana, en nuevos soles
f. Estatura, en centímetros, de una persona
g. Grado de afectación de una vivienda por un sismo (nada afectada, poco afectada, muy afectada)
h. Color de un lapicero
Estadística EEGGCC 11

Escalas de medición de las variables

Medición
Proceso de observación de una característica de interés (variable), sobre las unidades de la población.

Escala de medición
Asigna números a las mediciones realizadas en las unidades estadísticas. Los números asignados por
las escalas deben informar lo más precisamente posible acerca de las características de cada unidad
observada.

Tipos de escalas de medición


Stanley Smith Stevens (1906 – 1973), en la revista Science de junio de 1946, presentó su artículo
“Sobre la Teoría de las Escalas de Medición”. La clasificación de Stevens considera cuatro tipos de
escala: nominal, ordinal, de intervalo y de razón.

Nominal
Una variable está medida en escala nominal cuando los valores de la variable clasifican a las unidades
estadísticas en iguales o diferentes.
Por ejemplo, el género de las personas, el estado civil de los empleados de una empresa, las carreras
profesionales universitarias.

Ordinal
Una escala ordinal es una escala nominal cuyos valores reflejan el orden existente entre los valores de
la variable, según el mayor o menor grado en el que se encuentre presente la característica.
Por ejemplo, el orden de mérito de los atletas en una competición, el grado de instrucción de los
clientes de un banco, la opinión de los alumnos sobre su universidad.

Intervalo
Una escala de intervalo es una escala ordinal en la que, además, las diferencias entre los valores
asignados proporcionan información acerca de la diferencia en el grado en que se presenta la
característica observada.
Esta escala no tiene un cero real sino un cero relativo, definido arbitrariamente y que no indica
ausencia de la característica medida.
Por ejemplo, las escalas de temperatura, centígrados y Fahrenheit, la altura de una ciudad, en metros
sobre el nivel del mar.

Propiedad de la escala de intervalo


Si la medida de un elemento en una escala de intervalo es X y en otra escala de intervalo es Y, entonces
 m, b  IR : Y  mX  b
Capítulo 1. Nociones de Estadística Descriptiva 12
Razón
Es una escala de intervalos en la que además los números asignados representan las cantidades de la
característica que se mide.
La proporción entre dos números corresponde a la misma proporción entre las cantidades de la
característica medida.
El cero es real e indica ausencia total de la característica que mide la variable.
Por ejemplo, el sueldo de los empleados de una empresa, el tiempo en terminar un examen.

Propiedad de la escala de razón


Si la medida de un elemento en una escala de razón es X y en otra escala de razón es Y, entonces
 m  IR : Y  mX

Ejemplo 11
Indique el tipo de variable y la escala de medición de las siguientes variables.
a. Código de una alumna o alumno de la PUCP
b. Costo, en dólares, de licencia del software SPSS
c. Número de servidores de un centro de cómputo
d. Material de una tubería (cobre, bronce, pvc, etc.)
e. Año de nacimiento de una persona

Ejemplo 12
La medición de la velocidad del pulso ultrasónico como una alternativa de prueba no destructiva para
evaluar la calidad del concreto se ha utilizado desde hace aproximadamente 50 años. La técnica fue
desarrollada por Leslie y Cheesman en Canadá (Malhotra y Carino, 1991) y se utilizó con gran éxito
desde la década de los sesentas para diagnosticar el estado del concreto. Además, se han realizado
estudios que permitan obtener modelos para predecir la resistencia a la compresión del concreto en
base a la velocidad ultrasónica. La clasificación del concreto en categorías con base a intervalos de
velocidad se presenta en el cuadro siguiente.

Clasificación del concreto según velocidad ultrasónica


Velocidad ultrasónica, V (metros/segundo) Clasificación del concreto
V > 4 575 Excelente
4 575 > V > 3 660 Bueno
3 660 > V > 3 050 Cuestionable
3 050 > V > 2 135 Pobre
V < 2 135 Muy pobre

Fuente Malhotra, 1985. Predicción de la resistencia del concreto. Solís, Moreno y Catillo. 2004.

Identifique, para cada variable, si es discreta o continua, cualitativa o cuantitativa y su escala de


medición.
Estadística EEGGCC 13

a. Velocidad ultrasónica en metros por segundo


b. Clasificación del concreto
c. Resistencia a la compresión del concreto, en kg/cm2
d. Grado de escolaridad del técnico que realizó el experimento (Ninguna, Primaria, Secundaria,
Superior)
e. Número de experimentos realizados en un día

Ejemplo 13
Calcular cuántos grados Fahrenheit corresponden a X grados centígrados, si se sabe que las
temperaturas 10ºC y 20ºC equivalen a 50ºF y 68ºF respectivamente.

Solución
X  10 Y  50 9
De los datos, podemos plantear de la siguiente ecuación  , de donde Y  X  32
20  10 68  50 5
Capítulo 1. Nociones de Estadística Descriptiva 14

1.2. Organización y tratamiento de datos

Distribución de frecuencias
Es la representación estructurada, en forma de tabla, de los datos que se han recolectado sobre una
variable en estudio.
Es útil para resumir grandes volúmenes de datos.
Permite que quienes toman decisiones puedan extraer directamente la información relevante.

Frecuencias simples
La frecuencia absoluta ni de una clase es la cantidad de elementos que pertenecen a esa clase.
La frecuencia relativa fi de una clase es la proporción de elementos que pertenecen a esa clase.

frecuencia relativa  f i  
frecuencia absoluta ni

número de datos n

Frecuencias acumuladas
La frecuencia acumulada absoluta Ni de una clase es la cantidad de elementos que pertenecen hasta
esa clase.
i
Se tiene que N i  n
j 1
j , i  1, 2,..., k

Luego N1  n1 y N i  N i 1  ni , i  2, 3,...,k

La frecuencia acumulada relativa Fi de una clase es la proporción de elementos que pertenecen


hasta esa clase.

frecuencia relativa acumuladaFi  


frecuencia absoluta acumualda N i

número de datos n

Ejemplo 14
Se tomó una muestra de personas y se les preguntó por su bebida gaseosa preferida. Los resultados se
muestran en la siguiente tabla. Construya la distribución de frecuencias de la variable en estudio.

Inca Kola Otras Coca Cola Coca Cola Inca Kola Kola Real Sprite Coca Cola Kola Real
Kola Real Kola Real Inca Kola Inca Kola Sprite Inca Kola Inca Kola Otras Coca Cola
Kola Real Kola Real Sprite Inca Kola Inca Kola Inca Kola Otras Kola Real Coca Cola
Inca Kola Coca Cola Otras Kola Real Coca Cola Coca Cola Coca Cola Inca Kola Kola Real
Inca Kola Coca Cola Inca Kola Inca Kola Coca Cola Inca Kola Inca Kola Sprite Coca Cola
Estadística EEGGCC 15
1.3. Gráficos y tablas estadísticas
Todo gráfico o tabla debe tener, por lo menos, lo siguiente:
un título que lo describa lo mejor posible
unidades y rótulos en todos los ejes
fuente de los datos.

Gráficos de variables cualitativas

Gráfico de barras
Es una forma de representar datos cualitativos resumidos en una distribución de frecuencias.
En uno de los ejes, se
representan las categorías o
clases de la variable; para el
otro eje, se puede usar una
escala de frecuencias
absolutas, relativas o
porcentuales. Se traza una
barra sobre cada indicador
de clase de una altura
proporcional a la frecuencia
correspondiente.
Las barras deben estar
separadas para enfatizar el
hecho de que cada clase es
diferente de otra.

Diagrama circular
Cuando se utiliza el gráfico circular, también llamado pastel, cada sector circular representa la
frecuencia observada de una clase o categoría.
El sector circular que
representa a una
determinada clase o
categoría de la variable
tiene un ángulo en el
centro proporcional a la
frecuencia relativa de dicha
clase. El ángulo que le
corresponde a cada clase se
obtiene multiplicando 360º
por la respectiva frecuencia
relativa.
Capítulo 1. Nociones de Estadística Descriptiva 16
Distribución de frecuencias de variables cuantitativas discretas

Es un resumen de un conjunto de datos que consiste en presentar la frecuencia de ocurrencia de cada


valor observado de la variable discreta.

Gráfico de bastón
Es un gráfico que muestra la frecuencia de ocurrencia de cada valor observado de la variable discreta
mediante un segmento (bastón) cuya altura es proporcional a la frecuencia correspondiente.

Gráfico de escalones
Es un gráfico que muestra la frecuencia acumulada de ocurrencia hasta cada valor observado de la
variable discreta.
Estadística EEGGCC 17
Ejemplo 15
Los siguientes datos muestran el número de veces que fueron al cine el último mes un grupo de
alumnos de Estudios Generales Ciencias.

2 3 4 0 0 7 1 0 5 3 2 1 2 2 3 2 1 2 1 4 3 4 0 1 0 0 2 2 3 4
1 0 0 2 1 1 2 0 4 3 5 3 5 1 4 1 4 0 2 1 5 1 2 2 0 0 0 2 2 0

Construya la tabla de distribución de frecuencias de la variable en estudio y su respectivo gráfico de


bastones.

Distribución de frecuencias de variables cuantitativas continuas

Cuando se realiza mediciones de una variable continua, por lo general, se observan muchos valores
diferentes, por ello, para presentarlos en forma de tabla deben agruparse primero en clases o
intervalos.
Los tres pasos necesarios para definir en una distribución de frecuencias con datos cuantitativos son
los siguientes:
Determinar la cantidad de clases
Determinar el ancho de cada clase
Determinar los límites de cada clase

Cantidad de clases
Se recomienda usar entre 5 y 20 clases.
La idea es emplear suficientes clases para mostrar la variación de los datos, pero no tantas que
varias contendrían muy pocos o ningún elemento.
Para determinar la cantidad de clases (k) se puede usar la regla de Sturges.
k = 1 + 3,322 log n
El valor de k se redondea al entero más próximo.
La regla de Sturges no es la única que existe para determinar la cantidad de clases.
La regla de Sturges no se usa para hallar la cantidad de datos.

Amplitud de cada clase


Por lo general, se usa el mismo ancho para todas las clases.
Se calcula de la siguiente manera:
valor máximo valor mínimo rango
Amplitud  
k k
La amplitud se redondea por exceso de acuerdo con la cantidad de decimales que tienen los datos
o según la precisión con que se desea trabajar.
Se usa el redondeo por exceso para asegurar que el mayor de los datos pertenezca a algún
intervalo.
Capítulo 1. Nociones de Estadística Descriptiva 18
Límites de cada clase
Los límites de clase se escogen de tal manera que cada dato pertenezca a una clase y sólo a una.
La marca de clase (mi) es el punto medio de los límites de cada intervalo.
Por lo general, el límite inferior de la primera clase es el mínimo valor observado.

Ejemplo 16
Construya la tabla de distribución de frecuencias para los siguientes datos.

8,8 8,7 10,2 10,3 8,2 11,7 7,8 9,8 11,1 8,9 9,3 8,3 8,2 9,0 9,2 8,5
8,9 12,4 9,6 10,1 9,6 9,7 9,6 11,3 10,9 9,8 9,5 12,0 10,9 12,4 9,3 9,4
12,7 8,4 10,5 10,9 11,9 9,9 9,5 10,7 12,6 10,8 8,6 9,2 8,5 9,6 10,0 9,8

Solución
El rango R se calcula con:
R = valor máximo – valor mínimo = 12,7 - 7,8 = 4,9

Siguiendo la regla de Sturges, el número de intervalos es


k  1  3.322 log10 n  6,58
Por redondeo simple, k será igual a 7.
El ancho del intervalo es
R 4,9
A   0,7
k 7
El redondeo por exceso es a un decimal, pues los datos tienen un decimal, por lo tanto A es igual a 0,7.

Distribución de frecuencias
Intervalos Marca de clase ni fi Ni Fi
[7,8 8,5] 8,15 7 0,1458 7 0,1458
]8,5 9,2] 8,85 8 0,1667 15 0,3125
]9,2 9,9] 9,55 14 0,2917 29 0,6042
]9,9 10,6] 10,25 5 0,1042 34 0,7083
]10,6 11,3] 10,95 7 0,1458 41 0,8542
]11,3 12,0] 11,65 3 0,0625 44 0,9167
]12,0 12,7] 12,35 4 0,0833 48 1,0000

Variables cuantitativas discretas como variables cuantitativas continuas


Si la variable es discreta pero tiene muchos valores posibles, se puede construir la distribución de
frecuencias como si fuera continua.
Estadística EEGGCC 19

Gráficos de variables cuantitativas continuas

Histograma
Este gráfico se construye a partir de una distribución de frecuencias por intervalos.
Cada frecuencia de clase se representa trazando un rectángulo, cuya base es el intervalo de clase
sobre el eje horizontal y cuya altura es proporcional a la frecuencia correspondiente.
Los rectángulos adyacentes se tocan entre sí.

Polígono de frecuencias
Es la representación por medio de una figura poligonal cerrada de una distribución de frecuencias
absolutas o relativas.
Se obtiene uniendo con segmentos de recta los puntos con la marca de clase como abscisa y la
correspondiente frecuencia absoluta o relativa como ordenada.
Los polígonos de frecuencias se cierran en los puntos del eje horizontal correspondientes al límite
inferior del primer intervalo y al límite superior del último intervalo.
Capítulo 1. Nociones de Estadística Descriptiva 20

Ojiva
Es la gráfica de una distribución de frecuencias absolutas o relativas acumuladas.

La ojiva parte del punto que tiene como abscisa el límite inferior del primer intervalo y a cero
como ordenada.
Se obtiene uniendo con segmentos de recta los puntos con el límite superior de cada intervalo
como abscisa y la frecuencia acumulada respectiva como ordenada.
Con la ojiva se puede estimar el número o porcentaje de observaciones que corresponden a un
intervalo determinado.

Ejemplo 17
Grafique el histograma, el polígono de frecuencias y ojiva de los siguientes datos que corresponden al
tiempo de duración, en minutos, de las llamadas telefónicas recibidas en una central durante un día.

2,6 2,9 3,8 4,4 4,4 4,4 4,5 4,5 4,6 4,7 4,7 4,8 4,8 4,9 4,9 5,0 5,1 5,1 5,3 5,5
5,5 5,5 5,6 5,6 5,6 5,6 5,7 5,7 5,8 5,8 5,9 5,9 5,9 5,9 6,0 6,0 6,0 6,1 6,1 6,2
6,2 6,2 6,2 6,3 6,3 6,3 6,4 6,4 6,5 6,5 6,6 6,6 6,6 6,6 6,6 6,7 6,8 6,8 6,9 7,1
7,2 7,2 7,3 7,4 7,5 7,5 7,5 7,6 7,7 7,8 7,8 7,8 7,9 7,9 8,2 8,4 8,6 8,7 8,8 9,0
Estadística EEGGCC 21

1.4. Estadísticos de posición

Percentil

El percentil k-ésimo Pk es el menor de los datos tal que por lo menos el k% de los datos son menores o
iguales que este valor.

Cuartil

Se denomina así a cada uno de los tres percentiles: P25, P50, P75 y se les denota como Q1, Q2 y Q3
respectivamente.

Ejemplo 18
Evaluación de postulantes a puestos de trabajo en una empresa de telecomunicaciones.

Edad Conocimientos generales Neuroticismo


Percentiles 25 (Primer cuartil) 29,0 26,0 48,0
50 (Segundo cuartil) 31,0 30,0 63,0
75 (Tercer cuartil) 36,0 34,0 77,5

 El primer cuartil de la variable Edad es 29, esto quiere decir que el 25% de los postulantes tiene 29
años o menos.
 El segundo cuartil de la variable Conocimientos generales es 30, esto quiere decir que el 50% de
los postulantes obtuvieron 30 o menos puntos en la prueba de conocimientos generales.
 El tercer cuartil de la variable Neuroticismo es 77,5, esto quiere decir que el 75% de los
postulantes obtuvieron 77,5 o menos puntos en la evaluación de Neuroticismo.

Ejemplo 19
En los últimos 150 años, los holandeses han pasado a ser los habitantes más altos del mundo, y según
los expertos siguen creciendo. El estudio de la altura de los holandeses a lo largo de los siglos ofrece
un panorama sobre la salud y riqueza de la nación. No siempre fue así, en 1848, uno de cada cuatro
varones era rechazado del servicio militar porque no alcanzaba la estatura de 1,57 metro. Actualmente,
el percentil 1 de la estatura de los varones holandeses es 1,57 metro y el percentil 70 es 1,88 metro.
Indique el significado de estos percentiles.
Fuente http://www.ap.org/ Associated Press.
Capítulo 1. Nociones de Estadística Descriptiva 22

Datos no agrupados (simples) y datos agrupados


Se denomina datos no agrupados o simples a los valores que no están agrupados en
distribuciones de frecuencia, mientras que son datos agrupados aquellos que sí lo están.
Si se tiene datos simples, no se construye la distribución de frecuencias para calcular ningún
estadístico, se prefiere el cálculo con los datos simples.

Percentil de datos no agrupados


Ordene los n datos de manera ascendente: x1 ≤ x2 ≤ x3 ≤ …≤ xn
Calcule la posición i del percentil k-ésimo, Pk.
 k 
i n
 100 
Si i es entero, el percentil k-ésimo Pk es el valor que tiene la posición igual a i.
Si i no es entero, el percentil k-ésimo Pk es el valor que tiene la posición inmediata mayor a i.

Ejemplo 20
Dadas las siguientes edades, de una muestra de jóvenes asistentes al concierto de Justin Bieber, calcule
e interprete el percentil 30 y el percentil 50.

10 12 15 14 8 25 19 10 7 14 12 6 18 13 11 15 13 15 16 14 13 15

Percentil en una distribución de frecuencias de una variable cuantitativa discreta


k
El percentil k-ésimo Pk es aquel valor xi que Fi 1   Fi , donde Fi es la frecuencia relativa
100
acumulada hasta xi

Ejemplo 21
Calcule el percentil 30 y el percentil 75 de los siguientes datos. Interprete estos percentiles.

xi ni
1 15
8 56
12 80
15 48
Estadística EEGGCC 23

Percentil de datos agrupados en intervalos


Identificamos la clase o intervalo en que se encuentra el percentil Pk mirando en la columna de las
frecuencias relativas acumuladas.
El valor del percentil se determina por la siguiente expresión:
A  nk  A k 
Pk  Li    N i 1   Li    Fi 1 
ni  100  f i  100 
donde:
Li = límite inferior de la clase del percentil
ni = frecuencia de la clase del percentil
Ni-1 = frecuencia acumulada de la clase que precede a la clase del percentil
A = amplitud de clase
n = número de datos

Para deducir la fórmula para percentiles de datos agrupados en intervalos, podemos establecer una
semejanza de triángulos en la siguiente gráfica.

U i  Li F  Fi 1
 i
Pk  Li k
 Fi 1
100
De donde se tiene que:
A fi

Pk  Li k
 Fi 1
100
Despejando se obtiene la fórmula del percentil k.
A k 
Pk  Li    Fi 1 
f i  100 
Capítulo 1. Nociones de Estadística Descriptiva 24
Cuartiles
Primer cuartil: Q1 = P25
Segundo cuartil: Q2 = P50
Tercer cuartil: Q3 = P75

Ejemplo 22
Según la definición oficial de la Organización Meteorológica Mundial, la lluvia es la precipitación de
agua en forma de gotas, cuando éstas alcanzan un diámetro superior a los 0,5 mm caen a la tierra por
la gravedad a una velocidad superior a los 3 m/s. La cantidad de lluvia que cae en un lugar se mide con
pluviómetros. La cantidad de precipitación es medida en milímetros de agua caída, es decir, la altura
de agua caída recogida en una superficie plana y medida en milímetros durante una hora.
La lluvia se categoriza en:
 débiles: cuando su intensidad es menor o igual a 2 mm/h,
 moderadas: mayor a 2 mm/h y menor o igual a 15 mm/h,
 fuertes: mayor a 15 mm/h y menor o igual a 30 mm/h,
 muy fuertes: mayor a 30 mm/h y menor o igual a 60 mm/h
 torrenciales: mayor a 60 mm/h

En la ciudad A se ha realizado 120 mediciones de una hora, en diversos días del año, de la cantidad de
lluvia obteniéndose los siguientes resultados.

Medición de 120 precipitaciones, en milímetros por hora, en la ciudad A


Precipitación, en milímetros por hora Marca de clase ni fi Ni Fi
[0 16] 8 30 0,2500 30 0,2500

]16 32] 24 55 0,4583 85 0,7083

]32 48] 40 21 0,1750 106 0,8833

]48 64] 56 9 0,0750 115 0,9583

]64 80] 72 5 0,0417 120 1,0000


Fuente: Dirección de Saneamiento Ambiental. Ciudad A.
Estadística EEGGCC 25

a. Calcule e interprete el P80 de las mediciones.


b. Calcule la cantidad de precipitación máxima para estar en el 15% de las precipitaciones más bajas
de las 120 medidas.
c. Calcule el porcentaje de mediciones que fueron clasificadas como lluvia débil o moderada.
d. Calcule el porcentaje de mediciones que fueron clasificadas como lluvia fuerte o muy fuerte.
Capítulo 1. Nociones de Estadística Descriptiva 26

1.5. Medidas de tendencia central


Las medidas de tendencia central se refieren al valor que representa a los datos de una determinada
variable.

Moda

La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor
frecuencia.

Características de la moda
La moda se puede calcular para datos medidos en cualquier escala de medición.
El valor de la moda no se ve afectado por valores extremos.
La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más
modas (multimodal).

Moda de datos no agrupados


Agrupe los datos de acuerdo con sus frecuencias, el dato con mayor frecuencia es la moda.

Ejemplo 23
Calcule e interprete la moda de los siguientes datos, que representa el número de artículos comprados
por 14 clientes de cierto supermercado.
2 2 2 4 2 5 5 4 5 2 5 5 5 4
Calcule e interprete la moda de los siguientes datos, que representa el número de artículos comprados
por 14 clientes de cierto supermercado.
2 2 6 4 3 4 6 3 5 80 7 80 5 7
Estadística EEGGCC 27
Ejemplo 24
En la empresa A, se midió el número de errores por día que cometieron 158 obreros al ensamblar un
determinado producto. Calcule e interprete la moda del número de errores por obrero.

Empresa A. Número de errores al ensamblar el producto


Número de errores Número de obreros
0 25
3 45
5 60
8 28
Fuente: Gerencia de Producción. Empresa A

Moda de datos agrupados en intervalos


Identifique la clase con mayor frecuencia (clase modal).
Obtenga el valor de la moda mediante la expresión:

 d1 
Mo  Lmo    A
 1
d  d 2 

donde
Lmo : límite inferior de la clase modal
d1: diferencia entre las frecuencias (absolutas o relativas) de las clases modal y precedente
d2: diferencia entre las frecuencias (absolutas o relativas) de las clases modal y siguiente
A: amplitud de clase

Ejemplo 25
En la empresa A se tomó un examen de conocimientos sobre los procesos administrativos. Los
resultados se muestran en la siguiente tabla:

Empresa A. Resultado del examen de conocimientos sobre procesos administrativos


Puntaje Marca de clase ni fi
 ,  100 20 0,0939
 ,  24 0,1127
 ,  54 0,2535
 ,  82 0,3850
 ,  180 33 0,1549
Fuente: Gerencia de Recursos Humanos. Empresa A

Calcular la moda del puntaje si los intervalos tienen la misma amplitud.


Capítulo 1. Nociones de Estadística Descriptiva 28

Mediana

Es el percentil 50.

Características de la mediana
Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.
La mediana es un estadístico que no se ve afectado por valores extremos. Por eso se le utiliza
cuando hay datos inusuales o el polígono de frecuencias no es muy simétrico.

n
Dados n datos x1, x2,…, xn, sea S c   x
i 1
i  c , entonces S c  tiene mínimo absoluto cuando c

es igual a la mediana del conjunto de datos.

Ejemplo 26
La mediana de los siguientes datos es 9,5.

9,5 11,4 9,0 9,3 9,3 9,5 9,7 13,7 5,6 9,5 8,2 10,8 12,0 9,4 14,5 10,9 4,3 10,3 12,8 12,9
11,6 10,6 10,5 4,8 2,4 9,5 7,1 10,1 10,7 8,0 8,0 10,6 8,9 7,5 9,9 9,9 10,1 6,8 6,0
n
La gráfica muestra los valores de S c   x i  c para diversos valores de c. De la gráfica, podemos
i 1

observar que el mínimo de S c  se da cuando c es igual a la mediana del conjunto de datos.


Estadística EEGGCC 29
Ejemplo 27
El tiempo, en horas, que se tarda un grupo de obreros, capacitados y no capacitados, en realizar una
tarea se muestra en la siguiente tabla.

Capacitados 4,5 4,3 2,7 8,2 8,3 6,4 5,4 3,4 2,7 5,6
No capacitados 8,3 7,4 8,5 8,5 9,0 8,4 18

Calcule la mediana del tiempo para cada grupo e interprete.

Ejemplo 28
En la empresa A se tomó una muestra aleatoria de trabajadores y se les preguntó por su ingreso
mensual, en dólares, obteniéndose los siguientes resultados.
Ciudad A. Ingreso mensual, en dólares
Ingresos (en dólares) Marca de clase ni
  30
 175 , 225  200 45
 225 , 275  250 190
 275 , 325  300 140
 275 , 325  130
 325 , 2600  2500 25
Fuente: Gerencia de Recursos Humanos. Empresa A

Complete la tabla de distribución de frecuencias y calcule la mediana del ingreso. Interprete.

Media

La media aritmética es el valor que se obtiene al dividir la suma total de los datos entre el número de
datos.

Características de la media
Se puede calcular para datos medidos en escala de intervalo o razón.
El cálculo de la media es sencillo y es la medida de tendencia central más conocida.
El valor de la media depende de todos los datos, por lo que la presencia de valores muy grandes o
muy pequeños con respecto a los demás pueden cambiar drásticamente su valor.
Capítulo 1. Nociones de Estadística Descriptiva 30

Si cada uno de los n valores xi es transformado en: yi = a xi + b, siendo a y b constantes, entonces,


la media de los n valores yi es:
y  ax  b
n

x
i 1
i  nx

 x
i 1
i  x  0

n
Dados n datos x1, x2,…, xn, sea S c    x
i 1
i  c  , entonces S c  tiene mínimo absoluto cuando c
2

es igual a la media del conjunto de datos x .

Ejemplo 29
La media de los siguientes datos es 9,5375.

9,5 11,4 9,0 9,3 9,3 9,5 9,7 13,7 5,6 9,5 8,2 10,8 12,0 9,4 14,5 10,9 4,3 10,3 12,8 12,9
11,6 10,6 10,5 4,8 2,4 9,5 7,1 10,1 10,7 8,0 8,0 10,6 8,9 7,5 9,9 9,9 10,1 6,8 15,9 6,0

n
La gráfica muestra los valores de S c    x
i 1
i  c
2
para diversos valores de c. De la gráfica,

podemos observar que el mínimo de S c  se da cuando c es igual a la media del conjunto de datos x .
Estadística EEGGCC 31

Media aritmética para datos no agrupados


n

x
i 1
i
x
n
Ejemplo 30
Calcule la media de los siguientes datos que representan la cantidad de dinero que tiene en sus
bolsillos cada una de 11 personas.

12 13 25 20 17 19 15 14 28 5 4

Media aritmética para datos agrupados. Variable discreta


n

x n i i n
x i 1
n
 x
i 1
i fi

Ejemplo 31
En la empresa A, se midió el número de errores que cometieron 158 obreros al ensamblar un
determinado producto. Calcule la media del número de errores por obrero.

Empresa A. Número de errores al ensamblar un producto


Número de errores Número de obreros
0 25
3 45
5 60
8 28
Fuente: Gerencia de Recursos Humanos. Empresa A

Media aritmética para datos agrupados. Variable continua


n

m n i i n
x i 1
n
 m f
i 1
i i

Ejemplo 32
En el distrito A se tomó una muestra aleatoria de jóvenes y se les preguntó por su estatura, en
centímetros, obteniéndose los siguientes resultados.
Distrito A. Estaturas de una muestra de 800 jóvenes
Estatura (en centímetros) Marca de clase mi ni fi Ni Fi
 150 ,  0,48
 , 166  0,32
 ,  0,95
 ,  800
Fuente: Gerencia de Desarrollo Humano. Municipalidad del distrito A

Complete la tabla de distribución de frecuencias y calcule la estatura media.


Capítulo 1. Nociones de Estadística Descriptiva 32
Ejemplo 33
Una urbanizadora ha comprado una serie de terrenos a un precio medio de 750 dólares por metro
cuadrado.
a. Si los vende con una ganancia del 25%, calcule el nuevo precio medio por metro cuadrado.
b. Si los vende con una ganancia de 150 dólares por metro cuadrado más un 10% del precio de
compra, calcule el nuevo precio medio por metro cuadrado.

Media aritmética ponderada

Dados n datos x1, x2,…, xn con pesos w1, w2,…, wn la media aritmética ponderada de los datos es:
n

w x i i
xp  i i
n

w i 1
i

Si todos los pesos son iguales, entonces x p  x

Ejemplo 34
Calcule la nota final de un alumno del curso de Estadística de Estudios Generales Ciencias que tiene
las siguientes notas: práctica calificada 1 = 18, práctica calificada 2 = 10, práctica calificada 3 = 12,
práctica calificada 4 = 15, examen parcial = 14 y examen final = 9. Los pesos del promedio de
prácticas, examen parcial y examen final son 3, 3 y 4, respectivamente. La práctica con menor nota se
anula.

Media armónica

Dados n datos x1, x2,…, xn la media armónica de los datos se define como:
n
M . A.  n

x
1
i 1 i

Ejemplo 35
Un vehículo va de la ciudad A a la ciudad B con una velocidad constante de 20 Km/h y regresa con
una velocidad constante de 40 Km/h. Encontrar la velocidad promedio del auto.

eT e1  e2 ee 2
Vp      26,66 km / h
tT t1  t 2 e e 1 1
 
20 40 20 40

Media geométrica

Dados n datos x1, x2,…, xn la media geométrica de los datos se define como:
M .G.  n x1 x2 ...xn
Estadística EEGGCC 33

Ejemplo 36
La población de una ciudad ha crecido en las últimas tres décadas con tasas de 2, 1,8 y 1,2. Encontrar
la tasa promedio de crecimiento por década.

Solución
La tasa promedio de crecimiento por década será la media geométrica de las tasas de cada década.
Tp  3 2  1,8  1,2  1,628

Ejemplo 37
El INEI usa la media geométrica para calcular la inflación media, lo mostraremos mediante un
ejemplo:
La inflación en cierta ciudad en los últimos cuatro años ha sido: 4,5%, 3,2%, 2,1% y 6,9%,
respectivamente.
Sea un producto cuyo precio al inicio del primer año es PI. Al finalizar el cuarto año, el precio del
producto sería PF y se calcularía por:
PF = PI x 1,045 x 1,032 x 1,021 x 1,069
Si la inflación anual hubiera sido constante e igual a i x 100%, ¿cuánto hubiera sido para llegar al
mismo precio final?
PF = PI x (1+i) (1+i) (1+i) (1+i) = PI x (1+i)4
Para hallar i igualamos los precios finales PF.
PI x 1,045 x 1,032 x 1,021 x 1,069 = PI x (1+i)4
Resolviendo, i = 0,041597 entonces la inflación media en el período de cuatro años fue de 4,16%
aproximadamente.

Media cuadrática

Dados n datos x1, x2,…, xn la media cuadrática de los datos se define como:
n

x 2
i
M .C.  i 1

Propiedad de las medias

Si todos los datos son positivos, entonces se cumple que


M . A.  M .G.  X  M .C.
Capítulo 1. Nociones de Estadística Descriptiva 34

1.6. Medidas de dispersión

Con las medidas de tendencia central es posible determinar el valor que representa a los datos de
un conjunto, pero no indica qué tan cercanos o lejanos están los datos de dicho valor central.
Las medidas de variabilidad indican cuán alejados están los datos del valor que los representa.

Ejemplo 38
Calcule la media, mediana y moda de los siguientes grupos de datos:

Grupo 1
1 3 5 5 5 7 9
Grupo 2
-20 5 5 5 5 5 30
Grupo 3
5 5 5 5 5 5 5
¿Qué conclusión deduce de los cálculos?

Rango

El rango (alcance, amplitud o recorrido) de un conjunto de datos observados se define como:


R = valor máximo – valor mínimo

Características del rango


Se puede calcular en variables medidas en escala de intervalo y de razón.
Se ve afectado por valores extremos.
Solo depende del valor máximo y mínimo de los datos e ignora cómo están distribuidos los demás.
El rango es la longitud del intervalo de variación de los datos.
Estadística EEGGCC 35

Rango intercuartil

Es la diferencia entre el tercer y primer cuartil.


Rango intercuartil = RIC = Q3 – Q1= P75 – P25

Características del rango intercuartil


Se puede calcular en variables medidas en escala de intervalo y de razón.
No se ve afectado por valores extremos.

Diagrama de cajas

Es una gráfica que describe la distribución de un conjunto de datos tomando como referencia los
valores de los cuartiles como medidas de posición, la mediana como medida de tendencia central y el
valor del rango intercuartil como medida de dispersión. Además, permite apreciar la forma de la
distribución de los datos (simétrica o asimétrica).

Dato atípico

Es un dato inusualmente grande o pequeño con respecto a los otros datos. Se considera dato atípico a
cualquier valor que esté:
a más de 1,5(RIC) por arriba (o a la derecha) del tercer cuartil
a más de 1,5(RIC) por debajo (o a la izquierda) del primer cuartil

Pasos para trazar un diagrama de cajas


Se traza un rectángulo con los extremos en el primer y tercer cuartil
En la caja se traza una recta vertical en el lugar de la mediana.
Se ubican los límites mediante el rango intercuartil,
o el límite superior está a 1,5(RIC) arriba (o a la derecha) de Q3
o el límite inferior está a 1,5(RIC) debajo (o a la izquierda) de Q1
Se trazan los bigotes desde los extremos de la caja hasta los valores mínimo y máximo dentro de
los límites inferior y superior.
Se marcan con un asterisco (*) las localizaciones de los valores atípicos.
Capítulo 1. Nociones de Estadística Descriptiva 36

La siguiente figura presenta un diagrama de cajas con datos hipotéticos.

Ejemplo 39
Se seleccionó una muestra de 45 viviendas y se registró el monto cobrado por la empresa proveedora
por consumo de luz en el último mes. Obtenga un diagrama de cajas para mostrar la distribución de los
montos cobrados.

10,7 45,0 59,8 65,7 87,4 97,1 98,1 98,8 99,2 99,5 99,6 99,7 102,4 106,3 107,3
108,2 108,7 109,2 109,3 109,9 111,4 112,1 112,6 112,9 115,0 115,4 116,4 116,5 119,1 119,2
119,6 120,4 120,6 121,5 122,1 122,7 124,0 124,5 124,9 125,1 125,2 127,1 128,1 129,0 200,8

Diagramas de caja comparativos

Una ventaja de los diagramas de cajas es que se pueden presentar varios juntos, ello permite la fácil
comparación visual de las características de varios conjuntos de datos.
Los diagramas de caja permiten comparar las distribuciones de los valores de una variable cuantitativa
en los diferentes niveles de otra variable cualitativa.

Ejemplo 40
Se desea comparar el resultado de la primera práctica de tres horarios de Estadística de EEGGCC, para
lo cual, se tienen los siguientes resultados.

H1 0 2 3 4 11 11 12 12 12 12 12 12 12 13 13 13 14 14 15 15 15 15 15 15 20 20
H2 11 12 12 12 13 13 14 14 14 14 14 14 15 15 16 16 16 16 16 17 17 18 18 18 18
H3 0 0 1 3 3 4 5 10 11 11 12 12 13 13 13 14 15 15 16 16 16 17 17 17

Construya un diagrama de cajas que permita comparar las notas en los tres horarios.
Estadística EEGGCC 37

Desviación absoluta

Dados n datos x1, x2,…, xn la desviación absoluta de los datos se define como:
n

 x x i
D. A.  i 1

n
La desviación absoluta es la media de los valores absolutos de las desviaciones a la media.
Se calcula para datos medidos en escala de intervalo o de razón.

Desviación estándar

Dados n datos x1, x2,…, xn la desviación estándar de los datos se define como:
n

 x  x
2
i
sd x  i 1

n
La desviación estándar de los datos es la media cuadrática de las desviaciones a la media.
Es siempre mayor o igual a cero.
Se calcula para datos medidos en escala de intervalo o de razón.

Ejemplo 41
Las notas de cuatro alumnos son x1 = 6, x2 = 11, x3 = 15, x4 = 16.
6  11 15  16
Luego la media aritmética es x   12.
4
Las diferencias de cada valor con la media son d1 = 6 – 12 = -6, d2 = 11 - 12 = -1, d3 = 15 - 12 = 3, d4 =
16 - 12 = 4.

(6) 2  (1) 2  32  42
Luego, la desviación estándar es sd x   3.937
4

Ejemplo 42
Calcule la desviación estándar de los siguientes datos.

18 5 2 4 2 6 2 10 5 8 11 4 5 6 7
Capítulo 1. Nociones de Estadística Descriptiva 38

Desviación estándar de datos agrupados. Variable cuantitativa discreta

 n x  x i i
2
k
sd x  i 1
n
  f x  x 
i 1
i i
2

Ejemplo 43
Calcule la desviación estándar de los siguientes datos.

xi ni
20 3
85 48
120 26
150 45

Desviación estándar de datos agrupados. Variable cuantitativa continua

 n m  x 
i i
2
k
sd x  i 1
n
  f m  x 
i 1
i i
2

Ejemplo 44
Calcule la desviación estándar de los siguientes datos.

Intervalos Marca de clase ni


[2,5 - 12,0] 9
- 75
56
- 8
4

Varianza

Dados n datos x1, x2,…, xn la varianza de los datos se define como sd x2  sd x 
2

2
n n
 n 
 x  x    xi 
2 2
i x i
Se cumple que sd  2 i 1
 i 1
  i 1 
x
n n  n 
 
 
Estadística EEGGCC 39
Propiedades de la varianza y la desviación estándar
La varianza y la desviación estándar son números no negativos.
Son sensibles a la existencia de valores atípicos.
La varianza está expresada en unidades cuadráticas a las de los datos, mientras que las de la
desviación estándar son las mismas. Por ejemplo, si los datos están expresado en kilos, la varianza
estará expresada en kilos2 y la desviación estándar en kilos.
Si cada uno de los n valores xi es transformado en yi = a xi + b, siendo a y b constantes, entonces,
la varianza de los n valores yi es
sd y2  a 2 sd x2 , de donde sd y  a sd x

Ejemplo 45
En una ciudad, se ha registrado el precio, en varias tiendas, de varillas de acero de 12 mm,
encontrándose un precio medio de 19,80 nuevos soles y una desviación estándar de 0,85 nuevos soles.
Si los precios se redujeran en un 5% en todas las tiendas, calcule el nuevo precio medio y la nueva
desviación estándar de los precios.

Desigualdad de Chebyshev

Sea k > 1, entonces el porcentaje de datos en el intervalo [ x  k sd x , x  k sd x ] es mayor o igual que


 1 
1  2 %
 k 
En el intervalo [ x  2 sd x , x  2 sd x ] están por lo menos el 75% de los datos.

En el intervalo [ x  3 sd x , x  3 sd x ] están por lo menos el 88,89% de los datos.

Ejemplo 46
Dados los siguientes datos, compruebe que se cumple la desigualdad de Chebyshev para k = 2,5.

3 6 12 18 4 1 0 2 7 5 12 3 4 5 8 3

Ejemplo 47
Si el ingreso de 120 obreros tiene una media de 300 dólares y una desviación estándar de 30 dólares.
a. ¿Cuántos obreros, por lo menos, tienen sueldos comprendidos en el intervalo de 240 a 360
dólares?
b. Determinar un intervalo que contenga al menos el 88,89% de los ingresos.
c. Si el mínimo sueldo es 210 dólares, ¿en qué porcentaje se puede afirmar que los ingresos son
superiores a 390 dólares?
Capítulo 1. Nociones de Estadística Descriptiva 40

Coeficiente de variación

El coeficiente de variación (CV) de un conjunto de datos indica qué proporción de la media es la


desviación estándar.
La fórmula para el coeficiente de variación para una muestra es
sd x
CV 
x
Es útil al comparar la variabilidad de dos o más series de datos que se miden en distintas o iguales
unidades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones
estándar no es muy útil, por ejemplo, cuando las medias están muy distantes.

Ejemplo 48
En una tienda, el precio medio y la desviación estándar del precio de los jeans es de 74 y 15,4 nuevos
soles, respectivamente. Si se rebaja 10 nuevos soles a todos los precios, calcule e interprete el nuevo
coeficiente de variación de los precios.

Ejemplo 49
El coeficiente de variación de los salarios un grupo de trabajadores es 0,12. Si se aprueba un aumento
del 20% más una bonificación especial de S/.115, el nuevo coeficiente de variación será igual a 0,06.
Determine el valor de la media y la varianza de los salarios de los obreros, antes y después del
aumento.

Ejemplo 50
El siguiente cuadro muestra la distribución de sueldos mensuales de los empleados de dos empresas A
y B en el mes de julio del 2011.

Empresas A y B. Sueldos mensuales en diciembre del 2011


Sueldos (en nuevos soles) Empleados de la empresa A Empleados de la empresa B
[2 500 – 3 500] 8 14
]3 500 – 4 500] 25 25
]4 500 – 5 500] 35 83
]5 500 – 6 500] 8 15
Fuente: Gerencias de Recursos Humanos Empresa A y B.

a. ¿Cuál de los grupos presenta mayor variabilidad de sueldos?


b. Si en la empresa A se aprueba un aumento de sueldo del 25%, mientras que en la B se da una
bonificación de 320 nuevos soles, ¿cuál de los grupos presenta mayor variabilidad de sueldos,
luego de los cambios?
Estadística EEGGCC 41

Puntuación estandarizada Z

Indica a cuántas desviaciones estándar, por arriba o por debajo de la media, se encuentra un valor.
Permite comparar los resultados de un individuo en distintas pruebas en las que las distribuciones
de los resultados de los otros miembros de la población sean distintas.
Si los datos son xi, i = 1, 2,…, n, entonces los datos estandarizados son:
xi  x
zi  i = 1, 2,…, n
sd x

Se tiene que z  0 y que sd z  1

Ejemplo 51
Un conjunto de alumnos rindió dos exámenes. En el primer examen, la nota media fue 13,4 y la
desviación estándar de 2,3, mientras que en el segundo examen la nota media fue 15,4 y la desviación
estándar 4,3. Una persona obtuvo 14 en el primer examen y 16 en el segundo examen. En términos de
los resultados de los exámenes, ¿en cuál de ellos tuvo un mejor resultado?

1.7. Indicadores de asimetría


Mide si los datos aparecen ubicados simétricamente o no respecto a una medida de tendencia central.

Distribución de frecuencias simétrica

Una distribución de frecuencias de k clases es simétrica, si se cumple que f1  f k ,


f 2  f k 1 , f 3  f k 2 , ...

Coeficiente de asimetría de Pearson para datos agrupados o no agrupados

El coeficiente de asimetría para datos simples o agrupados se calcula con la siguiente fórmula:

 x  Q2 
As  3 
 sd x 
Si el coeficiente de asimetría (As) es
igual a cero, la distribución es simétrica alrededor de la media.
positivo, indica sesgo a la derecha (cola derecha).
negativo, indica sesgo a la izquierda (cola izquierda).
Capítulo 1. Nociones de Estadística Descriptiva 42
Ejemplo 52
El salario, en cientos de nuevos soles, de los trabajadores una empresa se presenta a continuación:

25 14 19 14 15 16 15 15 18 15 52 24 36 15 15 23 24

Calcule el coeficiente de asimetría de Pearson.

Ejemplo 53
El siguiente cuadro muestra la distribución del sueldo mensual de los empleados de dos empresas A y
B en julio del 2011.

Empresas A y B. Sueldos mensuales en julio del 2011


Sueldos (en nuevos soles) Empleados de la empresa A Empleados de la empresa B
[1 500 – 2 500] 2 1
]2 500 – 3 500] 40 6
]3 500 – 4 500] 12 25
]4 500 – 5 500] 3 6
]5 500 – 6 500] 1 1
Fuente: Gerencias de Recursos Humanos Empresa A y B.

Calcule el coeficiente de asimetría de los dos grupos. Emita una conclusión.


Estadística EEGGCC 43

Ejercicios

1. Un auditor, luego de revisar las declaraciones juradas de impuesto a la renta de 50 personas


naturales, hace un informe de los montos omitidos. El informe lo presenta con una distribución
de frecuencias de 6 intervalos de la misma longitud. Los montos omitidos varían de 0 soles a
3000 soles, y las frecuencias acumuladas del primero al sexto intervalo son respectivamente: 5,
15, 35, 43, 48, 50.
a. Encuentre e interprete la mediana y el coeficiente de variación.
b. Halle el porcentaje de declaraciones en las que el monto omitido supera la media.

2. La manzana delicia (manzana Red Delicious), tiene piel o cáscara color rojo brillante, pulpa
blanquecina, es algo arenosa y con un sabor algo ácido, de esta variedad procede la variedad
Royal Red Delicious. Se ha tomado una muestra de manzanas obteniéndose los siguientes pesos,
en gramos.

130 158 163 166 168 170 171 174 178 180 183 185 186 187 189
190 190 192 192 193 193 193 193 194 195 196 198 198 199 203
205 211 214 215 217 218 222 224 226 227 233 235 238 239 305

a. Calcule el coeficiente de variación de los pesos de las manzanas.


b. Grafique el diagrama de cajas de los pesos de las manzanas de la muestra.
c. Grafique el polígono de frecuencias de los pesos de las manzanas usando cinco intervalos.

3. Los siguientes son los resultados de pruebas de vigas de concreto reforzado.

Número de la viga 1 2 3 4 5 6 7 8 9 10
Carga de agrietamiento (en miles de kg) 3,8 3,9 3,8 2,3 2,9 4,8 2,7 2,7 4,3 2,9
Carga de falla (en miles de kg) 3,7 4,1 4,6 4,6 4,2 4,8 4,5 4,4 4,3 4,6

a. Hacer una descripción estadística de los datos usando medidas estadísticas (de tendencia
central y dispersión).
b. Comparar los resultados de las dos variables consideradas usando un diagrama de cajas.

4. Hay 10 personas en un ascensor, 4 mujeres y 6 hombres. El peso medio de las mujeres es de 60


kilos con una desviación estándar de 8 kilos y el peso medio de los hombres es de 80 kilos con
una varianza de 25 kilos2.
a. ¿Cuál es el peso medio de las 10 personas en el ascensor?
b. Si el peso de cada una de las mujeres aumentara al doble ¿cuáles serían el nuevo peso medio
y la nueva varianza de los pesos de las mujeres?
c. Suponga que cada uno de los hombres se pesa en una balanza que no está bien calibrada y
que aumenta 2,5 kilos en cada medición. ¿Cuál sería el coeficiente de variación que se
obtendría con esas mediciones de los pesos de los hombres?
Capítulo 1. Nociones de Estadística Descriptiva 44

5. El siguiente cuadro muestra el número de accidentes fatales en empresas mineras en el año 2000
y en el año 2008
(http://www.minem.gob.pe/archivos/dgm/estadisticas/dfm_conten/2008/ACCIDENTES_FATALES_2008.xls)

Años ENE FEB MAR ABR MAY JUN JUL AGO SET OCT NOV DIC
2000 6 4 2 3 3 6 8 0 0 7 8 7
2008 12 5 7 6 3 5 6 6 5 3 3 3

Haga una descripción estadística de los datos usando medidas estadísticas (de tendencia central y
dispersión). Compare los resultados de los años 2000 y 2008.

6. A continuación, se presenta la distribución de los tiempos totales, en minutos, que diferentes


estaciones de radio dedicaron a los avisos comerciales entre las 8:00 a. m. y las 12:00 m. de un
día de la semana pasada.

Tiempo (minutos [0 - 6] ]6 - 12] ]12 - 18] ]18 - 24] ]24 - 30] ]30 - 36] ]36 - 42] ]42 - 48] ]48 - 54] ]54 - 60]
Número de radios 1 3 17 2 1 10 0 0 2 14

a. Calcule e interprete el coeficiente de variación del tiempo dedicado a los avisos comerciales.
b. Halle e interprete los cuartiles de la distribución.
c. Grafique el histograma, el polígono de frecuencias y la ojiva de la distribución. Comente la
simetría de la distribución de tiempos.

7. El porcentaje de grasa corporal es el método más fiable para establecer el peso ideal de una
persona pero es el más difícil y complicado de medir. En un grupo de hombres adultos se midió
el porcentaje de grasa corporal obteniendo la tabla siguiente.

Porcentaje de grasa [ 3 , 7 ] ]7 , 11] ]11,15] ]15,19] ]19,23] ]23,27]


Frecuencia absoluta 16 66 44 60 10 4

a. Grafique el polígono de frecuencias y la ojiva de la distribución.


b. Calcule e interprete el coeficiente de variación.
c. Halle e interprete los cuartiles de la distribución.
d. Se considera que un hombre tiene sobrepeso si tiene un porcentaje de grasa corporal mayor
a 18%. ¿Qué porcentaje de entrevistados tuvo sobrepeso?

8. La anchoveta es el pez más importante del ecosistema de la Corriente de Humboldt. Su


abundancia ha permitido el desarrollo y sustento de muchas otras especies de peces, aves,
mamíferos e invertebrados que hoy en día habitan en nuestro mar. Una muestra de 250
anchovetas de un año de edad ha dado una longitud media de 11,24 cm. Los datos se muestran en
la tabla.
Estadística EEGGCC 45

Tamaño Marca de Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa


(centímetros) clase absoluta relativa acumulada acumulada
0,10
65
180
30
0,96
17 0,04

a. Complete la distribución de frecuencias por intervalos de las longitudes de las anchovetas.


b. Grafique el histograma y la ojiva de frecuencias relativas acumuladas. (Presente dos gráficas
separadas y coloque un título adecuado en cada una de ellas, ponga nombres a los ejes, use
regla para hacer las gráficas).
c. Determine de manera aproximada el porcentaje de anchovetas que miden entre 11 y 13
centímetros.
d. Calcule e interprete la mediana y el rango intercuartil de los tamaños de las anchovetas.
e. Realice el diagrama de cajas del tamaño de las anchovetas.

9. En dos ríos de determinada región se han soltado crías de truchas marcadas y se han recogido
muestras de las mismas después de cierto periodo de tiempo. Se ha medido el peso (en gramos)
de esos ejemplares resultando la tabla siguiente:

Peso (en gramos) Número de peces del río 1 Número de peces del río 2
[0 , 50] 14 11
]50 , 100] 31 23
]100, 150] 25 29
]150, 200] 18 22
]200, 250] 12 15

a. ¿En qué río la distribución del peso resulta más homogénea?


b. Calcule la mediana de los pesos de las truchas del río 1. Interprete el resultado.
c. Grafique el polígono de frecuencias relativas de los pesos de las truchas del río 2.

10. Los salarios que ofrece una empresa a los practicantes varían entre $180 y $300. Si los salarios se
agrupan en cuatro intervalos de clase de longitudes iguales de manera que el 40% de los
practicantes tienen salarios menores o iguales que $225, el 80% tienen salarios menores o iguales
que $255 y el 15% tiene salarios mayores que $262,50.

a. Hallar el porcentaje de practicantes en cada intervalo.


b. Si el ingreso mínimo se fija en $265 y la empresa aumenta una misma cantidad a todos los
practicantes de modo que el 25% supere el ingreso mínimo, ¿cuánto sería el aumento?
Capítulo 1. Nociones de Estadística Descriptiva 46

11. El porcentaje de germinación es uno de los principales factores para decidir la calidad de las
semillas. Un fabricante afirma que el porcentaje de germinación de sus semillas de maíz es del
85%. Para verificar tal afirmación, una cooperativa de agricultores seleccionó 120 muestras de
100 semillas cada una y anotó el porcentaje de germinación en cada muestra. Los valores
observados se organizaron en la siguiente tabla.

Frecuencia absoluta Frecuencia relativa


Germinación (%) Frecuencia absoluta Frecuencia relativa
acumulada acumulada
[ 70 ; ] 10
0,20
0,70
22
] ; 95 ]
2

a. Complete la tabla y construya el histograma, el polígono y la ojiva correspondiente.


b. Calcule la media, la mediana, y el coeficiente de variación de los porcentajes observados.
c. Comente la afirmación del fabricante.

12. En los reportes estadísticos de una empresa, correspondientes al período de los últimos 100 días,
se lee la siguiente información sobre el número de facturas diarias emitidas por la empresa en
dicho período:
Número de facturas Frecuencia relativa
[30 ; 60] 0,25
]60 ; 90] 0,40
]90 ; 120] 0,20
]120 ; 150] 0,10
]150 ; 180] 0,05

a. Graficar el polígono y la ojiva de la distribución. Además, calcule la media y la desviación


estándar del número de facturas diarias emitidas por la empresa en dicho período.
b. Calcule aproximadamente el porcentaje de días en los que fueron emitidas más facturas que
la media.

13. Se realizó una prueba de destreza manual entre los obreros de una fábrica. Se midió el número de
errores cometidos en la prueba, obteniéndose los siguientes resultados:

Número de errores Número de obreros


0 8
2 16
3 24
5 12
7 20
Estadística EEGGCC 47
a. Calcule el rango intercuartil y el coeficiente de variación del número de errores en la prueba.
b. Grafique el diagrama de cajas correspondiente.

14. En una fábrica, la media y la varianza de los tiempos en minutos x i (i = 1,2,…n) para realizar n
tareas similares son 10 y 9 respectivamente.
a. ¿Qué transformación de la forma yi = a + bx i debe hacerse para que la media y la varianza
de los datos trasformados sean 40 y 25 respectivamente?
b. Si el costo en nuevos soles para realizar cada tarea es C(x i ) = 10 + 5x i + 2x i2 . Encuentre la
media de los costos por tarea realizada.

15. En agosto del 2005, la empresa LibroOnLine dictó un curso sobre redes en computadoras
mediante dos sistemas: presencial y a distancia. Con el objetivo de comparar las notas promedio,
la variabilidad de los valores centrales y el rango de las notas, se tomó un examen final y se
registró los resultados en la siguiente distribución de frecuencias.

Notas del examen final   3,5            


Frecuencia relativa (Sistema Presencial) 0,14 0,10 0,12 0,23 0,27 a
Frecuencia relativa (Sistema A distancia) 0,19 0,26 0,24 0,15 0,13 b

a. Realizar un gráfico que permita llegar al objetivo deseado y realizar dos conclusiones sobre
el gráfico.
b. Encontrar, en cada uno de los dos sistemas, el porcentaje de notas que son mayores que su
respectiva media.

16. Se conocen los datos del peso de un grupo de estudiantes.

Intervalos Frecuencias absolutas Frecuencias relativas acumuladas

5 0,96
]60 ; 70]
n = 50
Además, se sabe que la distribución es simétrica
a. Graficar el histograma y el polígono de frecuencias.
b. Calcular la media, la mediana, la moda y la desviación estándar.

17. Una industria usa tres tipos de aceites que cuestan 8,10 y 20 soles el litro. Encontrar el precio
promedio por litro del aceite comprado:
a. Si la industria compra 200 litros de cada aceite.
b. Si la industria compra 2000 soles de cada aceite.
Capítulo 1. Nociones de Estadística Descriptiva 48
18. Se aplicó un cuestionario a 16 trabajadores de una gran empresa y se obtuvieron los datos
presentados en la siguiente tabla:

Código del Año de Nivel educativo Categoría Salario anual Salario anual
Género
trabajador nacimiento (años) laboral actual en S/. inicial en S/.
9534 F 1966 10 Empleado 27,900 12,750
2041 F 1960 12 Empleado 26,250 11,550
1187 F 1952 16 Ejecutivo 41,500 18,750
1842 F 1980 12 Empleado 24,000 12,750
1813 F 1960 12 Empleado 27,450 10,200
2519 F 1979 12 Empleado 23,100 11,250
3338 F 1985 16 Ejecutivo 37,050 18,000
3012 F 1973 12 Empleado 24,450 12,450
1056 M 1980 8 Empleado 28,350 12,000
2087 M 1960 19 Directivo 95,000 56,980
1004 M 1967 12 Empleado 30,900 15,000
6589 M 1975 12 Empleado 26,700 14,500
1723 M 1962 20 Directivo 69,250 42,800
2013 M 1968 16 Directivo 48,200 21,000
1096 M 1981 12 Empleado 27,900 16,500
2873 M 1979 16 Ejecutivo 40,350 19,500
(Género: F = Femenino, M = Masculino)
a. Clasifique cada una de las variables e indique la escala de medición adecuada para cada
caso.
b. Calcule la moda, la media y la mediana de la variable nivel educativo y comente su simetría.
c. Haga un gráfico que permita comparar el rango y los cuartiles de los salarios iniciales de los
hombres y mujeres. Comente el gráfico.

19. Se ha encuestado a un grupo de alumnos de una facultad de ingeniería sobre la cantidad de


minutos que usan al día la Internet obteniéndose los siguientes resultados.

i Intervalo fi
1 [0 ; 18] 0,0548
2 0,1905
3 0,2500
4 0,2857
5 0,1071
6 0,0762
7 0,0357

a. Calcule el tiempo mínimo para estar en el quinto superior de los que usan la Internet.
b. Calcule el porcentaje de alumnos que usan una hora o menos la Internet.
c. Encuentre la media y la varianza del número de minutos diarios que usan la Internet.
Estadística EEGGCC 49
20. Un complejo industrial está formado por dos fábricas. Se tiene los siguientes datos respecto al
consumo mensual de electricidad en cada una de las fábricas.
Fábrica 1: Tiene 9 talleres cuyos consumos en nuevos soles son: S/.88, S/.92, S/.106, S/.110,
S/.93, S/.102, S/.91, S/.94, S/.80
Fábrica 2: Los consumos se dan en la siguiente tabla.

Consumos (en nuevos soles) Talleres


[ 62 ; 72 ] 1
] 72 ; 82 ] 2
] 82 ; 92 ] 4
] 92 ; 102 ] 3

a. ¿Cuál de las fábricas tiene el menor consumo medio de electricidad?


b. ¿Cuál es el consumo medio en todo el complejo industrial?
c. ¿En cuál de las fábricas los consumos de electricidad están más dispersos?

21. En un curso donde hay gran número de alumnos, los estudiantes varones tienen una estatura
media de 170 cm, mientras las mujeres la tienen de 165 cm. En ambos casos la desviación
estándar es de 7 cm. Hay 250 hombres y 180 mujeres en el curso. Si los consideramos a todos
juntos, ¿cuál sería la estatura media?, ¿cuál sería la varianza? Justifique sus respuestas.

22. En la siguiente tabla se muestra la distribución de frecuencias del número de hojas impresas por
un grupo de impresoras durante un día:

Intervalo Marca de clase Frecuencia relativa Frecuencia relativa acumulada


[20 ; ] 0,20
0,45
0,60
125
0,10

a. Complete la tabla de distribución de frecuencias y presente gráficamente la distribución de


frecuencia relativa y de frecuencia relativa acumulada.
b. Encontrar la media, mediana, la moda y la desviación estándar de la distribución.
c. Hallar el porcentaje de impresoras que imprimen entre 70 y 115 hojas.

23. Los siguientes datos representan la cantidad de bebida gaseosa en una muestra de 25 botellas de
dos litros.
1,928 1,946 1,984 2,013 2,045
1,928 1,957 1,996 2,014 2,066
1,938 1,969 1,997 2,014 2,075
1,941 1,971 1,999 2,015 2,086
1,941 1,973 2,003 2,034 2,088
Capítulo 1. Nociones de Estadística Descriptiva 50
a. Las especificaciones del proceso de llenado de las botellas establecen que el contenido
medio debe estar entre 1,950 y 2,050 litros y que la desviación estándar del contenido debe
ser menor a 0,050 litros. A partir de los datos de la muestra, ¿diría usted que el proceso
cumple las especificaciones?
b. Determine e interprete el rango y los cuartiles para la muestra de contenidos de gaseosa.
c. Construya un diagrama de cajas y comente la simetría de la distribución de los contenidos
de gaseosa observados.

24. En un estudio sobre consumo de petróleo en una gran ciudad se eligió dos grifos y se tomó una
muestra de 100 camiones en cada uno de ellos y se observó el número de galones que consumían
en un día, obteniéndose la siguiente distribución de frecuencias.

Grifo A Grifo B
Número de galones Número de camiones Número de galones Número de camiones
1 ; 5 4 10 20
5 ; 9 8 15 37
9 ; 13 35 20 25
13 ; 17 30 25 10
17 ; 21 20 30 8
21 ; 25 3

a. ¿En cuál de los dos grifos el consumo de petróleo presenta mayor variabilidad?
b. Realice un diagrama de cajas que permita comparar el consumo de petróleo de los dos
grifos.

25. Se tomó una muestra aleatoria de 80 viajes de la empresa de transporte interprovincial A y una
muestra aleatoria de 20 viajes de la empresa B. Las tablas siguientes muestran los datos del
número de pasajeros por viaje de esas muestras.

Número de pasajeros por viaje Empresa A


[10 ; 14] 20
]14 ; 18] 30
]18 ; 22] 15
]22 ; 26] 10
]26 ; 30] 5

Número de pasajeros por viaje en la empresa B


12 13 14 17 17 18 19 23 23 25
26 26 27 27 30 31 32 32 34 34

a. Grafique el polígono y la ojiva de las frecuencias relativas de la distribución del número de


pasajeros por viaje de la empresa A.
b. ¿Cuál empresa presenta mayor variabilidad en el número de pasajeros por viaje?
Estadística EEGGCC 51

26. La ojiva de los ingresos mensuales, en miles de nuevos soles, de una empresa se muestran en el
siguiente gráfico.

Ojiva de ingresos mensuales

1
0.9
0.8
0.7
0.6
Fi

0.5
0.4
0.3
0.2
0.1
0
0 1000 2000 3000 4000 5000 6000 7000 8000
Ingresos

a. Grafique el polígono de frecuencias relativas de los ingresos mensuales.


b. Hallar la mediana y coeficiente de variación de los ingresos mensuales.
c. Calcule e interprete el tercer cuartil de los ingresos mensuales.

27. En la siguiente tabla se muestra la distribución de los asistentes a una charla informativa sobre un
nuevo programa de especialización ofrecido por cierta escuela de posgrado, según su profesión.

Profesión Número de asistentes


Ingeniería 24
Administración 8
Contabilidad 10
Economía 15
Derecho 3
Total 60

a. Construya un gráfico que permita observar la composición porcentual de los asistentes,


según sus profesiones, a la charla informativa. El gráfico debe tener un título adecuado.
b. Calcule una medida de tendencia central para la variable cualitativa.

28. La resistencia a la compresión del concreto es la medida más común de desempeño que emplean
los ingenieros para diseñar edificios y otras estructuras. La resistencia a la compresión se mide
fracturando probetas cilíndricas de concreto en una máquina. A continuación se presenta el
histograma correspondiente a las mediciones realizadas en una serie de ensayos.
Capítulo 1. Nociones de Estadística Descriptiva 52

Histograma

0.45
0.4
0.35
0.3
Frecuencia relativa
0.25
0.2
0.15
0.1
0.05
0
1 3 5 7 9
Resistencia (MPa)

a. ¿Qué porcentaje de las probetas tiene una resistencia superior a 3,45 MPa?
b. Calcule e interprete el coeficiente de variación y el coeficiente de asimetría.
c. Estime la resistencia más frecuente.

29. Una compañía requiere los servicios de un técnico especializado. De los expedientes presentados,
se han seleccionado 2 candidatos: A y B, los cuales reúnen los requisitos mínimos requeridos.
Para decidir cuál de los 2 se va a contratar, los miembros del jurado deciden tomarles 7 pruebas.
Todas las pruebas se calificaron utilizando una escala de 0 a 80, donde 80 es el máximo puntaje
posible. Los resultados se dan a continuación:

Prueba
1 2 3 4 5 6 7
Puntaje obtenido por A 57 55 54 52 62 55 59
Puntaje obtenido por B 80 40 62 72 46 80 40

a. Calcule e interprete la media y mediana de los puntajes de los dos candidatos.


b. Calcule e interprete las desviaciones estándar y los coeficientes de variación.
c. ¿Si usted fuese el gerente de Recursos Humanos, a cuál de los candidatos contrataría?
Fundamente su respuesta.
30. La resistencia a compresión es una medida de la capacidad del concreto para resistir cargas que
tienden a aplastarlo. En una ciudad, el requerimiento para la resistencia a la compresión para
concreto residencial es de por lo menos 17,5 MPa. En una muestra de 80 muestras se obtuvo las
siguientes resistencias:

Resistencia [16,0 ;16,5] ]16,5 ;17,0] ]17,0 ;17,5] ]17,5 ;18,0] ]18,0 ;18,5] ]18,5 ;19,0]
Número de pruebas 5 17 20 29 5 4

Calcule la resistencia media de las pruebas y determine el porcentaje de estás cumplen el


requerimiento.
Estadística EEGGCC 53

1.8. Estadística descriptiva bidimensional: Regresión lineal simple

Correlación
La correlación mide la asociación lineal entre las variables X e Y.

Regresión
La regresión encuentra una relación funcional entre las variables X e Y.

Diagrama de dispersión
Dado un conjunto de n observaciones de las variables cuantitativas X e Y: (x1, y1), (x2, y2),…, (xn, yn),
El primer paso en el análisis de regresión, es construir una gráfica de los datos muestrales en un plano
bidimensional. Esta gráfica se denomina diagrama de dispersión o scatter plot.

Fuente: http://www.itl.nist.gov/div898/handbook/eda/section1/eda16.htm

Covarianza
Dados n datos (x1 , y1), (x2 , y2),…, (xn , yn), la covarianza se define como:
n

 x i  x  yi  y 
sd xy  i 1

n
n n n

 xi y i  xi y i
sd xy  i 1
 i 1 i 1

n n n
sd xx  sd x2
Capítulo 1. Nociones de Estadística Descriptiva 54
Coeficiente de correlación lineal de Pearson
Dados n datos (x1 , y1), (x2 , y2),…, (xn , yn), el coeficiente de correlación de Pearson se define como
sd xy
r
sd x sd y

El coeficiente de correlación expresa el grado de asociación lineal que existe entre dos variables X e Y

Varía dentro del intervalo de -1 y 1.


Si r = 0 entonces indica que no existe una asociación lineal entre las variables
Si r se acerca a 1 o a -1 indica que existe una asociación lineal fuerte entre las variables, directa si
r = 1 e inversa si r = -1.

Observaciones
Una correlación alta no indica que una variable dependa de la otra o que sea causa de las
variaciones en la otra. La asociación entre ellas no necesariamente es “causal”.
Una correlación alta indica que el modelo lineal podría ser adecuado para hacer predicciones en el
intervalo de variación de los datos; fuera de él, el tipo de relación entre las variables puede
cambiar o no existir.
Podemos obtener valores de correlación muy altos si usamos una muestra de dos o tres pares de
datos pero en ese caso es claro que la conclusión acerca de la asociación entre las variables puede
no ser válida.
Diversos grupos de datos pueden tener el mismo coeficiente de correlación (como se observa en el
gráfico siguiente) , sin embargo, el tipo de relación entre las variables es distinta, lo que muestra la
importancia de realizar el diagrama de dispersión.

Fuente: http://www.itl.nist.gov/div898/handbook/eda/section1/eda16.htm
Estadística EEGGCC 55
1.9. Regresión lineal simple

El análisis de regresión lineal estudia la relación lineal entre dos variables numéricas. El análisis de
regresión lineal da como resultado una ecuación matemática y  a  bx que describe dicha relación.
La regresión lineal simple encuentra una recta L: y = a + bx que modela los datos, para estimar un
valor de la variable Y dado un valor de la variable X.

Método de mínimos cuadrados


Dados n datos (x1 , y1), (x2 , y2),…, (xn , yn), donde: xi (i = 1, 2,…, n) son los valores observados de X. e
yi (i = 1, 2,…, n) son los valores observados de Y.
Si la recta L: y = a + bx es la recta de regresión yˆ i  a  bxi (i = 1, 2,…, n) es el valor esperado de Y
dado que X = xi. Luego, el error es ei  yi  yˆ i (i = 1, 2,…, n).
La suma de cuadrados de los errores (SCE) es:
n n n
SCE   ei    yi  yˆ i     yi  a  bxi 
2 2 2

i 1 i 1 i 1

La recta de regresión de mínimos cuadrados de Y sobre X, es la recta L: y = a + bx que minimiza la


suma de cuadrados de los errores.
Los valores de b y a que minimizan SCE son:
sd y
br , a  y  bx
sd x
sd xy
También se tiene que b 
sd x2

Interpretación de los coeficientes de regresión


a es igual al valor estimado de la variable dependiente Y cuando la variable independiente X vale
cero.
b es igual al incremento estimado de la variable dependiente Y a incrementos unitarios de la
variable independiente X.

Propiedad de la recta de regresión


Si la recta L: y = a + bx es la recta de regresión de mínimos cuadrados de Y sobre X.
El punto x, y  pertenece a la recta de regresión.
La media de los errores es igual a cero, es decir, e  0

yˆ  y , la media de los valores esperados es igual a la media de los valores observados.


Capítulo 1. Nociones de Estadística Descriptiva 56
Predicción
Para predecir el valor de la variable dependiente para un valor dado de la variable independiente, basta
con reemplazar el valor dado en la fórmula de la recta de mínimos cuadrados.

Descomposición de la varianza

( y
i 1
i  y)2
VT  sd y 
2
Varianza total
n
n n

i 1
(ei  e ) 2 ( y
i 1
i  yˆ i ) 2
VNE  sd e  
2
Varianza no explicada
n n
n

 ( yˆ
i 1
i  y)2
VER  sd yˆ 
2
Varianza explicada por la regresión
n

Se cumple que VT  VNE  VER

Coeficiente de determinación

El coeficiente de determinación es
VER
R
VT
Mide qué proporción de la varianza total VT es la varianza explicada por la regresión VER.
Se cumple que R  r 2
Se cumple que 0  R  1

Ejemplo 54
Durante ocho semanas se observó la relación, entre el número de comerciales contratados y el valor de
las ventas (en miles de soles) de un artículo.

Semana Comerciales (X) Ventas (Y)


1 58 208
2 51 171
3 85 253
4 35 126
5 62 206
6 70 220
7 98 275
8 104 281
Estadística EEGGCC 57
a. Realice el diagrama de dispersión.
b. Calcule la recta de regresión de las ventas sobre el número de comerciales.
c. Si en una semana se contratan 75 comerciales, estimar las ventas en esa semana.
d. Calcule e interprete el coeficiente de correlación.
e. Calcule e interprete el coeficiente de determinación.

Solución
a. El diagrama de dispersión es el siguiente:

b. Calculemos los coeficientes de la recta de regresión.


x  70,375, y  217,5, sd x  22,242, sd y  49,196, sd xy  1074,187

De donde b  2,1712, a  64,699


Por lo tanto, la recta de regresión es L : y  64,699  2,17121x
Capítulo 1. Nociones de Estadística Descriptiva 58
c. Si x es igual a 75, entonces, yˆ  a  b (75)  227,5
sd xy 1074.187
d. El coeficiente de correlación es r    0,981, luego hay una asociación
sd x sd y 22.242 49.196
lineal fuerte y directa entra las variables.
e. El coeficiente de correlación R  r 2  0.96  96 % . La varianza explicada por la recta de regresión
es el 96% de la varianza de la variable valor de las ventas.

Ejemplo 55
Las notas siguientes corresponden a la primera práctica de dos horarios de un curso de Estadística y la
cantidad de horas dedicadas a estudiar para dicha práctica.

Horas 5,0 6,0 12,0 10,0 8,0 8,5 4,5 5,0 2,0 2,5 4,0 5,0 6,0 3,0 4,0 6,0 12,5
Notas 15 12 17 14 15 15 13 13 10 10 10 14 12 12 13 11 17

a. Realice el diagrama de dispersión.


b. Calcule la recta de regresión, interprete los coeficientes de la recta.
c. Estime la nota de un alumno que estudió nueve horas.
d. Calcule e interprete el coeficiente de correlación.
e. Calcule e interprete el coeficiente de determinación.

Ejemplo 56
Se llevó a cabo un estudio para investigar la relación entre Y: el precio de reventa (en cientos de
dólares) y X: la antigüedad (en años) de automóviles compactos de lujo. Se determinó que la ecuación
de la recta de regresión de mínimos cuadrados fue y = 192,7 + bx. También se determinó que por cada
mes adicional de antigüedad del automóvil, la estimación del precio de reventa baja en 153,50 dólares.
Con esta información estime el precio de reventa de un automóvil compacto de lujo con cuatro años de
antigüedad.
Estadística EEGGCC 59

Ejercicios

31. A continuación, se muestran los datos recogidos del valor en dólares de dos acciones, una de un
mercado externo cuya cotización termina a las 9 am. hora peruana, y otra de la Bolsa de Valores
de Lima cuya cotización concluye a las 3 pm.

Día Acción del mercado externo Acción de la BVL


2-Feb-2009 14,29 16,24
3-Feb-2009 14,32 16,28
4-Feb-2009 14,33 16,33
5-Feb-2009 14,28 16,32
6-Feb-2009 14,36 16,47
9-Feb-2009 14,43 16,52
10-Feb-2009 14,35 16,38
11-Feb-2009 14,41 16,45
12-Feb-2009 14,43 16,47
13-Feb-2009 14,36 16,33

a. Encuentre la recta de regresión que mejor se ajuste a los datos y que permita predecir el
precio de la acción que cotiza en la BVL cuando se conoce el precio de la acción del
mercado externo.
b. Estime el precio de la acción que cotiza en la BVL cuando el precio de la acción del
mercado externo es de 14,25 soles.
c. Calcule el coeficiente de determinación y comente sus resultados.

32. Los datos de la siguiente tabla muestran el área construida (en metros cuadrados) y el precio de
venta (en miles de dólares) de 10 departamentos nuevos ubicados en el mismo distrito.

Departamento Área (metros cuadrados) Precio (miles de US$)


1 126 78,5
2 180 175,7
3 162 139,5
4 144 129,8
5 166 95,6
6 163 110,3
7 207 260,5
8 149 105,2
9 134 88,6
10 174 165,7

a. Calcule e interprete el coeficiente de correlación entre el área del departamento y el precio


de venta.
b. Determine la ecuación de la recta de regresión de mínimos cuadrados e interpretar sus
coeficientes.
Capítulo 1. Nociones de Estadística Descriptiva 60

c. Use la recta de regresión hallada en (b) para estimar el precio de un departamento de 150
metros cuadrados.
d. Calcule e interprete el coeficiente de determinación.

33. Se lleva a cabo un estudio, por medio de detectores radioactivos, de la capacidad corporal para
absorber hierro y plomo. A cada participante del estudio se le da una dosis oral idéntica de hierro
y plomo. Después de 12 días se mide la cantidad de cada componente retenida en el sistema
corporal y, a partir de ésta, se determina el porcentaje absorbido por el cuerpo. Se obtienen los
siguientes resultados:

Sujeto 1 2 3 4 5 6 7 8 9 10
Porcentaje de hierro 17 22 35 43 80 85 91 92 96 99
Porcentaje de plomo 8 17 18 25 58 59 62 65 70 72

a. Prediga el porcentaje de hierro absorbido por un individuo cuyo sistema corporal absorbe el
20% del plomo ingerido.
b. Calcule e interprete el coeficiente de determinación.

34. La tabla da la resistencia a la tracción FT y la dureza Brinell HB de diez probetas de cierto tipo
de acero.

FT 42,4 42,9 39,8 39,4 39,9 40,5 38,4 42,8 43,2 42,7
HB 119 119 120 121 122 122 123 124 128 132

a. Si el puntaje z de la dureza Brinell HB de una probeta es igual a 1,2, calcular el valor de la


dureza Brinell HB de esa probeta.
b. Estime, usando una recta de regresión, la resistencia a la tracción FT de una probeta de
dureza Brinell HB 125.
c. Haga un diagrama de cajas para la dureza Brinell HB. Usando el diagrama, comente la
simetría de la distribución.

35. Los datos siguientes representan X = la cantidad total de empresas por región e Y = la cantidad de
empresas exportadoras por región.

Región X = cantidad total de empresas Y = cantidad de empresas exportadoras


Región A 7 360 1 543
Región B 2 540 782
Región C 4 562 910
Región D 5 681 1 243
Región E 2 354 521
Región F 5 976 1 034
Región G 2 351 600
Estadística EEGGCC 61

a. Determine la ecuación de la recta de regresión de mínimos cuadrados y úsela para estimar la


cantidad de empresas exportadoras en una región que tiene un total de 5000 empresas.
b. Calcule el coeficiente de correlación e indique si la relación entre las variables es directa o
inversa.

36. En un estudio para determinar la relación entre la edad y la presión sanguínea en mujeres se tomó
una muestra aleatoria de 9 mujeres dando los siguientes resultados:

Edad 56 41 70 37 63 46 57 50 39
Presión sanguínea 146 125 153 117 151 124 151 142 118

a. Encuentre la ecuación de regresión lineal y estime la presión sanguínea de una mujer de 65


años.
b. Calcule e interprete el coeficiente de correlación lineal.
Estadística EEGGCC 63

Capítulo 2. Nociones de probabilidad

2.1. Conceptos básicos

Experimento aleatorio

Es todo proceso que genera dos o más resultados bien definidos sin que se pueda predecir con certeza
cuál de ellos será observado u ocurrirá en la realización del proceso.

Espacio muestral

Es el conjunto de todos los posibles resultados de un experimento aleatorio. Se le suele simbolizar


como .

Ejemplo 57
Indique, para cada uno de los siguientes experimentos aleatorios, los respectivos espacios muestrales.
a. Lanzar una moneda y anotar lo obtenido en la cara superior
b. Registrar el resultado de una partida de ajedrez
c. Lanzar un dado y anotar el número de puntos de la cara superior
d. Lanzar dos dados y anotar el número de puntos de cada cara superior
e. Lanzar un dado y anotar lo obtenido hasta que salga seis
f. Registrar la temperatura mínima y máxima de un día

Tipos de espacio muestral

Espacio muestral discreto


Tiene un número finito o infinito numerable de elementos.

Espacio muestral continuo


Sus elementos pertenecen a un intervalo o unión de intervalos de los números reales.

Evento

Es cualquier subconjunto del espacio muestral.


Al realizar un experimento, diremos que el evento A ha ocurrido si el resultado obtenido es un
elemento del evento A.
Capítulo 2. Nociones de Probabilidad 64
Ejemplo 58
Indique, para cada uno de los siguientes experimentos aleatorios, uno o más eventos que pertenezcan a
sus respectivos espacios muestrales.

a. Lanzar una moneda y anotar lo obtenido en la cara superior


b. Registrar el resultado de una partida de ajedrez
c. Lanzar un dado y anotar el número de puntos de la cara superior
d. Lanzar dos dados y anotar el número de puntos de cada cara superior
e. Lanzar un dado y anotar lo obtenido hasta que salga seis
f. Registrar la temperatura mínima y máxima de un día.

Tipos de eventos

Evento elemental o simple: Se llama así a cada uno de los elementos del espacio muestral Ω
Evento conjunto: Formado por dos o más eventos simples
Evento contrario o complemento del evento A: Ac que está formado por todos los elementos del
espacio muestral Ω que no pertenecen a A
Evento imposible: Ø
Evento seguro o siempre cierto: Ω

Probabilidad

Mide la posibilidad de que un evento ocurra cuando se realiza un experimento.

Operaciones con eventos

Unión de eventos
Es el conjunto de los resultados que están en uno o en ambos eventos. Se denota por (A B).
A  B  {w   / w  A  w  B}
A  B se expresa como: Al menos uno de los eventos A o B ocurre.
Estadística EEGGCC 65
Intersección de eventos
Es el conjunto de los resultados que están en ambos eventos. Se denota por (A B).
A  B  {w   / w  A  w  B}
A  B se expresa como: Ambos eventos, A y B ocurren a la vez.

Complemento de un evento
AC  {w   / w  A }
A C se expresa como: El evento A no ocurre.

Diferencia de eventos
A  B  A  B C  {w   / w  A  w  B}

A  B se expresa como: Ocurre el evento A pero no el evento B.


Capítulo 2. Nociones de Probabilidad 66
Diferencia simétrica de eventos
   
A  B  A  B C  AC  B  {w   / w  A  w  B}
A  B se expresa como: Ocurre solamente uno de los eventos A o B.

Eventos disjuntos (mutuamente excluyentes)


Dos eventos A y B son disjuntos, si A  B   , es decir, si no tienen elementos comunes.

Álgebra de eventos

Sean A y B dos eventos.


Conmutativa A B  B  A A B  B  A
Identidad A   A  A
Complemento A  AC   A  AC  
Distributiva A  B  C    A  B   A  C  A  B  C    A  B   A  C 
Idempotencia A A  A A A  A
Acotamiento A  A A   
Absorción A   A  B  A A   A  B  A
Asociativas A  B  C    A  B  C A  B  C    A  B  C

Involución A 
C C
A
Opuestos C   C  

de De Morgan  A  BC  AC  BC  A  BC  AC  B C


Estadística EEGGCC 67
Ejemplo 59
Dados los n eventos A1, A2,…, An, la descripción de los siguientes eventos es:
n
Alguno de los eventos ocurra. A
i 1
i

n
Todos los eventos ocurran. A
i 1
i

C
n
 n 
A    Ai 
C
Ninguno de los eventos ocurra. i
i 1  i 1 
C
n
 n 
A    Ai 
C
Alguno de los eventos no ocurra. i
i 1  i 1 

Ejemplo 60
Un experimento consiste en observar el número de televisores vendidos por semana en cierta tienda de
electrodomésticos.
Se definen los siguientes eventos:
A = En una semana se venden menos de cinco televisores
B = En una semana se venden 25 televisores
C = En una semana se venden más de ocho televisores

a. Describa los eventos A  B , A  C y A  B


b. ¿Los eventos A y B son mutuamente excluyentes?
c. Encuentre el evento complementario de A.

Ejemplo 61
Un inspector revisa un proceso de producción de tres etapas. Cada una de las etapas puede o no haber
sido concluida satisfactoriamente. Definamos los eventos Ai:= la etapa i del proceso concluyó
satisfactoriamente, i = 1, 2, 3.

Describa los siguientes eventos:


a. Las tres etapas concluyeron satisfactoriamente.
b. Por lo menos una de las etapas del proceso concluyó satisfactoriamente.
c. Solo dos de las etapas concluyeron satisfactoriamente.

Ejemplo 62
Indique si los siguientes eventos son mutuamente excluyentes
A: estudio muy poco el curso Estadística, B: apruebo el curso Estadística.
Capítulo 2. Nociones de Probabilidad 68
Principios de conteo, combinaciones, variaciones y permutaciones

Principio de la adición
Si A y B son eventos finitos y A  B   , entonces n A  B   n A  nB 

Ejemplo 63
Una persona solo puede viajar de una ciudad a otra por carretera de cuatro formas o por avión de dos
formas. ¿De cuántas formas diferentes puede viajar la persona de una ciudad a la otra?

Principio de la multiplicación
Si A y B son eventos finitos, entonces n A  B   n A nB 

Ejemplo 64
Una joven tiene 34 polos, 16 pantalones y 15 pares de zapatos ¿de cuántas maneras diferentes puede
elegir un polo, un pantalón y un par de zapatos para vestirse?

Factorial
Si n es un número natural, entonces:
0! = 1
(n+1)! = (n +1) n!
Para n ≥ 1, n! = n (n-1) (n-2) (n-3)…1

Permutaciones
La cantidad de formas en que se puede ordenar n objetos distinguibles es:
Pn  n!
Ejemplo 65
Encontrar de cuántas maneras se puede ordenar en una fila a cuatro alumnos.

Solución
La cantidad de maneras es P4  4! 24.

Ejemplo 66
Un grupo de doce personas hace cola en un cine para comprar una entrada.
a. ¿De cuántas maneras diferentes pueden formar la cola las doce personas?
b. ¿De cuántas maneras diferentes pueden formar la cola, si el más grande y el más bajo no tienen
que estar juntos?
Estadística EEGGCC 69
Regla de conteo para variaciones
La cantidad de formas en que se puede ordenar r objetos seleccionados de un total de n objetos
distinguibles es:
n!
Vrn 
n  r !
Si n = r, entonces Vnn  Pn .

Ejemplo 67
Encontrar de cuántas maneras se pueden ordenar dos de cinco alumnos.

Solución
5!
La cantidad de maneras es V25   20
5  2!

Ejemplo 68
De un grupo de 12 vecinos de un edificio, se desea escoger a tres personas al azar para que ocupen los
puestos de presidente, tesorero y vocal de la junta de administración del edificio, respectivamente. ¿De
cuántas maneras diferentes se puede hacer dicha elección?

Regla de conteo para combinaciones


La cantidad de formas de seleccionar r objetos de un total de n objetos distinguibles sin tomar en
cuenta el orden es:
n!
C rn 
r!n  r !

Ejemplo 69
Encontrar de cuántas maneras se pueden escoger dos de cinco alumnos.

Solución
5!
La cantidad de maneras es C25   10
2!5  2!

Ejemplo 70
Un grupo de 25 amigos quiere elegir, al azar, a cuatro de ellos para organizar una fiesta. ¿De cuántas
maneras diferentes se puede elegir a dichas personas?
Capítulo 2. Nociones de Probabilidad 70
Propiedad de combinaciones
C0n  1

C1n  n

Cnn  1

Ckn  Cnnk
n

C
i 0
i
n
 2n

Ejemplo 71
Calcular de cuántas maneras se pueden extraer tres componentes de un panel que tiene cinco
componentes si las extracciones se realizan:
a. A = Uno por uno, con reposición.
b. B = Uno por uno, sin reposición.
c. C = A la vez.

Solución
a. n A  53  5  5  5  125

nB   V35 
5!
b.  5  4  3  60
2!

nC   C35 
5!
c.  10
2! 3!

2.2. Definición clásica de probabilidad


Si el espacio muestral Ω tiene un número finito de elementos equiprobables, la probabilidad de la
ocurrencia del evento A
n  A
P( A) 
n 
número de elementos del evento A
Es decir, P( A) 
número de elementos del espacio muestral

Ejemplo 72
Se lanza un dado, calcular la probabilidad de que salga:
a. un as.
b. un número par.
c. un número menor que 5.
d. un número par y menor que 5.
e. un número par o menor que 5.
Estadística EEGGCC 71
Solución
El espacio muestral al lanzar un dado es   {1, 2, 3, 4, 5, 6} . La cantidad de elementos del espacio
muestral es n()  6

n  A 1
a. A  {1} ,  n( A)  1 entonces, P( A)  
n 6
n B  3
b. B  {2,4,6} ,  n( B )  3 entonces, P( B)  
n 6
nC  4
c. C  {1,2,3,4} ,  n(C )  4 entonces, P(C )  
n 6
n D  2
d. D  B  C  {2,4} ,  n( D )  2 entonces, P( D)  
n 6
n E  5
e. E  B  C  {1,2,3,4,6} ,  n( E )  5 entonces, P( E )  
n 6

Ejemplo 73
Una persona realiza una jugada de la Tinka, que es un juego de lotería que consiste en elegir seis
números de 45 números posibles. Encontrar la probabilidad de que con un boleto de seis números se
acierte con todos los números seleccionados.

Solución
Sea el evento A := Ganar la Tinka.
n A C66C039
P A 
1
 
n C645
8 145 060

Ejemplo 74
De un mazo de 52 cartas se saca una carta al azar, calcule la probabilidad de que sea 6.

Ejemplo 75
Se lanzan dos dados.
a. Calcule la probabilidad de que la suma sea 6.
b. Calcule la probabilidad de que la suma sea mayor a 6.

Ejemplo 76
Calcular la probabilidad de que al sacar una carta de un mazo esta sea menor a 5 o de espadas.

Ejemplo 77
Se sabe que en determinada urbanización viven 120 familias, de las cuales 90 son propietarias y el
resto inquilinas. Si se escoge una familia al azar, ¿cuál es la probabilidad de que sea inquilina?
Capítulo 2. Nociones de Probabilidad 72
Ejemplo 78
Se entrevistó a 3500 clientes de una empresa de telefonía celular que adquirieron un paquete
promocional que permitía llamar ilimitadamente a otros dos celulares de la misma empresa durante
tres meses. La siguiente tabla muestra la distribución de los clientes entrevistados por sexo y por su
intención de renovar el paquete promocional.

Sexo Sí renueva No renueva


Masculino 1 000 900
Femenino 1 200 400

Si se selecciona al azar uno de los clientes entrevistados, calcule la probabilidad de que el cliente
seleccionado:
A = Sea mujer
B = Tenga intención de renovar el paquete promocional
C = Sea hombre y no tenga intención de renovar el paquete promocional
D = Sea mujer o no tenga intención de renovar el paquete promocional

Definición frecuencial de probabilidad

La probabilidad de ocurrencia de un evento se determina por la observación de la proporción de veces


que eventos similares ocurrieron en el pasado (frecuencia relativa)
Si un experimento se realiza n veces y si en nA de ellas ocurre el evento A, la probabilidad de A es:
nA
P( A)  lim
n n

Ejemplo 79
Se lanza un dado y se anota el número de cara superior del dado. Luego, el espacio muestral es igual a
Ω = {1, 2, 3, 4, 5, 6}. Definimos el evento A como el número es un uno, esto es, A = {1}. Si lanzamos
el dado n veces y anotamos las veces en que ha salido un uno, tendremos:

n nA fA
10 2 0,2
100 15 0,15
1 000 168 0,168
10 000 1 661 0,1661
 P(A)

Ejemplo 80
En un almacén donde hay miles de circuitos, se extraen al azar 100 circuitos y se observa que 12 de
ellos son defectuosos. Aproximar la probabilidad de que un circuito del almacén sea defectuoso.

Solución
Sea el evento A = {circuito es defectuoso}. Se tiene que n = 100, nA = 12. Luego, fA = 0,12, de donde
P(A) ≈ 0,12
Estadística EEGGCC 73
Ejemplo 81
En un bosque donde hay miles de aves de una cierta especie, se captura, para luego dejarlas libres, a
70 de ellas y se observa que 5 padecen una cierta enfermedad. Aproximar la probabilidad de que una
ave de dicha especie padezca la enfermedad.

Probabilidad subjetiva

Es la valoración que hace un individuo de las posibilidades de obtener un resultado, basado en su


experiencia, opinión personal y análisis que él hace de la situación particular que se evalúa (estado de
información de la persona). Por ejemplo:
 La probabilidad de que el rendimiento de la Bolsa de Valores de Lima en setiembre sea mayor que
el obtenido en el mes de agosto es menor al 10%.
 La probabilidad de que Perú clasifique para la Copa Mundial del de Fútbol 2014 es 10%.
 La probabilidad de que apruebe el curso de Estadística es 70%.

2.3. Definición axiomática de probabilidad

La probabilidad es una función P que a cada evento A del espacio muestral Ω le hace corresponder el
número P(A) que satisface los siguientes axiomas:

Axioma 1. A   : P( A)  0

Axioma 2. P()  1
Axioma 3. Sean A1 y A2 eventos de Ω, si A1  A2   , entonces P( A1  A2 )  P( A1 )  P( A2 )

Propiedades

Sean A y B dos eventos cualesquiera de Ω, se cumple que:

Si A   , entonces P A  0 , pero si P A  0 entonces no implica que A  

P( A)  P( AC )  1
A  B  P( A)  P( B)
P A  1

P A  B  P A  P A  B


P A  P A  B   P A  B C 
En general, P A  B  P A  PB  P A  B
Capítulo 2. Nociones de Probabilidad 74
Ejemplo 82
La probabilidad de que una computadora de un cierto instituto de computación tenga instalado el
programa A es 0,6 y de que tenga el programa B es 0,5. Si la probabilidad de que tenga instalados los
dos programas es 0,2, calcule la probabilidad de que:
a. tenga alguno de los dos programas.
b. tenga el programa A pero no el B.
c. tenga el programa B pero no el A.
d. tenga sólo uno de los dos programas.
e. no tenga ninguno de los dos programas.

Solución
Sean los eventos A = {Tenga el programa A} y B = {Tenga el programa B}
a. P( A  B)  P( A)  P( B)  P( A  B)  0,6  0,5  0,2  0,9
b. P( A  B)  P( A)  P( A  B)  0,6  0,2  0,4
c. P( B  A)  P( B)  P( B  A)  0,5  0,2  0,3
d. P( AB)  P( A  B)  P( B  A)  0,4  0,3  0,7

e. 
P( AC  BC )  P  A  B
C
  1  P( A  B)  1  (0,9)  0,1
Ejemplo 83
En un estrado se sientan al azar las personas: I , J, K, L y M. Encontrar la probabilidad de que J y K no
se sienten juntos.

Solución
El evento pedido es A = {J y K no se sienten juntos}. Luego AC = {J y K se sienten juntos}. La
4! 2! 3
probabilidad pedida es P( A)  1  P( AC )  1  
5! 5

Ejemplo 84
En un lote de conservas de atún 12 son de marca nacional y ocho son de marca extranjera. Se escogen
al azar y sin reposición seis conservas, encontrar la probabilidad de que entre las conservas elegidas:
a. cuatro sean de marca nacional.
b. todas sean de marca nacional.
c. ninguna sea de marca nacional.
d. alguna sea de marca nacional.
e. por lo menos cuatro sean de marca nacional.
f. a lo más una sea de marca nacional.
Estadística EEGGCC 75
Solución
C412  C28
a. P A   0,3576
C620

C612  C08
b. P B    0,0238
C620

C012  C68
c. PC    0,0007
C620

C012  C68
d. P D   1   0,9993
C620

C412  C28  C512  C18  C612  C08


e. P E    0,5449
C620

C012  C68  C112  C58


f. P F    0,0181
C620

Ejemplo 85
Si  
P AC = 1/3, P A  B  5 / 6 ,  
P B C =1/2, determine: P A  B  , 
P A  BC  y
  
P A  B C  AC  B 

Ejemplo 86
La probabilidad que se fracase en el negocio A es de 1/3, que se tenga éxito en al menos uno de los
negocios es 5/6 y que se fracase en el negocio B es 1/2. Determine la probabilidad de que solamente se
tenga éxito en uno de los negocios.

Ejemplo 87
Se desea realizar dos proyectos de negocios. La probabilidad de tener éxito en el proyecto A es de 0,8,
mientras que en el proyecto B es de 0,9. La probabilidad de tener éxito en ambos proyectos es 0,75.
a. Calcule la probabilidad de tener éxito en alguno de los proyectos
b. Calcule la probabilidad de tener éxito en el proyecto A pero no en el B
c. Calcule la probabilidad de tener éxito en solo uno de los proyectos
d. Calcule la probabilidad de no tener éxito en ninguno de los proyectos
Ejemplo 88
   
Si A y B son eventos mutuamente excluyentes P AC = 3/4, P B C =2/3, determine P A  B  ,
P A  B  y P  A  B C
.

Ejemplo 89
Una persona escoge seis manzanas al azar de 25 posibles. Si de las 25 manzanas solo hay ocho que
están jugosas, calcule la probabilidad de que al menos una de las manzanas escogidas por la persona
estén jugosas.
Capítulo 2. Nociones de Probabilidad 76
Ejemplo 90
Si la probabilidad de ganar la Tinka, al jugar una vez, es 0,0000123%, ¿cuál es la probabilidad de no
ganarla?

Ejemplo 91
El análisis costo-beneficio de la compra de cierta fábrica determinó que solo la ocurrencia de alguno
de los eventos A o B ocasionaría una inversión desfavorable. Se estima que la probabilidad de que
ocurra el evento A es 0,1; la probabilidad de que el evento B ocurra es 0,05 y la probabilidad de que
ocurran ambos eventos es 0,02.
a. ¿Cuál es la probabilidad de que la inversión resulte desfavorable debido únicamente a la
ocurrencia del evento A?
b. ¿Cuál es la probabilidad de que la inversión resulte desfavorable debido únicamente a la
ocurrencia del evento B?
c. Cuantifique el riesgo que se corre en esta inversión, es decir, la probabilidad de que la compra
ocasione una inversión desfavorable.

Asignación de probabilidades

Sea A un evento del espacio muestral Ω.

En un espacio muestral finito y equiprobable


n  A
P( A) 
n 

En un espacio muestral discreto finito


P( A)   Pw 
wi A
i

En un espacio muestral continuo equiprobable (Probabilidad geométrica)


medida A m A
P( A)  
medida m

Ejemplo 92
Un dado se lanza sucesivamente hasta obtener el primer uno.

a. Describa el espacio muestral Ω.


b. Asigne probabilidades a cada uno de los elementos del espacio muestral.
c. Pruebe que P(Ω) = 1.
d. Si A y B juegan tirando el dado alternadamente, ¿cuál es la probabilidad de que A gane, si A sale
primero?
Estadística EEGGCC 77
Ejemplo 93
Al lanzar un dardo a un blanco circular de diez centímetros de radio, el dardo cae indistintamente en
cualquier punto del blanco. Encontrar la probabilidad de que al lanzar el dardo este caiga a menos de
cinco centímetros del centro del blanco.

Solución

El espacio muestral es   x, y  IR2 / x 2  y 2  102 

El evento A es A  x, y   IR 2 / x 2  y 2  5 2 
La medida de cada conjunto es
m()   102 , m( A)    52

m A   5 2 1
Luego, la probabilidad de A es P( A)   
m  10 2
4

Ejemplo 94
Al imprimir una gráfica en un recuadro, el largo del recuadro varía de manera uniforme entre 0 y 40
cm y el ancho varía de manera uniforme entre 0 y 20 cm. Encontrar la probabilidad de que el área del
recuadro sea de más de 200 cm2.

Solución
El espacio muestral es   x, y   IR2 / 0  x  40, 0  y  20
El evento A es A  x, y   IR2 / xy  200

40
200
La medida de cada conjunto es 
m( A)  20 
10
x
dx  600  200.Ln(4)  322,74 y

m()  40  20  800

m A 322,74
Luego, la probabilidad de A es P( A)    0,4034
m 800
Capítulo 2. Nociones de Probabilidad 78
Ejemplo 95
Un blanco de forma hexagonal regular con lados de 14 centímetros de longitud tiene un centro circular
con un diámetro de tres centímetros. ¿Cuál es la probabilidad de que un dardo que da en el blanco
vaya a dar en el centro?

Ejemplo 96
Considere que se han tomado al azar dos números reales x e y, tales que 0 < x < 2, 0 < y < 2. Encontrar
la probabilidad de que el producto xy sea menor que 1 o que el cociente y/x sea menor que 2.

2.4. Probabilidad condicional


La probabilidad condicional se refiere a hallar la probabilidad de un evento conociendo cierta
información (condición).
P( A  B)
P( A B) 
P( B)
PB /   PB 

Propiedad de la probabilidad condicional


La probabilidad condicional es una función de probabilidad que cumple los tres axiomas de la
probabilidad:
Si P( A)  0
B  . P( B / A)  0
P( / A)  1
B1 , B2  . Si B1  B2   , entonces se cumple que P((B1  B2 ) / A)  P( B1 / A)  P( B2 / A)

Ejemplo 97
De las 100 computadoras de una empresa, 60 tienen instalado el programa A y 50 tienen instalado el
programa B. Si 20 tienen instalados los dos programas, encontrar la probabilidad de que una
computadora de la empresa tenga instalado el programa B si tiene instalado el programa A.

Solución
Sean los eventos A y B, definidos como:
A:={La computadora tenga instalado el programa A}
B:={La computadora tenga instalado el programa B}

60 50 20
Se tiene que P( A)  , P( B )  , P( A  B ) 
100 100 100
Estadística EEGGCC 79
20
P( A  B) 100 20
La probabilidad pedida es P( B / A)   
P( A) 60 60
100
Ejemplo 98
En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se
preguntó a todos los peruanos por los servicios de comunicación con los que contaba su hogar y su
área de residencia, obteniéndose los siguientes resultados:

Servicios con que los cuenta el hogar Urbano Rural Total


Hogares sin ningún tipo de servicio 1 682 454 1 468 889 3 151 343
Solo tienen teléfono fijo 480 831 6 170 487 001
Solo tienen teléfono celular 1 299 037 138 721 1 437 758
Solo tienen Internet 3 336 275 3 611
Solo tienen TV por cable 56 343 2 688 59 031
Tienen teléfono fijo y teléfono celular 506 759 2 912 509 671
Tienen teléfono fijo e Internet 15 684 31 15 715
Tienen teléfono fijo y TV por cable 117 733 186 117 919
Tienen teléfono celular e Internet 9 970 84 10 054
Tienen teléfono celular y TV por cable 204 563 1 981 206 544
Tienen Internet y TV por cable 1 288 19 1 307
Tienen teléfono fijo, teléfono celular e Internet 93 103 110 93 213
Tienen teléfono fijo, teléfono celular y TV por cable 326 181 468 326 649
Tienen teléfono fijo, Internet y TV por cable 19 732 9 19 741
Tienen teléfono celular, Internet y TV por cable 15 424 49 15 473
Los cuatro servicios 298 911 133 299 044
Total 5 131 349 1 622 725 6 754 074

a. Si se selecciona a un hogar al azar, ¿cuál es la probabilidad de que sólo cuente con un servicio?
b. Si se selecciona a un hogar, ¿cuál es la probabilidad de que tenga al menos un servicio en su casa?
c. Si se selecciona a un hogar que no cuenta con ningún servicio, ¿cuál es la probabilidad de que sea
de zona rural?
d. Si se selecciona a un hogar de zona urbana, ¿cuál es la probabilidad de que cuente con tres
servicios por lo menos?
e. Si se selecciona a un hogar, ¿cuál es la probabilidad de que sea de zona rural y que tenga todos los
servicios?
f. Si se selecciona a un hogar, ¿cuál es la probabilidad de que sea de zona urbana o que tenga todos
los servicios?
Capítulo 2. Nociones de Probabilidad 80

Regla del producto

La regla del producto se usa para calcular la probabilidad de una intersección de eventos

P( A  B)  P AP( B / A)  PBP( A / B)

Ejemplo 99
En un lote de 50 computadoras hay 20 que son HP. Si se escoge al azar y una por una dos
computadoras del lote, encontrar la probabilidad de que la primera sea HP y la segunda no lo sea.

Solución
Sean los eventos A y B, definidos como:
A:={La primera computadora escogida sea HP}
B:={La segunda computadora escogida no sea HP}

Por dato del problema, afirmamos que P A  , PB / A 


20 30
50 49
20 30
Por la regla del producto tenemos que P( A  B)  P( A) P( B / A)  
50 49

Ejemplo 100
La probabilidad de que una persona sufra de la enfermedad A es del 5%; sin embargo, si sufre de la
enfermedad A, la probabilidad de que sufra de la enfermedad B es del 30%. Calcule la probabilidad de
que sufra ambas enfermedades.

Ejemplo 101
Un juego consiste en poner en una bolsa dos bolas negras y una bola blanca. Tres personas sacan en
orden una bola que no devuelven, quien saque la bola blanca gana. ¿Quién tiene más probabilidad de
ganar?

Partición del espacio

Los eventos A1, A2,…, Ak son una partición del espacio muestral Ω, si:
P( Ai )  0 , (i  1, 2,..., k )

Ai  A j   , (i  j )
k

A i 
i 1
Estadística EEGGCC 81
Teorema de la probabilidad total

Sean los k eventos A1, A2, A3,..., Ak que constituyen una partición del espacio muestral Ω, entonces para
cualquier evento B de Ω se cumple lo siguiente:
PB  P A1 PB / A1   P A2 PB / A2   ...  P Ak PB / Ak 

Teorema de Bayes

Sean los k eventos A1, A2, A3,..., Ak que constituyen una partición del espacio muestral Ω, entonces para
cualquier evento B de Ω se cumple lo siguiente, si P(B) > 0:

P Ai  B  P Ai PB / Ai 
P Ai B   
PB  P A1 PB / A1   P A2 PB / A2   ...  P Ak PB / Ak 

Ejemplo 102
En una fábrica los discos compactos (CD) son producidos por una de tres máquinas: M1, M2, M3. La
producción diaria de cada máquina es de: 500, 300 y 200 CD, respectivamente. El porcentaje de CD
defectuosos producidos por cada máquina es de: 1%, 1,5% y 0,5% respectivamente.
a. Si se escogió un CD producido en la fábrica, calcule la probabilidad de que el CD sea defectuoso.
b. Si el CD escogido es defectuoso, calcule la probabilidad que haya sido producido por M1.

Solución
Sean los eventos Ei:={El CD es producido por Mi}, (i = 1, 2, 3); D:={El CD es defectuoso}

PE1    0,5 , PE2    0,3 , PE3  


500 300 200
 0,2
1 000 1 000 1 000
Además, se sabe que:
PD / E1   0,01, PD / E2   0,015, PD / E3   0,005
3
a. P D    PE PD / E   0,5  0,01  0,3  0,015  0,2  0,005  0,0105
i 1
i i

PE1 PD / E1  0,5  0,01


b. PE1 / D     0,4761
PD  0,0105

Ejemplo 103
En una zona de la ciudad, durante las noches de los fines de semana, la policía sabe por experiencia
que el 20% de los conductores ha consumido alcohol, por lo que realiza operativos para detectar a los
conductores que han consumido alcohol. Para realizar las pruebas usan unos dispositivos que detectan
al consumidor de alcohol en el 95% de los casos y que se equivocan al indicar que una persona ha
consumido, cuando en realidad no lo ha hecho en el 3% de los casos.
a. Con la información anterior estime el porcentaje de conductores para los que el dispositivo da
positivo al consumo de alcohol.
b. Si la persona ha dado positivo para consumo de alcohol, calcule la probabilidad de que en realidad
no haya consumido alcohol.
Capítulo 2. Nociones de Probabilidad 82
Ejemplo 104
Un ingeniero industrial está interesado en determinar si cierta impureza está presente en un producto.
Por estudio de los datos históricos, el ingeniero estima que la impureza está presente en 20% de estos
productos. Con un experimento de laboratorio se puede evaluar si la impureza está o no presente en el
producto; este experimento tiene una probabilidad de 0,86 de detectar la impureza cuando esta está
presente y una probabilidad de 0,08 de indicar que la impureza está presente cuando en realidad no lo
está. Si acaba de realizarse el experimento y el resultado indica que la impureza está presente en el
producto evaluado, determine la probabilidad de que la impureza esté realmente presente en este
producto.

2.5. Eventos independientes


Si P A  0 , los eventos A y B son independientes si y solo si:

PB A  PB 

Dos eventos A y B son independientes si se cumple que:


P( A  B)  P( A) P( B)
Tres eventos A, B y C son independientes si se cumple que:
P A  B  P APB P A  C   P APC  PB  C   PBPC 

P( A  B  C)  P( A) P( B) P(C)

Sean dos eventos A y B de tales que P(A) ≠ 0 y P(B) ≠ 0, entonces:


o Si los eventos A y B son independientes, entonces A y B no son disjuntos
o Si los eventos A y B son disjuntos, entonces A y B no son independientes
Si los eventos A y B son independientes, entonces
o A y BC son independientes.
o AC y BC son independientes

Ejemplo 105
Se lanza un dado n veces, encontrar la probabilidad de que el as aparezca por lo menos una vez.

Solución
Definamos el evento A = {El as aparece por lo menos una vez}

Definamos los eventos Ai = {El as aparece en el lanzamiento i}, se tiene que P Ai  


1
6
Luego, podemos afirmar que Ai, i = 1, 2,…, n son eventos independientes.

 
También, afirmamos que AiC , i = 1, 2,…, n son eventos independientes y que P AiC 
5
6
Estadística EEGGCC 83
n n
Además, A  A
i 1
i por lo que AC  A
i 1
C
i . Luego, tenemos que

 n 
      
n
5
P A  1  P AC  1  P AiC   1  P A1C P A2C ...P AnC  1    ...  1   
5 5 5
 6 6 6 6
 i 1 

Ejemplo 106
Un televidente ve de manera independiente los programas A y B. La probabilidad de que vea el
programa A es 0,2 y de que vea el programa B es 0,3, calcule la probabilidad de que:

a. vea los dos programas.


b. no vea ninguno de los dos programas.
c. vea alguno de los dos programas.
d. vea sólo el programa A.
e. vea sólo el programa B.
f. vea sólo uno de los dos programas.

Solución
Sean los eventos:
A:= {El televidente vea el programa A}
B:= {El televidente vea el programa B}

a. P( A  B)  P( A) P( B) 0,2  0,3  0,06

b.     
P AC  BC  P AC P B C  0,8  0,7  0,56

c. P A  B   1  P(( A  B)C )  1  P( AC  BC )  1  0,56  0,44

d. P A  B  P( A  BC )  P( A)  P( BC )  0,2  0,7  0,14

e. PB  A  P( B  AC )  P( B)  P( AC )  0,3  0,8  0,24

f. P AB  P( A  B)  P( B  A)  0,14  0,24  0,38

Ejemplo 107
En una empresa, los obreros A y B realizan trabajos riesgosos. En cierta tarea, la probabilidad de que
el obrero A tenga un accidente laboral es del 10%, mientras que para el obrero B es del 25%. Si al
realizar dicha tarea, la ocurrencia de los accidentes se puede considerar independiente.

a. ¿Cuál es la probabilidad de que al menos uno de los obreros tenga un accidente laboral?
b. ¿Cuál es la probabilidad de que ninguno de los obreros tenga un accidente laboral?
c. ¿Cuál es la probabilidad de que solo uno de los obreros tenga un accidente laboral?
Capítulo 2. Nociones de Probabilidad 84
Ejemplo 108
Un joven estima por experiencias pasadas que la probabilidad de que, en una gran fiesta, una chica
acepte bailar con él es del 5%. En una fiesta planea sacar a bailar a 35 chicas diferentes. Asuma
independencia entre la decisión de una chica y otra.
a. Calcule la probabilidad de que baile por lo menos con una de ellas.
b. Calcule la probabilidad de que baile por lo menos con dos de ellas.

Ejemplo 109
En la fabricación de un producto se presenta tres tipos de defectos A, B y C, cada uno con
probabilidad del 2%, 5% y 3%, respectivamente. Los defectos ocurren de manera independiente.
a. Si se elige al azar un producto, calcule la probabilidad de que se presente un defecto.
b. Si se elige al azar un producto, calcule la probabilidad de que se presente al menos dos defectos.

Ejemplo 110
En una mina todos los días, en la mañana, se eligen al azar a dos personas de cada cuadrilla para
tomarles un examen que determina si han consumido alcohol el día anterior. En la cuadrilla A hay 40
obreros y en la B hay 35, de los cuales dos y cinco obreros consumieron alcohol el día anterior,
respectivamente. Calcular la probabilidad de que ese día se detecten obreros que consumieron alcohol
solamente de una cuadrilla.
Estadística EEGGCC 85

Ejercicios

37. Tres máquinas producen cierto artículo en cantidades muy grandes, de tal manera que cualquiera
de estos artículos resulta defectuoso independientemente de la máquina que lo haya producido.
La primera máquina produce 2,5% de artículos defectuosos, la segunda 3,1% y la tercera 1,8%.
Se seleccionan al azar tres de estos artículos, el primero producido en la máquina 1, el segundo
en la máquina 2 y el tercero en la máquina 3.
a. ¿Cuál es la probabilidad de que al menos uno de los artículos seleccionados de las dos
primeras máquinas sea defectuoso?
b. ¿Cuál es la probabilidad de que el artículo seleccionado de la tercera máquina sea el
segundo defectuoso?
c. ¿Cuál es la probabilidad de que solo uno de los artículos seleccionados sea defectuoso?

38. La probabilidad de que un evento ocurra es p. Si el experimento aleatorio se repite tres


veces de manera independiente, calcule el valor de p que hace máxima la probabilidad de
que ocurra el evento como máximo una vez.

39. Al imprimir una gráfica en un recuadro, el largo del recuadro varía indistintamente entre 20 y 60
cm. y el ancho varía indistintamente entre 10 y 30 cm. Encontrar la probabilidad de que el área
del recuadro sea de más de 900 cm2.

40. En cierta galaxia, las estrellas pueden de manera independiente ser de neutrones o no. La
probabilidad de que una estrella sea de neutrones es 1/n, donde n es el número de estrellas en la
galaxia. Encontrar la probabilidad de que ninguna estrella de la galaxia sea de neutrones,
suponiendo que hay infinitas estrellas en la galaxia.

41. Se escoge un punto al azar de un segmento de longitud L, ¿cuál es la probabilidad de que la razón
del segmento más corto con relación al más largo sea menor que ¼?

42. Una barra se rompe al azar en dos puntos. ¿Cuál es la probabilidad de que con las tres partes
resultantes se pueda formar un triángulo?

43. Un ingeniero realiza dos tareas diarias, supervisar obras y preparar presupuestos. El tiempo en
supervisar una obra varía indistintamente, entre 2 y 4 horas, mientras que el tiempo en preparar
presupuestos varía indistintamente entre 2 y 6 horas.
a. En un día en particular, determine la probabilidad de que el ingeniero demore más en
supervisar una obra que en preparar presupuestos.
b. Si el ingeniero se demoró más de tres horas en supervisar una obra, ¿cuál es la probabilidad
de que termine sus dos tareas diarias (supervisión y presupuestos) en menos de seis horas?
c. El costo total (en soles) para realizar las tareas es cinco veces el producto de los tiempos de
cada tarea, ¿cuál es la probabilidad de que el costo sea mayor a 80 soles?

44. De los números naturales del 0 al 100 se elige al azar y con reposición 3 números, encontrar la
probabilidad de que la suma de los tres números elegidos sea igual a 50.
Capítulo 2. Nociones de Probabilidad 86
45. Una fábrica de bujías para motores produce un 88% de buenas y un 12% de defectuosas. Antes
de enviarlas a los almacenes para su venta, se someten a un control en la que se admiten como
buenas las que los son con una probabilidad de 0,91 y las que no los son con una probabilidad de
0,04.
a. Calcule la probabilidad de que una bujía sea considerada como buena en un control.
b. Si una bujía fue considerada como buena en un control, ¿cuál es la probabilidad de que sea
realmente buena?

46. Tres tiradores tiran al blanco simultáneamente y de manera independiente. Sus probabilidades de
acertar son 0,5; 0,25 y 0,75 respectivamente. Calcule la probabilidad de que consigan:
a. Al menos un acierto.
b. Exactamente un acierto.
c. Exactamente dos aciertos.

47. Considere que se han tomado al azar dos números reales x e y, tales que 0 < x  2, 0 < y  2.
Encontrar la probabilidad de que el producto xy no sea mayor que uno y que el cociente y/x no
sea mayor que dos.

48. En un circuito eléctrico se instalan en serie y al azar doce resistencias del tipo A y cinco del tipo
B, encontrar la probabilidad de que en el circuito no queden dos resistencias del tipo B
consecutivas.

49. En una ciudad el 55% de los habitantes consume pan integral, el 30% consume pan blanco y el
20% consume ambos. Si se selecciona un habitante al azar:
a. ¿Cuál es la probabilidad de que solamente coma pan blanco?
b. ¿Cuál es la probabilidad de que una persona de esa ciudad no consuma ninguno de los dos
tipos de pan?
c. Sabiendo que el habitante seleccionado consume pan blanco, ¿cuál es la probabilidad de que
no consuma pan integral?

50. Problema propuesto por Leonard Euler (1707 – 1783). Se tienen 100 tarjetas numeradas del 1 al
100. Se retiran 3 al azar. Determine la probabilidad de que las tres tarjetas tengan números
consecutivos.

51. Cuando los artículos llegan al final de una línea de producción, un supervisor escoge los que
deben pasar por una inspección completa; 10% de todos los artículos producidos son defectuosos;
60% de todos los artículos defectuosos y 20% de todos los artículos buenos pasan por una
inspección completa. ¿Cuál es la probabilidad de que un artículo sea defectuoso dado que pasó
por una inspección completa?

52. Un estudiante contesta una pregunta que ofrece cuatro soluciones posibles en un examen de
opción múltiple. Suponga que la probabilidad de que el estudiante sepa la respuesta a la pregunta
es de 0,8 y la probabilidad de que tenga que contestar al azar es de 0,2. Suponga además que la
probabilidad de seleccionar la respuesta correcta al azar es de 0,25. Si el estudiante contesta
correctamente la pregunta, ¿cuál es la probabilidad de que realmente sea la respuesta correcta?
Estadística EEGGCC 87
53. Un banco sortea un viaje entre 100 clientes que han abierto una cuenta bancaria en el último mes.
De ellos, 56 son mujeres, 82 están casados y 43 son mujeres casadas.
a. Calcula la probabilidad de que le toque el viaje a un hombre soltero.
b. Si la persona ganadora es casada, ¿cuál es la probabilidad de que sea mujer?

54. Si un vehículo se pasa la luz roja en un cruce que se equipó con una cámara de vigilancia, hay un
80% de probabilidad de que reciba una multa de tránsito. Si durante las últimas tres horas cinco
vehículos se han pasado la luz roja en el referido cruce, ¿cuál es la probabilidad de que al menos
uno de ellos reciba una multa?

55. Cierto sistema electrónico funciona si al menos una de sus componentes funciona. Si la
probabilidad de que una componente funcione es de 0,75 y las componentes funcionan de manera
independientes, ¿por lo menos cuantas componentes debería tener el sistema para que la
probabilidad de que el sistema funcione sea de por lo menos 0,999?

56. Tres personas lanzan un dado cada una. Calcule la probabilidad de que las tres saquen el mismo
número.

57. Un equipo electrónico tiene tres componentes que funcionan de manera independiente, cuyas
probabilidades de fallar son, respectivamente, iguales a 0,01; 0,015 y 0,08. Si se determina que
dos de los tres componentes han fallado, determine la probabilidad de que hayan sido el segundo
y tercer componente.

58. Se estima que sólo un 25% de las personas que compran acciones en la Bolsa de Valores tiene
conocimientos bursátiles. De los que compran acciones sin conocimientos bursátiles, sólo un
10% obtienen beneficios. El 5% de los que compran acciones tiene conocimientos bursátiles pero
no obtiene beneficios. Si se elige al azar una persona que ha comprado acciones en la Bolsa de
Valores y resulta que ha obtenido beneficios, ¿cuál es la probabilidad de que tenga conocimientos
bursátiles?

59. El Gerente de Proyectos de la empresa LUCET está determinando si debía presentar una oferta
para hacerse cargo de la iluminación de un nuevo centro comercial. En el pasado, el principal
competidor de LUCET, la empresa ILUMIN, ha propuesto ofertas en el 78% de los nuevos
proyectos. Si ILUMIN no presenta ofertas para un trabajo, la probabilidad de que LUCET
obtenga el trabajo es de 0,62. Si ILUMIN propone una oferta para el trabajo, la probabilidad de
que LUCET obtenga el trabajo es de 0,25.
a. ¿Cuál es la probabilidad de que LUCET obtenga el trabajo? Con base en este resultado,
¿recomendaría usted que la empresa presente una oferta? ¿Por qué?
b. Si la empresa LUCET obtiene el trabajo, ¿cuál es la probabilidad de que la empresa
ILUMIN haya propuesto una oferta?

60. Sean A, B y C tres eventos independientes. Demuestre que los eventos (A  B) y C son
independientes.

61. Un inversionista que tiene acciones en tres compañías: A, B y C, estima que las probabilidades de
tener utilidades son 0,3; 0,6 y 0,4 respectivamente.
Capítulo 2. Nociones de Probabilidad 88
a. Si la probabilidad de que tenga utilidades en A y B es 0,12, ¿cuál es la probabilidad de que
no tenga utilidades en B dado que sí las tuvo en A?
b. ¿El tener utilidades en A es independiente de no tener utilidades en B?
c. Si hay independencia entre tener utilidades en las compañías, calcular la probabilidad de que
el inversionista tenga utilidades en más de una de ellas.

62. Según datos del informe Perfil Sociodemográfico del Perú, publicado por el INEI en:
http://www.inei.gob.pe/Anexos/libro.pdf, el 78,78% de la población censada de 18 o más años
vive en área urbana y el resto en área rural. En área urbana, el 97,59% de las personas censadas
de 18 o más años cuenta con Documento Nacional de Identidad (DNI), y este porcentaje es del
93,65% en área rural.
a. Con base en los datos anteriores, calcule el porcentaje de la población censada, de 18 o más
años, que no cuenta con DNI.
b. Si se selecciona una persona censada de 18 o más años y tiene DNI, ¿cuál es la probabilidad
que viva en área urbana?

63. Los registros de los delitos en una ciudad muestran que 20% de ellos son violentos y 80% son no
violentos. Se señala también que son denunciados el 90% de los delitos violentos y solo el 70%
de los delitos no violentos
a. ¿Cuál es la proporción global de delitos que se denuncian en la ciudad?
b. Si no se denuncia un delito ante la policía, ¿cuál es la probabilidad de que el delito sea
violento?

64. Suponga que en una eliminatoria mundialista de fútbol la probabilidad de que cierto equipo gane
el primer encuentro es 2/5 y la de que gane el segundo encuentro es 3/8. Si la probabilidad de que
gane al menos uno de los dos encuentros es 3/4, calcule la probabilidad de que:
a. No gane ninguno de los dos primeros encuentros.
b. Gane sólo uno de los dos primeros encuentros.

65. El único aeropuerto de cierta ciudad cuenta con tres terminales. El terminal A controla el 50% del
tránsito aéreo, el terminal B controla el 35% y el terminal C el 15%. Las tasas de detección de
pasajeros portando armas de fuego en los terminales A, B y C se estiman en 0,96; 0,87 y 0,90,
respectivamente.
a. ¿Cuál es la probabilidad de que un pasajero que porte arma de fuego sea detectado en este
aeropuerto?
b. Si un pasajero que portaba un arma de fuego fue detectado, ¿cuál es la probabilidad de que
haya sido detectado en el terminal B?

66. En el contexto de la eliminatoria mundialista un equipo B debe jugar dos encuentros seguidos. La
probabilidad de ganar el juego de local que es el primero es x. La probabilidad de ganar el juego
de visitante, que es el segundo juego, es y, con y < x. Si ambos encuentros los podría ganar con
probabilidad z con z < y, halle la probabilidad de:
a. ganar solamente el primer encuentro.
b. no ganar ninguno de los encuentros.
c. haber ganado el primer encuentro si gano el último encuentro.
d. ganar el segundo encuentro habiendo perdido el primer encuentro.
Estadística EEGGCC 89
67. Antes de la distribución de cierto software estadístico se prueba si funciona correctamente. El
proceso de prueba consiste en correr cuatro programas independientes y verificar los resultados.
La tasa de falla para los cuatro programas de prueba son 0,01; 0,03; 0,02; y 0,01 respectivamente.
a. ¿Cuál es la probabilidad de que el software falle al menos en una prueba?
b. ¿Cuál es la probabilidad de que el software falle al menos en dos pruebas?
c. Sabiendo que el software falló al menos en una prueba, ¿cuál es la probabilidad de que haya
fallado sólo una prueba?

68. De la población de trabajadores de cierta empresa, el 30% han participado en el curso de


capacitación sobre Control Estadístico de Procesos y el 15% han participado en el curso de
capacitación en Seis Sigma. Se sabe también que el 37% de los trabajadores han participado en al
menos uno de los dos cursos.
a. ¿Qué porcentaje de los trabajadores participaron en los dos cursos?
b. Si se selecciona uno de estos trabajadores al azar, ¿cuál es la probabilidad de que haya
participado sólo en uno de los cursos?

69. Se entrevistó a 120 personas que visitaron B&B, una nueva tienda por departamentos, durante el
fin de semana pasado. Se sabe que fueron entrevistadas 84 mujeres y que 30 de las personas
entrevistadas tenían la tarjeta de crédito de la tienda; también se sabe que un tercio de los
hombres tenían la tarjeta de crédito de la tienda.
a. Calcule la probabilidad de que una de las personas entrevistadas, elegida al azar, sea mujer o
tenga tarjeta de crédito de la tienda.
b. Se selecciona uno de los entrevistados al azar y se verifica que tiene la tarjeta de crédito de
la tienda, ¿cuál es la probabilidad de que el cliente entrevistado sea hombre?
c. Sean los eventos H = el cliente seleccionado es hombre y T = el cliente seleccionado tiene
tarjeta de crédito de la tienda. ¿Son H y T eventos independientes?, justifique claramente su
respuesta.
Estadística EEGGCC 91

Capítulo 3. Variables aleatorias y modelos o


distribuciones de probabilidad

3.1. Variable aleatoria


Es una función del espacio muestral en los números reales, es decir, X :   IR
La variable aleatoria atribuye a cada elemento del espacio muestral  un número que no es aleatorio o
imprevisible, sino fijo y predeterminado. Lo que es aleatorio es el experimento sobre cuyo espacio
muestral se define la variable aleatoria.

Rango de la variable aleatoria

Es el conjunto de los valores posibles de la variable aleatoria, es decir, R X  { X (w) / w   }

Evento (X = a)

El evento ( X  a) se define como ( X  a)  { w   / X (w)  a }

3.2. Variable aleatoria discreta


Una variable aleatoria es discreta si el conjunto de valores que puede tomar es finito o infinito
numerable. Una variable aleatoria discreta asume cada uno de los valores con cierta probabilidad que
se denota P(X = x)
Por ejemplo, son las variables aleatorias discretas las siguientes:
Número de barcos que llegan a un puerto diariamente.
Cantidad de preguntas correctamente contestadas en una prueba de evaluación.
Cantidad de guacamayos que viven en la reserva nacional Pacaya y Samiria.

Ejemplo 111
Sea Ω el espacio obtenido al lanzar una moneda dos veces y observar si sale cara (c) o sello (s) cada
vez. Ω = {(c,c), (c,s), (s,c), (s,s)}.
Sea X el número de caras obtenidas.
El rango de RX = {0, 1, 2}. X es una variable aleatoria discreta.
El evento (X = 1) = {(c,s), (s,c)}
El evento (X = 2) = {(c,c)}

Ejemplo 112
Sea Ω el espacio obtenido al lanzar un dado hasta que salga el as. Sea X el número de lanzamientos.
RX = {1, 2, 3,…} = Z+. X es una variable aleatoria discreta.
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 92
Distribución de probabilidad de una variable aleatoria discreta

La distribución de probabilidad de una variable aleatoria discreta X se describe como una función de
probabilidad representada por f(x) que asigna a cada valor de la variable aleatoria, la probabilidad de
que X asuma ese valor, esto es f(x) = P(X = x).
Toda función de probabilidad cumple lo siguiente:
0 ≤ f(x) ≤ 1

 f x   1
xR X

Si A  RX , entonces P A   f x 
xA

El dominio de la función f(x) se puede extender a todos los números reales, si se define f(x) = 0
para todo x  IR- RX.

Ejemplo 113
Sea X el número de caras obtenidas al lanzar una moneda dos veces. Determine la función de
probabilidad de la variable X y calcule P( X  1)

Solución
Sea la variable aleatoria X := número de caras obtenidas al lanzar una moneda dos veces.
RX = {0, 1, 2}
Luego, la función de probabilidad de la variable X es:

f 0  P X  0  f 1  P X  1  f 2  P X  2 


1 2 1
, ,
4 4 4
La probabilidad pedida es:
1

 f ( x)  f (0)  f (1)  4  4  0,75


1 2
P( X  1) 
x 0

Ejemplo 114
Sea X el número de lanzamientos de un dado hasta que salga el primer seis. Determine la función de
probabilidad de la variable X y calcule P( X  3)

Solución
Sea la variable aleatoria X := número de lanzamientos de un dado hasta que salga el primer seis.
RX = {1, 2, 3,…} = Z+.
f(1) = P(X = 1) = 1/6, f(2) = P(X = 2) = 5/6 x 1/6, f(3) = P(X = 3) = 5/6 x 5/6 x 1/6

Luego, la función de probabilidad de la variable X es:


x 1
5
f  x   P X  x    
1
 ; x  1, 2, 3,....
6 6
1 5 25 
P( X  3)  1  P( X  3)  1   f (1)  f (2)  f (3)   1       0,5787
 6 36 216 
Estadística EEGGCC 93
Ejemplo 115
Se lanza un dado una vez, sea la variable aleatoria X igual al número de la cara superior. Determine y
grafique la función de probabilidad de la variable X.

Ejemplo 116
Se lanza dos dados a la vez, sea la variable aleatoria X igual a la suma de los números de las caras
superiores. Determine y grafique la función de probabilidad de la variable X.

Ejemplo 117
En una urna hay dos bolas rojas y tres bolas negras. Se saca, una a una y sin reemplazo, las bojas hasta
que salga la segunda bola roja. Sea X la variable aleatoria definida como el número de extracciones
necesarias hasta que aparezca la segunda bola roja. Calcule la función de probabilidad de la variable X.

3.3. Variable aleatoria continua


Es una variable cuyo rango es un conjunto infinito no numerable de valores. Por ejemplo: peso, en
kilos, de una persona, tiempo en resolver la primera pregunta del examen parcial de un curso o
volumen, en decibeles, en una discoteca a una hora determinada.

Ejemplo 118
Sea Ω el espacio obtenido al escoger al azar un alumno de la facultad. Sea X la estatura del alumno.
RX = [m, M]. X es continua.

Función de densidad de una variable aleatoria continua

Se denomina función de densidad de probabilidad f(x) de una variable aleatoria continua X a la


función que satisface lo siguiente:
f x   0 x  R X

 f x  dx  1
RX

Si A  RX , entonces P A   f x dx
RX

El dominio de la función f(x) se puede extender a todos los números reales, si se define f(x) = 0
para todo x  IR- RX

Se cumple que:
b
Pa  X  b    f x dx
a

a
P( X  a)   f ( x) dx  0
a

P(a  X  b)  P(a  X  b)  P(a  X  b)  P(a  X  b)


Capítulo 3. Variables aleatorias y distribuciones de probabilidad 94
Ejemplo 119
Si las ventas diarias (en miles de nuevos soles) en una tienda se modelan con una variable continua X
con función de densidad de probabilidad

f ( x)  c x ; 0  x  10

a. Calcular el valor de c
b. Calcule e interprete P( X  5)
c. Calcule e interprete P( X  8)

Solución
10 10
x2
0

a. Como f(x) es una función de densidad cx dx  1 , luego c
2 0
 1 , de donde, 50c  1  c  0,02

5
b. 
P( X  5)  f ( x) dx  0,25 . La probabilidad de que las ventas en un día cualquiera sean menores
0
a 5 000 nuevos soles es de 0,25.
10
c. P( X  8)   f ( x) dx  0,36 . La probabilidad de que las ventas en un día cualquiera sean de al
8
menos 8 000 nuevos soles es de 0,36.

Ejemplo 120
El porcentaje de grasa corporal en un hombre adulto de 40 años puede modelarse como una variable
aleatoria continua X con la siguiente función de densidad de probabilidad:

f ( x)  a (12  x) ; 8  x  10

a. Determine el valor de a.
b. Si se elige al azar a un hombre adulto de 40 años, calcule la probabilidad de que su porcentaje de
grasa corporal sea mayor a 9,5%

Distribución de probabilidad

La distribución de probabilidad f(x) de una variable aleatoria X, es la función de probabilidad de X, si


X es discreta y la función de densidad de probabilidad de X, si X es continua.
Estadística EEGGCC 95

Función de distribución acumulada

La función de distribución acumulada de la variable aleatoria X, es una función F : RX  IR , tal que


F ( x)  P( X  x)
Si X es una variable discreta con función de probabilidad f(x)
F ( a )  P( X  a )   f x 
x a

Si X es una variable continua con función de densidad de probabilidad f(x)

F ( a )  P( X  a)   f xdx
x a

Se cumple que:
Si x1 ≤ x2 entonces F(x1) ≤ F(x2)
P(a < X ≤ b) = F(b) – F(a)

 f x 
dF ( x)
Si la variable X es continua se cumple que
dx
lim F x   0 y que lim F x   1
x x

Ejemplo 121
Sea X el número de lanzamientos de un dado hasta que salga el primer as. Encontrar la función de
distribución acumulada de la variable aleatoria X y P(X ≤ 3).

Solución
La función de distribución acumulada de la variable aleatoria X es:
t 1 x
x
5 1
x
5
F x   P X  x    f t         1   
t 1 t 1  6  6 6
x
5
F x   1    ; x  1, 2, 3,...
6
3
5
Luego, la probabilidad pedida será P X  3  F 3  1     0,4213
6
Ejemplo 122
Sea X el número de caras obtenidas al lanzar una moneda dos veces. Encontrar la función de
distribución acumulada de la variable aleatoria X y calcular P(X ≤ 1)

Ejemplo 123
Sea X una variable aleatoria discreta que denota el número de averías que un operario resuelve en una
jornada de trabajo, con función de probabilidad dada por:

f x  
k
; x  0, 1, 2, 3
x 1
Halle el valor de k y encuentre y grafique la función de distribución acumulada de X.
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 96
Ejemplo 124
El tiempo, en minutos, en que un equipo mete un gol durante un partido de fútbol se puede modelar
por una variable aleatoria continua X con la siguiente función de densidad de probabilidad:

f ( x)  a ; 0  x  90

Determine y grafique la función de distribución acumulada de la variable aleatoria X.


a. Use la función de distribución acumulada para calcular la probabilidad de que un equipo meta un
gol en los diez primeros minutos del partido.
b. Use la función de distribución acumulada para calcular la probabilidad de que un equipo meta un
gol entre el minuto 20 y 30 del partido.
c. Use la función de distribución acumulada para calcular la probabilidad de que un equipo meta un
gol en los últimos cinco minutos del partido.
d. Use la función de distribución acumulada para calcular el rango intercuartil de X.

Valor esperado de una variable aleatoria discreta

El valor esperado E(X) de una variable aleatoria discreta X con distribución de probabilidad f(x) se
define por:
EX    xf x
xRX

El valor esperado E(X), también, se le conoce como media de la variable X, denotada por μX.

Ejemplo 125
Se lanza un dado una vez, sea la variable aleatoria X igual al número de la cara superior. Calcule e
interprete el valor esperado de la variable X.

Ejemplo 126
Se lanzan dos dados y sea la variable aleatoria X igual a la suma de los números de las caras
superiores. Calcule e interprete el valor esperado de la variable X.

Ejemplo 127
El número de trabajadores que faltan por día por razones de salud en una empresa se modela con una
variable aleatoria X con función de distribución.

x 0 1 2 3 4
f(x) 0,08 0,12 0,40 0,25 k

a. Determine k.
b. Calcule e interprete el valor esperado de X.
Estadística EEGGCC 97
Valor esperado de una función de variable aleatoria discreta

Sea G(X) una función de la variable aleatoria discreta X. El valor esperado de G(X) es:
E G X  
xRX
 Gx  f x 
Ejemplo 128
Un jugador lanza un dado, si sale un número de puntos mayor a cuatro gana 10 nuevos soles y si no,
pierde cinco nuevos soles. Calcule e interprete el valor esperado de la ganancia.

Varianza de una variable aleatoria discreta

La varianza V(X) de una variable aleatoria discreta X con distribución de probabilidad f(x) se define
por:

V X   E X   X  
2
  x   X 2 f x 
xRX

 
Se cumple V  X   E X 2   X2   x f x   
2 2
X
xRX

La varianza de la variable aleatoria X, V(X), también se denota por  X2 .

Desviación estándar de una variable aleatoria discreta

 X   X2
Ejemplo 129
Se lanza un dado una vez, sea la variable aleatoria X igual al número de la cara superior. Calcule la
desviación estándar de la variable X.

Ejemplo 130
Se lanzan dos dados y sea la variable aleatoria X igual a la resta del número mayor y el número menor
de las caras superiores. Calcule la desviación estándar de la variable X.

Ejemplo 131
La demanda diaria de un producto perecible puede modelarse por una variable aleatoria discreta X
cuya distribución de probabilidad está dada por la tabla que sigue:

x 12 24 36 48 60
f(x) 0,15 0,25 0,30 0,20 0,10

La empresa obtiene por cada unidad demandada de producto 20 nuevos soles de utilidad. Si la
cantidad demandada en un día es mayor a 36 unidades, se obtiene una utilidad adicional de dos nuevos
soles por unidad demandada de producto. La empresa tiene siempre más de 60 productos en su
almacén al inicio del día. Calcule el valor esperado y la desviación estándar de la utilidad por la
demanda diaria de productos.
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 98
Valor esperado de una variable aleatoria continua

El valor esperado E(X) de una variable aleatoria continua X con distribución de probabilidad f(x) se
define por:

EX    xf xdx
RX

El valor esperado E(X), también, se le conoce como media de la variable X, denotada por μX.

Ejemplo 132
Dada la siguiente función de densidad de probabilidad de la variable aleatoria X
 x ; 0  x 1
f ( x)  
a  x ; 1  x  2
Calcule el valor esperado de X

Valor esperado de una función de variable aleatoria continua

Sea G(X) una función de la variable aleatoria X. El valor esperado de G(X) es:

E G X   Gx  f x dx



RX

Ejemplo 133
La demanda diaria, en kilos, de un producto perecible se modela por una variable aleatoria con función
de densidad
f ( x)  0,01 ; 100  x  200
El kilo del producto tiene un costo de producción de 30 nuevos soles y se vende a 50 nuevos soles.
Todo lo producido que no sea vendido en el día se remata a 15 nuevos soles por kilo. Calcule la
cantidad que se debe producir diariamente para maximizar la utilidad esperada.

Varianza de una variable aleatoria continua

La varianza V(X) de una variable aleatoria continua X con distribución de probabilidad f(x) se define
por:

V X   EX      x    f xdx
2 2

RX

 
Se cumple V  X   E X 2   X2   x f x   
2 2
X
RX

La varianza de la variable aleatoria X, V(X), también se denota por  X2 .


Estadística EEGGCC 99
Desviación estándar de una variable aleatoria continua

 X   X2

Ejemplo 134
Dada la siguiente de probabilidad de la variable aleatoria X
f ( x)  ax2 ; 0  x 1
Calcule la desviación estándar de X.

Propiedades del valor esperado en variables aleatorias


E(b) = b
Si X e Y son variables aleatorias, a y b son constantes, entonces:
E(aX + bY) = a E(X) + b E(Y)
Si X1, X2, X3, . . ., Xn son n variables aleatorias, y a1, a2, a3, . . ., an son n constantes, entonces:
E  a1 X1  a2 X 2  ...  an X n   a1E ( X1 )  a2 E ( X 2 )  ...  an E ( X n )

Ejemplo 135
Un examen de admisión consta de 100 preguntas. Cada pregunta tiene cinco opciones para marcar y
solamente una respuesta correcta. Por cada respuesta correcta se le otorga al postulante un punto,
mientras que si la respuesta es incorrecta al postulante se le resta un cuarto de punto.
a. Si un postulante contesta todas las preguntas del examen al azar, calcule el valor esperado del
puntaje obtenido.
b. Si un postulante puede descartar en cada pregunta tres respuestas incorrectas y luego contesta
todas las preguntas del examen al azar, calcule el valor esperado del puntaje obtenido.

Propiedades de la varianza en variables aleatorias


Si Y = aX + b, con a y b son constantes, entonces: 2y  a 22x

Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes, y a1, a2, a3, . . ., an son n
constantes, entonces:
V  a1 X1  a2 X 2  ...  an X n   a12V ( X1 )  a22V ( X 2 )  ...  an2V ( X n )

Desigualdad de Chebyshev

 1 
Para k > 1 se cumple que P  | X   X |  k X )  1  2 
 k 
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 100
Variable estandarizada

X  x
La variable Z  , tiene esperado igual a 0 y varianza igual a 1.
X

Coeficiente de variación
Sea X una variable aleatoria con distribución de probabilidades f(x). El coeficiente de variación de una
variable aleatoria X es

CV X  X
X

Moda
La moda de la variable aleatoria X es el valor de x que maximiza su función de distribución f(x).

Mediana
La mediana de la variable aleatoria X es el menor valor de x tal que su función de distribución
acumulada F(x) ≥ 0,50.

Ejemplo 136
Sea X una variable aleatoria discreta con la siguiente función de probabilidad:
f x   kx ; x  1, 3, 6, 9
Determine k y calcule la media, moda, mediana de la variable X y el coeficiente de variación de la
variable Y = 3X + 5.

Ejemplo 137
La función de distribución acumulada de la variable aleatoria X está dada por:

 0 ; x  1

F x   ax  1 ;  1  x 
1
 3
 1 1
; x
 3
Calcule P X  0,5 X  0,5 y el coeficiente de variación de la variable aleatoria Y = 2X + 4.

Ejemplo 138
La variable aleatoria con distribución de Pareto se usa en el campo de los seguros de autos para
modelar la cuantía del daño por siniestro. Para una variable aleatoria X con distribución de Pareto se
a
b
cumple que P( X  x)    y su rango es b, . Calcule la media, mediana, moda y desviación
 x
estándar de la variable aleatoria X si a > 2.
Estadística EEGGCC 101

Ejercicios

70. El contenido (en gramos) de oro por tonelada de material extraído en una mina es una variable X
con función de densidad:
f ( x)  e  x  c ; 0  x  3 .
a. Encontrar el valor de la constante c y hallar el contenido de oro esperado por tonelada de
material extraído.
b. Encontrar la función de distribución acumulada de X y hallar la probabilidad de que una
tonelada de material extraído tenga más de un gramo de oro, si se sabe que a lo más tiene
dos gramos de oro.
c. Si el costo por extraer el oro del material es de 25 dólares por tonelada y el gramo de oro se
vende a 40 dólares, encontrar la ganancia esperada al vender el oro extraído de 1000
toneladas de material.

71. En un taller hay tres tipos de máquinas: A, B y C. De las 20 del tipo A, 4 están malogradas; de las
15 del tipo B, 2 están malogradas; y de las 10 del tipo C, 3 están malogradas. Se escoge al azar y
de manera independiente una máquina de cada tipo. Si la variable X es igual al número de
máquinas malogradas escogidas, encontrar la media y la desviación estándar de la variable X.

72. Sea X es una variable aleatoria continua con función de densidad de probabilidad dada por:
f ( x)  ce x ; x 3
a. Halle el valor de la constante c.
b. Determine la función de distribución acumulada de X, F(x).
c. Calcule la media y varianza de X.
d. Compruebe que se cumple el teorema de Chebyshev, para un intervalo con una longitud de
cuatro desviaciones estándar

73. Sea X una variable aleatoria continua con función de densidad:


1  x2
f ( x)  ; 0 xa
12
a. Determine el rango, la moda, la media y la varianza de la variable aleatoria X.
b. Determine y grafique la función de distribución acumulada de la variable aleatoria X.
c. Calcule la probabilidad de que X asuma valores en el intervalo [µ-2σ ; µ+2σ], compare este
valor con el indicado por la desigualdad de Chebyshev.

74. La demanda diaria de gasolina, en miles de galones, en una refinería, se modela con una variable
aleatoria X con función de densidad f(x) dada por:
2cx , 0  x 1
f ( x)  
c(3  x) , 1  x  3
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 102
a. Determine el valor de la constante c y la función de distribución acumulada de la variable X.
b. ¿Cuál debe ser, al comenzar el día, el inventario mínimo que la refinería debe tener para que
con una probabilidad de por lo menos 0,95, exista gasolina disponible al final de un día
cualquiera?
c. Determine la demanda esperada

75. La demanda diaria de cierto artículo es una variable aleatoria cuyos valores son 10, 20 o 30 con
probabilidades de 0,2; 0,5 y 0,3 respectivamente. El costo de cada artículo es 1,80 soles y el
precio de venta es dos soles. Los artículos son perecederos de tal manera que si un artículo no se
vende en el día la pérdida es total. Hallar el número de artículos que se deben ordenar para la
venta de tal manera que la ganancia esperada sea máxima.

76. Suponga que el ingreso familiar mensual en miles de unidades monetarias en una ciudad, es una
variable aleatoria X con función de densidad:
4kx ; 0  x 1
f ( x)  
k (5  x) ; 1 x  5
a. Determinar el valor de la constante k y calcular el porcentaje de familias con ingresos
mensuales de entre 500 y 2000 unidades monetarias.
b. ¿Cuál es el ingreso familiar esperado?

77. La proporción de su presupuesto anual que una compañía dedica al mantenimiento de sus
máquinas es una variable aleatoria X con función de densidad:
f ( x)  c ( x  1) ; 0  x 1
a. Halle el valor de la constante c.
b. Encuentre la distribución acumulada de la variable X.
c. Si la proporción del presupuesto anual dedicado al mantenimiento de sus máquinas es de al
menos 0,20, ¿qué probabilidad hay de que esta proporción no supere el 0,80?

78. Un ingeniero propone que la proporción de construcciones civiles sin licencias de construcción
puede ser modelada usando la siguiente función de densidad
g ( y)  cy 2 (1  y) ; 0  y  1
Un segundo ingeniero propone usar otro modelo dado por
f ( x)  d ; 0  x  1
a. Encuentre c y d.
b. Halle las distribuciones acumuladas en cada modelo y calcule la probabilidad que la
proporción indicada supere a 0,8.
c. ¿Cuál modelo presenta menor variabilidad?

79. La demanda semanal de gas propano, en miles de galones, de una distribuidora en particular es
una variable aleatoria X con función de densidad f(x) dada por:
 1 
f ( x)  21  2  ; 1 x  c
 x 
Estadística EEGGCC 103
a. Determine c y la función de distribución acumulada de X, F(x).
b. Calcule la media y el percentil 80 de la demanda semanal de gas propano.
c. Si hay 1500 galones en existencia al principio de la semana y no se recibe nuevo suministro
durante la semana, ¿cuántos galones se espera que queden al finalizar la semana?

80. Sea X una variable aleatoria discreta que denota el número de averías que un operario resuelve en
una jornada de trabajo, con función de probabilidad dada por:
k
f ( x)  ; x  0, 1, 2, 3.
x 1
a. Halle el valor de k y encuentre la función de distribución acumulada de X.
b. Calcule la mediana de la variable X y el coeficiente de variación de la variable Y = 3X+5.

81. Se ha observado que un termómetro sometido a condiciones meteorológicas adversas da una


medición de entre dos grados más y dos menos de la temperatura real. El error cometido se
modela por una variable aleatoria continua con la siguiente función de densidad.

1
f ( x)  ( 2  x) ,  2  x  2
8

a. Calcule la probabilidad de que el valor absoluto del error sea menor a un grado.
b. Calcule la probabilidad de que el termómetro dé la temperatura exacta.
c. Calcule el error esperado y la desviación estándar del error.

82. El número de solicitudes de crédito hipotecario recibidas semanalmente en una agencia bancaria
se modela con una variable aleatoria X con función de probabilidad f(x) dada por:

 c
 x  5; 6; 7; 8; 9
f ( x)   2 x  3

 0,092 x  10

Determine el valor de la constante c, la media, mediana y moda de X.

83. El tiempo de fraguado, en minutos, de un cierto tipo de concreto se puede modelar por una
variable aleatoria X con la siguiente función de distribución acumulada

F x  
x 2
 ; 20  x  50.
30 3
Calcule el coeficiente de variación de la variable X.

84. La vida, en horas, de un tipo de transistores se representa por una variable aleatoria continua con
función de distribución acumulada:
100
F ( x)  1  , x  100.
x
¿Cuál es la probabilidad de que en un aparato de radio que lleva cuatro de estos transistores, al
menos tres deban ser sustituidas durante las primeras 250 horas?
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 104

3.4. Algunos modelos discretos importantes

Experimento de Bernoulli

Un experimento de Bernoulli (εβ) es un experimento aleatorio con dos únicos resultados posibles
denominados éxito (E) y fracaso (F).
La probabilidad de éxito se denota P(E) = p y la de fracaso P(F) = 1- p = q.
Los siguientes son ejemplos de experimentos Bernoulli:
Lanzar un dado y observar si sale seis
o E:= Sale 6. Luego, P(E) = 1/6
Revisar un artículo y verificar si es defectuoso en una línea de producción que produce el 0,1% de
artículos defectuosos.
o E:= El artículo es defectuoso. Luego, P(E) = 0,001
Ofrecer una póliza de seguros a un cliente y anotar si la compra. Por experiencia se sabe que el 5%
de los clientes compra la póliza.
o E:= El cliente compra la póliza. Luego, P(E) = 0,05

Distribución Bernoulli

Se denomina una variable Bernoulli a una variable aleatoria X definida en el espacio muestral asociado
a un experimento Bernoulli tal que X(F) = 0 y X(E) = 1.
La función de probabilidad de la variable aleatoria X es:
f ( x)  P X  x   p x q1x x  0, 1

Se denota X ~ Ber (p) y se lee X sigue una distribución Bernoulli con parámetro p.
Media   E X   p

Varianza  2  V  X   p1  p   pq
Estadística EEGGCC 105

Distribución binomial

Un experimento binomial consiste en una serie de n repeticiones de un experimento Bernoulli, donde n


se fija antes de realizar el experimento.
Las pruebas son independientes entre sí por lo que el resultado de un intento en particular no
influye en el resultado de cualquier otro.
La probabilidad de éxito es constante de una prueba a otra y la denotamos como p.
Se define la variable aleatoria binomial X como el número de éxitos observados en un experimento
binomial, es decir:
X := Número de éxitos obtenidos en n repeticiones independientes de un experimento de Bernoulli con
probabilidad de éxito p.
La función de probabilidad de la variable aleatoria binomial X es:
f x   P X  x   C xn p x 1  p 
n x
; x  0, 1, 2,, n

Se denota X ~ B (n, p) y se lee X sigue una distribución binomial con parámetros n y p.

Media   E X   np

Varianza  2  V  X   np1  p 
Se cumple que X ~ Ber(p), si y solo si X ~ B(1, p)
Si Xi ~ Ber(p) (i = 1, 2,…, n) variables aleatorias independientes, entonces se cumple que
X1+X2+… + Xn ~ B(n, p)

Ejemplo 139
Los siguientes son ejemplos de variables binomiales:
X1 = Número de artículos defectuosos en un lote de 500
o n = 500 E:= artículo defectuoso P(E) = 0,001  X1 ~ B(n = 500, p = 0,001)
X2 = Número de clientes que compran una póliza de seguro de vida de los 20 visitados
o n = 20 E:= cliente compra la póliza P(E) = 0,08  X2 ~ B(n = 20, p = 0,08)
X3 = Número de solicitudes de crédito hipotecario aprobadas de 15 evaluadas
o n = 15 E:= crédito aprobado P(E) = 0,68  X3 ~ B(n = 15, p = 0,68)
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 106
Ejemplo 140
En un proceso de fabricación artesanal de papel reciclado se estima, por experiencia anterior, que el
3% de las hojas de papel producidas presentan defectos en el teñido. Las hojas de papel se empacan en
cajas de 50 unidades. Si usted ha comprado una de estas cajas, calcule la probabilidad de que:
a. ninguna de las hojas presente defectos en el teñido
b. la caja contenga exactamente tres hojas con defectos en el teñido
c. la caja contenga a lo más dos hojas con defectos en el teñido
d. la caja contenga al menos una hoja con defectos en el teñido
e. ¿Cuántas hojas con defectos en el teñido esperaría encontrar en su caja?

Solución
Definimos la variable aleatoria X: = número de hojas con defectos en el teñido en la caja de 50 hojas
de papel reciclado
Notemos que X ~ B (n = 50, p = 0,03)
a. La probabilidad de que ninguna de las hojas de la caja presente defectos en el teñido es
P X  0  C050 0,0300,9750  0,218
b. La probabilidad de que en la caja haya exactamente tres hojas que presenten defectos en el teñido
es P X  3  C350 0,0330,9747  0,126
c. La probabilidad de que en la caja haya a lo más dos hojas con defectos en el teñido es
2
P X  2   C
x 0
50 x
x 0,03 0,97
50 x
 0,811

d. La probabilidad de que en la caja haya más de una hoja con defectos en el teñido es
1
P X  1  1  P X  1  1  C
x 0
50 x
x 0,03 0,97
50 x
 1  0,555  0,445

e. En una caja de 50 hojas recicladas se esperaría encontrar E(X) = np = 50(0,03) = 1,5 hojas que
presenten defectos en el teñido.

Ejemplo 141
Un médico estima que el 42% de los pacientes que atiende diariamente requiere algún examen de
laboratorio.
a. Si en un día en particular el médico debe atender 18 pacientes, estime la probabilidad de que
menos de siete de ellos requieran algún examen de laboratorio.
b. Estime la probabilidad de que de 22 pacientes atendidos en un día por este médico, más de 20
requieran de algún examen de laboratorio.

Ejemplo 142
La probabilidad de realizar con éxito cierto experimento es constante en cada repetición. Se sabe que
si el experimento se repite de manera independiente 24 veces, entonces es igualmente probable
obtener cuatro éxitos que obtener cinco éxitos. Determine la probabilidad de obtener tres éxitos si el
experimento se realiza diez veces.
Estadística EEGGCC 107
Distribución geométrica

La variable aleatoria X tiene una distribución geométrica con parámetro p si X es el número de


repeticiones independientes de un experimento Bernoulli con P(E) = p hasta obtener un éxito.

La función de probabilidad de X es:


f ( x)  P X  x   q x1 p ; x  1, 2, 3,...

Se denota X ~ G(p) y se lee X sigue una distribución geométrica con parámetro p.

  EX  
1
Media
p
1 p q
Varianza  2  V X    2
p2 p
La función de distribución acumulada es
F ( x)  P X  x   1  q x ; x  1, 2, 3,...

Se cumple que P X  x   q x ; x  1, 2, 3,...

Se cumple que P(X > k+s / X > k) = P(X > s) k, s  Z+


Esta propiedad indica que la distribución geométrica “no tiene memoria”, es decir, si el éxito no se
ha obtenido en las primeras k repeticiones, entonces, la probabilidad de que no ocurra en las
próximas s repeticiones es la misma que la probabilidad de que el éxito no ocurra en las primeras s
repeticiones.
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 108

Ejemplo 143
La probabilidad de que cada llamada telefónica de un vendedor resulte en una venta es 0,10.
a. Determine el modelo de probabilidad del número de llamadas realizadas por el vendedor hasta que
conseguir su primera venta.
b. ¿Cuántas llamadas espera hacer el vendedor hasta conseguir su primera venta?
c. Si el vendedor ya realizó tres llamadas sin éxito, ¿cuál es la probabilidad de que necesite hacer
más de 12 llamadas para conseguir su primera venta?

Solución
a. Sea X := número de llamadas realizadas por el vendedor hasta que conseguir su primera venta.
Suponiendo que las llamadas y las ventas se realizan independientemente y con una probabilidad
de éxito constante e igual a 0,1, se tiene que X ~ G(p = 0,1)
b. Calculamos E(X) = 1/p = 1/0,1 = 10. El vendedor espera realizar su primera venta en la décima
llamada.
c. Calculamos la probabilidad usando la propiedad de la “falta de memoria” P(X >k+s/X>k)=P(X > s)

P X  12 X  3  P X  9  3 X  3  P X  9  1  1  0,9 9  0,3874 
Por lo tanto, sabiendo que el vendedor ya hizo tres llamadas y no tuvo éxito, la probabilidad de que
realice más de doce llamadas para conseguir su primera venta es 0,3874.

Ejemplo 144
Una compañía petrolera sabe que la probabilidad de que una perforación sea exitosa es del 15%.
Calcular la probabilidad de que se necesite realizar por lo menos 6 perforaciones para tener la primera
perforación exitosa.

Distribución de Pascal o binomial negativa

Se define la variable Pascal con parámetros r y p como X número de repeticiones independientes de un


experimento Bernoulli con P(E) = p hasta obtener r éxitos.
La función de probabilidad de la variable X es:
f ( x)  P X  x   Crx11 1  p 
x r
pr ; x  r, r  1, r  2,...
Estadística EEGGCC 109

Se denota X ~ Pas(r, p) y se lee X sigue una distribución Pascal con parámetros r y p.

  EX  
r
Media
p
r 1  p  rq
Varianza  2  V X    2
p2 p

Se cumple que X ~ G(p) si y solo si X ~ Pas(1, p)


Si Xi ~ G(p) (i = 1, 2,…, n) variables aleatorias independientes, entonces se cumple que la variable
X = X1+X2+… + Xn ~ Pas(r, p)

Ejemplo 145
En cierta línea de producción la probabilidad de producir un artículo defectuoso es de 0,001
a. Describa el modelo de probabilidad del número de artículos producidos hasta el quinto defectuoso.
b. Calcule la probabilidad de que el octavo artículo producido sea el quinto defectuoso.
c. ¿Cuántos artículos se espera producir hasta el cuarto defectuoso?

Ejemplo 146
Una compañía petrolera sabe que la probabilidad de que una perforación sea exitosa es del 15%.
Calcular la probabilidad de que se necesite realizar por lo menos ocho perforaciones para tener la
tercera perforación exitosa.

Distribución hipergeométrica

El experimento hipergeométrico consiste en extraer al azar y sin sustitución n elementos de un


conjunto de N elementos, r de los cuales son éxitos y N - r son fracasos.

Se define la variable aleatoria hipergeométrica como X número de éxitos observados en la muestra


de tamaño n.
La función de probabilidad de la variable X es:
C xr C nNxr
f ( x)  P X  x   ; x  max{0, n  ( N  r )},..., min{n, r}
C nN
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 110

Se denota X ~ H (N, r, n) y se lee que la variable aleatoria X sigue una distribución


hipergeométrica con parámetros N, r y n.

  EX   n
r
Media
N
r  r  N  n 
Varianza  2  V X   n 1   
N  N  N  1 
Sea X ~ H(N, r, n), si n/N tiende a cero, entonces X ~ B(n, r/N) aproximadamente.

Ejemplo 147
En un equipo de fútbol hay 18 jugadores de los cuales cuatro consumen sustancias prohibidas.

a. Calcule la probabilidad de detectar a por lo menos uno de los jugadores que usan sustancias
prohibidas, si la directiva del club ha realizado una prueba antidoping a 2 jugadores.
b. Calcule la probabilidad de detectar a por lo menos uno de los jugadores que usan sustancias
prohibidas, si la directiva del club ha realizado una prueba antidoping a 6 jugadores.

Ejemplo 148
En una distribuidora hay 25 televisores de los cuales 6 son de tecnología LED. Si se seleccionan al
azar 10 televisores, calcule la probabilidad de que se haya seleccionado por lo menos dos televisores
de tecnología LED.

Ejemplo 149
Se embarcan mayólicas de piso en cajas de 50 unidades. En el control de calidad, se elige al azar (una
por una sin reposición) cinco mayólicas de una caja. Si ninguna mayólica es defectuosa, la caja es
aceptada; si se encuentra que una o más son defectuosas, se inspecciona la caja completa. Suponga que
en realidad hay tres mayólicas defectuosas en la caja inspeccionada.

a. Calcule la función de probabilidad del número de mayólicas defectuosas en la muestra.


b. ¿Cuál es la probabilidad de que sea necesaria una inspección de toda la caja?
c. El costo del proceso de control, C(X), es función del número de mayólicas defectuosas en la
muestra y está dado por C(X)= 2 + 0,2X + 0,5X2. Hallar el costo esperado del proceso de control
de la caja inspeccionada.
d. Determine la función de probabilidad del número de mayólicas defectuosas en la muestra si las
mayólicas se escogen una por una y con reposición.
Estadística EEGGCC 111

Distribución de Poisson

El experimento que origina una variable aleatoria que sigue una distribución de Poisson se denomina
proceso de Poisson y posee las siguientes propiedades:

El número de eventos de interés que ocurren en un intervalo o región de espacio cualquiera es


independiente del número que ocurre en cualquier otro intervalo o región del espacio disjunto.
La probabilidad de que ocurra un solo éxito durante el intervalo muy corto o región muy pequeña
es proporcional a la longitud del intervalo o al tamaño de la región y no depende del número de
éxitos que ocurren fuera del intervalo o región.
La probabilidad de que ocurra más de un éxito en tal intervalo corto o caiga en tal región pequeña
es insignificante.

La función de probabilidad de la variable X es:


e   x
f  x   P X  x   ; x  0, 1, 2, 
x!
 = número esperado de éxitos por unidad de tiempo o región.
e = 2,71828…

Se denota X ~ P() y se lee que la variable aleatoria X sigue una distribución Poisson con
parámetro λ.

Media   E X   

Varianza  2  V X   

Sea la variable discreta X definida como el número de veces que ocurre un evento en un intervalo
dado (área, volumen o cualquier medida continua). La variable aleatoria X usualmente se modela
con una distribución de Poisson de parámetro λ (λ > 0), que representa el número medio de éxitos
en el intervalo dado.
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 112
Ejemplo 150
Las siguientes son ejemplos de variables con distribución Poisson:
a. X := Número de alumnos que ingresan a la cafetería central entre las 12 m. y las 2 p.m. con una
media de 20 alumnos por minuto.
b. Y := Número de defectos en una mayólica con una media de un defecto por placa rectangular.
c. W := Número de quejas recibidas por día en el módulo de atención al cliente de cierta empresa de
telefonía celular, con una media de cinco quejas diarias.

Ejemplo 151
El número de personas que llega a un restaurante puede modelarse por una variable Poisson con una
promedio de 0,8 personas por minuto.
a. ¿Cuál es la probabilidad de que en un minuto llegue una persona al restaurante?
b. ¿Cuál es la probabilidad de que en un minuto llegue más de una persona al restaurante?
c. ¿Cuál es la probabilidad de que en dos minutos lleguen más de dos personas al restaurante?
d. ¿Cuál es la probabilidad de que en dos minutos lleguen más de dos personas si dentro de ese
intervalo de tiempo ya llegó una persona al restaurante?
Estadística EEGGCC 113

Ejercicios

85. El número de buques que llegan a un puerto sigue una distribución de Poisson con una media de
tres buques por día. Cada buque se demora en el puerto por los menos tres días y el puerto tiene
capacidad para ocho buques. Si en este momento, no hay ningún buque atracado en el puerto,
calcular la probabilidad de que el puerto se llene en los siguientes dos días.

86. Una compañía encuestadora va a entrevistar personas en un área rural hasta encontrar tres
personas indocumentadas. Si la probabilidad de que una persona esté indocumentada es de 0,25,
encuentre la probabilidad de que la compañía entreviste por lo menos a seis personas.

87. Un aparato de cocina tiene 16 partes funcionales, cada una de las cuales tiene una probabilidad de
0,99 de funcionar correctamente hasta el fin del período de garantía del producto. Las partes
funcionan de manera independiente, pero si dos o más no funcionan, el aparato tampoco. ¿Cuál
es la probabilidad de que uno de estos aparatos seleccionado al azar funcione bien durante todo el
periodo de garantía?

88. Suponga que se va a comprar lotes de siete tubos de rayos catódicos (CRT) para terminales de
computadora. Se decide muestrear 3 CRT de cada lote y rechazar el lote si se observa uno o más
CRT defectuosos en la muestra.
a. Si el lote contiene un CRT defectuoso, ¿qué probabilidad hay de que se acepte el lote?
b. ¿Qué probabilidad hay de que se acepte el lote si contiene 3 CRT defectuosos?

89. Se supone que el 30% de los aspirantes para cierto trabajo tiene entrenamiento en programación.
Si los aspirantes son entrevistados uno tras otro, encontrar la probabilidad de hallar el segundo
aspirante con entrenamiento en programación antes de la quinta entrevista.

90. Una operadora de una empresa de telemarketing dispone de un listado de clientes potenciales de
un determinado producto. Si la probabilidad de que dicha operadora haga una venta al hacer una
llamada es del 25%, determine la probabilidad de que en la décima llamada se realice la tercera
venta.

91. Un vendedor de artefactos eléctricos por teléfono sabe que el 8% de las llamadas que realiza
terminan en una venta. Si el vendedor hace 50 llamadas y la ganancia por x ventas es de 2x 2
soles, encontrar su ganancia esperada.

92. El número de torres de alta tensión que se caen por año en una ciudad puede modelarse por una
variable aleatoria de Poisson, con una desviación estándar de 1,5 torres por año. El costo de
reparar una torre caída es 200 000 dólares y la compañía destina como máximo 600 000 dólares
anuales para reparar torres. Calcule el gasto anual esperado en la reparación de torres.

93. Air América tiene la política de registrar a 24 personas para viajar en un avión que cuenta con 20
asientos para pasajeros. Estudios anteriores revelaron que solo el 80% de los pasajeros que se
registran en un determinado vuelo, se presentan al aeropuerto para viajar en ese vuelo. Calcular la
probabilidad de que no haya suficientes asientos disponibles para los pasajeros, en un vuelo en el
que se registraron 24 personas.
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 114
94. Con fines de auditoría sobre 18 empresas que comercializan Gas doméstico que funcionan en
nuestro medio (entre las cuales tenemos a las compañías A, B y C) se tomará una muestra
aleatoria de 6 de ellas. Determine la probabilidad de los siguientes eventos:
a. Que la muestra solo tenga una de las tres empresas antes citadas.
b. La muestra incluya a las tres empresas mencionadas.
c. Que la muestra incluya al menos una de las tres empresas antes citadas.

95. Una empresa de seguros considera que sólo alrededor de 5 % de los asegurados atendidos tiene
una determinada enfermedad.
a. Halle la probabilidad de atender más de dos casos hasta que se reporte el primer asegurado
que sufre de esta enfermedad.
b. ¿Cuál es el número esperado de asegurados atendidos hasta encontrar el tercer caso con la
enfermedad?
c. Si fueron seleccionados aleatoriamente 100 de los asegurados atendidos, ¿cuál sería la
probabilidad de que no más de 3 de ellos tengan la enfermedad?

96. A un estudiante que tiene de manera independiente una probabilidad p de aprobar cada examen
del curso de Física 1, se le ofrecen dos alternativas:
I) Dar un único examen.
II) Dar tres exámenes con la condición de aprobar por lo menos dos.
¿Cuál es la alternativa más favorable para el alumno?

97. En un lote de 50 computadoras 12 son defectuosas. Si se eligen al azar y de una sola vez 20 de
ellas, calcule la probabilidad de que de las computadoras elegidas por lo menos dos sean
defectuosas.
Estadística EEGGCC 115

3.5. Algunos modelos continuos importantes

Distribución de probabilidad uniforme

La variable aleatoria X tiene una distribución uniforme en el intervalo [a, b], si su función de densidad
de probabilidad es:

f x  
1
; a xb
ba

Se denota X ~ U (a, b) y se lee que la variable aleatoria X sigue una distribución uniforme con
parámetros a, b.
La función de distribución acumulada es:
 0 ; xa
x  a
F ( x)   ; a xb
b  a
 1 ; xb

ab
Media   EX  
2

Varianza  2  V X  
b  a 2
12
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 116
Ejemplo 152
El tiempo, en minutos, que demora un servicio de delivery en entregar una pizza puede modelarse por
una variable aleatoria uniforme con parámetros 10 y 38. Si la pizza se tarda más de 30 minutos en ser
entregada, el cliente no la pagará.
a. Si una familia pide una pizza, calcule la probabilidad de que le salga gratis.
b. Si la familia pide una pizza diaria durante diez días seguidos, calcule la probabilidad de que por lo
menos una de ellas le salga gratis.
c. Una familia pidió una pizza hace 25 minutos y aún no ha llegado, ¿cuál es la probabilidad de que
le salga gratis?

Ejemplo 153
El tiempo de vida medio de una licuadora es de 14 meses con una varianza de 12 meses2. La fábrica
repone sin cargo alguno al cliente todas las licuadoras que dejen de funcionar dentro del tiempo de
garantía. Si sólo se desea reponer el 5% de las licuadoras que funcionen mal, ¿qué tiempo de garantía
se debe ofrecer? Suponga que el tiempo de vida de una licuadora es una variable uniforme.

Distribución exponencial

La variable aleatoria X tiene una distribución exponencial con parámetro β (β > 0) si su función de
densidad de probabilidad es:
f ( x )   e  x ; x  0

Se denota X ~ Exp(β) y se lee que la variable aleatoria X sigue una distribución exponencial con
parámetro β.
La función de distribución acumulada de X es:
F ( x)  P X  x   1  e  x ; x  0
Estadística EEGGCC 117

  EX  
1
Media

 2  V X  
1
Varianza
2

Se cumple que:
P X  x   e  x
P X  k  t / X  k   P X  t 

Ejemplo 154
El tiempo, en minutos, que demora una llamada telefónica se modela con una variable exponencial
con una media de 5 minutos. Calcular la probabilidad de que la duración de una llamada sea mayor a
seis minutos.

Ejemplo 155
El tiempo de vida de un tipo de marcapasos puede modelarse por una variable con distribución
exponencial con media de 12 años.
a. Calcule la probabilidad de que un marcapasos de este tipo se malogre antes de los 15 años de
funcionamiento.
b. Si el marcapasos lleva funcionando correctamente cinco años en un paciente, ¿cuál es la
probabilidad de que se malogre antes de 15 años?

Distribución exponencial y distribución de Poisson


Si el número de éxitos por unidad de tiempo tiene una distribución de Poisson con parámetro λ,
entonces el tiempo entre dos éxitos consecutivos, medido en la misma unidad de tiempo, tiene una
distribución exponencial con parámetro β = λ.

Ejemplo 156
Si el número de llamadas que entran a una central telefónica tiene una distribución de Poisson con una
media de tres llamadas por minuto, encontrar la probabilidad de que el tiempo entre una llamada y la
siguiente sea de menos de medio minuto.
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 118

Distribución normal

La variable aleatoria X tiene una distribución normal con parámetros μ y σ2 (σ2 > 0) si su función de
densidad de probabilidad es
2
1  x  
1   
f ( x)  e 2  
; x  IR
 2
Se denota X ~ N (, 2) y se lee que la variable aleatoria X sigue una distribución normal con
parámetros µ y σ2.
Media   E X   

Varianza  2  V X    2
La función de densidad de una variable normal tiene forma de campana y es simétrica, por lo que
las medidas de tendencia central coinciden.
El rango de la variable aleatoria normal es el conjunto de los números reales.
Ejemplos de gráficas de distribuciones normales con diferentes medias y varianzas.

Distribución norm al con m edia 15 y desviación estándar 1

0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0.0
10 11 12 13 14 15 16 17 18 19 20

Distribución norm al con m edia 15 y desviación estándar 0,5

0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
10 11 12 13 14 15 16 17 18 19 20

Distribución norm al con m edia 15 y desviación estándar 1,8

0.3

0.2

0.2

0.1

0.1

0.0
10 11 12 13 14 15 16 17 18 19 20
Estadística EEGGCC 119
Áreas bajo la curva normal

Propiedad de la distribución normal


Sea X ~ N(μ, σ2), si Y = mX + b, entonces, Y ~ N(μY, σY2)
μY = m μ + b
σY2 = m2 σ2
σY = |m| σ

Estandarización de una variable normal


X 
Sea X ~ N(μ,σ2), si Z  entonces la variable aleatoria Z tiene distribución normal y se cumple

μZ = 0 y σZ2 = 1. Se dice que la variable Z ~ N(0,1) tiene distribución normal estándar.
1
1  2 z2
La función de densidad de Z es  ( z)  e
2

1
z 1  2 z2
La función de distribución acumulada de Z es ( z )  
 2
e dz
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 120
Cálculo de probabilidades para una variable normal

Sea X ~ N(μ, σ2), entonces:


a X  b a b
Pa  X  b   P     P Z  
        
b   a
     
     

Ejemplo 157
Si Z ~ N   0,  2  1

Calcule P(Z < 1,25), P(Z < -1,25), P(-1,25 < Z < 1,25), P(Z > 2,16), P(Z < 4), P(Z = 2,05)
Determine c para que P(Z < c) = 0,975
Determine c para que P(-c < Z < c) = 0,95

Ejemplo 158

Si X ~ N   10,  2  25 

Calcule P( X  7,47) , P( X  12,45) , P(8  X  12) , P X  11 X  9


Determine c para que P(X < c) = 0,7549

Ejemplo 159
Si los puntajes de los postulantes en un examen de ingreso se distribuyen como una variable aleatoria
normal con una media de 1 200 y una desviación estándar de 300 puntos.
a. Encontrar la probabilidad de que el puntaje de un postulante sea de por lo menos 1 300.
b. Si ingresa el 12,3 % de los postulantes con puntajes más altos, hallar el puntaje mínimo para
ingresar.

Solución
Definamos la variable aleatoria X := puntaje de un postulante.
μ = 1 200, σ = 300, σ2 = 3002 → X ~ N(1 200, 3002)
a. La probabilidad pedida es
 X   1300   
P X  1300  1  P X  1300  1  P  
   
 X  1200 1300  1200 
= 1  P    1  PZ  0,33  1  0,33  0,3707
 300 300 
Estadística EEGGCC 121
b. Sea k el puntaje mínimo para ingresar. Se tiene P( X  k )  0,123 , luego P( X  k )  0,877 .
 X  1 200 k  1 200   k  1 200 
Estandarizando tendremos que P    P Z    0,877
 300 300   300 

 k  1200 
De lo cual, se tiene que    0,877
 300 
k  1200
En la tabla N(0, 1) observamos que (1,16)  0,8770, luego  1,16 , de donde k = 1 548.
300

Ejemplo 160
En una ciudad se estima que la temperatura máxima en un día del mes de enero puede modelarse con
una variable normal con media 30°C y desviación estándar 2°C.

a. Si se escoge al azar un día del mes de enero, calcule la probabilidad de que la temperatura máxima
sea menor a 31°C.
b. Si se escoge al azar un día del mes de enero, calcule la probabilidad de que la temperatura máxima
esté entre 28,5 y 32°C.
c. Calcule el número esperado de días en el mes de enero en que la temperatura máxima es mayor a
33°C. Asuma independencia entre las temperaturas de un día y otro.

Ejemplo 161
Los sueldos mensuales de los empleados de una empresa se modelan mediante una distribución
normal. Se sabe que el 2,68% de los empleados ganan menos de S/. 2 035 y que el 2,5% de los
empleados ganan más de S/. 3 980.

a. ¿Cuál es la media y la desviación estándar de los ingresos mensuales de los empleados de esta
empresa?
b. Si se ha dispuesto que el 15% de los empleados que ganan menos en la empresa reciban un bono.
¿Cuánto debe ganar como máximo un empleado para recibir dicho bono?

Propiedad reproductiva de la normal


Sean X e Y dos variables aleatorias normales e independientes, tales que X ~ N  X ,  X2  e
 
Y ~ N Y ,  Y2 , c1 y c2 constantes reales, entonces se cumple que:

W  c1 X  c2Y ~ N c1  X  c2 Y , c12 X2  c22 Y2 

Esta propiedad se puede generalizar para la suma de más variables normales independientes.
Si Xi ~ N(μ, σ2) (i = 1, 2,…, n) son variables aleatorias independientes, entonces la variable

 
n
S   X i ~ N n , n 2
i 1
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 122
Ejemplo 162
Sean X ~ N(5, 6) e Y ~ N(4, 10) variables aleatorias independientes, calcular la distribución de las
siguientes variables: W = X + Y, W = X – Y, W = 2X +Y, W = 4X - 5Y

Ejemplo 163
El peso de un adulto peruano puede modelarse con una variable aleatoria normal. El peso medio para
los varones es de 72 kilos y de 64 kilos para las mujeres, mientras que sus desviaciones estándar
fueron de 8 kilos y 4 kilos respectivamente.
a. Si se elige, al azar, a un hombre y una mujer, calcular la probabilidad de que la mujer pese más
que el hombre.
b. Si se elige a dos hombres y a dos mujeres, calcular la probabilidad de que la suma total de pesos
supere los 260 kilos.
c. Si en un grupo de peruanos, el 60% de las personas son varones y se elige a una persona al azar,
calcule la probabilidad de que dicha persona pese entre 65 y 72 kilos.

Función Gamma
La función Gamma se define por

( )  0
x  1e  x dx ,   0

Se tiene que:
( )  (  1) (  1) si   1
(1)  1

(n)  (n  1)! si n  Z 

1
   
2

Distribución Gamma

La variable aleatoria X tiene una distribución gamma con parámetros  y  ( > 0,  > 0) si su función
de densidad de probabilidad es
   1  x
f ( x)  x e ; x0
( )
Estadística EEGGCC 123
Se denota X ~ (, ) y se lee que la variable aleatoria X sigue una distribución gamma con
parámetros  y .
La función de distribución acumulada de X es
x    1 x
F ( x)  
0 ( )
x e dx , x  0


Media   EX  


Varianza  2  V X  
2

Se cumple que:
X ~ Exp( ) si y sólo si X ~ (1, )
Si Xi ~ Exp( ), Xi (i = 1, 2,…, ) independientes y sea S = X1 + X2 +… + X entonces S ~ (,)

Propiedad reproductiva de la gamma


Si Xi ~ (, ) (i = 1, 2,…, n) son variables aleatorias independientes y sea S = X1 + X2 +… + Xn
entonces S ~ (n, )
Distribución Gamma y Distribución de Poisson: Si el número de éxitos en un intervalo de tiempo
ocurre según una distribución de Poisson con parámetro λ, entonces, el tiempo hasta el r-ésimo
éxito (medido en las mismas unidades que el intervalo) tiene una distribución gamma con
parámetros  = r y β = λ.
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 124

Distribución chi-cuadrado

La variable aleatoria X tiene una distribución chi-cuadrado con r grados de libertad (r es un entero
positivo) si su función de densidad de probabilidad es
r
 r x
2 2 1 
f ( x)  x2 e 2 , x  0
(r / 2)

Se denota X ~ 2 (r) y se lee que la variable aleatoria X sigue una distribución chi cuadrado con r
grados de libertad.
El rango de la variable aleatoria chi cuadrado es el conjunto de los números reales no negativos.
La función de densidad de una variable chi cuadrado tiene sesgo positivo.

Media   E X   r

Varianza  2  V  X   2r

Se cumple que
X ~ 2(r) si y sólo si X ~ (r/2, 1/2)
Si Z ~ N(0, 1) entonces Z2 ~ 2(1)
Si Zi ~ N(0, 1) (i = 1, 2,…,r) son independientes y sea X  Z12  Z 22  ...  Z r2 , entonces X ~ 2(r)

Propiedad reproductiva de la chi cuadrado


Si X ~ 2(ri) (i = 1, 2,…, n) son variables aleatorias independientes S = X1 + X2 +… + Xn entonces
S ~ 2(r1+r2+…+rn)
Estadística EEGGCC 125

Distribución t-Student

La variable aleatoria X tiene una distribución t-Student con r grados de libertad (r es un entero
positivo) si su función de densidad de probabilidad es

 r  1  r 1 
   
 x2 
f ( x)  
2  1  
 2 

(r / 2) r  r 

Se denota X ~ t(r) y se lee que la variable aleatoria X sigue una distribución t-Student con r grados
de libertad.
La función de densidad de una variable t-Student es simétrica respecto al cero y tiene forma de
campana.
El rango de la variable aleatoria t-Student es el conjunto de los números reales.
A medida que r grados de libertad tiende a infinito, la distribución de la variable aleatoria t-
Student se aproxima a la distribución normal estándar.
La función de distribución acumulada de X es
 r  1  r 1 
   
x  2   x2   2 
F ( x)   ( r / 2) r
1 



r 
dx
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 126
Media   E X   0

 2  V X  
r
Varianza r2
r2

Propiedad de la distribución t - Student


Z
Si Z ~ N(0, 1) y V ~ 2(r) son variables aleatorias independientes y sea X  , entonces se
V /r
cumple que X ~ t(r)
Sea X ~ t(r) si r tiende al infinito, entonces X tiene una distribución aproximadamente N(0,1).

3.6. Teorema central del límite

Si n variables aleatorias independientes X1, X2, X3,...Xn tienen la misma distribución de probabilidad
con media  y varianza 2, entonces para la variable aleatoria S = X1 + X2 + X3 +...+ Xn se tiene:
Media ES   n

Varianza V S   n 2

S tiende a seguir una distribución normal a medida que n crece. Se considera aproximadamente
una distribución normal si n  30.

Del Teorema Central del Límite se deduce que, a medida que crece el tamaño de la muestra n, la
distribución muestral de la media X se acerca a la normal, independientemente de la distribución de la
población de origen de los datos de la muestra.

Ejemplo 164
Una empresa tiene un sistema de cómputo que tiene 30 componentes de seguridad en línea y cada
componente se activa inmediatamente después de que el anterior falle, permitiendo que el sistema
funcione de forma continua. El tiempo de funcionamiento de cada componente puede considerarse una
variable exponencial con una media de 40 horas. ¿Cuál es la probabilidad de que el sistema de
cómputo funcione más de 1400 horas?

Ejemplo 165
El tiempo, en minutos, que se tarda un alumno en resolver una pregunta de un examen de admisión
puede modelarse por una variable aleatoria con la siguiente función de distribución acumulada.
 0 ; x0
 x 2
F x    ; 0  x  10
100
 1 ; x  10

Si el examen tiene 32 preguntas, calcule la probabilidad de que se demore más de 210 minutos en
responder todo el examen. Asuma independencia.
Estadística EEGGCC 127
Aplicaciones del Teorema Central del Límite

La distribución de una variable aleatoria X ~ B(n, p) se puede aproximar por una distribución
N(np, npq) siempre y cuando n ≥ 30. La aproximación es buena si, además, se verifica que np es
mayor a 5 y nq = n(1-p) es mayor a 5.
La distribución de una variable aleatoria X~Pas(r, p) se puede aproximar por una distribución
N(r/p; rq/p2) siempre y cuando r ≥ 30.
Bajo ciertas condiciones, otras distribuciones como la hipergeométrica o la Poisson también se
pueden aproximar por una distribución normal.

Corrección por continuidad

Sea S una variable discreta que toma valores enteros consecutivos. Si la distribución de S se aproxima
por una distribución continua se realiza la siguiente corrección antes de calcular la probabilidad
requerida usando la distribución continua.
P(S = a)  P( a - ½ ≤ S ≤ a + ½)
P(a ≤ S ≤ b)  P(a - ½ ≤ S ≤ b + ½ )

Ejemplo 166
Por un estudio previo se estima que la probabilidad de que un elector vote por la elección del
candidato oficialista es del 25%. Si los electores son entrevistados uno por uno de manera
independiente, encontrar la probabilidad de que por lo menos 275 de un total de 1000 electores voten
por el candidato oficialista.

Ejemplo 167
La cantidad de personas que llegan a un concierto se puede modelar por una variable aleatoria Poisson
con una media de 3,1 personas por minuto. Calcular la probabilidad de que en la última hora lleguen
entre 180 y 190 personas al concierto.

Ejemplo 168
Un especialista en conseguir personal para empresas sabe por experiencia que sólo el 25% de los
postulantes son aptos para los cargos a los que postulan. Calcular la probabilidad de necesitar más de
200 entrevistas para encontrar a los primeros 48 postulantes que sean aptos a un cargo.
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 128

Ejercicios

98. El peso de los jabones fabricados por una empresa es una variable aleatoria uniforme con media
120 gramos y varianza 12 gramos2. Un jabón se considera defectuoso si su peso es menor a 115
gramos o mayor de 124 gramos. En el control de calidad, los jabones se pesan uno por uno.
Calcular la probabilidad de que se necesite pesar más de 10 jabones hasta encontrar el primer
jabón defectuoso.

99. El tiempo en minutos que demora una llamada telefónica en una oficina es una variable aleatoria
con distribución exponencial. Si la probabilidad de que una llamada demore más de cinco
minutos es de 0,4, calcule la probabilidad de que una llamada dure más de cuatro minutos.

100. En un supermercado, la demanda diaria, en kilos, de mariscos se distribuye según el modelo


uniforme en el intervalo [70, 170]. Por cada kilo de mariscos que se vende se gana 8 soles, pero
por cada kilo que no se vende en el día se pierde 5 soles. El supermercado compra los mariscos
todos los días, muy temprano en la mañana. Calcular la cantidad de kilos que el supermercado
debe comprar diariamente para maximizar su utilidad esperada.

101. El tiempo X entre dos pausas en una terminal de edición se distribuye uniformemente entre 0,5 y
2,25 segundos.

a. ¿Qué probabilidad hay de que el tiempo entre dos pausas en la terminal sea de menos de dos
segundos si se sabe que es de más de un segundo?
b. Si μ es la media de la variable aleatoria X y σ es la desviación estándar de la variable
aleatoria X, calcular: P (| X – μ | < σ).

102. El tiempo de vida, en años, de cierto tipo de balanza electrónica se distribuye exponencialmente
con una desviación estándar de 5 años. Los fabricantes, que por la venta de cada balanza ganan
S/.150, se comprometen a devolver al comprador S/.100 si la balanza se malogra antes del primer
año y S/.60 si se malogra entre el primer y el tercer año. Si la balanza se malogra después, no se
devuelve nada de dinero. Calcule la ganancia media obtenida por balanza.

103. Si una máquina de una imprenta se malogra, ésta puede destinarse a uno de dos talleres A o B
para su reparación. El tiempo de reparación en el taller A es una variable aleatoria normal con
una media de 5 horas y una desviación estándar de 3 horas. El tiempo de reparación en el taller B
es una variable aleatoria normal con una media de 7 horas y una desviación estándar de 2 horas.
a) ¿En qué taller es más probable que la máquina se repare en menos de 8 horas?
b) Calcule la probabilidad de que la reparación demore más en el taller B que en el taller A.

104. Una compañía ha comprado una prueba para seleccionar personal. Los que han diseñado la
prueba saben que, para cierta población, las notas siguen una distribución normal con una media
de 75 puntos y una desviación estándar de 10 puntos. Si se va a escoger al primer postulante que
supere los 90 puntos. Calcular el número esperado de entrevistas que debe hacer la compañía
para escoger un postulante.
Estadística EEGGCC 129
105. Un cargador de granos se puede ajustar para que descargue granos en cantidades cuya
distribución es normal, con media  kilos y desviación estándar igual a 25,7 kilos. Si una
compañía desea usar el cargador para llenar recipientes que contengan 2 000 kilos y quiere
sobrellenar sólo uno de cada 100 recipientes, ¿en qué valor de  se debe ajustar el cargador?

106. Los sueldos mensuales, en miles de dólares, de los directivos de una multinacional se modelan
con una distribución N(10, 1) mientras que los del resto de personal se modelan con una N(4, 2).
Si se extrae una muestra aleatoria de 10 directivos y de 20 empleados no directivos, ¿cuál es la
probabilidad de que el sueldo medio mensual de los directivos de la muestra supere al
correspondiente de la muestra de empleados no directivos en más de 5 000 dólares?

107. El porcentaje de determinado compuesto, contenido en un galón de cierto líquido industrial, se


modela con una distribución normal con una media de 15% y una desviación estándar de 3%. El
fabricante del líquido obtiene una utilidad neta por galón de $0,15 si el porcentaje del compuesto
está entre 9% y 21%, mientras que la utilidad es de $0,10 si el porcentaje varía entre 21% y 27%.
Cuando el porcentaje está entre 3% y 9%, el fabricante sufre una pérdida de $0,05. Calcular la
utilidad esperada por galón.

108. En un estudio de evaluación de la atención de un servicio de cafeterías se encontró que los


tiempos, en minutos, que tardan en atender a un cliente las cafeterías A y B se pueden modelar
con las variables aleatorias X ~ N(4,9) y Y ~ N(5,16) respectivamente y de manera independiente.
Si en cada cafetería son atendidas 20 personas, halle la probabilidad de que el tiempo total de
atención en la cafetería B sea mayor que el de la cafetería A.

109. En una fábrica, el 25% de los corchos para las botellas de vino se producen en una máquina y la
distribución de los diámetros de estos corchos se modela normal con una media de 3 cm y una
desviación estándar de 0,1 cm. El resto de la producción de corchos para botellas de vino se
realiza en otra máquina y en este caso la distribución de los diámetros de los corchos se modela
normal con media 3,04 cm y varianza 0,0004 cm2. Los corchos son considerados aceptables si
sus diámetros están entre 2,9 y 3,1 cm. ¿Cuál es la probabilidad de que un corcho producido en
esta fábrica sea considerado aceptable?

110. Una familia tiene tres hijos. El monto de la propina semanal que se le da a cada hijo puede
modelarse como una variable normal. Al menor se le da en promedio 20 nuevos soles con una
desviación estándar de 3 nuevos soles, al del medio se le da el doble que al menor y al mayor se
le da el triple que al menor. Calcular la probabilidad de que en cuatro semanas la suma total
recibida en propinas por los tres sume más de 500 nuevos soles.

111. La estatura de las personas de un país se puede modelar por una variable normal con una media
de 1,68 metros y una desviación estándar de 8 centímetros. Si se eligen al azar personas para
medir su estatura, calcule el valor esperado y desviación estándar del número de personas
elegidas hasta encontrar a las primeros doce personas que midan más de 1,80.

112. El tiempo en terminar de construir una casa puede modelarse por una variable normal con una
media de 90 días y una desviación estándar de 5 días. Si la casa se termina en menos de 95 días,
el capataz recibirá un premio de obra de 1 500 nuevos soles. Si el capataz participa en la
construcción de muchas casas, calcule el valor esperado del premio de obra por casa. Asuma
independencia en la construcción de cada casa.
Capítulo 3. Variables aleatorias y distribuciones de probabilidad 130
113. Cuando el cemento y el agua entran en contacto, se inicia una reacción química exotérmica que
determina el endurecimiento de la mezcla. Dentro del proceso de endurecimiento se presenta un
estado en que la mezcla pierde su plasticidad y se vuelve difícil de manejar; tal estado
corresponde al fraguado inicial de la mezcla. El tiempo de fraguado inicial de un tipo de cemento
puede modelarse por una variable aleatoria normal con una media de 50 minutos y una
desviación estándar de 10 minutos.
a. Calcule la probabilidad de que el cemento tenga un tiempo de fragua inicial menor a 40
minutos.
b. Calcule el tiempo máximo para estar en el 25% de las mezclas con menor tiempo de
fraguado inicial.
c. Si un obrero prepara dos mezclas independientes, calcule la probabilidad de que la
diferencia entre los tiempos de fraguado inicial de estas mezclas sea menor a 5 minutos.

114. Una compañía tiene dos proveedores A y B de tuercas. El diámetro interno de las tuercas que se
usarán en el armado de cierto artefacto debe estar en el intervalo expresado como 0,30,005
pulgadas. El diámetro interno de las tuercas ofrecidas por cada proveedor puede considerarse una
variable aleatoria con distribución normal con:
 media igual a 0,302 y desviación estándar igual a 0,003 pulgadas para el proveedor A.
 media igual a 0,303 y desviación estándar igual a 0,002 pulgadas para el proveedor B.
Al proveedor A se le compra el 60% de las tuercas y el resto al proveedor B. Si los lotes se juntan
y se elige una tuerca al azar y esta sale defectuosa ¿qué proveedor es más probable que la haya
producido?

115. Los pesos de los posibles usuarios de un ascensor constituyen una población cuya distribución es
normal con media 70 kg y una desviación estándar de 10 kg.
a. ¿Qué peso máximo debería poder soportar el ascensor de modo que sólo el 1% de las
ocasiones el peso de cuatro personas supere ese peso máximo?
b. Si el ascensor admite como peso máximo 585 kg, ¿cuántas personas a la vez pueden entrar
al ascensor de manera que sea 0,0668 la probabilidad de que el peso no supere el máximo
permitido?

116. El tiempo, en minutos, de una llamada telefónica internacional se modela con una variable
aleatoria X con la siguiente función de densidad:

e 0,5 x
f x   x0
2
a. Si una persona realiza 10 llamadas, calcule la probabilidad de que por lo menos dos de las
llamadas duren más de tres minutos.
b. Cada llamada cuesta un sol por conectarse más un sol por minuto. Se cobra el tiempo
exacto. Si una persona hace 100 llamadas internacionales, calcule la probabilidad de tener
que pagar por lo menos 310 nuevos soles.

117. El ingreso mensual de las socias de una cooperativa se modela por una variable aleatoria con
media de 2800 nuevos soles y desviación estándar de 500 nuevos soles. Si 80 de las socias han
decidido que destinarán el 3% de sus ingresos para constituir un fondo común que sirva para
posibles emergencias, calcule la probabilidad de que en un año el fondo tenga más de 81 mil
nuevos soles.
Estadística EEGGCC 131

Capítulo 4. Introducción a la Estadística


Inferencial

4.1. Muestra aleatoria


Una muestra aleatoria de tamaño n de la variable aleatoria X, es un conjunto de n variables aleatorias
X1, X2,…, Xn independientes y con la misma distribución que la variable aleatoria X.
Así, dada una variable aleatoria X con E(X) =  y V(X) = 2; si X1, X2,…, Xn es una muestra aleatoria
de X, entonces E(Xi) = , V(Xi) = 2 (i = 1, 2,…, n)

Estadístico

Un estadístico es cualquier función de las variables de una muestra aleatoria.


Un estadístico es una variable aleatoria.

Distribución muestral

Es la distribución de probabilidades de un estadístico.

4.2. Distribución de la media muestral


Sea X1, X2,…, Xn una muestra aleatoria de tamaño n de la variable aleatoria X tal que E(Xi) = , V(Xi) =
2 (i = 1, 2,…, n).
n

X i 1
i
Si se define el estadístico media muestral como X  entonces se cumple que:
n
Media  
E X  X  

2
Varianza  
V X   X2 
n
Si el muestreo es sin reemplazo en poblaciones de tamaño finito N, entonces debe usarse el factor
de corrección por población finita en la varianza de X ; en ese caso:
2 N n
Varianza  
V X   X2 
n N 1

Si la población X sigue una distribución normal, entonces X  N  ,  X2 para n ≥ 2. 
 
Si el tamaño de muestra n ≥ 30, entonces X  N  ,  X2 por Teorema Central del Límite

Ejemplo 169
Cuarenta estudiantes van a celebrar a un restaurante después del examen final de Estadística. El dinero
que aporta cada estudiante, en estas ocasiones, se modela con una variable aleatoria continua con una
media de 30 nuevos soles y una desviación estándar de 10 nuevos soles. Calcule la probabilidad de
que la media de los aportes para pagar la cuenta esté entre 29 y 31 nuevos soles.
Capítulo 4. Introducción a la Estadística Inferencial 132
4.3. Distribución de la proporción muestral
Sea X1, X2,…, Xn una muestra aleatoria de tamaño n de la variable aleatoria X con distribución de
Bernoulli con parámetro p.
n

X
i 1
i
Se define el estadístico proporción muestral como P 
n
 
EP p

p1  p  pq
 
V P   P2 
n

n
Si la población es finita y el muestreo sin reemplazo
p1  p  N  n
 
V P   P2 
n N 1
La proporción muestral representa la proporción de éxitos observados en una muestra de tamaño
n.
Por el teorema central del límite, si el tamaño de muestra n tiende al infinito, entonces P se
distribuye aproximadamente normal.

Ejemplo 170
Según un estudio realizado por la consultora privada Ecolatina, en el primer semestre de 2009, en la
Argentina, la pobreza llegó al 31,8% de la población. Si se extrae una muestra aleatoria de 1200
argentinos, calcular la probabilidad de que la proporción muestral de pobres esté entre 30% y 32%.

Ejemplo 171
En cierto banco se ha calculado que el 17% de los clientes que poseen fondos mutuos son personas
retiradas. Se toma una muestra aleatoria de 500 clientes del banco que poseen fondos mutuos.
Encontrar la probabilidad de que al menos el 20% de los clientes de la muestra sean personas retiradas.

4.4. Distribución de la varianza muestral


Sea X1, X2,…, Xn una muestra aleatoria de una población X.

 X 
n
1 2
Se define la varianza muestral como S 2  X
n 1
i
i 1

Si la población X ~ N(µ, σ2) entonces se cumple que:


S2
(n  1) ~  n21
2
donde  2n1 representa la distribución chi cuadrado con n-1 grados de libertad.
Estadística EEGGCC 133

Ejercicios

118. Supóngase que las alturas de las antenas de telefonía celular se distribuyen normalmente con
media 40 metros y desviación estándar 9 metros. Si se toman 50 muestras de 36 antenas cada
una, ¿en cuántas de las muestras se espera una media entre 38 y 41 metros?

119. Una persona lanza dos dados, suma los números de las caras superiores y repite este
procedimiento 500 veces. Calcule la probabilidad de la media de las 500 sumas esté entre 6,9 y
7,1.

120. La duración de un componente eléctrico sigue una distribución exponencial con una media de
1000 horas.
a. Calcular la probabilidad de que si el componente ha durado más de 2000 horas, dure más de
3500 horas. Comparar esta probabilidad con la probabilidad de que dure más de 1500 horas.
Comentar el resultado.
b. Encontrar la probabilidad de que la suma de las duraciones de 50 componentes sea de más
de 60000 horas.

121. En una embajada, el tiempo para la entrega del pasaporte luego de la entrevista para una visa de
turista, en minutos, es una variable aleatoria exponencial con función de densidad f(x) tal que
f(3)=0,1115651 y f(5) = 0,0410425. Si en una mañana sumamente concurrida, una persona
entregó los pasaportes, sin pausa, a 30 personas, calcular la probabilidad de que se haya
demorado más de 75 minutos en la entrega de los 30 pasaportes.

122. En una empresa se escoge una muestra aleatoria de 100 empleados para una encuesta sobre
condiciones laborales. Si se estima que el porcentaje de empleados en la empresa que están a
favor de las condiciones laborales es del 80%.
a. ¿Cuál es la probabilidad de que la proporción muestral a favor de las condiciones laborales
esté entre 0,76 y 0,84?
b. Hallar la probabilidad de que se tenga que tomar más de diez muestras de tamaño 100 hasta
encontrar la primera muestra donde la proporción muestral a favor de las condiciones
laborales no esté entre 0,76 y 0,84.

123. Una compañía hotelera observa que 21% de las habitaciones reservadas no son cubiertas. La
compañía acepta reservas por un 20% más de las 200 habitaciones que dispone. Calcular
aproximadamente el porcentaje de clientes con reservas que se quedarán sin habitación.

124. En el depósito de una fábrica de chocolates hay un lote grande de sacos de azúcar comprados a
dos proveedores que llamaremos A y B. Los pesos, en kilogramos, de los sacos de azúcar
comprados al proveedor A tienen una distribución N(50, 4) y los de los sacos comprados al
proveedor B se distribuyen N(50, 1). En este lote el 40% de los sacos fueron comprados a A y el
resto a B.
a. Si se selecciona un saco de azúcar al azar del lote, ¿cuál es la probabilidad que pese entre 49
y 51 kg?
b. Si se seleccionan al azar 45 sacos de azúcar del lote, ¿cuál es la probabilidad de que al
menos 30 de ellos pesen entre 49 y 51 kg?
Capítulo 4. Introducción a la Estadística Inferencial 134
125. La eutanasia activa se da cuando se provoca la muerte mediante drogas. Holanda fue el primer
país europeo en autorizar la eutanasia activa con una ley que se puso en vigor desde el 1 de abril
del 2002. Desde entonces se ha practicado, hasta abril del 2006, en más de 7600 ocasiones. La
legislación holandesa aclara que la eutanasia debe aplicarse en casos extremos y bajo una serie de
condiciones: que la enfermedad sea irreversible y el sufrimiento insoportable, que el médico esté
seguro de que nadie coacciona al paciente y que la petición de morir haya sido expresada por el
paciente en más de una ocasión. En Holanda, los médicos cada año rechazan dos tercios de las
peticiones de eutanasia que reciben. Si, en un año, se presentan 2850 peticiones de eutanasia,
calcular aproximadamente la probabilidad de que se acepten entre 900 y 1000 peticiones de
eutanasia activa en Holanda. (Fuente: Diario El Comercio 16 de abril del 2006)

126. La cantidad de mango que exporta una empresa mensualmente es una variable con una media de
25 toneladas y una desviación estándar de 4 toneladas. Encontrar la probabilidad de que la
cantidad exportada en tres años supere las 920 toneladas.

127. El peso de los pasajeros que abordan un ómnibus de transporte interprovincial tiene una media de
60 kilogramos y una desviación estándar de 19 kilogramos. Si se sabe que los 72 asientos de
pasajeros están ocupados, ¿cuál es la probabilidad de que el peso medio de los pasajeros supere
los 65 kilogramos?

128. El tiempo, en minutos, que demora una llamada telefónica es una variable exponencial con una
media de 5 minutos. Hallar la probabilidad de que el tiempo total de duración de 100 llamadas
sea de menos de 8 horas y media.

129. Los ingresos por facturas del último año de un restaurante pueden modelarse con una variable
aleatoria de media 84 soles y desviación estándar 12 soles.

a. ¿Cuál es la probabilidad de que 100 clientes elegidos al azar gasten en total más de 8600
soles?
b. ¿Después de cuántas facturas podemos tener un 90% de seguridad de que el total de dinero
gastado por los clientes será de al menos 24000?

130. En un invernadero se conectan 30 focos de luz infrarroja, de tal manera que si falla un foco, otro
se enciende inmediatamente, encendiendo solamente un foco a la vez. Si la vida útil de los focos
se puede modelar con una variable aleatoria exponencial con una desviación estándar de 120
horas, ¿cuál es la probabilidad de que haya un foco encendido al final de un periodo de 4000
horas?

131. Un biólogo quiere estimar la longitud media de los delfines adultos de una especie del río
Amazonas. Si se supone que la desviación estándar de la población es de 25 centímetros y se
seleccionan al azar a 35 delfines de esa especie, encuentre la probabilidad de que la diferencia
entre la media de la muestra y la media de la población sea de a lo más 6 centímetros.

132. En una fábrica se procede a detener el funcionamiento de una máquina para repararla si en una
muestra aleatoria de 100 artículos de la producción diaria de la máquina se encuentra por lo
menos 15% de artículos defectuosos. Si realmente la máquina produce 10% de artículos
defectuosos, encuentre la probabilidad de que se proceda a detener la máquina un día dado.
Estadística EEGGCC 135
133. Según un estudio del Instituto Nacional de Salud del Ministerio de Salud del Perú, una de cada
tres mujeres peruanas sufre de sobrepeso, mientras que una de cada diez peruanas es obesa. Un
nutricionista toma una muestra aleatoria de 80 peruanas, calcular la probabilidad de que el
porcentaje de mujeres obesas en la muestra sea mayor a 12%.

134. El porcentaje de los clientes de una tienda por departamentos que paga con la tarjeta de crédito de
la tienda es 72%. Si se toma una muestra aleatoria de 250 clientes, calcule la probabilidad de que
la diferencia entre la proporción muestral y la proporción poblacional de los clientes que pagan
con la tarjeta de crédito de la tienda sea menor a 3%.

135. El tiempo que espera un alumno al ómnibus en el paradero para ir desde su casa a la universidad
es una variable aleatoria exponencial con una media 4 minutos. Si el alumno va a la universidad
200 días al año, calcule la probabilidad de que en más de 65 días, haya tenido que esperar más de
5 minutos.

136. El tiempo que demora una persona en hablar por teléfono es una variable aleatoria con una media
de 5 minutos y una desviación estándar de 2 minutos. Si el costo por llamada tiene un valor fijo
de 0,50 soles más un costo variable de 0,20 soles por minuto, calcular la probabilidad de que el
costo al realizar 40 llamadas sea menor que 58 soles.

137. El 75% de los conductores de cierta ciudad usan regularmente el cinturón de seguridad.
a) Si se selecciona al azar una muestra de 200 conductores de esta ciudad, ¿cuál es la
probabilidad de que menos de 150 de estos conductores usen regularmente el cinturón de
seguridad?
b) Un agente de control de tránsito inspecciona a los conductores que pasan por una vía de esta
ciudad. Calcule la probabilidad de que deba inspeccionar al menos 120 conductores para
encontrar 35 que no usen regularmente el cinturón de seguridad.
Capítulo 4. Introducción a la Estadística Inferencial 136

4.5. Estimación de parámetros

Estimador puntual

Un estimador puntual es un estadístico para estimar un parámetro.


Los siguientes son ejemplos de estimadores puntuales
La media muestral X es un estimador puntual de la media poblacional µ.
La proporción muestral P es un estimador puntual de la proporción poblacional p.
La varianza muestral S2 es un estimador puntual de la varianza poblacional σ2.

4.6. Estimación puntual de parámetros


Sean x1, x2,…, xn los valores experimentales de una muestra aleatoria X1, X2,…, Xn de la variable
ˆ  X ,..., X  es un estimador puntual del parámetro  entonces ˆx ,..., x  es una
aleatoria X. Si  1 n 1 n
estimación puntual del parámetro .
Un estimador puntual del parámetro  es una variable aleatoria y la estimación puntual es un
número real.

Sesgo del estimador

ˆ ) y se
Si ̂ es un estimador puntual del parámetro , el sesgo de este estimador se denota sesgo(
ˆ  .
define como E ()

Estimador insesgado

El estimador ̂ es un estimador insesgado de  si su sesgo es igual a cero, es decir, si E ()


ˆ 

Se cumple que:
o  
X es un estimador insesgado de , pues E X  
o P es un estimador insesgado de p, pues E P   p
o S es un estimador insesgado de σ , pues E S   
2 2 2 2

Ejemplo 172
Sea X1, X2,…, Xn una muestra aleatoria tomada de una población con media µ y desviación estándar .
Demostrar que X es un estimador insesgado de µ.

Ejemplo 173
Sea X1, X2,…, Xn una muestra aleatoria tomada de una población con media µ y desviación estándar .
n

 X i  
2

ˆ 
Determinar si  i 1
es un estimador insesgado de 2
n
Estadística EEGGCC 137
Estimador más eficiente

Dados dos estimadores insesgados de un parámetro, es más eficiente el que tiene menor varianza.

Ejemplo 174
Sea X1, X2,…, Xn una muestra aleatoria de la variable aleatoria X, con E(Xi) = μ, V(Xi) = σ2
10 3

 Xi X i  2X n
ˆ 
(i=1,2,…,n). Sean  i 1 ˆ 
y  i 1
dos estimadores de µ. Demuestre que ambos
1 2
10 5
estimadores son insesgados y determine cuál de los dos es más eficiente.

Error estándar

El error estándar de un estadístico es la desviación estándar del estadístico.

Si la población es infinita o el muestreo es con reposición, entonces el error estándar de:



X es  X 
n

pq
P es  X 
n
Si la población es finita de tamaño N y el muestreo es sin reposición, entonces el error estándar de:
 N n
X es  X 
n N 1

pq N  n
P es  X 
n N 1

Ejemplo 175
Sea X1, X2,…, Xn una muestra aleatoria tomada de una población con media µ y desviación estándar 
n

c X i i
ˆ 
y sea  i 1
donde c1, c2,…, cn es un conjunto de constantes reales. Determine el valor de
n
n

c
i 1
i para que ̂ sea un estimador insesgado de µ y encuentre el error estándar de ̂ .

Error de estimación

El error de estimación es la distancia entre la estimación del parámetro y el parámetro.

Si ˆ es la estimación puntual del parámetro  , el error de estimación es ˆ  


Capítulo 4. Introducción a la Estadística Inferencial 138

4.7. Estimación de parámetros por intervalo de confianza


Sean x1, x2,…, xn los valores experimentales de una muestra aleatoria X1, X2,…, Xn de la variable
aleatoria X cuya función de distribución depende del parámetro .
Sean A = H(X1,…, Xn) y B = G(X1,…, Xn) dos estadísticos tales que P(A ≤  ≤ B) = 1-.
El intervalo [A, B] se denomina intervalo de confianza al nivel (1-) para estimar el parámetro ,
Un intervalo de confianza al nivel (1-) x 100% para el parámetro , es un intervalo que con
probabilidad (1-) contiene al parámetro.
Si a = H(x1,…, xn) y b = G(x1,…, xn), entonces I() = [a, b] es la estimación por intervalo de confianza
para  al nivel de confianza de 1-.

Interpretación del nivel de confianza

Por ejemplo, para un intervalo de confianza para la media µ a un nivel de confianza del 95%
Si se seleccionan repetidamente 1000 muestras de tamaño n, y calculamos la media de cada una de
ellas, podremos realizar 1000 estimaciones por intervalo de confianza para la media poblacional .
Se espera o confía que aproximadamente 950 de los intervalos de confianza hallados contengan el
parámetro  y los restantes no lo contengan.

Ejemplo 176
Intervalos a 95% de confianza para µ generados con once muestras de tamaño n

Fuente: http://www.fisicanet.com.ar/matematica/estadisticas/ap08_inferencia_estadistica.php
Estadística EEGGCC 139

Intervalo de confianza para la media poblacional

Sean x1, x2,…, xn los valores experimentales de una muestra aleatoria X1, X2,…, Xn de la variable
aleatoria X, con E(Xi) = , V(Xi) = 2.

Si la población es normal o el tamaño de muestra n es mayor o igual a 30, entonces el


intervalo de confianza para µ, a un nivel de confianza de 1-α, es
I ( )  [ x  z  X ]
1
2

donde x es la media calculada con los datos de la muestra de tamaño n.

Esta fórmula se deduce de la forma siguiente: Dado n nivel de confianza (1-α), se plantea
 
P  z   Z  z   1 
 1 1 
 2 2 
X 
Reemplazamos la variable Z por
X

 X  
P  z   z   1
 1  1 
 2 X 2 
Despejamos µ
 
P X  z   X    X  z   X  1
 1 1 
 2 2 
De donde
I ( )  [ x  z  X ]
1
2

En I (  ) , el error estándar de la media muestral se determina según los siguientes criterios:

Varianza poblacional 2 es conocida. Población normal o tamaño de muestra mayor o igual a 30



Si la población infinita o el muestreo es con reposición  __ 
X n

 N n
Si la población finita de tamaño N y el muestreo es sin reposición  X 
n N 1

Varianza poblacional 2 es desconocida y tamaño de muestra mayor o igual a 30


Si la población infinita o el muestreo es con reposición
 sx
X  se estima por ̂ X 
n n
Capítulo 4. Introducción a la Estadística Inferencial 140
Si la población finita de tamaño N y el muestreo es sin reposición
 N n s N n
X  se estima por ̂ X  x
n N 1 n N

Varianza poblacional 2 es desconocida y población normal


El intervalo de confianza para µ a un nivel de confianza de 1-α es
sx
I ( )  [ x  t  ]
(1 ,n1) n
2

Ejemplo 177
Para estimar el precio medio de las guías turísticas para visitar el Cusco se elige una muestra aleatoria
formada por 34 guías y se determina que la media muestral es de S/.34,90. Por estudios realizados
anteriormente se sabe que la desviación estándar de los precios de estas guías es de S/.4,50. Construya
un intervalo de confianza para el precio medio de las guías turísticas para visitar el Cusco, al nivel del
95%. Interprete.

Solución
El intervalo de confianza al 95% está dado por
 
x  z0.975    x  z0.975
n n
Reemplazando los datos tenemos:
4,5 4,5
34,9  1,96    34,9  1,96
34 34
33,39    36,41
El precio medio de las guías de turismo para visitar el Cusco, se estima entre S/.33,39 y S/.36,41, con
una confianza del 95%.

Ejemplo 178
Se desea estimar, mediante intervalos de confianza, la distancia media diaria, en kilómetros, recorrida
por los taxistas de cierta población, para ello, se eligió una muestra de 130 taxistas y se obtuvo una
media muestral diaria de 275,6 kilómetros. Se sabe, por estudios anteriores, que la desviación estándar
poblacional es de 23,7 kilómetros. Calcule e interprete el intervalo pedido al 95% de confianza.

Tamaño de muestra para estimar la media poblacional

La forma general de una estimación por intervalo es:


Estimación puntual ± margen de error

El margen de error determina qué tan precisa es la estimación realizada, y este valor depende de los
siguientes factores: tamaño de la muestra n, nivel de confianza (1-) y variabilidad de la población .
Estadística EEGGCC 141
Para tener una confianza de (1-) de que el margen de error o error de estimación, al estimar la media
poblacional con la media muestral, sea de a lo más e unidades:
 
P | X   | e  1    e  z
1
   __
X
2

De la expresión anterior, se deduce que:


Si la población es infinita o el muestreo es con reposición
2
 z 
 1 
n 2 
 e 
 
Si la población es finita de tamaño N y el muestreo es sin reposición
2 N
n
 2  ( N  1)(e / z  )2
1
2

El tamaño de muestra n debe ser un número entero. Si es necesario el valor obtenido en las
expresiones anteriores se aproxima al siguiente entero.
Si σ es desconocida, para encontrar el tamaño de muestra, σ se estima por sx.

Ejemplo 179
El peso de cierto tipo de motores se modela con una variable con desviación estándar de 7,04 kilos.
Calcular el tamaño de muestra para que con una confianza del 99% el error de estimación, al estimar
la media poblacional por la media muestral, sea de a lo más dos kilos.

Solución
Sea X = peso del motor, en kilos, la desviación estándar σ = 7,04 kilos y error máximo e = 2 kilos.

El nivel de confianza 1- α es 0,99, luego 1   0,995  z0,995  2,575
2
Luego, el tamaño de muestra será
2
 2,575 7,04 
n   82,15
 2 
El tamaño de muestra n se aproxima al entero siguiente, luego n = 83.
Basta tomar una muestra de 83 motores para que la estimación del peso medio, al 99% de confianza,
tenga un error máximo de dos kilos.

Ejemplo 180
Se pide al administrador de un supermercado que estime el tiempo medio que invierte una cajera en
atender a un cliente. Le piden que las estimaciones tengan un nivel de una confianza del 90% y un
margen de error de 15 segundos. Si se sabe que la desviación estándar poblacional es de 1,5 minutos,
¿cuál debe ser el tamaño de muestra?
Capítulo 4. Introducción a la Estadística Inferencial 142
Intervalos de confianza para la proporción poblacional

Sean x1, x2,…, xn los valores experimentales de una muestra aleatoria X1, X2,…, Xn de una población
Bernoulli(p), tales que con E(Xi) = p, V(Xi) = p(1-p)  i = 1,..,n..

El intervalo de confianza para la proporción poblacional p con un nivel de confianza de (1-) es


I ( p)  [ p  z  P ]
1
2

donde p es la proporción muestral observada en la muestra de tamaño n.

En I ( p) , el error estándar de la proporción muestral se determina según los siguientes criterios:

Si la población infinita o el muestreo es con reposición


pq pq
P  se estima por ˆ P 
n n 1
Si la población finita de tamaño N y el muestreo es sin reposición
pq N  n pq N  n
P  se estima por ̂ P 
n N 1 n 1 N

Ejemplo 181
En una muestra aleatoria de 100 clientes de una empresa de telefonía celular, se encontró que 28 de
ellos presentaron quejas por fallas en el servicio durante el mes de abril. Calcule e interprete un
intervalo con una confianza del 90%, para la proporción de clientes de esta empresa que presentaron
quejas por fallas en el servicio, durante el mes de abril.

Solución

El nivel de confianza (1- α) es 0,90, luego 1   0,95  z0.95  1,645
2

28 pq (0,28)(0,72)
n  100 : p  0,28  __  ˆ __    0,045
100 P P n 1 100  1

Luego, el intervalo de confianza pedido es


I ( p)  [0,28  1,645 0,045]  0,28  0,074

La proporción de clientes que presentaron quejas por fallas en el servicio, durante el mes de abril, se
estima entre 0,206 y 0,354, con una confianza del 90%.
Estadística EEGGCC 143
Ejemplo 182
A una muestra aleatoria de 650 personas mayores de 18 años de una ciudad determinada se les
preguntó si estaban a favor de un incremento del 4% en el impuesto al precio de la gasolina para
obtener fondos necesarios que se destinarían a un programa de asistencia social. Si en la muestra
elegida se encontró que 312 están a favor del impuesto adicional, calcule e interprete un intervalo de
confianza del 90% para la verdadera proporción de personas a favor del nuevo impuesto.

Ejemplo 183
Se quiere estimar la aprobación del presidente de la república para lo cual se realizó una encuesta
nacional, en la cual se entrevistó a 1116 personas, encontrándose que 854 de ellas no estaban de
acuerdo con la gestión presidencial. Calcule un intervalo de confianza al 96% para proporción
poblacional de las personas que están de acuerdo con la gestión presidencial. Además, determine el
margen de error. Interprete.

Tamaño de muestra para estimar una proporción poblacional

Para tener una confianza de (1- ) de que el error de estimación al estimar la proporción poblacional
por la proporción muestral, sea de a lo más e:

 
P P  p  e 1   e  z
1
   __
P
2

De la expresión anterior, se deduce que:

Si la población es infinita o el muestreo es con reposición, entonces:

z 2  p1  p 
1
n 2
e2

Si la población es finita y el muestreo es sin reposición, entonces:

( pq) N
n
( pq)  ( N  1)(e / z  )2
1
2

Como p es desconocida (p es el parámetro que se desea estimar), para encontrar el tamaño de


muestra, el valor p se reemplaza por una estimación previa disponible o por 0,5.
El tamaño de muestra n debe ser un número entero. Si es necesario el valor obtenido en las
expresiones anteriores se aproxima al siguiente entero.
Capítulo 4. Introducción a la Estadística Inferencial 144
Ejemplo 184
Una empresa encuestadora quiere realizar una investigación sobre intención de voto a favor de cierto
candidato en la segunda vuelta electoral de las próximas elecciones presidenciales. Desea que los
resultados tengan un nivel de confianza del 95% y un margen de error del 3%. Calcule el tamaño de
muestra necesario para dicha encuesta.

Ejemplo 185
Una compañía de investigación de mercado desea estimar el porcentaje de hogares que tienen Internet
en casa, ¿cuántos hogares debe encuestarse si desea tener un nivel de confianza del 99% y un margen
de error del 2%? En una investigación del año pasado se determinó que el porcentaje de hogares con
Internet era del 24%.

Intervalo de confianza para la varianza de una población normal

Sean X1, X2,…, Xn una muestra aleatoria de una población normal con una varianza desconocida σ2. El
intervalo de confianza para 2 con un nivel de confianza de (1-) es
 
 (n  1) s 2 (n  1) s 2 
I ( )   2
2
, 2 
 (1 ,n1)  (  ,n1) 
 
 2 2 
Donde s2 es la varianza muestral observada en la muestra de tamaño n.

Ejemplo 186
Se desea estimar la varianza de la longitud de ciertos cables coaxiales. En una muestra de 25 de estos
cables se encuentra que la longitud tiene una media de 80 metros y una desviación estándar de tres
metros. Calcule e interprete un intervalo con una confianza del 95%, para la desviación estándar de las
longitudes de los cables coaxiales. Asuma normalidad.

Solución

El nivel de confianza (1- α) es 0,95, luego 1   0,975 , luego
2
Buscamos en la tabla de la distribución chi cuadrado
 (20,025;251)  12,4011,  (20,975;251)  39,3641
Además, n  25 y s  3 .
Luego, el intervalo de confianza pedido es
 
 n  1s 2 n  1s 2    25  1  3 2 25  1  3 2 
I     ,   , 
  1  ,n 1  2
2
, n 1
  39,3641 12,4011 
 2 2 

I    [2,34 , 4,17]
La desviación estándar de las longitudes de los cables coaxiales se estima entre 2,34 y 4,17 metros con
una confianza del 95%.
Estadística EEGGCC 145

Ejercicios

138. Sea X1, X2, X3,..., Xn una muestra aleatoria de tamaño n. Demostrar que X 2 no es un estimador
insesgado de µ2


139. Sea ˆ es un estimador de parámetro  y su sesgo está dado por b  E ˆ   . Demuestre que

 

2



E  ˆ     var ˆ  b 2 .

140. Sea X1, X2, X3,..., Xn una muestra aleatoria de tamaño n de una distribución de Rayleigh con
función de densidad
x2

f x  
x
e 2
x0

n
Hallar k, para que k X
i 1
i
2
sea un estimador insesgado de  .

 
141. Sea una población N  ,  2 de la que sea toma una muestra aleatoria de tamaño n. Compruebe
que el estadístico de Von Newmann
n 1

 x  xi 
2
i 1
ˆ  i 1

2n  1
es un estimador insesgado de σ2. Sugerencia E(XY) = E(X)E(Y)

142. Se extrae una muestra aleatoria de tamaño n de una variable aleatoria X con función de densidad:

f ( x)  1   x   1
Encontrar un estimador insesgado de  y halle la desviación estándar de este estimador.

143. ¿De qué tamaño conviene tomar una muestra de una línea de producción para tener una confianza
del 95% de que la proporción estimada no difiere de la verdadera en más de un 5%? Se sabe por
estudios previos que la proporción de objetos defectuosos es del orden de 0,04?

144. Para estimar la media de los sueldos de una población normal con varianza 16, se tomó una
muestra aleatoria de 10 elementos y se usó como estimador a

ˆ  ( X 1  X 2  ...  X 10 )

(10  1)
Analizar si el estimador es insesgado y calcular su error estándar.
Capítulo 4. Introducción a la Estadística Inferencial 146

145. Sea X1, X2, …, X7 una muestra aleatoria de una población que tiene media µ y varianza σ².
Considere los siguientes estimadores de µ:
7

X
ˆ  2 X1  X 6  X 4
i
ˆ 
 i 1
, 
1 2
7 2

Analizar si ̂1 es más eficiente que ̂ 2 .

146. Se quiere estimar la calidad de un champú en envases de monodosis de 10 gramos, es decir, en


envases pequeños de un solo uso, para lo cual se ha tomado una muestra de 106 de dichos
envases, encontrándose una media muestral de 10,5 gramos y una desviación estándar muestral
de 0,8 gramos. Cuando la máquina de envasado está bien calibrada la desviación estándar
poblacional es menor a un gramo. Calcular un intervalo de confianza al 95% que le permita decir
si la máquina de envasado está bien calibrada.

147. El gerente financiero de una cadena de tiendas desea estimar la proporción de clientes que
utilizan tarjetas de crédito, ¿qué tamaño de muestra es necesario si el intervalo de confianza del
95% para la proporción debe tener una longitud de a lo sumo 0,10?

148. Un intervalo de confianza para el porcentaje de taxis informales en Lima es [69,6; 80,4]. Si este
intervalo se obtuvo a partir de una muestra de 200 taxis, ¿cuál es su nivel de confianza?

149. Una empresa constructora desea estimar, con un nivel de confianza del 95% y un error máximo
de estimación de 0,025 la proporción de personas de una determinada ciudad que comprarían una
vivienda de dimensiones comprendidas entre 180 y 200 m2. Para ello pretende tomar una muestra
aleatoria entre los potenciales compradores de vivienda, disponiendo para realizar el muestreo de
10 000 dólares.
a. Si cada elemento muestreado supone un costo de 10 dólares, ¿es suficiente el presupuesto
disponible?
b. ¿Qué nivel de confianza se puede alcanzar con 10 000 dólares de presupuesto, si se pretende
mantener el error máximo de estimación en 0,025?

150. En un restaurante universitario, el peso de la ración de arroz que se pone en un plato del menú se
puede modelar como una variable aleatoria normal. Si se pesan las raciones de arroz de 116
menús escogidos al azar y se encuentra una media muestral de 220 gramos y una desviación
estándar muestral de 25 gramos.
a. Estime la media poblacional del peso de la ración de arroz en cada plato con un nivel de
confianza del 95%.
b. Estime la varianza poblacional del peso de la ración de arroz en cada plato con un nivel de
confianza del 90%.

151. En la ficha técnica de la encuesta realizada por Ipsos Apoyo Opinión y Mercado S.A. y publicada
el día 22 de julio de 2007 en el diario El Comercio se afirma que el margen de error fue de 4,4%
con un nivel de confianza del 95%. ¿Qué tamaño mínimo de muestra se debe usar para cumplir
con dichas especificaciones?
Estadística EEGGCC 147

152. En una investigación realizada en el Valle de los ríos Apurímac y Ene (VRAE) se tomó una
muestra aleatoria de 350 viviendas y se estimó en 80%  4,8% el porcentaje de viviendas que no
tienen agua potable. Encontrar el nivel de confianza de la estimación.

153. Un padre desea regalar a su hija una tablet por Navidad, para lo cual ha preguntado, a una
muestra aleatoria de 13 tiendas de la ciudad, el precio de la misma tablet encontrando los
siguientes valores (en nuevos soles):

1499 1460 1507 1538 1536 1552 1434 1490 1530 1469 1479 1449 1440

Si el precio de la tablet se puede modelar con una variable normal, estime la desviación estándar
del precio de la tablet a un nivel de confianza del 90%. Interprete.

154. Para estimar el porcentaje de colegíos rurales que tienen por lo menos una computadora, una
universidad realizó una encuesta en 200 colegios rurales. Si en el informe de esta encuesta se
indicó que el porcentaje de colegios rurales con por lo menos una computadora se estima entre
33,2% y 46,8%, determine con qué nivel de confianza se realizó la estimación.
Capítulo 4. Introducción a la Estadística Inferencial 148

4.8. Nociones de prueba de hipótesis

Conceptos básicos

La prueba de hipótesis involucra una suposición elaborada sobre algún parámetro de la población. Se
usa una muestra aleatoria para decidir si se rechaza o no la suposición planteada. Para tomar esta
decisión se establece una regla antes de seleccionar la muestra.

Hipótesis nula H0

La hipótesis nula H0 es la hipótesis que se acepta inicialmente como verdadera y cuya validez será
sometida a la comprobación experimental.

Hipótesis alterna H1

La hipótesis alterna H1 es la negación de la hipótesis nula. Es la hipótesis que se acepta en caso se


rechace H0. (H1 es generalmente la hipótesis de investigación).

Ejemplo 187
H0: El tiempo medio de atención a un cliente en el módulo de información es de 2,8 minutos o menos.
H1: El tiempo medio de atención a un cliente en el módulo de información es de más de 2,8 minutos.
Notación:
H0: µ ≤ 2,8 minutos
H1: µ > 2,8 minutos

Ejemplo 188
H0: El porcentaje de personas que votará por un candidato es del 50%.
H1: El porcentaje de personas que votará por un candidato es menor al 50%.
Notación:
H0: p = 0,50
H1: p < 0,50

Contraste de hipótesis

El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta, significa que los datos de
la muestra no proporcionan evidencia suficiente que contradiga lo supuesto en la hipótesis nula.
La hipótesis que se contrasta es rechazada o no en función de la información muestral. La
hipótesis alternativa se especifica como opción posible si se rechaza la nula.
Estadística EEGGCC 149

Tipos de errores

Error tipo I
Es el error que se comete al rechazar la hipótesis nula cuando ésta es realmente verdadera.
La probabilidad de cometer el error tipo I () se define como:

  PRechazar H 0 H 0 es cierta
La probabilidad de cometer el error tipo I se denomina el nivel de significación de la prueba. El
valor  es fijado por la persona que realiza la investigación, por lo general, en 1%, 5% ó 10%.

Error tipo II
Es el error que se comete al no rechazar la hipótesis nula H0 cuando ésta en realidad es falsa.
La probabilidad de cometer el error tipo II (β) se define como:
  PNo rechazarH 0 H 0 es falsa

Decisión
Rechazar H0 No rechazar H0
H0 cierta Error tipo I Decisión correcta
H0 falsa Decisión correcta Error tipo II

Potencia de una prueba

La potencia de la prueba es la probabilidad de tomar la decisión acertada de rechazar H0 cuando H0 es


falsa (o aceptar H1 cuando H1 es verdadera).
La potencia de una prueba es (1 - ) = P(Rechazar H0/H0 es falsa)
Si se reduce la probabilidad de cometer uno de los errores, la probabilidad de cometer el otro error
crece (manteniendo todo lo demás constante).

Ejemplo 189
Según un estudio tomar aspirina una vez por semana reduce el riesgo de contraer cáncer de colon.
Plantee las hipótesis e indique cuál de los dos errores tendría peor consecuencia si se comete.

Ejemplo 190
Una persona es juzgada por cierto delito y podría ser condenada a ir a la cárcel, plantee este problema
como una prueba de hipótesis e indique cuál de los dos errores tendría peor consecuencia si se comete.

Ejemplo 191
En un grupo de 10 billetes hay r billetes falsos. Una persona afirma que el número de billetes falsos r
es igual a dos y otra persona afirma que r es mayor a dos. Para probar dichas afirmaciones se extraen
dos billetes uno por uno con reemplazo y se rechaza la hipótesis nula si ambos billetes son falsos.
Calcule la probabilidad de cometer el error tipo I de la prueba. Calcule la probabilidad de cometer el
error tipo II cuando r es igual a tres.
Capítulo 4. Introducción a la Estadística Inferencial 150

Pasos a seguir en una prueba de hipótesis

Paso 1: Plantear hipótesis acerca del parámetro  . En este curso  puede ser  ,  2 o p

  /2 /2

H 0 :    0
 H 0 :    0
 H 0 :    0

  
H1 :    0
 H1 :    0
 H1 :    0

Paso 2: Fijar el nivel de significación.


Paso 3: Escoger el estadístico de prueba adecuado.
Paso 4: Establecer las regiones críticas y la regla de decisión.
Paso 5: Calcular el valor del estadístico de prueba con los datos de la muestra.
Paso 6: Tomar la decisión y dar las conclusiones en el contexto del problema.

Región crítica

La región crítica o de rechazo de la hipótesis nula H0 es un intervalo de valores de la estadística de la


prueba que depende del nivel de significación α y de la hipótesis alterna H1.
Intervalos de valores de la estadística que se observarían con una probabilidad muy baja en el caso
en que la hipótesis nula fuera cierta.
La región crítica se usa para establecer la regla de decisión para la prueba.

Regla de decisión

Sea ˆ el valor observado del estadístico de prueba

Si ˆ pertenece a la región crítica se rechaza H0

Si ˆ no pertenece a la región crítica no se rechaza H0

Ejemplo 192
H0: El tiempo medio de atención a un cliente en el módulo de información es de 2,8 minutos o menos.
H1: El tiempo medio de atención a un cliente en el módulo de información es de más de 2,8 minutos.
H0: µ  2,8 minutos (µ0 = 2,8 minutos)
H1: µ > 2,8 minutos
Nivel de significación: α = 0,05
Región de rechazo: { X > 3,02 minutos}
Estadística EEGGCC 151
Regla de decisión
Rechazar la hipótesis nula si la media observada en la muestra es mayor que 3,02 minutos (es decir, si
pertenece a la región de rechazo). En caso contrario, no rechazar la hipótesis nula.
Supongamos que se ha tomado una muestra de tamaño 36 y se ha observado una media muestral igual
a 3,21 minutos.

Decisión
El tiempo medio de atención observado en la muestra pertenece a la región crítica, por lo tanto se
rechaza H0

Conclusión
A un nivel de significación del 5%, la evidencia muestral indica que el tiempo medio de atención a un
cliente en el módulo de información sería mayor que 2,8 minutos.

Nivel crítico de la prueba (valor p)

Es la probabilidad de obtener un estadístico de prueba igual o más extremo que el resultado obtenido
de la muestra, dado que la hipótesis nula H0 es cierta.

El nivel crítico de la prueba, valor p o p-value es el mayor valor posible del nivel de significación para
el que no se rechaza H0.

Se puede tomar la decisión en base al valor p de la prueba.


Si  ≤ valor p, entonces no se rechaza H0.
Si  > valor p, entonces se rechaza H0.

Ejemplo 193
H0: µ = 2,8 minutos (µ0 = 2,8 minutos)
H1: µ > 2,8 minutos

Nivel de significación: α = 0,05


Región de rechazo: { X > 3,02 minutos}
Se toma una muestra de tamaño 36 y se observa una media muestral igual a 3,21 minutos. El valor p es
igual a P( X >3,21 min. / µ = 2,8 min.) = 0,0011

Decisión
El valor p observado = 0,0011 es menor que el nivel de significación fijado α = 0,05, entonces, se
rechaza H0.

Conclusión
A un nivel de significación del 5%, la evidencia muestral indica que el tiempo medio de atención a un
cliente en el módulo de información es mayor que 2,8 minutos.
Capítulo 4. Introducción a la Estadística Inferencial 152

4.9. Pruebas de hipótesis

Prueba de hipótesis para una media poblacional

Sean x1, x2,…, xn los valores experimentales de una muestra aleatoria X1, X2,…, Xn de la variable
aleatoria X con E(Xi) = μ, V(Xi) = σ2 (i = 1, 2,…, n).

Posibles hipótesis
- Unilateral izquierda. H 0 :   0 H1 :   0

- Bilateral H 0 :   0 H1 :   0
- Unilateral derecha H 0 :   0 H1 :   0

Estadístico de prueba y regiones críticas

Si usamos como estadístico de prueba la media muestral X , entonces las regiones críticas serán:

- Unilateral izquierda 
RC   ,  0  z1  X 
   
- Bilateral RC    ,  0  z   X     0  z   X ,   
   
1 1
2 2

- Unilateral derecha 
RC   0  z1  X ,   

Varianza poblacional 2 es conocida. Población normal o tamaño de muestra n30



Población infinita o el muestreo es con reposición X 
n

 N n
Población finita de tamaño N y el muestreo es sin reposición X 
n N 1

Varianza poblacional 2 es desconocida y tamaño de muestra n  30


Población infinita o el muestreo es con reposición
 sx
X  se estima por ̂ X 
n n
Población finita de tamaño N y el muestreo es sin reposición
 N n s N n
X  se estima por ̂ X  x
n N 1 n N
Estadística EEGGCC 153
X  0
Si usamos como estadístico de prueba la media muestral Z  , entonces las regiones
X
críticas serán:
- Unilateral izquierda RC    ,  z1 

   
- Bilateral RC   ,  z     z  ,   
1
 2   1 2 
- Unilateral derecha RC   z1 ,  

Varianza poblacional 2 desconocida y población normal


Regiones críticas
 s 
- Unilateral izquierda RC    ,  0  t(1 ,n1) x 
 n

 sx   sx 
- Bilateral RC    ,  0  t    0  t  ,
 (1 , n 1)
2 n   (1 , n 1)
2 n 

 s 
- Unilateral derecha RC    0  t (1 ,n 1) x ,   
 n 

X  0
Si usamos como estadístico de prueba el estadístico T  ~ t n1 , entonces las regiones
S
n
críticas serán:

- Unilateral izquierda RC   ,  t(1 ,n1) 

   
- Bilateral RC   ,  t    t  ,   
(1 , n 1)
 2   (1 2 ,n1) 
- Unilateral derecha RC  t(1 ,n1) ,   

Ejemplo 194
El director de una biblioteca universitaria, afirma que el número promedio de libros sacados a
préstamo semanalmente por cada estudiante ha cambiado últimamente. Anteriormente, se sacaba una
media de 3,4 libros. En una muestra reciente de 40 estudiantes la media fue de 4,3 libros con una
desviación estándar de 1,5 libros. Al nivel de significación del 1%.
a. ¿Ha cambiado la media de préstamos?
b. Calcule el nivel crítico de la prueba.
c. Si actualmente la media es de 4,2 libros, calcule la probabilidad de cometer el error tipo II.
Capítulo 4. Introducción a la Estadística Inferencial 154
Solución
a. Determinemos las hipótesis nula y alterna
H0: µ = 3,4 libros (µ0 = 3,4 libros)
H1: µ ≠ 3,4 libros
El nivel de significación α es 0,01.
n  40 : x  4,3 , s  1,5 z   z0,995  2,575
1
2

s 1,5
 __  ˆ __    0,237
X X n 40
La región crítica (RC) es
RC ]  ,  0  z   X [  ] 0 z  X ,  [
1 1
2 2
]  , 3,4  2,575 0,237[]3,4  2,575 0,237,  [
RC ]  , 2,79[  ]4,01,  [

Como x  4,3 pertenece a la región crítica (RC), luego se rechaza H0 y se acepta que la media ha
cambiado.

También, podemos contrastar las hipótesis con el siguiente procedimiento.


H0: µ = 3,4 libros (µ0 = 3,4 libros)
H1: µ ≠ 3,4 libros
El nivel de significación α es 0,01.
Determinemos la región crítica.
RC ]  , z  [  ]z  ,  [
1 1
2 2
RC ]  ,  2,575[]2,575,[
Calculemos el valor real del estadístico de prueba
x  0 4,3  3,4
z   3,79
 __ 0,237
X

Como z  3,79 pertenece a la región crítica (RC), luego se rechaza H0 y se acepta que la media ha
cambiado.
b. Calculemos el nivel crítico de la prueba pv.
pv  2PZ  3,79  21  3,79  2  0,0001 0,0002
Como el nivel de significación α es mayor al nivel crítico de la prueba pv, esto α = 0,01 > pv =
0,0002, se rechaza H0 y se acepta que el promedio ha cambiado.
c. Calculemos la probabilidad de cometer el error tipo II
β = P(cometer el error tipo II) = P(No rechazar H0/ H0 es falsa)

  P2,79  X  4,01 /   4,2  P


 2,79  4,2 4,01  4,2 
Z    (0,80)  (5,95)
 0,237 0,237 
 0,2119  0  0,2119
Estadística EEGGCC 155
Ejemplo 195
Los inspectores de INDECOPI al investigar el cargo levantado contra una embotelladora de que no
llena adecuadamente las botellas, tomaron una muestra de 100 botellas y encontraron que el contenido
tenía una media de 31,65 onzas con una desviación estándar de dos onzas. Las botellas indican en su
etiqueta que contienen 32 onzas. Al nivel de significación del 2%.
a. ¿Deberían los inspectores aceptar que las botellas están siendo llenadas con menos contenido
medio que el indicado?
b. Calcular el nivel crítico de la prueba.
c. Si realmente la media es de 31 onzas, calcule la probabilidad de cometer el error tipo II.

Solución
a. Determinemos las hipótesis nula y alterna
H0: µ = 32 onzas (µ0 = 32 onzas)
H1: µ < 32 onzas
El nivel de significación α es 0,02.
n  100, x  31,65 , s  2, z1  z0.98  2,05
s 2
 X  ˆ X    0,2
n 100
Establezcamos la región crítica (RC)
RC ]  ,  0  z1  X []  , 32  2,05  0,2[
RC ]  , 31,59[
Como x  31,65 no pertenece a la región crítica (RC), luego no se rechaza H0 y se rechaza que las
botellas están siendo llenadas con menos contenido medio que el indicado.

También, podemos contrastar las hipótesis con el siguiente procedimiento.


H0: µ = 32 onzas (µ0 = 32 onzas)
H1: µ < 32 onzas
El nivel de significación α es 0,02.
Establezcamos la región crítica (RC)
RC ]  ,  z1 []  ,2,05[
Calculemos el valor real del estadístico de prueba
x  0 31,65  32
z   1,75
 __ 0,2
X

Como z  1.75 no pertenece a la región crítica (RC), luego no se rechaza H0 y se rechaza que
las botellas están siendo llenadas con menos contenido medio que el indicado.

b. Calculemos el nivel crítico de la prueba pv.


pv  PZ  1,75   1,75  0.0401
Como el nivel de significación α es menor al nivel crítico de la prueba pv, esto α = 0,02 > pv =
0,0401, se rechaza H0 y se rechaza que las botellas están siendo llenadas con menos contenido
medio que el indicado.
Capítulo 4. Introducción a la Estadística Inferencial 156

c. Calculemos la probabilidad de cometer el error tipo II


β = P(cometer el error tipo II) = P(No rechazar H0/ H0 es falsa)

  PX  31,59 /   31  P Z 


 31,59  31 
  1  2,95  0,0016
 0,2 

Ejemplo 196
Los estatutos ambientales aplicables a una planta nuclear, especifican que la temperatura del agua
reciclada no debe en promedio exceder los 84 ºF. En una muestra, de tamaño 25, se encuentra que la
temperatura del agua reciclada tiene una media de 88,6 ºF y una desviación estándar de 12 ºF. A un
nivel de significación del 5%, ¿la planta excede las limitaciones del estatuto? Asumir normalidad.

Solución
Determinemos las hipótesis nula y alterna
H0: µ = 84 ºF (µ0 = 84 ºF)
H1: µ > 84 ºF
El nivel de significación α es 0,05.
n  25 : x  88,6 , s  12 t(1 ,n1)  t( 0,95; 24)  1,7109
s 12
  2,4
n 25
Establezcamos la región crítica (RC)
sx
RC ] 0  t(1 ,n1) ,  [  ]84  1,7109 2,4 ,  [
n
RC ]88,1,  [
Como x  88.6 pertenece a la región crítica (RC), luego se rechaza H0 y se acepta que la planta excede
las limitaciones.

También, podemos contrastar las hipótesis con el siguiente procedimiento.


H0: µ = 84 ºF (µ0 = 84 ºF)
H1: µ > 84 ºF
El nivel de significación α es 0,05.

Establezcamos la región crítica (RC)


RC ]t(1 ,n1) ,  [  ]1,7109,  [

Calculemos el valor real del estadístico de prueba


x   0 88,6  84
t   1,9166
s 12
n 25
Como t  1,9166 pertenece a la región crítica (RC), luego se rechaza H0 y se acepta que la planta
excede las limitaciones.
Estadística EEGGCC 157
Ejemplo 197
En un cultivo de alcachofa se trabaja con la variedad Imperial Star, cuyo rendimiento medio es de
16,8 toneladas por hectárea con una desviación estándar es de 1,54 toneladas por hectárea. Los
fitotecnistas desean aumentar el rendimiento medio, para lo cual han usado un proceso de selección.
Para decidir si la selección mejoró el rendimiento medio se plantaron 35 parcelas, cuyo rendimiento
medio fue de 17,2 toneladas por hectárea. A un nivel de significación del 5%, ¿puede afirmarse que el
rendimiento medio aumentó? Asuma que el rendimiento es una variable normal. Determine e
interprete el nivel crítico de la prueba (valor p).

Ejemplo 198
Una compañía trata que una facultad compre un software de comunicación que, según la compañía,
mejorará las notas medias de los alumnos en algunos cursos. La facultad ha decidido que comprará el
software, si la compañía logra demostrar la mejoría en un curso cuya nota promedio poblacional es de
14,1. Se hizo una prueba piloto con 50 alumnos seleccionados al azar registrándose la nota media de
14,5 y luego se calculó el valor p que es igual 0,0252. Se desea cometer el error tipo I con una
probabilidad de 0,01. Indique las hipótesis nula y alterna, las consecuencias de cometer cada error y la
decisión de la facultad con respecto a la compra.

Pruebas de hipótesis para una proporción poblacional (n  30)

Posibles hipótesis
- Unilateral izquierda H 0 : p  p 0 H1 : p  p 0

- Bilateral H 0 : p  p 0 H1 : p  p 0

- Unilateral derecha H 0 : p  p 0 H1 : p  p 0

Estadísticos de prueba y regiones críticas

Si usamos como estadístico de prueba la proporción muestral P , entonces las regiones críticas
serán:
- Unilateral izquierda 
RC   , p0  z1  P 
   
- Bilateral RC    , p0  z   P    p 0  z   P ,   
   
1 1
2 2

- Unilateral derecha 
RC  p0  z1  P ,   
p0 q0
Si la población es infinita o el muestreo es con reposición,  P 
n
p0 q0 N n
Si la población es finita de tamaño N y el muestreo es sin reposición,  P 
n N 1
Capítulo 4. Introducción a la Estadística Inferencial 158
P  p0
Si usamos como estadístico de prueba el estadístico Z  , entonces las regiones
p0 (1  p0 )
n
críticas serán:

- Unilateral izquierda RC  ,  z1 

   
- Bilateral RC   ,  z     z  ,   
1
 2   1 2 
- Unilateral derecha RC   z1 ,  

Ejemplo 199
El director de correos implementó nuevos procedimientos para reducir el número de cartas
extraviadas. Anteriormente el porcentaje de cartas extraviadas era del 0,3 %. Recientemente en una
investigación en la que 8 000 cartas fueron enviadas se extraviaron 18 cartas. Al nivel de significación
del 10%.

a. ¿Se puede aceptar que los nuevos procedimientos consiguieron su objetivo?


b. Calcule el nivel crítico de la prueba.
c. Si actualmente el porcentaje de cartas extraviadas es del 0,2%, encontrar la probabilidad de
cometer el error tipo II.

Solución
a. Determinemos las hipótesis nula y alterna
H0: p = 0,003 (p0 = 0,003)
H1: p < 0,003
El nivel de significación α es 0,05.
18
n  8 000: p  0,00225 z1  z0.90  1,28
8000
p0 q 0 0,003 0,997
 __    0,00061
P n 8 000

Establezcamos la región crítica (RC)


RC ]  , p0  z1  P []   , 0,003  1,28  0,00061[
RC ]   , 0,0022[
Como p  0,00225, no pertenece a la región crítica (RC), luego no se rechaza H0 y se rechaza que
los nuevos procedimientos consiguieron su objetivo.
Estadística EEGGCC 159
También, podemos contrastar las hipótesis con el siguiente procedimiento.
H0: p = 0,003 (p0 = 0,003)
H1: p < 0,003
El nivel de significación α es 0,05.
Determinemos la región crítica. Como z1  1,28 , entonces, RC ]  ,  1,28[
Calculemos el valor real del estadístico de prueba
p  p0 p  p0 0,00225 0,003
z    1,23
P p0 q0 0,003 0,997
n 8 000

Como z  1,23 no pertenece a la región crítica RC no se rechaza H0 y se rechaza que los nuevos
procedimientos consiguieron su objetivo.
b. Calculemos el nivel crítico de la prueba pv.
pv  P(Z  1,23)  (1,23)  0,1093
Como el nivel de significación α es menor al nivel crítico de la prueba pv, esto α = 0,10 > pv =
0,1093, no se rechaza H0 y se rechaza que los nuevos procedimientos consiguieron su objetivo.
c. Calculemos la probabilidad de cometer el error tipo II
β = P(cometer el error tipo II) = P(No rechazar H0/ H0 es falsa)
 
 
 
  P P  0,0022/ p  0,002  P Z 
0,0022  0,002 
  1  (0,4)  0,3446
 0,002  0,998 
 8 000 
 

Ejemplo 200
El jefe de personal opina que el 18% de los empleados de la compañía trabajan horas extras cada
semana. El porcentaje observado esta semana en una muestra de 100 empleados es de 9%. Con un
nivel de significación del 5%.
a. ¿Se puede aceptar la opinión del jefe de personal ha cambiado?
b. Hallar el nivel crítico de la prueba.
c. Si el 12% de los empleados de la compañía trabajan horas extras cada semana, calcule la
probabilidad de cometer el error tipo II.

Solución
a. Determinemos las hipótesis nula y alterna
H0: p = 0,18 (p0 = 0,18)
H1: p ≠ 0,18
El nivel de significación α es 0,05
Determinemos la región crítica RC
Capítulo 4. Introducción a la Estadística Inferencial 160
n  100 : p  0,09

NS    0,05  1   0,975 z   z 0.975  1,96
2 1
2

p0 q0 0,18  0,82
P    0,0384
n 100
Tenemos que:
RC ]  , p0  z   P [  ] p0 z  P ,  [
1 1
2 2
]  ,0,18  1,96  0,0384[  ]0,18  1,96  0,0384,[
]  ,0,105[  ] 0,255,[
Luego, la región crítica es RC ]  , 0,105[  ]0,255,  [
Como p  0,09 pertenece a la región crítica (RC) se rechaza H0 y se rechaza la opinión del jefe de
personal.

También, podemos contrastar las hipótesis con el siguiente procedimiento.


H0: p = 0,18 (p0 = 0,18)
H1: p ≠ 0,18
El nivel de significación α es 0,05.
Determinemos la región crítica. Como z   1,96 , entonces RC ]  ,  1,96[  ]1,96,  [
1
2

Calculemos el valor real del estadístico de prueba


p  p0
p  p0 0,09  0,18
z   2,34
P p0 q0 0,0384
n
Como z  2,34 pertenece a la región crítica RC se rechaza H0 y se rechaza la opinión del jefe de
personal.

b. Calculemos el nivel crítico de la prueba pv.


pv  2PZ  2,34  2(2,34))  2  0,0096  0,0192
Como el nivel de significación α es mayor al nivel crítico de la prueba pv, esto α = 0,05 > pv =
0,0192, se rechaza H0 y se rechaza la opinión del jefe de personal.

c. Calculemos la probabilidad de cometer el error tipo II


β = P(cometer el error tipo II) = P(No rechazar H0/ H0 es falsa)
 
 
__
 0,255  0,12 0,105  0,12 
  P(0,105  P  0,255 / p  0,12)  P Z
 0,12  0,88 0,12  0,88 
 
 100 100 
 (4,15)  (0,46)  1  0,3228  0,6772
Estadística EEGGCC 161
Ejemplo 201
En una encuesta a 400 electores de un distrito, el 52 % estaban de acuerdo con la gestión del alcalde.
Con un nivel de significación del 5%.
a. ¿Se puede afirmar que más de la mitad de los electores del distrito están de acuerdo con la gestión
del alcalde?
b. Calcule el nivel crítico de la prueba.
c. Si el 60 % de los electores del distrito están de acuerdo con la gestión del alcalde, calcule la
probabilidad de cometer el error tipo II.

Solución
a. Determinemos las hipótesis nula y alterna
H0: p = 0,50 (p0 = 0,50)
H1: p > 0,50

El nivel de significación α es 0,05


Determinemos la región crítica RC
n  400 : p  0,52
NS    0,05  1    0,95 z1  z0,95  1,645
p0 q0 0,50  0,50
 __    0,025
P n 400
De donde
RC ] p0  z1  P ,  [] 0,50  1,645 0,025,  [
RC ] 0,54,  [
Como p  0,52 no pertenece a la región crítica (RC) no se rechaza H0 y se rechaza la afirmación.

También, podemos contrastar las hipótesis con el siguiente procedimiento.


H0: p = 0,50 (p0 = 0,50)
H1: p > 0,50
El nivel de significación α es 0,05
Determinemos la región crítica (RC)
RC ]z1 ,[]1,645,  [

Calculemos el valor real del estadístico de prueba


p  p0 p  p0 0,52  0,50
z    0,80
P p0 q 0 0,025
n
Como z  0.80 pertenece a la región crítica (RC) se rechaza H0 y se rechaza la opinión del jefe de
personal.
Capítulo 4. Introducción a la Estadística Inferencial 162

b. Calculemos el nivel crítico de la prueba pv.


pv  PZ  0,8  1  0,8  0,2119
Como el nivel de significación α es menor al nivel crítico de la prueba pv, esto α = 0,05 > pv =
0,2119, no se rechaza H0 y se rechaza la afirmación.
c. Calculemos la probabilidad de cometer el error tipo II
β = P(cometer el error tipo II) = P(No rechazar H0/ H0 es falsa)
 
 
 
  P P  0,54 / p  0,60  P Z 

0,54  0,60 
  2,45  0,0071
0,60  0,40 
 
 400 

Ejemplo 202
La ludopatía es un impulso irreprimible de jugar a pesar de ser consciente de sus consecuencias y del
deseo de detenerse. Un estudio en el Reino Unido, el British Gambling Prevalence Survey 2007,
concluyó que el 0,6% de la población adulta tenía problemas con el juego. Un nuevo estudio del 2009
afirma que dicho porcentaje ha subido, ya que se encontró una proporción muestral de 0,78%,
habiéndose encuestado a una muestra de 1450 personas. ¿Hay evidencia muestral suficiente que
indique que la proporción de ludópatas se habría incrementado? Use =3%. Calcule el valor p.

Ejemplo 203
Según Edison De la Cruz Pérez, Inspector del Trabajo del Ministerio de Trabajo y Promoción del
Empleo del Perú, el 88% de los accidentes laborales se deben a factores humanos. Otro experto cree
que el porcentaje de accidentes laborales debidos a factores humanos es menor. Para contrastar dicha
hipótesis se registró de forma aleatoria 516 accidentes laborales encontrándose que 434 fueron debido
a factores humanos. ¿Cuál sería su conclusión?. Use =3%. Calcule e interprete el valor p.

Prueba de hipótesis para una varianza poblacional

Sean x1, x2,…, xn los valores experimentales de una muestra aleatoria X1, X2,…, Xn de la variable
aleatoria X con distribución normal, en la que E(Xi) = μ, V(Xi) = σ2 (i = 1, 2,…, n).

Posibles hipótesis
- Unilateral izquierda. H 0 :  2   02 H1 :  2   02

- Bilateral H0 :  2   02 H1 :  2   02

- Unilateral derecha H0 :  2   02 H1 :  2   02

Estadístico de prueba y regiones críticas

 X 
n
1 2
Si usamos como estadístico de prueba la desviación estándar muestral S 2  X ,
n 1
i
i 1
entonces las regiones críticas serán:
Estadística EEGGCC 163
   2 
- Unilateral izquierda. RC   0,  (2 ,n 1)  0  
  n 1 

   02    2   02  
- Bilateral RC   0,  2          ,  
( , n 1) n  1
 2     (1 2 ,n1)  n  1  

  2  
- Unilateral derecha RC    (21 ,n1)  0 ,   
  n 1 

Si usamos como estadístico de prueba el estadístico  2 


n  1S 2 , entonces las regiones
 02
críticas serán:

- Unilateral izquierda. RC   0, (2 ,n1) 

   2 
- Bilateral RC   0,  2      ,  
( , n 1)
 2   (1 2 , n1) 

- Unilateral derecha RC   (12  ,n1) ,   

Ejemplo 204
En una embotelladora la desviación estándar de la cantidad de liquido llenado debe ser menor que 0,1
onzas. El supervisor del control de calidad tomó una muestra de 12 botellas y encontró que la cantidad
de líquido llenado tenía una desviación estándar muestral de 0,07 onzas. Con un nivel de significación
del 10 %, ¿se puede afirmar que la desviación estándar de la cantidad de liquido llenado es menor que
0,1 onzas? Asume que la cantidad de líquido en una variable normal.

Solución
Determinemos las hipótesis nula y alterna
H 0 :  2  0,12 ( 02  0,12  0,01)
H1 :  2  0,12

El nivel de significación α es 0,10


Determinemos la región crítica (RC)
n  12 : s 2  0,072  0,0049  (2 ,n1)   (20,10;11)  5,5778

 2   0,12 
RC  0,  (2 ,n 1) 0   0, 5,5778   0, 0,00507
 n  1   12  1 

Como s 2  0.0049 pertenece a la región crítica (RC) se rechaza H0 y se acepta la afirmación.


Capítulo 4. Introducción a la Estadística Inferencial 164

También, podemos contrastar las hipótesis con el siguiente procedimiento.

Definamos las hipótesis nula y alterna


H 0 :  2  0,12 ( 02  0,12  0,01)
H1 :  2  0,12
El nivel de significación α es 0,10
 
Determinemos la región crítica, RC  0,  (2 ,n1)   ,5,5778

Calculemos el valor real del estadístico de prueba

2 
(n  1) s 2

12  1  0,0049  5,39
 2
0 0,01

Como  2  5,39 pertenece a la región crítica (RC) se rechaza H0 y se acepta la afirmación.

Ejemplo 205
Según un fabricante, una máquina que embolsa arroz tiene una desviación estándar de 10 gramos. Para
confirmar dicha aseveración, se toma una muestra aleatoria de 51 bolsas y se encuentra una desviación
estándar de 11,89 gramos. A un nivel de significación del 5%, ¿puede afirmarse que la desviación
estándar es diferente a 10 gramos? Asuma que la cantidad de arroz embolsado es una variable normal.
Estadística EEGGCC 165

Ejercicios

155. El encargado de mantenimiento de una aerolínea de una compañía quiere probar si la cantidad
media de desgaste de un eje después de un recorrido fijo de millas de motores de combustión
interna, que llevan cobre y plomo como material antifricción es mayor a 3,50 cm. Para lo cual
midió el desgaste de ocho motores, resultando en una media muestral igual a 3,72 cm. y una
desviación muestral igual a 1,25 cm. Suponiendo distribución normal.
a. Haga esta prueba de hipótesis a un nivel de significación del 5%.
b. ¿Cuál es la probabilidad de cometer el error tipo II si realmente la media poblacional es
igual a 4 cm. y la desviación estándar es igual a 1,25 cm?

156. La resistencia a la rotura de los cables producidos por un fabricante tiene una media de 800 kg y
una desviación estándar de 40 kg. Se afirma que mediante una nueva técnica en el proceso de
fabricación esta resistencia puede ser incrementada. Para probar esto se ensaya una muestra de 50
cables producidos con la nueva técnica y se encuentra que su resistencia media es de 820 kg.
Admitiendo que la nueva técnica no modifica la desviación estándar y con un nivel de
significación del 1%:
a. ¿Puede decirse que hay un aumento en la resistencia media?
b. ¿Cuál es la probabilidad de cometer el error tipo II, si la resistencia a la rotura de los cables
producidos con la nueva técnica tiene una media de 830 kg?

157. El porcentaje deseado de dióxido de silicio SiO2 en cierto tipo de cemento aluminoso es 15. Para
probar si la verdadera media del porcentaje es 15 para una planta de producción en particular, se
analizarán 16 muestras obtenidas de manera independiente. Supongamos que el porcentaje de
SiO2 en una muestra está normalmente distribuido con una desviación estándar de 2 y se utiliza
una prueba con un nivel de significación del 1%.
a. Si la media del porcentaje en las muestras es de 16,1, ¿indica esto de manera concluyente
que la verdadera media del porcentaje difiere de 15?
b. Si la verdadera media del porcentaje es µ= 17, ¿cuál es la probabilidad de no rechazar H0
siendo falsa?

158. En un estudio estadístico se informa que el ingreso promedio de la población de obreros es de


más de 150 dólares. Para verificar esta afirmación se escogió una muestra aleatoria de 50 obreros,
cuyos ingresos en dólares se dan en la siguiente tabla:

Ingresos 80 120 160 200 240


Obreros 8 10 20 7 5

Con un nivel de significación del 5%, ¿se debería rechazar la afirmación sobre el promedio?

159. Una organización de defensa del consumidor afirma que más del 15% de los clientes de una
compañía que presta servicios de desratización necesita que se repita el proceso después del
período de garantía de 90 días. Para determinar la validez de esta afirmación, selecciona una
muestra aleatoria de 100 clientes y descubre que 22 necesitaron repetir el proceso después del
período de garantía de 90 días. Usando un nivel de significación del 5%, ¿hay evidencia
estadística de que la afirmación sea válida?
Capítulo 4. Introducción a la Estadística Inferencial 166
160. El tiempo de vida de un equipo electrónico es una variable aleatoria exponencial. El fabricante
afirma que el tiempo de vida medio de este equipo electrónico es de más de 300 horas. Para
probar esta afirmación se toma una muestra aleatoria de tamaño 40. Si el nivel de significación es
del 5%, calcular la probabilidad de cometer el error tipo II, si la verdadera media es de 420 horas.

161. Un investigador afirma que el número promedio de terremotos en el Japón al año es de 1 500, sin
embargo, otros investigadores afirman que esta cifra es demasiado alta. En los últimos 30 años el
número de terremotos promedio por año fue de 1 479 con una desviación estándar de 50
terremotos.
a. A un nivel de significación del 2% ¿aceptaría la afirmación de que el número medio de
terremotos en el Japón al año es menor que 1 500?
b. Hallar el nivel crítico de la prueba.

162. La municipalidad de una ciudad afirma que el 65% de los accidentes automovilísticos son
causados por el alcohol. Para contrastar la hipótesis, se toma una muestra de 70 accidentes
automovilísticos y se observa que 48 de ellos se deben al alcohol. Con un nivel de significación
del 8%, ¿se acepta la afirmación de la municipalidad?

163. En el pasado, 42% de quienes se sometieron a un examen de auditoría contable aprobó esta
evaluación al primer intento. En la actualidad, el fácil acceso a los libros y cursos de preparación
para este examen parece haber mejorado la probabilidad de que una persona lo apruebe en el
primer intento. En una muestra de 250 aspirantes que rindieron el examen por primera vez el día
de hoy, 126 resultaron aprobados.
a) A un nivel de significación del 5%, ¿admitiría que la probabilidad de aprobar el examen al
primer intento ha mejorado?
b) Si el porcentaje de personas que aprueban el examen al primer intento es ahora 40%, calcule e
interprete la probabilidad de cometer el error tipo II.
Estadística EEGGCC 167

Tablas estadísticas
Tabla de la distribución normal estándar
Área bajo la curva normal: PZ  z    
Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
-3,1 0,000711 0,000736 0,000762 0,000789 0,000816 0,000845 0,000874 0,000904 0,000935 0,000968
-3,0 0,001001 0,001035 0,001070 0,001107 0,001144 0,001183 0,001223 0,001264 0,001306 0,001350

-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275

-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866

-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
Estadística EEGGCC 168
Tabla de la distribución normal estándar
Área bajo la curva normal: PZ  z    

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891

1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670

2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861

3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481 0,999499
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638 0,999651
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749 0,999758
3,5 0,999767 0,999776 0,999784 0,999792 0,999800 0,999807 0,999815 0,999822 0,999828 0,999835
3,6 0,999841 0,999847 0,999853 0,999858 0,999864 0,999869 0,999874 0,999879 0,999883 0,999888
3,7 0,999892 0,999896 0,999900 0,999904 0,999908 0,999912 0,999915 0,999918 0,999922 0,999925
3,8 0,999928 0,999931 0,999933 0,999936 0,999938 0,999941 0,999943 0,999946 0,999948 0,999950
3,9 0,999952 0,999954 0,999956 0,999958 0,999959 0,999961 0,999963 0,999964 0,999966 0,999967
Estadística EEGGCC 169
Tabla de la distribución t-Student
Área bajo la curva: PT  c   


 0,8 0,85 0,9 0,925 0,95 0,975 0,98 0,985 0,9875 0,99 0,9925 0,995
1 1,3764 1,9626 3,0777 4,1653 6,3138 12,7062 15,8945 21,2049 25,4517 31,8205 42,4335 63,6567
2 1,0607 1,3862 1,8856 2,2819 2,9200 4,3027 4,8487 5,6428 6,2053 6,9646 8,0728 9,9248
3 0,9785 1,2498 1,6377 1,9243 2,3534 3,1824 3,4819 3,8960 4,1765 4,5407 5,0473 5,8409
4 0,9410 1,1896 1,5332 1,7782 2,1318 2,7764 2,9985 3,2976 3,4954 3,7469 4,0880 4,6041
5 0,9195 1,1558 1,4759 1,6994 2,0150 2,5706 2,7565 3,0029 3,1634 3,3649 3,6338 4,0321
6 0,9057 1,1342 1,4398 1,6502 1,9432 2,4469 2,6122 2,8289 2,9687 3,1427 3,3723 3,7074
7 0,8960 1,1192 1,4149 1,6166 1,8946 2,3646 2,5168 2,7146 2,8412 2,9980 3,2032 3,4995
8 0,8889 1,1081 1,3968 1,5922 1,8595 2,3060 2,4490 2,6338 2,7515 2,8965 3,0851 3,3554
9 0,8834 1,0997 1,3830 1,5737 1,8331 2,2622 2,3984 2,5738 2,6850 2,8214 2,9982 3,2498
10 0,8791 1,0931 1,3722 1,5592 1,8125 2,2281 2,3593 2,5275 2,6338 2,7638 2,9316 3,1693

11 0,8755 1,0877 1,3634 1,5476 1,7959 2,2010 2,3281 2,4907 2,5931 2,7181 2,8789 3,1058
12 0,8726 1,0832 1,3562 1,5380 1,7823 2,1788 2,3027 2,4607 2,5600 2,6810 2,8363 3,0545
13 0,8702 1,0795 1,3502 1,5299 1,7709 2,1604 2,2816 2,4358 2,5326 2,6503 2,8010 3,0123
14 0,8681 1,0763 1,3450 1,5231 1,7613 2,1448 2,2638 2,4149 2,5096 2,6245 2,7714 2,9768
15 0,8662 1,0735 1,3406 1,5172 1,7531 2,1314 2,2485 2,3970 2,4899 2,6025 2,7462 2,9467
16 0,8647 1,0711 1,3368 1,5121 1,7459 2,1199 2,2354 2,3815 2,4729 2,5835 2,7245 2,9208
17 0,8633 1,0690 1,3334 1,5077 1,7396 2,1098 2,2238 2,3681 2,4581 2,5669 2,7056 2,8982
18 0,8620 1,0672 1,3304 1,5037 1,7341 2,1009 2,2137 2,3562 2,4450 2,5524 2,6889 2,8784
19 0,8610 1,0655 1,3277 1,5002 1,7291 2,0930 2,2047 2,3456 2,4334 2,5395 2,6742 2,8609
20 0,8600 1,0640 1,3253 1,4970 1,7247 2,0860 2,1967 2,3362 2,4231 2,5280 2,6611 2,8453

21 0,8591 1,0627 1,3232 1,4942 1,7207 2,0796 2,1894 2,3278 2,4138 2,5176 2,6493 2,8314
22 0,8583 1,0614 1,3212 1,4916 1,7171 2,0739 2,1829 2,3202 2,4055 2,5083 2,6387 2,8188
23 0,8575 1,0603 1,3195 1,4893 1,7139 2,0687 2,1770 2,3132 2,3979 2,4999 2,6290 2,8073
24 0,8569 1,0593 1,3178 1,4871 1,7109 2,0639 2,1715 2,3069 2,3909 2,4922 2,6203 2,7969
25 0,8562 1,0584 1,3163 1,4852 1,7081 2,0595 2,1666 2,3011 2,3846 2,4851 2,6122 2,7874
26 0,8557 1,0575 1,3150 1,4834 1,7056 2,0555 2,1620 2,2958 2,3788 2,4786 2,6049 2,7787
27 0,8551 1,0567 1,3137 1,4817 1,7033 2,0518 2,1578 2,2909 2,3734 2,4727 2,5981 2,7707
28 0,8546 1,0560 1,3125 1,4801 1,7011 2,0484 2,1539 2,2864 2,3685 2,4671 2,5918 2,7633
29 0,8542 1,0553 1,3114 1,4787 1,6991 2,0452 2,1503 2,2822 2,3638 2,4620 2,5860 2,7564
30 0,8538 1,0547 1,3104 1,4774 1,6973 2,0423 2,1470 2,2783 2,3596 2,4573 2,5806 2,7500

31 0,8534 1,0541 1,3095 1,4761 1,6955 2,0395 2,1438 2,2746 2,3556 2,4528 2,5755 2,7440
32 0,8530 1,0535 1,3086 1,4749 1,6939 2,0369 2,1409 2,2712 2,3518 2,4487 2,5708 2,7385
33 0,8526 1,0530 1,3077 1,4738 1,6924 2,0345 2,1382 2,2680 2,3483 2,4448 2,5664 2,7333
34 0,8523 1,0525 1,3070 1,4728 1,6909 2,0322 2,1356 2,2650 2,3451 2,4411 2,5623 2,7284
35 0,8520 1,0520 1,3062 1,4718 1,6896 2,0301 2,1332 2,2622 2,3420 2,4377 2,5584 2,7238
36 0,8517 1,0516 1,3055 1,4709 1,6883 2,0281 2,1309 2,2595 2,3391 2,4345 2,5547 2,7195
37 0,8514 1,0512 1,3049 1,4701 1,6871 2,0262 2,1287 2,2570 2,3363 2,4314 2,5513 2,7154
38 0,8512 1,0508 1,3042 1,4692 1,6860 2,0244 2,1267 2,2546 2,3337 2,4286 2,5480 2,7116
Estadística EEGGCC 170
Tabla de la distribución t-Student
Área bajo la curva: PT  c   


 0,800 0,850 0,900 0,925 0,950 0,975 0,980 0,985 0,9875 0,990 0,9925 0,995
39 0,8509 1,0504 1,3036 1,4685 1,6849 2,0227 2,1247 2,2524 2,3313 2,4258 2,5449 2,7079
40 0,8507 1,0500 1,3031 1,4677 1,6839 2,0211 2,1229 2,2503 2,3289 2,4233 2,5420 2,7045
41 0,8505 1,0497 1,3025 1,4670 1,6829 2,0195 2,1212 2,2482 2,3267 2,4208 2,5392 2,7012
42 0,8503 1,0494 1,3020 1,4664 1,6820 2,0181 2,1195 2,2463 2,3246 2,4185 2,5366 2,6981
43 0,8501 1,0491 1,3016 1,4657 1,6811 2,0167 2,1179 2,2445 2,3226 2,4163 2,5340 2,6951
44 0,8499 1,0488 1,3011 1,4651 1,6802 2,0154 2,1164 2,2427 2,3207 2,4141 2,5316 2,6923
45 0,8497 1,0485 1,3006 1,4645 1,6794 2,0141 2,1150 2,2411 2,3189 2,4121 2,5294 2,6896
46 0,8495 1,0483 1,3002 1,4640 1,6787 2,0129 2,1136 2,2395 2,3172 2,4102 2,5272 2,6870
47 0,8493 1,0480 1,2998 1,4635 1,6779 2,0117 2,1123 2,2380 2,3155 2,4083 2,5251 2,6846
48 0,8492 1,0478 1,2994 1,4629 1,6772 2,0106 2,1111 2,2365 2,3139 2,4066 2,5231 2,6822
49 0,8490 1,0475 1,2991 1,4625 1,6766 2,0096 2,1099 2,2351 2,3124 2,4049 2,5212 2,6800
50 0,8489 1,0473 1,2987 1,4620 1,6759 2,0086 2,1087 2,2338 2,3109 2,4033 2,5193 2,6778

51 0,8487 1,0471 1,2984 1,4615 1,6753 2,0076 2,1076 2,2325 2,3095 2,4017 2,5176 2,6757
52 0,8486 1,0469 1,2980 1,4611 1,6747 2,0066 2,1066 2,2313 2,3082 2,4002 2,5159 2,6737
53 0,8485 1,0467 1,2977 1,4607 1,6741 2,0057 2,1055 2,2301 2,3069 2,3988 2,5143 2,6718
54 0,8483 1,0465 1,2974 1,4603 1,6736 2,0049 2,1046 2,2289 2,3056 2,3974 2,5127 2,6700
55 0,8482 1,0463 1,2971 1,4599 1,6730 2,0040 2,1036 2,2278 2,3044 2,3961 2,5112 2,6682
56 0,8481 1,0461 1,2969 1,4596 1,6725 2,0032 2,1027 2,2268 2,3033 2,3948 2,5097 2,6665
57 0,8480 1,0459 1,2966 1,4592 1,6720 2,0025 2,1018 2,2258 2,3022 2,3936 2,5083 2,6649
58 0,8479 1,0458 1,2963 1,4589 1,6716 2,0017 2,1010 2,2248 2,3011 2,3924 2,5070 2,6633
59 0,8478 1,0456 1,2961 1,4585 1,6711 2,0010 2,1002 2,2238 2,3000 2,3912 2,5057 2,6618
60 0,8477 1,0455 1,2958 1,4582 1,6706 2,0003 2,0994 2,2229 2,2990 2,3901 2,5044 2,6603

70 0,8468 1,0442 1,2938 1,4555 1,6669 1,9944 2,0927 2,2152 2,2906 2,3808 2,4939 2,6479
80 0,8461 1,0432 1,2922 1,4535 1,6641 1,9901 2,0878 2,2095 2,2844 2,3739 2,4860 2,6387
90 0,8456 1,0424 1,2910 1,4519 1,6620 1,9867 2,0839 2,2050 2,2795 2,3685 2,4800 2,6316
100 0,8452 1,0418 1,2901 1,4507 1,6602 1,9840 2,0809 2,2015 2,2757 2,3642 2,4751 2,6259
110 0,8449 1,0413 1,2893 1,4497 1,6588 1,9818 2,0784 2,1986 2,2725 2,3607 2,4712 2,6213
120 0,8446 1,0409 1,2886 1,4488 1,6577 1,9799 2,0763 2,1962 2,2699 2,3578 2,4679 2,6174
130 0,8444 1,0406 1,2881 1,4481 1,6567 1,9784 2,0746 2,1942 2,2677 2,3554 2,4651 2,6142
140 0,8442 1,0403 1,2876 1,4475 1,6558 1,9771 2,0731 2,1924 2,2658 2,3533 2,4628 2,6114
150 0,8440 1,0400 1,2872 1,4469 1,6551 1,9759 2,0718 2,1909 2,2641 2,3515 2,4607 2,6090
160 0,8439 1,0398 1,2869 1,4465 1,6544 1,9749 2,0706 2,1896 2,2627 2,3499 2,4589 2,6069

170 0,8437 1,0396 1,2866 1,4461 1,6539 1,9740 2,0696 2,1885 2,2614 2,3485 2,4574 2,6051
180 0,8436 1,0394 1,2863 1,4457 1,6534 1,9732 2,0687 2,1874 2,2603 2,3472 2,4560 2,6034
190 0,8435 1,0393 1,2860 1,4454 1,6529 1,9725 2,0679 2,1865 2,2593 2,3461 2,4547 2,6020
200 0,8434 1,0391 1,2858 1,4451 1,6525 1,9719 2,0672 2,1857 2,2584 2,3451 2,4536 2,6006
Infinito 0,8416 1,0364 1,2816 1,4395 1,6449 1,9600 2,0538 2,1701 2,2414 2,3264 2,4324 2,5758
Estadística EEGGCC 171
Tabla de la distribución ji-cuadrado

Área bajo la curva: P(   c)  
2


v
0,005 0,01 0,02 0,025 0,04 0,05 0,1 0,2 0,3 0,4 0,5
1 0,000 0,000 0,001 0,001 0,003 0,004 0,016 0,064 0,148 0,275 0,455
2 0,010 0,020 0,040 0,051 0,082 0,103 0,211 0,446 0,713 1,022 1,386
3 0,072 0,115 0,185 0,216 0,300 0,352 0,584 1,005 1,424 1,869 2,366
4 0,207 0,297 0,429 0,484 0,627 0,711 1,064 1,649 2,195 2,753 3,357
5 0,412 0,554 0,752 0,831 1,031 1,145 1,610 2,343 3,000 3,655 4,351
6 0,676 0,872 1,134 1,237 1,492 1,635 2,204 3,070 3,828 4,570 5,348
7 0,989 1,239 1,564 1,690 1,997 2,167 2,833 3,822 4,671 5,493 6,346
8 1,344 1,646 2,032 2,180 2,537 2,733 3,490 4,594 5,527 6,423 7,344
9 1,735 2,088 2,532 2,700 3,105 3,325 4,168 5,380 6,393 7,357 8,343
10 2,156 2,558 3,059 3,247 3,697 3,940 4,865 6,179 7,267 8,295 9,342

11 2,603 3,053 3,609 3,816 4,309 4,575 5,578 6,989 8,148 9,237 10,341
12 3,074 3,571 4,178 4,404 4,939 5,226 6,304 7,807 9,034 10,182 11,340
13 3,565 4,107 4,765 5,009 5,584 5,892 7,042 8,634 9,926 11,129 12,340
14 4,075 4,660 5,368 5,629 6,243 6,571 7,790 9,467 10,821 12,078 13,339
15 4,601 5,229 5,985 6,262 6,914 7,261 8,547 10,307 11,721 13,030 14,339
16 5,142 5,812 6,614 6,908 7,596 7,962 9,312 11,152 12,624 13,983 15,338
17 5,697 6,408 7,255 7,564 8,288 8,672 10,085 12,002 13,531 14,937 16,338
18 6,265 7,015 7,906 8,231 8,989 9,390 10,865 12,857 14,440 15,893 17,338
19 6,844 7,633 8,567 8,907 9,698 10,117 11,651 13,716 15,352 16,850 18,338
20 7,434 8,260 9,237 9,591 10,415 10,851 12,443 14,578 16,266 17,809 19,337

21 8,034 8,897 9,915 10,283 11,140 11,591 13,240 15,445 17,182 18,768 20,337
22 8,643 9,542 10,600 10,982 11,870 12,338 14,041 16,314 18,101 19,729 21,337
23 9,260 10,196 11,293 11,689 12,607 13,091 14,848 17,187 19,021 20,690 22,337
24 9,886 10,856 11,992 12,401 13,350 13,848 15,659 18,062 19,943 21,652 23,337
25 10,520 11,524 12,697 13,120 14,098 14,611 16,473 18,940 20,867 22,616 24,337
26 11,160 12,198 13,409 13,844 14,851 15,379 17,292 19,820 21,792 23,579 25,336
27 11,808 12,879 14,125 14,573 15,609 16,151 18,114 20,703 22,719 24,544 26,336
28 12,461 13,565 14,847 15,308 16,371 16,928 18,939 21,588 23,647 25,509 27,336
29 13,121 14,256 15,574 16,047 17,138 17,708 19,768 22,475 24,577 26,475 28,336
30 13,787 14,953 16,306 16,791 17,908 18,493 20,599 23,364 25,508 27,442 29,336

31 14,458 15,655 17,042 17,539 18,683 19,281 21,434 24,255 26,440 28,409 30,336
40 20,707 22,164 23,838 24,433 25,799 26,509 29,051 32,345 34,872 37,134 39,335
50 27,991 29,707 31,664 32,357 33,943 34,764 37,689 41,449 44,313 46,864 49,335
60 35,534 37,485 39,699 40,482 42,266 43,188 46,459 50,641 53,809 56,620 59,335
70 43,275 45,442 47,893 48,758 50,724 51,739 55,329 59,898 63,346 66,396 69,334
80 51,172 53,540 56,213 57,153 59,290 60,391 64,278 69,207 72,915 76,188 79,334
90 59,196 61,754 64,635 65,647 67,944 69,126 73,291 78,558 82,511 85,993 89,334
100 83,852 86,923 90,367 91,573 94,303 95,705 100,624 106,806 111,419 115,465 119,334
00

0
Estadística EEGGCC 172

Tabla de la distribución ji-cuadrado



Área bajo la curva: P(   c)  
2

v 
0,750 0,800 0,850 0,875 0,900 0,950 0,975 0,980 0,990 0,995
1 1,323 1,642 2,072 2,354 2,706 3,841 5,024 5,412 6,635 7,879
2 2,773 3,219 3,794 4,159 4,605 5,991 7,378 7,824 9,210 10,597
3 4,108 4,642 5,317 5,739 6,251 7,815 9,348 9,837 11,345 12,838
4 5,385 5,989 6,745 7,214 7,779 9,488 11,143 11,668 13,277 14,860
5 6,626 7,289 8,115 8,625 9,236 11,070 12,833 13,388 15,086 16,750
6 7,841 8,558 9,446 9,992 10,645 12,592 14,449 15,033 16,812 18,548
7 9,037 9,803 10,748 11,326 12,017 14,067 16,013 16,622 18,475 20,278
8 10,219 11,030 12,027 12,636 13,362 15,507 17,535 18,168 20,090 21,955
9 11,389 12,242 13,288 13,926 14,684 16,919 19,023 19,679 21,666 23,589
10 12,549 13,442 14,534 15,198 15,987 18,307 20,483 21,161 23,209 25,188

11 13,701 14,631 15,767 16,457 17,275 19,675 21,920 22,618 24,725 26,757
12 14,845 15,812 16,989 17,703 18,549 21,026 23,337 24,054 26,217 28,300
13 15,984 16,985 18,202 18,939 19,812 22,362 24,736 25,472 27,688 29,819
14 17,117 18,151 19,406 20,166 21,064 23,685 26,119 26,873 29,141 31,319
15 18,245 19,311 20,603 21,384 22,307 24,996 27,488 28,259 30,578 32,801
16 19,369 20,465 21,793 22,595 23,542 26,296 28,845 29,633 32,000 34,267
17 20,489 21,615 22,977 23,799 24,769 27,587 30,191 30,995 33,409 35,718
18 21,605 22,760 24,155 24,997 25,989 28,869 31,526 32,346 34,805 37,156
19 22,718 23,900 25,329 26,189 27,204 30,144 32,852 33,687 36,191 38,582
20 23,828 25,038 26,498 27,376 28,412 31,410 34,170 35,020 37,566 39,997

21 24,935 26,171 27,662 28,559 29,615 32,671 35,479 36,343 38,932 41,401
22 26,039 27,301 28,822 29,737 30,813 33,924 36,781 37,659 40,289 42,796
23 27,141 28,429 29,979 30,911 32,007 35,172 38,076 38,968 41,638 44,181
24 28,241 29,553 31,132 32,081 33,196 36,415 39,364 40,270 42,980 45,559
25 29,339 30,675 32,282 33,247 34,382 37,652 40,646 41,566 44,314 46,928
26 30,435 31,795 33,429 34,410 35,563 38,885 41,923 42,856 45,642 48,290
27 31,528 32,912 34,574 35,570 36,741 40,113 43,195 44,140 46,963 49,645
28 32,620 34,027 35,715 36,727 37,916 41,337 44,461 45,419 48,278 50,993
29 33,711 35,139 36,854 37,881 39,087 42,557 45,722 46,693 49,588 52,336
30 34,800 36,250 37,990 39,033 40,256 43,773 46,979 47,962 50,892 53,672

31 35,887 37,359 39,124 40,181 41,422 44,985 48,232 49,226 52,191 55,003
40 45,616 47,269 49,244 50,424 51,805 55,758 59,342 60,436 63,691 66,766
50 56,334 58,164 60,346 61,647 63,167 67,505 71,420 72,613 76,154 79,490
60 66,981 68,972 71,341 72,751 74,397 79,082 83,298 84,580 88,379 91,952
70 77,577 79,715 82,255 83,765 85,527 90,531 95,023 96,388 100,425 104,215
80 88,130 90,405 93,106 94,709 96,578 101,879 106,629 108,069 112,329 116,321
90 98,650 101,054 103,904 105,595 107,565 113,145 118,136 119,648 124,116 128,299
100 109,141 111,667 114,659 116,433 118,498 124,342 129,561 131,142 135,807 140,169
Estadística EEGGCC 173

Índice alfabético

Coeficiente de correlación, 54 circular, 15


Coeficiente de variación, 40 de barras, 15
Cuartil, 21 Diagrama de cajas, 35
Desviación estándar, 37, 38 Histograma, 19
Distribución Ojiva, 20
Bernoulli, 104 Polígono de frecuencias, 19
binomial, 105 Intervalo de confianza
chi cuadrado, 124 proporción poblacional, 142, 144
de frecuencias, 14, 16, 17 Media, 29
de la media muestral, 131 Mediana, 28
de la proporción muestral, 132 Moda, 26
de la varianza muestral, 132 Muestra, 7
de probabilidad, 92 Percentiles, 21
hipergeométrica, 109 Población, 7
normal, 118 Propiedad reproductiva de la normal, 121
Poisson, 111 Prueba de hipótesis
uniforme continua, 115 media poblacional, 152
Escalas de medición proporción poblacional, 157
intervalo, 11 varianza poblacional, 162
nominal, 11 Puntuación estandarizada Z, 41
ordinal, 11 Rango intercuartil, 35
razón, 12 Teorema
Espacio muestral, 63 de Bayes, 81
Estadística Valor esperado
descriptiva, 7 de una función de una variable aleatoria, 97, 98
inferencia, 7 Variable, 10
Estadístico, 131 aleatoria continua, 93
Evento, 63 aleatoria discreta, 91
Eventos continua, 10
independientes, 82 cualitativa, 10
Experimento aleatorio, 63 cuantitativa, 10
Experimento de Bernoulli, 104 discreta, 10
Función Varianza
de densidad, 93 de una variable aleatoria, 97, 98, 99
Gráfico

También podría gustarte