Estadística Descriptiva
Estadística Descriptiva
Este documento fue creado en la versión TeX 3.14159265 (TeX Live 2019/Debian) y la versión de LATEX
pdfTeX 3.14159265-2.6-1.40.20 (TeX Live 2019/Debian) en el sistema operativo Ubuntu 20.04 LTS
x64. La publicación del mismo es de dominio público, se puede imprimir y distribuir libre de gastos en
su forma original.
Índice general
1. Introducción a la estadística 1
1.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1. Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
i
ii ÍNDICE GENERAL
3.3.2.1. Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.3.2.4. Ojiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4. Índices estadísticos 33
4.1.2. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.1.3. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2.1. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.3.1. Cuartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.3.2. Percentiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.4.2. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.4.3. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.5.1. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
ÍNDICE GENERAL iii
4.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
5. Probabilidades 49
5.2.1. Experimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.2.3. Sucesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.3. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
5.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6. Modelos probabilísticos 73
6.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
Apéndice A. Tablas 87
Bibliografía 91
Índice alfabético 93
Capı́tulo 1
Introducción a la estadística
Resultados de aprendizaje
• Define estadística, estadística descriptiva, inferencial, población, muestra, dato, datos, parámetro,
estadístico, unidad experimental, datos univariados y multivariados.
• Identifica diferencias entre población y muestra, población finita e infinita, estadístico y parámetro.
La estadística surge en el Estado o Gobierno, con la necesidad de realizar censos poblacionales para es-
timar la cantidad de habitantes en una población con el fin de cuantificar los ingresos que se obtendrían
a partir de los impuestos generados por esa cantidad de habitantes.
Como este tipo de cuestiones eran preocupaciones del estado, es decir, eran los trabajadores del gobierno
que buscaban dar respuestas a esta problemática, de allí surge el nombre estadística.
El vocablo estatistik proviene de la palabra italiana statista (que significa “estadista”). Fue utilizada
por primera vez por Gottfried Achenwall (1719-1772), un profesor de Marlborough y de Göttingen.
El Dr. E. A. W. Zimmerman introdujo el término statistics (estadística) a Inglaterra. Su uso fue
popularizado por sir John Sinclair en su obra Statistical Account of Scotland 1791-1799 (“Informe
estadístico sobre Escocia 1719-1799”). Sin embargo, mucho antes del siglo XVIII, la gente ya utilizaba
y registraba datos. (p. 3)
1
2 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA
No fue fácil que la estadística se consolidara como ciencia, pues tomó alrededor de 200 años para
lograrlo, al respecto Cáceres (2007) concluye:
Los primeros intentos de construir una disciplina con entidad propia fueron consolidándose a lo lar-
go de los siglos XVII y XVIII, a medida que crecía la complejidad administrativa del estado. En esta
época es posible distinguir dos direcciones contemporáneas: la descriptiva o histórica y la investiga-
dora, cuyos protagonistas eran los aritméticos políticos ingleses, preocupados por la búsqueda de
leyes cuantitativas que regularan los comportamientos sociales. (p. 2)
Para dar ideas sobre la existencia de la estadística, Levin y Rubin (2004) describen:
La estadística oficial es tan vieja como la historia registrada. El Viejo Testamento contiene varios
informes sobre levantamiento de censos. Los gobiernos de los antiguos Babilonia, Egipto y Roma
reunieron registros detallados sobre población y recursos. En la edad media, los gobernantes em-
pezaron a registrar la propiedad de la tierra. En el año 762 de nuestra era, Carlomagno pidió una
descripción detallada de las propiedades de la Iglesia. A principios del siglo IX terminó la enumera-
ción estadística de los siervos que habitan los feudos. Por el año 1806, Guillermo el Conquistador
ordenó que se escribiera Domesday Book, un registro de la propiedad, extensión y valor de las tierras
de Inglaterra. Este trabajo fue el primer resumen estadístico de Inglaterra. (p. 3)
En la actualidad el uso de la estadística se ha extendido más allá de sus orígenes como un servicio
al Estado o al gobierno. Personas, organizaciones y centros de enseñanza usan la estadística para
entender datos y tomar decisiones. La aplicación de la estadística se ha extendido a casi todas las áreas
del conocimiento, por mencionar algunas, ciencias naturales, sociales, medicina, negocios, educación y
deportes.
En épocas anteriores se definía a la estadística como una rama de la matemática; sin embargo, ésta ha
crecido sustancialmente, hasta llegar a ser considerada una ciencia por si sola, tanto así que, muchas
instituciones de educación superior han creado departamentos académicos de matemática y estadística
por separado.
La aparición de los ordenadores ha incidido para que la estadística obtenga mejoras significativas, con
la estadística asistida por ordenador es posible el procesamiento y análisis estadístico de enormes can-
tidades de datos y trabajar con herramientas estadísticas (gráficas, modelos lineales y no lineales, test
estadísticos, análisis de series temporales, control estadístico de la calidad, algoritmos de clasificación
y agrupamiento, etc.).
Es la ciencia encargada de recolectar, organizar, presentar y analizar datos, con la finalidad de tomar
decisiones.
La recolección de datos se hace mediante instrumentos de medición o recolección de datos como el cues-
tionario, las guías de observación, la entrevista, encuesta y grupos focales, por mencionar algunos. La
organización de datos se estudia en la sección ??, en ocasiones la toma de decisiones no está en nues-
tras manos; por tal razón hay autores que no agregan este factor a la definición, por ejemplo, Johnson
y Kuby (2012) definen estadística como “ciencia que se encarga de obtener, describir e interpretar los
datos” (p. 1), aquí se ha agregado, ya que, la razón de ser de la estadística es estudiar los datos para
hacer ajustes pertinentes.
1.4. DEFINICIÓN DE ESTADÍSTICA 3
Conjunto de métodos para determinar una propiedad de una población con base en la información de una
muestra.
Dentro de la estadística paramétrica están la descriptiva y la estadística inferencial. Según Triola (2018)
“las pruebas paramétricas tienen requisitos sobre la distribución de las poblaciones involucradas” (p.
599), es decir, la estadística paramétrica se fundamenta en el muestreo de una población con parámetros
específicos, como la media µ, la desviación estándar σ o la proporción p.
El término pruebas no paramétricas es engañoso en el sentido de que sugiere que las pruebas
no se basan en un parámetro, pero hay algunas pruebas no paramétricas que se basan en un
parámetro como la mediana. Debido al uso generalizado del término prueba no paramétrica, usamos
esa terminología, pero la definimos como una prueba que no requiere una distribución particular.
(p. 599)
El mundo en el que vivimos está lleno de información que encontramos en distintos medios como libros,
periódicos, revistas, páginas web, programas de televisión, redes sociales, etc. Es importante identificar
si esta información proviene de una estadística descriptiva o inferencial, veamos los siguientes ejemplos,
en los cuales usaremos las definiciones 1.4.2 y 1.4.3.
1. Según datos del Banco Central de Nicaragua (BCN, 2017), la población de Nicaragua es de 6.3 millones
de habitantes, equivalente a 6,300,000 habitantes.
2. La Comisión Nacional de Salario Mínimo ratificó que el salario mínimo a partir del 1/03/2020 para el
sector gobierno central y municipal, será de 5,345.25 córdobas mensuales.
3. El gobierno de Nicaragua informó que en el año 2005 la población era de 5,142,098 habitantes, en el
2013 era de 6,080,000 habitantes.
4. Según datos del BCN (2017), la esperanza de vida al nacer en el período 2015/2020 es de 75.7 años.
5. Según datos del Instituto Nacional de Información de Desarrollo (INIDE, 2017), la población de Nicara-
gua en el 2018 era de 6,460,411 habitantes, de los cuales, 3,187,500 son hombres y 3,272,911 son
mujeres.
La información del tercer caso no sería información de estadística descriptiva si estos datos se utilizaran
para calcular la población de Nicaragua en el año 2020 o el crecimiento porcentual de 2013 a 2020.
1. El gobierno de Nicaragua estima que en el año 2025 la población será aproximadamente 8, 629,000
habitantes.
2. De la población estudiantil de URACCAN, 58 % son mujeres (dato hipotético).
3. Una encuesta aplicada a trabajadores de URACCAN mostró que 40 % de éstos dominan la filosofía ins-
titucional, además, 90 % de los trabajadores describe la misión y visión de URACCAN (dato hipotético).
4 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA
1. Se desea hacer un sondeo sobre la opinión que tienen los nicaragüenses acerca de la ley 779. En este
caso la población está compuesta por la ciudadanía nicaragüense.
2. Para estimar el ingreso económico de los habitantes del municipio de Siuna, la población son las perso-
nas que habitan en el municipio de Siuna.
3. Conjunto de todos los árboles de la especie caoba en el municipio de Rosita.
4. Base de datos de registro académico de URACCAN con información de los estudiantes matriculados.
Las poblaciones se clasifican según la cantidad de elementos que éstas posean, por tanto, pueden ser
finitas e infinitas. Una población es finita cuando podemos enumerar físicamente todos sus elementos,
en otras palabras, para las poblaciones en las que es posible obtener una lista de todos y cada uno de
sus elementos, son poblaciones finitas.
1. La población estudiantil de URACCAN-Recinto Las Minas. Una lista del estudiantado la podemos obte-
ner en Registro académico.
2. Conjunto de libros de la biblioteca de URACCAN-Recinto Las Minas. El personal de biblioteca maneja
una base de datos en la que podemos obtener una lista de todos los libros de la biblioteca.
3. La población activa para votar en las futuras elecciones nacionales de Nicaragua, es una población
finita muy grande. El personal del Consejo Supremo Electoral maneja una lista por juntas receptoras
de voto de la población activa que puede ejercer su derecho al voto.
Una población es infinita cuando sus elementos son ilimitados, es decir, es difícil obtener una lista de
todos ellos.
1. Cantidad de personas que poseen una cuenta de correo electrónico. Es difícil tener una lista de la
cantidad exacta de personas que tienen una cuenta de correo electrónico a nivel mundial.
2. Cantidad de personas hipertensas a nivel mundial. Al igual que el ejemplo anterior es difícil obtener un
listado de todas las personas que padecen hipertensión en todo el mundo.
A pesar que las poblaciones sean finitas, en muchas situaciones se vuelve imposible estudiar a todos
y cada unos de sus elementos, ya ni digamos en el caso de las poblaciones infinitas. Para resolver
esta inconveniente se selecciona una muestra de la población, así que el estudio se concentra en los
elementos que integran la muestra.
1. Para el caso (1.) propuesto en el Ejemplo 1.5.1, una muestra podría estar conformada por hombres y
mujeres (mayores de edad) de cada uno de los departamentos de Nicaragua.
2. Un docente investigador de URACCAN estudia la relación entre el desempeño académico y la etnia. La
muestra podrá estar conformada por una proporción de elementos de cada una de las etnias.
3. Base de datos de registro académico de URACCAN-Recinto Las Minas con información de los estudian-
tes matriculados.
La metodología a seguir para definir una muestra, depende del rigor de la investigación, no es lo mismo
definir una muestra para un sondeo de opinión como una para realizar estudios en las ciencias médi-
cas. Las técnicas que permiten obtener muestras de poblaciones se denominan técnicas de muestreo o
simplemente muestreo y es un estudio posterior a la estadística descriptiva.
Conjunto de informaciones y cifras que se recogen, analizan y resumen para su presentación e interpreta-
ción.
Base de datos con valores relacionados a la edad, sexo, etnia e ingreso de los estudiantes de segundo año
de Contabilidad Pública y Auditoría.
Los parámetros poblacionales son la media (µ), varianza (σ 2 ) y la desviación típica (σ).
6 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA
1. Al realizar un estudio a 300 personas del municipio de Siuna, se determinó que el ingreso promedio de
estos habitantes es de 9,500 córdobas.
2. La estatura promedio de los estudiantes varones de URACCAN-Recinto Las Minas es de 1.69 metros.
Los estadísticos son la media (x̄), mediana (Me ), moda (M0 ), varianza (s2 ) y desviación típica (s), todos
calculadas en base a la muestra y se usan para estimar los parámetros poblacionales.
1. Un conjunto formado por 50 personas del municipio de Siuna se recolectan los datos sobre edad, sexo,
ingreso, religión y ocupación. La unidad experimental en la que se recolectan los datos es una persona
del municipio en particular.
2. Los estudiantes de ingeniería Agroforestal realizan un trabajo de curso en la clase Estadística general,
éste consiste en establecer un cultivo de ciclo corto (tomate, pepino, ayote, pipián, etc.) en el que reco-
lectan datos como altura, largo de hoja, ancho de hoja, germinación de semilla, largo de guía, etc. En
este caso la unidad experimental es una planta en particular, en la cual recolectan los datos.
Resultan cuando se mide una sola variable en una sola unidad experimental.
Calificación de la primera evaluación parcial del curso estadística descriptiva impartido en II año de Con-
tabilidad Pública y Auditoría.
Registro académico de URACCAN-Recinto Las Minas en el período de matrícula recolecta información rela-
cionadas con los nombres completos, edad, etnia, estado civil, carrera y año a cursar, semestre, asignatu-
ras y calificaciones del estudiante
1.6. EJERCICIOS 7
1.6. Ejercicios
1. Determine cuál de las siguientes frases es descriptiva en su naturaleza y cuál es inferencial.
a. De todos los maestros de jardín de niños en Estados Unidos, 32 % dicen que “Conocer el
alfabeto” es una habilidad esencial.
b. De los 800 maestros que fueron entrevistados en Estados Unidos, 32 % indican que “Conocer
el alfabeto” es una habilidad esencial.
c. De los centros vacacionales estudiados en 2004, 72 % se clasifican como centros vacaciona-
les de un día.
d. De todas las visitas a centros vacacionales en 2003, 23 % fueron visitas por hombres.
2. El 50 % de los automóviles vendidos en Estados Unidos en 2009 son de empresas asiáticas. ¿Se
llegó a esta conclusión a partir de una muestra o una población?
3. Un conjunto de datos contiene las edades al fallecimiento de cada uno de los anteriores 38 presi-
dentes de Estados Unidos ahora desaparecidos. ¿Este conjunto de mediciones es una población o
una muestra?
4. En los siguientes casos determine si el grupo representa una muestra o una población.
5. En los siguientes problemas indique si recogería información utilizando una muestra o una po-
blación.
6. Identifique las unidades experimentales en los que se miden las variables siguientes:
a. Género de un estudiante
b. Número de errores en una prueba diagnóstica
c. Edad de un paciente con cáncer
d. Número de flores en una planta de ayote
e. Color de un auto que entra a un estacionamiento
a. ¿Cuál es la población?
b. ¿Cuántas personas fueron interrogadas?
c. ¿Qué información se obtuvo de cada persona?
a. ¿Cuál es la población?
b. ¿Cuál es la muestra?
c. Identifique el parámetro de interés
d. Identifique el estadístico y de su valor
e. ¿Conocemos el valor del parámetro?
a. Se selecciona una muestra de hogares y el número promedio (media) de personas por familia
es de 2.58.
b. En la actualidad el 42 % de los gobernantes de las 50 entidades de Estados Unidos son
demócratas.
c. En un estudio de los 2223 pasajeros del Titanic, se encontró que 706 sobrevivieron cuando
se hundió.
d. Se selecciona una muestra de niños del municipio de Siuna y se descubre que la cantidad
de tiempo promedio (media) que ven televisión es de 6.5 horas al día.
11. Un técnico de control de calidad selecciona ciertas piezas ensambladas en una línea de montaje y
registra la siguiente información sobre cada pieza:
A: defectuosa o no defectuosa; B: el número de identificación del trabajador que ensambló la pieza;
C: el peso de la pieza.
a. ¿Cuál es la población?
b. La población, ¿es finita o infinita?
c. ¿Cuál es la muestra?
12. Seleccione 10 estudiantes que estén inscritos en su ciclo escolar y recolecte datos para las tres
variables siguientes:
X: número de cursos en los que está inscrito; Y: costo total de libros de texto y el material para los
cursos; Z: método de pago para cubrir el importe de los libros de texto y el material de los cursos.
a. ¿Cuál es la población?
b. La población, ¿es finita o infinita?
c. ¿Cuál es la muestra?
13. La empresa Aventis Pharmaceutica realizó un estudio para medir los efectos colaterales de Allegra,
un medicamento que se utiliza en el tratamiento de alergias estacionales. A una muestra de 679
personas que sufren de alergias en Estados Unidos se les administraron 60 mg del medicamento
dos veces al día. Los pacientes informaron si durante ese período experimentaron alivio de sus
alergias, así como cualquier otro efecto colateral adverso (infección viral, náusea, somnolencia,
etc.).
c. ¿Cuáles son las características de interés acerca de cada uno de los elementos de la pobla-
ción?
14. Un investigador médico desea estimar el tiempo de supervivencia de un paciente, después del
inicio de un tipo particular de cáncer y después de un régimen particular de radioterapia.
16. Se seleccionan seis vehículos, de entre los que tienen permiso para estacionarse, y se registran
los siguientes datos:
Resultados de aprendizaje
• Define variable estadística, tipos de variables y niveles de medición para variables cualitativas y cuan-
titativas.
• Interpreta los niveles de medición nominal, ordinal, de intervalo y de razón como método para clasifi-
car datos.
• Identifica la diferencia entre variables cuantitativas discretas y continuas.
• Clasifica variables en dicotómicas, categóricas, cuantitativas discretas o cuantitativas continuas.
2.1. Variables
Una variable es lo que en realidad interesa conocer de los elementos que conforman la población o
muestra, la siguiente definición fue tomada de Johnson y Kuby (2012, p. 5).
Es una característica de interés acerca de cada elemento individual de una población o muestra.
Para Newbold, Carlson, y Thorne (2008), las variables pueden clasificarse de varias formas, “uno de los
métodos de clasificación se refiere al tipo y la cantidad de información que contienen los datos. Los datos
son categóricos o numéricos” (2008, p. 10).
10
2.2. CLASIFICACIÓN DE LAS VARIABLES 11
Es toda aquella que expresa cualidades o atributos (palabras) de una población o muestra.
Sexo, estado civil, ocupación, número de cédula de una persona, placa de un automóvil, número de telé-
fono, enfermedades que afectan a los perros de raza pitbull en el municipio de Siuna, marca de ordenado-
res, color de los teléfonos celulares de un grupo de personas, calidad de la internet en URACCAN-Recinto
Las Minas, sistema operativo de los ordenadores de los docentes de URACCAN-Recinto Las Minas.
El número de cédula, placa de un automóvil y el número de teléfono son cualitativas a pesar de estar
compuestas por números, lo que ocurre es que aunque estén compuestas de dígito no tienen auténtico
significado de número.
Las variables cualitativas se denominan categóricas, porque, producen respuestas que pertenecen a
grupos o categorías, por ejemplo, la variable estado civil tiene como categorías: soltero, casado, viudo,
divorciado, en unión de hecho estable, etc.
En el caso de la variable sexo, ésta permite elegir entre dos opciones, es decir, femenino o masculino,
como tiene dos categoría recibe el nombre de variable dicotómica.
Edad, estatura, peso, número de hermanos, ingresos, costo de un artículo, kilómetros recorridos por un
auto, temperatura, cantidad de habitantes de una población, diámetro de un árbol, altura del fuste de un
árbol, tiempo diario de uso de la app de Facebook, tiempo de conexión a internet, tiempo que un ordenador
pasa encendido.
Al recolectar variables cuantitativas es posible obtener resultados expresados en valores enteros o pun-
tos decimales, esto obedece a subclasificar las variables cuantitativas en discretas y continuas.
Estatura, peso, ingresos, costo de un artículo, temperatura, kilómetros recorridos por un auto, diámetro de
un árbol, altura del fuste de un árbol, tiempo de conexión a internet, costo de un ordenador, tiempo de uso
de la app de Facebook, tiempo empleado para estudiar estadística.
Las variables del Ejemplo 2.2.4 son continuas, en el caso de la estatura de una persona, ésta puede
tomar valores como 1.70 metros o 1.82 metros y así sucesivamente. Lo mismo ocurre para las otras
variables.
Los niveles de medición no son más que otro método para clasificar datos cualitativos o cuantitativos.
El nivel de medida nominal es útil para caracterizar variables cualitativas. La palabra nominal indica
nombre para las variables, debido a que las variables cualitativas consisten en nombres, etiquetas o
categorías, por tanto, no son clasificables ni ordenables.
Según Cobo, Muñoz y González (2007), “la escala nominal clasifica las unidades de acuerdo con ciertas
características, de forma que dos unidades de la misma categoría son iguales entre sí y diferentes de las
restantes categorías” (p. 2).
Número de cédula, número de teléfono, sexo, etnia, estado civil, color de los autos aparcados en URACCAN-
Recinto Las Minas, religión, idiología política.
La variable sexo tiene dos categorías y no importa que en el informe estadístico se reporte primero el
sexo masculino seguido del femenino o viceversa, lo mismo ocurre con las otras variables del Ejemplo
2.3.1.
Se usa para caracterizar variables cualitativas pero en este caso si es importante el orden (la palabra
ordinal se refiere a orden), en otras palabras este nivel cumple las propiedades del nivel nominal y lo
adicional es que ordena las categorías.
Nivel académico, evaluación cualitativa de un estudiante, grado del personal del Ejército y Policía Nacional,
grado de intensidad (grave, moderado y leve) de los enfermos en un centro de salud, clase social (alta,
media y baja), clasificación de los peloteros en la Liga Nacional de Béisbol Superior Germán Pomares
Ordóñez (Clase A, B y C), posición jerárquica en una determinada empresa.
La evaluación cualitativa de un estudiante puede ser excelente, muy bueno, bueno y deficiente. El nivel
de medida es ordinal, ya que, un estudiante excelente tiene mejor calificación que uno muy bueno y así
sucesivamente.
2.3. NIVELES DE MEDICIÓN 13
Es útil para caracterizar variables cuantitativas discretas o continuas, en las que los intervalos tienen
significado y las variables en este nivel no tienen un punto de partida cero natural inherente (el cero no
es real), además, las diferencias entre dos valores cualesquiera tienen sentido.
Según Cobo et al. (2017), “la escala de intervalo cumple las propiedades de la escala ordinal y, además,
dispone de unidad de medida” (p. 3).
La temperatura. Las temperaturas en los primeros cinco días del mes de diciembre a las siete de la mañana
en el municipio de Siuna fueron 24.80, 24.50, 23.50, 23.00 y 24.00 grados Celsius. Estos datos se pueden
clasificar y calcular diferencias entre ellos, además el cero es arbitrario, pues no implica que en realidad
haya cero (ninguna) temperatura.
Tallas de ropa para mujeres, ya que, conforme la talla cambia 2 unidades cada medida (busto, cintura
y cadera) aumenta dos pulgadas, es decir, los intervalos son los mismos. Por otro lado, no existe un cero
que represente una talla. Una prenda talla cero no está hecha de cero material, más bien, se trata de una
prenda con 24 pulgadas de busto, 16 pulgadas de cintura y 27 de cadera.
Las calificaciones obtenidas por los estudiantes de Ingeniería en Sistemas en el curso análisis matemático
II. Las diferencias tienen sentido, la calificación de Cristhel fue 83, de Jorge 71 y Heyling 64, así, Jorge
obtuvo 7 puntos más que Heyling y 12 menos que Cristhel.
Peso de una persona, animal u objeto, número de cigarrillos fumados al día por una persona fumadora,
índice de inteligencia de una persona.
Útil para clasificar variables cuantitativas discretas o continuas, en ésta los intervalos y las razones
tienen sentido, además, existe un punto de partida cero natural, es decir, el cero es real y absoluto.
Número de hijos, ingresos, ventas de un determinado producto, metros cuadrados de una construcción,
consumo de un alimento o medicamento, número de hermanos, costo de un automóvil, edad, pacientes
atendidos en un centro de salud, llamadas atendidas por el servicio al cliente de Claro.
14 CAPÍTULO 2. VARIABLES Y SU NIVEL DE MEDICIÓN
2.4. Ejercicios
1. En la actualidad se estudia la severidad de los efectos colaterales que experimentan ciertos pa-
cientes cuando reciben tratamiento con un medicamento particular. Esta severidad se mide en la
escala: ninguna, benigna, moderada, grave, muy grave.
2. Al cuerpo docente de la universidad URACCAN se le hizo la siguiente pregunta “qué tan satisfecho
estuvo usted con el sistema de biblioteca 2016?”. Sus respuestas fueron clasificadas como “muy
satisfecho”, “un poco satisfecho”, “ni satisfecho ni insatisfecho”, “un poco insatisfecho”, o “muy
insatisfecho”.
3. Se pregunta a varios estudiantes el peso de los libros y demás materiales que llevan a clases.
4. identifique las siguientes expresiones como ejemplos (1) variables cualitativas o (2) variables cuan-
titativas:
5. Determine cuál de los cuatro niveles de medición (nominal, ordinal, de intervalo o razón) es el más
apropiado.
6. Un grupo de estudiantes elabora una escala para calificar la calidad de los alimentos en la cafete-
ría, donde 0 representa “neutral: ni buena ni mala”. A las comidas malas se les asignan números
negativos y a las comidas buenas números positivos, y a la magnitud del número corresponde al
grado de lo bueno o lo malo. Las primeras tres comidas se califican con 2, 4 y -5. ¿Cuál es el nivel
de medición de este tipo de calificaciones? Explique su respuesta.
7. Un investigador médico desea estimar el tiempo de supervivencia de un paciente, después del
inicio de un tipo particular de cáncer y después de un régimen particular de radioterapia.
9. Un profesor propone a sus estudiantes del curso de Matemática Aplicada una prueba con 10
ejercicios de cálculo. Si al resolverla alguno de los ejercicios presenta algún error, el profesor
califica toda la prueba con 0, de otro modo la califica con 20. ¿Qué tipo de escala empleó?
10. En un censo de estudiantes de una universidad se ha considerado como variables importantes
para obtener cierto tipo de información a las siguientes: facultad de pertenencia, año de ingreso,
nacionalidad, tiempo de residencia en el país, número de semestres que lleva en la universidad,
grado en la escala de pensiones, grado de instrucción del padre, número de hermanos e ingreso
mensual familiar promedio. Hacer una clasificación de las variables que se usaron en el censo,
indicando la escala apropiada para determinar los valores de estas variables.
11. Con la finalidad de medir el nivel de satisfacción de sus clientes, un banco usó una encuesta
de opinión en donde se consultó acerca del servicio en general del banco. Las respuestas a las
preguntas podían ser: pésimo, regular, bueno y excelente. ¿Qué tipo de variable representa a las
respuestas, cualitativa o cuantitativa? ¿Qué escala se usó?
12. A un fumador se le solicita que diga el orden de preferencia de cuatro tipos de cigarrillos de marcas
A, B, C y D. Indicar el tipo de escala utilizada.
Capı́tulo 3
Organización y representación de
datos
Resultados de aprendizaje
• Define diagrama de tallo y hoja, distribución de frecuencias, tipos de frecuencias, gráficos para varia-
bles cualitativas y cuantitativas, criterios y normas para la representación de datos.
• Comprende los criterios y normas establecidas en la estadística para organizar y representar datos.
• Interpreta distribuciones de frecuencias y gráficos estadísticos, extrayendo información relevante.
• Organiza datos cualitativos y cuantitativos en distribuciones de frecuencias.
• Identifica el tipo de gráfico estadístico adecuado para representar un conjunto de datos.
• Representa distribuciones de frecuencias para datos cualitativos y cuantitativos mediante gráficos
estadísticos.
El diagrama de tallo y hoja es una combinación de la técnica de gráficas y la de ordenar, acá, lo estudia-
mos con el fin de ordenar un conjunto de datos. Para construir el diagrama de tallo y hoja se necesita
que la variable sea cuantitativa con al menos dos dígitos, seguido se separa el dígito principal (de la
izquierda) del segundo (de la derecha). El dígito principal será el tallo y se alinea verticalmente, el dígito
secundario es la hoja y se alinea horizontalmente.
Ejemplo 3.1.1. Los datos dados a continuación son las calificaciones de la asignatura Física general: 52,
66, 58, 63, 60, 77, 81, 82, 91, 90, 60, 87. Construya un diagrama de tallo y hoja.
La cantidad más pequeña es 52 y la más grande 91, además hay calificaciones entre 52 y 91, por tanto,
el tallo estará formado por los dígitos 5, 6, 7, 8 y 9, veamos a continuación el diagrama de tallo y hoja.
5 2, 8
6 0, 0, 3, 6
7 7
8 1, 2, 7
9 0, 1
A partir del diagrama tallo y hoja es posible escribir los datos ordenados de menor a mayor con más
facilidad: 52, 58, 60, 60, 63, 66, 77, 81, 82, 87, 90 y 91.
16
3.2. DISTRIBUCIÓN DE FRECUENCIAS 17
Para datos con tres dígitos, se separan los primeros dos dígitos principales para formar el tallo, el dígito
restante será la hoja, veamos el siguiente ejemplo.
Ejemplo 3.1.2. Suponga que cotizó juguetes para sus niños en las tiendas del mercado local de Siuna y
recolectó los siguientes datos: 350, 180, 466, 223, 541, 195, 220, 341, 278, 190, 342 y 188. E diagrama
de tallo y hoja se muestra a continuación.
18 0, 88
19 0, 5
22 0, 3
27 8
34 1, 2
35 0
46 6
54 1
Si la variable es de cuatro dígitos, tome los primeros dos para formar el tallo y los dos restantes para las
hojas, por ejemplo, 4456 el tallo sería 44 y la hoja 56.
Nota 3.1.1. En la actualidad con el desarrollo de los ordenadores el diagrama de tallo y hoja no es de
uso común, ya que, cualquier software para procesamiento de datos contiene funciones de ordenamiento.
Cuando son muchos los valores recolectados de una variable se recomienda organizar los datos por
clases o intervalos, esto permite hacer un mejor análisis. La técnica usada para organizar o agrupar
datos en clases se llama distribución de frecuencias.
Tabla que muestra las frecuencias de los datos agrupados en categorías o de manera individual.
La definición 3.2.1 exige definir los distintos tipo de frecuencias en un conjunto de datos.
La frecuencia de una clase o categoría es el número de valores que están dentro de esa clase o categoría.
Ejemplo 3.2.1.
Clases f
Mestizo 4
Mayangna 2
Miskitu 1
Creol 3
De los estudiantes de URACCAN cuatro pertenecen a la etnia mestiza y uno a la etnia miskita.
18 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS
Nota 3.2.1. En toda distribución de frecuencias, la suma de las frecuencias es igual al número total de
datos N . En Ejemplo 3.2.1, la suma de las frecuencias es N = 4 + 2 + 1 + 3 = 10, es decir, ese grupo de
estudiantes de URACCAN está formado por 10 estudiantes distribuidos en las etnias mestizo, mayangna,
miskitu y creol.
ni
La frecuencia relativa de la i-ésima observación está dada por fr = , donde N es el total de datos.
N
Ejemplo 3.2.2.
La distribución de frecuencias relativas para la etnia del grupo de estudiantes del Ejemplo3.2.1, es:
Clases fr
Mestizo 4/10 = 0.4
Mayagna 2/10 = 0.2
Miskitu 1/10 = 0.1
Creol 3/10 = 0.3
Nota 3.2.2. La suma de las frecuencias relativas, en cualquier distribución de frecuencias, es igual a 1.
En estadísticas es más usual trabajar con las frecuencias relativas porcentuales, veamos a continuación
la definición.
Es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos, multiplicado
por 100.
En otras palabras, la definición 3.2.4 quiere decir que la frecuencia relativa porcentual es el valor de la
frecuencia relativa multiplicada por 100.
Ejemplo 3.2.3.
La distribución de frecuencias relativas porcentuales para la etnia del grupo de estudiantes presentados
en 3.2.1, es:
Clases fr %
Mestizo 0.4 ∗ 100 = 40 %
Mayangna 0.2 ∗ 100 = 20 %
Miskitu 0.1 ∗ 100 = 10 %
Creol 0.3 ∗ 100 = 30 %
En la tabla lo más relevante es: 40 % de los estudiantes pertenecen a la etnia mestiza y 30 % a la creol.
Nota 3.2.3. En cualquier distribución de frecuencias, la suma de las frecuencias relativas porcentuales
es igual a 100 %.
3.2. DISTRIBUCIÓN DE FRECUENCIAS 19
Es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
Ejemplo 3.2.4.
Distribución de frecuencias acumuladas para la etnia del grupo de estudiantes del Ejemplo 3.2.1.
Clases f fa
Mestizo 4 4
Mayagna 2 6
Miskitu 1 7
Creol 3 10
La tabla se interpreta: hay 6 estudiantes entre mestizos y mayangnas, otra interpretación puede ser:
Existen 7 estudiantes entre mestizos, mayangnas y miskitus.
Ejemplo 3.2.5.
Clases fa fra
Mestizo 4 4/10 = 0.4
Mayagna 6 6/10 = 0.6
Miskitu 7 7/10 = 0.7
Creol 10 1/10 = 1.0
Es el cociente entre la frecuencia acumulada de una clase y el número total de datos multiplicado por 100,
o bien, es el producto de la frecuencia relativa acumulada de una clase por 100.
Ejemplo 3.2.6.
Clases fra %
Mestizo 0.4 ∗ 100 = 40 %
Mayagna 0.6 ∗ 100 = 60 %
Miskitu 0.7 ∗ 100 = 70 %
Creol 1.0 ∗ 100 = 100 %
De la tabla se deduce: el 60 % de los estudiantes está entre las etnias mestiza y mayangna, otra interpre-
tación puede ser: existe un 70 % de los estudiantes entre mestizos, mayangnas y miskitus.
20 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS
Si la tabla contiene solo la frecuencia absoluta se llama distribución de frecuencia, si presenta la fre-
cuencia acumulada se llama distribución de frecuencia acumulada, distribución de frecuencia relati-
va si muestra la frecuencia relativa. Una distribución de frecuencias es una tabla que contiene: las
frecuencias absolutas, relativas, relativas porcentuales, acumuladas, relativas acumuladas y relativas
acumuladas porcentuales.
Ejemplo 3.2.7.
La siguiente tabla es distribución de frecuencias para la etnia de los estudiantes del Ejemplo 3.2.1.
Hasta ahora se ha mostrado el cálculo de una distribución de frecuencias para variable cualitativa,
consideremos ahora el caso de las variables cuantitativas.
Primero se calcula la cantidad de clases (k) que debe tener la distribución de frecuencias, en libros
de referencia estadística se específica que una distribución no debe tener menos de 4 ni más de 20
clases, es decir, 4 ≤ k ≤ 20, por mencionar una, Besterfield (2009) describe que la cantidad de clases
en una distribución de frecuencia depende principalmente del juicio del analista, además, describe los
siguientes lineamientos generales:
Para estimar la cantidad de clases se hace uso de la regla de Sturges, donde n es la cantidad de datos y
log el logaritmo en base 10.
Otro parámetro a calcular el ancho de cada clase, para esto se precisa calcular el rango, el cual se define
mediante la siguiente ecuación.
donde Omáx y Omín son la observación más grande y más pequeña en el conjunto de datos. El ancho de
cada clase está dado por:
R
W = (3.2.3)
k
Cada clase está delimitada por el límite inferior de clase y el límite superior de clase, en la clase [21 − 29],
21 es el límite inferior y 29 el límite superior de clase. Si la variable es discreta y el valor del ancho
de clase es un decimal, redondee hacia abajo o hacia arriba, según sea conveniente. Si la variable es
continua, redondee a la cantidad de dígitos de la variable.
Nota 3.2.4. El límite inferior de la primera clase es el dato más pequeño Omín , sin embargo, el límite
superior de la última clase no necesariamente es la observación más grande (Omáx ).
3.2. DISTRIBUCIÓN DE FRECUENCIAS 21
El punto medio o marca de clase es el punto que está a la mitad de las fronteras de cada clase y es
representativo de los datos que están en esa clase. Es la semisuma de las fronteras de clase, es decir, es
la suma el límite superior e inferior de cada clase, el resultado se divide por dos.
Ejemplo 3.2.8.
Los datos muestran el número de bebés nacidos durante un año en 60 hospitales de una comunidad.
Construir una distribución de frecuencias.
30 55 27 45 56 48 45 49 32 57 47 56 37 55 52 34 54 42 32 59
35 46 24 57 32 26 40 28 53 54 29 42 42 54 53 59 39 56 59 58
49 53 30 53 21 34 28 50 52 57 43 46 54 31 22 31 24 24 57 29
R 38
Ancho de clase W = = = 5.428571429 ∴ W ≈ 6. La distribución de frecuencias es:
K 7
• En cuatro hospitales de la comunidad han nacido entre 33 y 38 niños, inclusive, en tanto, en seis de los
hospitales han nacido entre 21 y 26 niños.
• En el 25 % de los hospitales han nacido entre 51 y 56 niños inclusive.
• En el 37 % de los hospitales han nacido como máximo 38 niños.
Ejemplo 3.2.9.
Los siguientes datos1 muestran “el diámetro (en cm) de la base del árbol con corteza”, construya una
distribución de frecuencias.
70.5 28.0 28.0 27.0 23.0 15.0 50.0 6.00 75.0 47.0 45.0 38.0 62.5 52.5 21.0 44.0
42.0 51.6 53.5 40.0 51.0 51.5 31.5 40.5 38.0 46.0 38.0 40.0 61.0 54.5 16.6 62.0
56.5 30.0 34.0 22.0 22.0 23.5 40.0 44.0 42.0 51.0 45.0 50.5 15.0 21.0 40.5 49.0
55.0 54.0 20.0 48.0 58.0 53.0 38.0 44.5 12.0 58.2 47.0 28.5 39.0 65.0 46.0
1
Estos datos fueron recolectados por Efraín Peralta Tercero, M. Sc., con los estudiantes de IV año de
Ingeniería Agroforestal 2015, como producto de una práctica de la asignatura dasometría en la comuni-
dad Llano Sucio, municipio de Prinzapolka.
22 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS
R 69.0
Ancho de cada clase, W = = = 9.857142857 ∴ W ≈ 9.86
K 7
• 35 árboles tienen diámetro de la base con corteza entre 36.0 y 55.9 centímetros.
• El 3 % de árboles tienen diámetro de la base con corteza entre 66.0 y 75.9 centímetros, inclusive.
• El 57 % de los árboles tiene como máximo 45.9 centímetros de diámetro de la base con corteza.
Esta sección se divide en dos partes, la primera aborda los gráficos más comunes para representar
variables cualitativas (categóricas) y la segunda, los gráficos para presentar variables cuantitativas.
Para construir los gráficos se hace uso de las frecuencias (absoluta, relativa, relativa porcentual); pero
es más común representar las frecuencias relativas porcentuales, sin embargo, hay gráficos como la
ojiva que usan frecuencias acumuladas.
Los datos categóricos son los que no provienen de mediciones, sino que se organizan en categorías, por
ejemplo: sexo, color de ojos, estado civil, religión, profesión, etc. Las gráficas para variables cualitativas
son los diagramas de sectores o pastel, gráfico de barras (horizontales y verticales), pictogramas y gráfico
de dona, aunque estos dos últimos no son considerados en este texto.
Qué gráfico elegir depende del propósito, al respecto Levine, Krehbiel y Berenson (2014) describen:
La gráfica que elija para hacer una representación gráfica de los datos de una sola variable categó-
rica depende de si objetivo consiste en comparar las categorías entre sí de manera directa (gráfica
de barras), en destacar la manera en que las categorías forman parte de un todo (gráfica circular),
o de que los datos se encuentren solamente en algunas de las categorías (gráfica de Pareto). (p. 39)
Este tipo de gráficas es útil cuando se quiere que las categorías formen parte de un todo, además,
muestran la cantidad de datos que pertenecen a cada una de las categorías como parte proporcional de
un círculo.
Para construir un diagrama de sectores partimos de que el círculo completo tiene 360◦ , así, hay que
calcular el espacio en grados para cada una de las frecuencias de cada categoría o clases.
3.3. REPRESENTACIÓN DE DATOS 23
fr × 360◦
Espacio en grados = (3.3.1)
100 %
f × 360◦
Espacio en grados = (3.3.3)
n
Ejemplo 3.3.1.
La tabla de abajo muestra la frecuencia relativa para el color de ojos de un grupo de estudiantes. Se ha
calculado el espacio en grados que ocupará cada frecuencia relativa en la circunferencia.
La Figura 3.1 muestra que el 31.9 % de los estudiantes tienen color de ojos negros, 34 % café y 8.5 % poseen
color de ojos azules.
Negros
31.9 %
Café 34.0 %
25.5 %
8.6 %
Verdes
Azules
Las gráficas de barras tal y como lo plantean Johnson y Kuby (2012) muestran cantidad de datos de
cada categoría en un área rectangular de tamaño proporcional.
Por otro lado, Levine, Krehbiel y Berenson (2014) describen: “Una gráfica de barras compara diferentes
categorías utilizando barras individuales para representar los conteos de cada categoría. La longitud
de una barra representa la cantidad, la frecuencia o el porcentaje de datos que caen dentro de una
categoría” (p. 40).
24 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS
En una gráfica de barras, las clases están ubicadas en el eje horizontal y en el vertical las frecuencias
absolutas, relativas o relativas porcentuales de cada clase. Si se usan las frecuencias relativas para
construir el gráfico, entonces, éste se llama gráfico de barras de frecuencias relativas.
En el pie de cada barra se agrega el nombre de cada clase, también, es preferible agregar una etiqueta
en cada barra que específica la frecuencia perteneciente a cada clase, esa etiqueta se suele poner en la
parte superior de cada barra, o bien, centrada en el interior de la barra.
Ejemplo 3.3.2.
La Figura 3.2 es un gráfico de barras para la cantidad de estudiantes en las carreras Administración
de Empresas (Admon), Ingeniería Agroforestal (Agrof), Contabilidad (Conta) y Desarrollo Local (DL) de
URACCAN-Recinto Las Minas.
10
9
8
7
6
f 5
4
3
2
1
Admon Agrof Conta Infor DL
Carreras
Si el gráfico no dispone de etiquetas en el eje horizontal para cada barra como en la Figura 3.2, se agrega
una leyenda. Una leyenda es un recuadro en el que se describe el nombre de cada clase representada
en el gráfico, mediante un cuadro pequeño con el color de cada barra.
Ejemplo 3.3.3.
10 Administración
9 Agroforestal
8
7 Contabilidad
6 Informática
f 5
4 Desarrollo Local
3
2
1
Carreras
En los gráficos 3.2 y 3.3 es difícil ver a simple vista la frecuencia de cada carrera por lo que se puede
agregar una etiqueta en cada barra especificando la frecuencia de cada clase. La etiqueta se puede poner
en la parte superior de cada barra, o bien, centrada en el interior de la barra.
3.3. REPRESENTACIÓN DE DATOS 25
Ejemplo 3.3.4.
La Figura 3.4 es un gráfico de barras con etiquetas de datos en la parte superior de cada barra.
43.2 %
40
30
fr 23.2 %
20
10 8.7 %
6.5 % 5.9 %
Para presentar gráficamente la información de dos variables cualitativas, se usan las gráficas de barras
agrupadas, veamos el siguiente ejemplo.
Ejemplo 3.3.5.
La Figura 3.5 es una gráfica de barras agrupadas que muestra información de un conjunto de estudiantes
por carrera y sexo.
De la Figura 3.5 se interpreta que en Agroforestal e Informática hay más hombres que mujeres, en tanto,
en Administración y Ciencias de la Educación hay más mujeres que hombres.
Para representar datos cuantitativos están los histogramas, polígonos, ojivas y diagramas de cajas. Las
variables cuantitativas continuas quedan mejor representadas en histogramas o diagramas de cajas
(box-plot), las discretas en polígonos u ojivas.
26 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS
3.3.2.1. Histograma
El histograma es una extensión del gráfico de barras que dibuja los rectángulos unidos entre sí,
indicando de este modo que existe continuidad en los valores de las variables. Un histograma es,
por tanto, un gráfico de variable continua dividida en intervalos de los que se eleva un rectángulo
con área proporcional a su frecuencia. (p. 36)
En el histograma las clases se señalan en el eje horizontal y las frecuencias (absolutas, relativas o
relativas porcentual) en el vertical. Muchas veces, es más práctico representar las marcas de clases a lo
largo del eje horizontal.
Ejemplo 3.3.6.
Los siguientes datos muestran la temperatura de Siuna a las nueve de la noche durante todo el mes de
octubre del 2016.
28.00 28.50 29.00 27.00 27.00 27.00 26.00 25.50 25.00 27.00 26.50
26.50 27.00 26.00 25.50 25.00 26.00 25.50 25.50 25.50 25.00 26.00
25.00 25.00 24.50 26.00 27.00 27.00 27.50 27.50 26.00
La Figura 3.6 muestra el histograma de los datos, en éste se aprecia que en diez días del mes de octubre,
la temperatura de Siuna a las nueve de la noche, osciló entre los 25 y 26 grados Celsius. En dos días del
mes de octubre en Siuna la temperatura osciló entre 28 y 29 grados Celsius a las nueve de la noche.
10
9
8
7
6
f 5
4
3
2
1
24 25 26 27 28 29
Temperatura
El diagrama de caja facilita mucha información, ya que, representa el rango intercuartil de los datos en
una caja que contiene la mediana representada.
El rango intercuartil tiene como extremos el percentil 75 (cuartil superior) y el percentil 25 (cuartil
inferior). Además de la caja se prolongan “bigotes”, que indican las observaciones alejadas en la
muestra. Para muestras razonablemente grandes la presentación indica el centro de localización, la
variabilidad y el grado de asimetría. (p. 24)
Además, la gráfica da información de las observaciones (valores) atípicas o extremas. Los valores atípicos
son observaciones que se consideran inusualmente alejadas de la masa de datos, esto es, datos muy
pequeños o muy grandes.
3.3. REPRESENTACIÓN DE DATOS 27
Ejemplo 3.3.7.
La Figura 3.7 representa el diagrama de caja para la temperatura de Siuna a las nueve de la noche.
29
28
27
26
25
La temperatura es mayor que 24.50◦ C y menor que 29.00◦ C, en el 25 % de los días del mes de octubre
la temperatura fue menor a los 25.50 grados. La temperatura mediana fue aproximadamente 66 grados
Celsius, la distribución de la variable temperatura es ligeramente asimétrica a la derecha (hay más trozo
de la caja por encima de la mediana).
El polígono es un segmentos de rectas conectados mediante puntos que se localizan directamente por
encima de los valores de las marcas de clases, por tanto, para su construcción en el eje horizontal se
representan las marcas de clases y en el vertical las frecuencias absolutas o relativas.
Si se han usado las frecuencias absolutas para graficar un polígono, éste se llama polígono de frecuen-
cias o bien un polígonos de frecuencias relativas si se han usado las frecuencias relativas.
Ejemplo 3.3.8.
Un experimento consistió en conocer el número de flores por plantas, para una muestra de 50 plantas,
cuyos datos se muestran a continuación.
10 8 4 6 5 8 10 3 7 3 6 7 2 8 2 3 9 7 8 1 9 10 5 6 4
7 6 5 7 3 5 8 4 7 6 4 6 3 9 8 6 3 7 8 7 9 2 6 6 0
La Figura 3.8 es el polígono de frecuencias, en éste observamos que 17 de las plantas tienen entre 6 y 7
flores, por otro lado, 11 plantas tienen entre 8 y 9 flores.
28 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS
17.0
14.2
11.4
f
8.5
5.7
2.84
Marcas de clase
3.3.2.4. Ojiva
La ojiva o polígono acumulado es una gráfica de línea, en la que en el eje horizontal se trazan los límites
inferiores de cada clase y cierra con el límite superior de la última clase. En el eje vertical las frecuen-
cias acumuladas (fa ), frecuencias relativas acumuladas (fra ) o las frecuencias relativas acumuladas
porcentuales (fra %).
El límite inferior de la primera frontera en la ojiva, toma el valor cero, para indicar que no existen valores
acumulados por debajo de él, la frecuencia absoluta o relativa acumulada se escribe en el límite superior
de cada clase de la ojiva. La ojiva es útil para determinar el número de valores que se encuentran por
debajo de un valor específico.
Ejemplo 3.3.9.
La Figura 3.9 muestra la ojiva con frecuencias relativas acumuladas para el número de flores por plantas.
1.0
0.75
fra
0.50
0.25
0 2 4 6 8 10 12
Flores
Sobre los gráficos de puntos, Triola (2018) describe que “Una gráfica de puntos consiste en un gráfico
de datos cuantitativos en el que cada valor de datos se representa como un punto sobre una escala
horizontal de valores. Los puntos que representan valores iguales se apilan” (p. 57).
3.3. REPRESENTACIÓN DE DATOS 29
Ejemplo 3.3.10.
La Figura 3.10 muestra la gráfica de puntos para el número de flores por plantas.
0 1 2 3 4 5 6 7 8 9 10
Número de flores
Los dos primeros puntos de la izquierda representan que una planta no tiene flores, y también hay una
con una flor. Los nueve puntos que se apilan por encima de seis, indican que nueve plantas tienen seis
flores.
30 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS
3.4. Ejercicios
1. Los siguientes datos muestran la etnia de un grupo de estudiantes de URACCAN.
2. Un conjunto de datos contiene 100 observaciones, la más grande es 315 y la más pequeña es 56.
a. ¿Cuántas clases debería tener la tabla de frecuencias?
b. ¿Cuál es el ancho de cada clase?
c. ¿Cuáles son las clases y las marcas de clases?
3. Complete la información de la siguiente tabla
Clases f fr fa
[0 − 10) 60 60
[10 − 20) 0.4
[20 − 30) 30 170
[30 − 40) 0.1
[40 − 50) 200
4. Las velocidades de 55 automóviles fueron medidas por un aparato radar en una calle citadina:
27 23 22 38 43 24 35 26 28 18 20
25 23 22 52 31 30 41 45 29 27 43
29 28 27 25 29 28 24 37 28 29 18
26 33 25 27 25 34 32 36 22 32 33
21 23 24 18 48 23 16 38 26 21 23
5. En un año reciente, 5524 personas murieron mientras trabajaban. Las causas fueron las siguien-
tes: transporte (2375), contacto con sujetos o equipo (884), asaltos o actos violentos (829), caídas
(718), exposición a sustancias dañinas o a un ambiente nocivo (552), incendios y explosiones
(166). Construya una gráfica de sectores que represente los datos.
6. Los siguientes datos muestran la temperatura (en grados Celsius) de Siuna, éstos fueron reco-
lectados a las cinco de la tarde y a las nueve de la noche durante todo el mes de julio del año
2016.
5:00 pm
28.00 29.00 30.00 29.50 27.50 27.00 27.00 24.00 28.00 28.00
27.00 25.00 28.00 28.00 29.00 27.00 27.00 24.00 25.00 27.00
27.00 26.50 26.00 30.00 28.00 27.80 28.00 29.50 27.00 27.00
26.00
9:00 pm
26.50 26.50 27.00 27.00 28.00 27.00 26.00 24.00 26.50 26.50
26.00 24.00 27.00 26.50 27.00 26.00 26.50 24.00 24.00 25.50
26.00 26.00 26.00 27.50 26.30 27.50 37.00 27.00 25.00 26.00
25.50
b. Para la temperatura a las cinco de la tarde construya e interprete una ojiva de frecuencias
relativas acumuladas y para las nueve una ojiva de frecuencias acumuladas
c. Use un polígono de frecuencia para comparar las distribuciones de frecuencias de la tempe-
ratura de Siuna a las cinco de la tarde y a las nueve de la noche
d. ¿En cuales de estas dos horas es más amena la temperatura?
7. Se realizó un estudio para determinar la cantidad de personas que obtienen un empleo. La si-
guiente tabla incluye datos de 400 sujetos seleccionados al azar. Los datos se basan en resultados
del National Center for Carreer Strategies. Construya una gráfica de Pareto que corresponda a los
datos. Si alguien quiere conseguir un empleo, ¿cuál parece ser la técnica más efectiva?
8. Remítase a los datos del ejercicio 7 y construya una gráfica de sectores. Compare esta gráfica con
la gráfica de Pareto. ¿Puede determinar qué gráfica es más efectiva para mostrar la importancia
relativa de las fuentes de empleo?
9. En un estudio de mercado, se pidió a 100 consumidores que seleccionaran el mejor reproductor
musical digital entre iPod, iRiver y Magic Star MP3. Con la finalidad de resumir las respuestas de
los consumidores en una tabla de frecuencias, ¿cuántas clases tendría la distribución de frecuen-
cias?
10. Se preguntó a un total de 1 000 residentes de Minnesota qué estación del año preferían. Los
resultados fueron que a 100 les gustaba más el invierno; a 300, la primavera; a 400, el verano y
a 200, el otoño. Si se resumieran los datos en una tabla de frecuencias, ¿cuántas clases serían
necesarias?, ¿cuáles serían las frecuencias relativas de cada clase?
11. Los siguientes datos representan la altura total de árboles (en metros), fueron recolectados en la
comunidad Llano Sucio, municipio de Prinzapolka, en una práctica de dasometría impartida en el
año 2015 por el maestro Efraín Peralta Tercero.
28 7 8 7 9 8 25 3 30 26 25 24
31 24 17 23 23 21 23 20 22 23 18 17
19 21 19 20 33 32 19 32 30 26 24 18
18 20 28 29 28 31 28 30 12 20 28 30
31 30 20 32 32 30 28 25 10 30 29 27
30 32 30
12. Los siguientes datos muestran la edad de 24 niños del barrio Gilberto Romero del municipio de
Siuna.
32 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS
2 1 5 5 5 5 4 4 5 6 1 6
2 1 5 8 7 6 2 5 7 3 4 5
13. La siguiente tabla muestra información de un grupo de personas por etnia y sexo. Construya e
interprete una gráfica de barras agrupadas.
14. Los estudiantes de II año de contabilidad de URACCAN-Recinto las Minas aplicaron una encuesta
a las modalidades sabatina y por encuentro, con el propósito de obtener información sobre los
módulos de inglés. Una de las variables fue la edad (en años) del estudiantado, cuyos datos se
muestran a continuación.
19 20 23 24 25 26 28 19 35 18 18 18 31 26 25 24 23 21
21 21 20 36 17 19 18 28 30 36 23 25 27 27 24 31 36 20
22 35 23 27 25 23 21 24 19 20 18 23 16 32 24 20 19 30
Resultados de aprendizaje
Los índices estadísticos son útiles para describir características numéricas de una población o muestra
mediante cantidades llamadas parámetros y estadísticos. Las medidas descriptivas se dividen en tres
grupos: medidas de tendencia central, medidas de variabilidad o posición y medidas, todas válidas
para variables cuantitativas, excepto, la moda, ya que, puede determinarse en variables cualitativas y
cuantitativas.
Las medidas de tendencia central permiten analizar como se aglutinan los datos con respecto a un
centro puede ser la media, la moda o la mediana, según cual sea la mejor medida de tendencia central.
33
34 CAPÍTULO 4. ÍNDICES ESTADÍSTICOS
Suponga que se coloca una persona adulta (con masa 190 libras) en un extremo de un sube y bajas, en el
otro extremo se colocan tantos niños (hasta que sus masas sumen 190 libras) hasta que el sube y bajas
esté equilibrado, cuando esto ocurre se ha encontrado el centro de gravedad del total de masas, es decir, la
media de las masas, sin embargo, los extremos no contienen la misma cantidad de elementos (personas),
esto mismo ocurre con la media de un conjunto de datos.
Para calcular la media aritmética es preciso saber de antemano si los datos provienen de una población
o una muestra. La siguientes ecuaciones corresponden a la media de una población y una muestra,
respectivamente.
N
X
xi
i=1 x1 + x2 + · · · + xN
µ= = (4.1.1)
N N
n
X
xi
i=1 x1 + x2 + · · · + xn
x̄ = = (4.1.2)
n n
La media es única, es decir, un conjunto de datos tiene una sola media, además, la unidad de medida
de la media es la misma unidad de medida de la variable. El resultado de la media se debe expresar con
la misma cantidad de cifras significativas que presentes en la variable.
Los siguientes datos representan la edad de una población formada por 7 personas adultas: 45, 56, 50,
49, 53, 48, 50. La edad media en poblacional formada por siete personas está dada por:
N
X
xi
i=1 x1 + x2 + · · · + xN 45 + 56 + 50 + 49 + 53 + 48 + 50
µ= = = ≈ 50
N N 7
Los siguientes pesos (en kg) fueron recolectados en una muestra de cinco niños: 10.20, 11.02, 10.90, 9.95
y 8.99. El peso medio está dado por:
n
X
xi
i=1 x1 + x2 + · · · + xn 10.20 + 11.02 + 10.90 + 9.95 + 8.99
x̄ = = = ≈ 10.21
n n 5
La principal desventaja de la media es que se ve afectada por valores extremos, es decir, datos muy
pequeños o muy grandes, veamos el siguiente ejemplo.
Las edades de un grupo de personas son 24, 33, 25, 28, 30 y 80. Sea x la edad, entonces, la edad media
está dada por:
n
X
xi
i=1 24 + 33 + 25 + 28 + 30 + 80 220
x̄ = = = ≈ 37
n 6 6
4.1. MEDIDAS DE TENDENCIA CENTRAL 35
La edad media 37 años se ve afectada por el último valor (80), por tanto, ésta no es representativa del
grupo, ya que todos, salvo dos personas tienen edades entre 24 y 33 años. La edad 80 años afecta en
exceso la media.
4.1.2. Moda
La moda se define como la observación que tiene mayor frecuencia en un conjunto de datos, matemáti-
camente se define mediante la siguiente ecuación.
La moda es útil para resumir todos los niveles de datos, nominal, ordinal, de razón y de intervalo. Por
otro lado, a diferencia de la media la moda no se ve afectada por valores extremos.
En un estudio de sondeo público se entrevistó a 100 personas, de las cuales 30 eran profesores, 20
mecánicos, 10 médicos, 15 albañiles, 18 taxistas y 7 comerciantes. La mayoría de los entrevistados fueron
profesores, por lo que la profesión profesores es la moda.
Los salarios de 7 personas son: 7,000; 8,000; 7,000, 9,500; 12,350; 7,000 y 35,900 córdobas. La moda
es M0 = 7, 000 córdobas, ya que, la frecuencia es 3, el salario modal es 7,000 córdobas.
Es posible que un conjunto de datos no tenga moda o tenga de más de una moda. Si ningún valor se
repite no hay moda, si hay una moda el conjunto de datos es unimodal, bimodal con dos y multimodal
con más de dos modas. Cuando un conjunto de datos es multimodal, el uso de la moda puede resultar
confuso.
El conjunto de datos 2.1, 1.10, 16.1, 45.7, 67.9 no tiene moda, ya que, ningún valor se repite, en tanto 20,
33, 45, 45, 45, 90, 105, 105, 105 es un conjunto de datos bimodal con modas M0 = 45 y M0 = 105, ya
que, ambos se repiten con la misma frecuencia.
4.1.3. Mediana
La mediana Me divide al conjunto de datos en dos partes exactamente iguales, el 50 % por debajo de
la mediana y el otro 50 % por encima de ésta. Para calcular manualmente la mediana primero hay que
ordenar los datos en orden ascendente, es decir, de menor a mayor, si se implementa un software el
proceso de ordenamiento no es necesario.
n+1
P Me = (4.1.4)
2
Calcule la mediana de los datos 45, 52, 49, 76, 60, 48, 56.
Solución: Datos ordenados: 45, 48, 49, 52, 56, 60, 76, con n = 7, la posición de la mediana es:
n+1 7+1
P Me = = =4
2 2
La mediana es el dato de la cuarta posición (de izquierda a derecha o de derecha a izquierda) en los datos
ordenados, Me = 52. Por debajo y encima de 52 se encuentran exactamente tres valores.
Si el número de observaciones es par, no hay una sola observación en medio, sino dos, en este caso se
promedia ambas observaciones, ese promedio es la mediana.
Calcular la mediana de 45, 52, 49, 40, 76, 60, 48, 56.
Solución: Se ordenan los datos de manera ascendente 40, 45, 48, 49, 52, 56, 60, 76. Para n = 8, la
posición de la mediana es:
n+1 8+1
P Me = = = 4.5
2 2
La mediana es el promedio de los datos de la cuarta y quinta posición en los datos ordenados, es decir,
49 + 52
Me = = 50.5. Por debajo y encima de 49 y 52 se encuentran exactamente tres valores.
2
Para conocer la forma o patrón de la distribución (simétrica o sesgada) de los datos a lo largo del rango
completo de todos los valores se comparan la media con la mediana, resultando los siguientes casos:
En la mayoría de los casos, cuando los datos están sesgados la mejor medida de tendencia central es la
mediana.
Los siguientes datos son las calificaciones del curso física general 80, 90, 54, 33, 60, 66, 89, 80, 71, 63,
65, 71, 95. Calcule e identifique la mejor medida de tendencia central. La media (al entero más cercano)
está dada por:
80 + 90 + 54 + 33 + 60 + 66 + 89 + 80 + 71 + 63 + 65 + 71 + 95
x̄ = = 71 puntos
13
La moda es 71 y 80 puntos, por tanto, es un conjunto de datos bimodal. Para calcular la mediana se
ordenan los datos, 33, 54, 60, 63, 65, 66, 71, 71, 80 80, 89, 90, 95. La posición de la mediana es:
13 + 1
P Me = =7 ∴ Me = 71 puntos
2
La media y la mediana son iguales, por tanto, la distribución de los datos es simétrica, la medida de
tendencia central puede ser la media o la mediana.
4.2. MEDIDAS DE DISPERSIÓN 37
Las medidas de dispersión proporcionan información sobre la manera que los datos se dispersan o
varían con respecto a un centro que puede ser la media o mediana, Johnson y Kuby (2012) concluyen
que “describen la cantidad de dispersión o variabilidad que se encuentra entre los datos: los datos
estrechamente agrupados tienen valores relativamente pequeños y los datos más ampliamente dispersos
tienen valores más grandes” (p. 74).
4.2.1. Varianza
La varianza es una medida numérica que mide las variación de los datos en una población o una
muestra. Webster (2000) describe que “la varianza es el promedio de las observaciones con respecto a su
media elevadas al cuadrado” (p. 48). La varianza mide la dispersión, por tanto, a mayor varianza mayor
dispersión de los datos con respecto a la media.
La ecuación para calcular la varianza poblacional está dada por la siguiente ecuación.
N
X
(xi − µ)2
i=1 (x1 − µ)2 + (x2 − µ)2 + · · · + (xN − µ)2
σ2 = = (4.2.1)
N N
n
X
(xi − x̄)2
i=1 (x1 − x̄)2 + (x2 − x̄)2 + · · · + (xn − x̄)2
s2 = = (4.2.2)
n−1 n−1
Las desventajas de la varianza es que al igual que la media, es un índice muy sensible a las puntuaciones
extremas, además, la unidad de medida difiere de la unidad de medida del conjunto de los datos, es decir,
la varianza se mide en unidades cuadradas, lo que la hace más difícil de interpretar en relación con los
datos.
Los siguientes datos son los ingresos (en córdobas) de una muestra de cinco persona, 12,000; 16,500;
18,120; 17,300 y 15,090. La varianza está dada por:
12, 000 + 16, 500 + 18, 120 + 17, 300 + 15, 090
x̄ = = 15, 802
5
(12000 − 15802)2 + (16500 − 15802)2 + (18120 − 15802)2 + (17300 − 15802)2 + (15090 − 15802)2
s2 =
4
(−3802)2 + (698)2 + (2318)2 + (1498)2 + (−712)2 14455204 + 487204 + 5373124 + 2244004 + 506944
= =
4 4
23066480
= ≈ 5, 766, 620
4
El concepto de desviación estándar es muy importante en los negocios y en la economía. Por ejem-
plo, en finanzas la desviación estándar se utiliza como medida de riesgo relacionada con varias
oportunidades de inversión. Mediante el uso de la desviación estándar para medir la variabilidad
en las tasas de rendimiento ofrecidas por diferentes inversiones, el analista financiero puede medir
el nivel de riesgo que tiene cada activo financiero. Generalmente, entre mayor sea la desviación es-
tándar de la tasa de rendimiento de una inversión en particular, mayor será el grado de riesgo. (p.
49)
En la sección 4.1.3 se abordó la forma de la distribución de los datos comparando la media con la
mediana, una forma alternativa es calcular el coeficiente de sesgo, P de Pearson, el cual se define
mediante la siguiente ecuación.
3(x̄ − Me )
P = (4.2.3)
s
Los siguientes datos representan la cantidad de horas que un grupo de niños ve televisión durante el día:
2, 3, 5, 1, 2, 3, 6 y 4. La media, mediana y la desviación estándar son:
2+3+5+1+2+3+6+4
x̄ = = 3.25
8
Datos ordenados: 1, 2, 2, 3, 3, 4, 5 y 6
Realizando el cálculo de la desviación estándar obtiene s = 1.67. El coeficiente de sesgo de Pearson está
dado por:
El conjunto de datos está sesgado hacia la derecha, es decir, la mayoría de los valores se encuentran en
la parte superior de la distribución.
En ocasiones resulta necesario contar con un estadígrafo que refleje la dispersión sin depender de la
magnitud de las observaciones, esto es que sea un valor relativo. Esta necesidad surge generalmente
cuando se comparan las dispersiones entre varios conjuntos expresados en unidades diferentes, o
incluso entre variables expresadas en las mismas unidades pero con diferencias significativas en
sus valores medios. Este estadístico es el denominado coeficiente de variación. (p. 25)
s
CV = 100 (4.2.4)
x̄
Sobre los valores que toma el coeficiente de variación, Wikipedia (2020) describe:
A mayor valor del coeficiente de variación mayor heterogeneidad de los valores de la variable; y a
menor coeficiente de variación, mayor homogeneidad en los valores de la variable. Por ejemplo, si el
coeficiente de variación es menor o igual al 80 %, significa que la media aritmética es representativa
del conjunto de datos, por ende el conjunto de datos es "Homogéneo". Por el contrario, si el coefi-
ciente de variación supera al 80 %, el promedio no será representativo del conjunto de datos (por lo
que resultará "Heterogéneo").
Calcular el coeficiente de variación para la edad (años) y el peso (libras) de cinco personas, cuyos datos se
muestran en la siguiente tabla.
Edad: 31 27 35 21 30
Peso: 140 160 170 145 180
Edad
31 + 27 + 35 + 21 + 30
x̄ = = 28.8 años
5
r
(31 − 28.8)2 + (27 − 28.8)2 + (35 − 28.8)2 + (21 − 28.8)2 + (30 − 28.8)2
s = = 5.22 años
4
s
5.22
CV = 100 ⇒ CV = 100 = 18.1 %
x̄ 28.8
40 CAPÍTULO 4. ÍNDICES ESTADÍSTICOS
Peso
Conclusión: Comparando ambos coeficientes, hay más variación en la edad (18.1 %) que en el peso
(10.5 %) de los estudiantes, en ambos casos CV < 80 %, por tanto, la media aritmética es representati-
va del conjunto de datos, lo que significa que tanto el peso y la edad son datos homogéneos.
Las medidas de posición también miden la dispersión de un conjunto de datos, por tanto, son medidas
alternativas a las medidas de dispersión, sobre el uso de éstas Johnson y Kuby (2012) describen “las
medidas de posición se usan para describir la posición que un valor de datos específico posee en relación
con el resto de los datos cuando están en orden clasificado” (p. 82). Dentro de las medidas de posición
están los cuartiles, deciles y percentiles, aquí se estudian los dos más comunes, cuartiles y percentiles.
4.3.1. Cuartiles
Los cuartiles dividen al conjunto de datos en cuatro partes iguales, resultando de esta forma tres cuar-
tiles. El primer cuartil Q1 separa al 25 % de los valores más pequeños del otro 75 % más grande. El
segundo cuartil Q2 es la mediana; 50 % de los datos son más pequeños o iguales que el cuartil dos y 50 %
mayores o iguales que éste. El tercer cuartil Q3 separa al 75 % de los valores más pequeños del otro 25 %
más grande.
El segundo cuartil es la mediana, por eso no es común calcularlo; pero si los cuartiles uno y tres. Antes
de calcular los cuartiles, primero hay que determinar la posición de cada uno en los datos ordenados
ascendentemente. La posición del primer y tercer cuartil, está dada mediante las siguientes ecuaciones:
n+1
P Q1 = (4.3.1)
4
3(n + 1)
P Q3 = (4.3.2)
4
Para determinar el cuartil en la serie de datos ordenados, se hace uso de las siguientes reglas.
Si el valor ordenado es un número entero, el cuartil es igual al valor que corresponde a ese dato ordenado.
Si el valor ordenado es una mitad fraccionaria (0.5, 1.5, 2.5, 3.5, 4.5, 5.5, etc.) , el cuartil es igual al valor
que corresponde al promedio de los valores de los datos ordenados implicados.
4.3. MEDIDAS DE POSICIÓN 41
Si el valor ordenado no es un número entero ni una mitad fraccionaria, se redondea el resultado al entero
más cercano y se selecciona el valor correspondiente a ese dato ordenado.
Calcular el primer y tercer cuartil para la temperatura (grados Celsius) de Siuna a la siete de la mañana du-
rante los primeros diez días del mes de diciembre del año 2016. Los datos son: 24.80, 24.50, 23.50, 23.00, 24.00,
24.00, 25.00, 23.50, 23.50, 23.50
Solución: Datos ordenados: 23.0, 23.5, 23.5, 23.5, 23.5, 24.0, 24.0, 24.524.8, 25.0. A continuación se muestra el
cálculo para cada cuartil especificando la regla usada para determinar la posición en el conjunto de datos
ordenados.
Primer cuartil
n+1 10 + 1
P Q1 = = = 2.75 ≈ 3.00 Regla 3
4 4
Tercer cuartil
3(n + 1) 3(10 + 1)
P Q3 = = = 8.25 ≈ 8.00 Regla 3
2 4
El tercer cuartil es el dato que ocupa la octava posición en los datos ordenados, Q3 = 24.50. El 75 % de las
temperaturas a la siete de la mañana en el mes de diciembre de 2016 fueron menores o iguales a 24.50◦ C
y 25 % de éstas fueron mayores o iguales a los 24.50◦ C.
4.3.2. Percentiles
Los percentiles dividen los datos en cien partes iguales, y por tanto, todo conjunto de datos tendrá 99
percentiles. El primer percentil es el valor por debajo del cual se encuentra el 1 % de las observaciones
y el resto, 99 % se encuentran por encima de ese valor.
Los percentiles se representan mediante subíndices, por ejemplo el quinto percentil se representa por
P5 y su ubicación (en los datos ordenados) es L5 . La posición del P -ésimo percentil se obtiene mediante
la siguiente ecuación:
P
LP = (n + 1) (4.3.3)
100
En todo conjunto de datos el percentil 25 coincide con el primer cuartil Q1 , es decir, P25 = Q1 , también,
P50 = Q2 = Me y P75 = Q3 . Para determinar el valor del percentil en la serie de datos ordenados, se
aplica cualquiera de las siguientes reglas.
Si el valor ordenado es un número entero, el percentil es igual al valor que corresponde a ese dato ordenado.
42 CAPÍTULO 4. ÍNDICES ESTADÍSTICOS
Si el valor ordenado es un número decimal, el percentil es igual al valor que corresponde a ese dato
ordenado, más el producto del punto decimal con la diferencia de la observación que está en la posición
k + 1 y la posición k.
P 35
Solución: L35 = (n + 1) = (10 + 1) = (11)(0.35) = 3.85. Por la Regla 2, el percentil 35 será el valor
100 100
correspondiente a la tercera posición, más el producto de 0.85 con la diferencia de la cuarta y tercera
posición, es decir:
En esta sección se muestra el cálculo de las medidas de tendencia central: media, moda y mediana para
datos agrupados en distribuciones de frecuencias.
La media en una distribución de frecuencias se calcula como, el cociente de la suma del producto de las
frecuencias (f ) con los puntos medios de cada clase (P M ) y el tamaño de la muestra (n) es decir:
k
X
f · PM
i=1
x̄ = (4.4.1)
n
Ejemplo 4.4.1.
Calcular la media para la distribución de frecuencias del número de bebés nacidos en 60 hospitales de
una comunidad.
Se calcula el producto de las frecuencias con los puntos medios de cada clase y la sumatoria, veamos.
4.4. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS 43
Clases PM f f · PM
[21 − 26] 23.5 6 141
[27 − 32] 29.5 12 354
[33 − 38] 35.5 4 142
[39 − 44] 41.5 6 249
[45 − 50] 47.5 9 427.5
[51 − 56] 53.5 15 802.5
[57 − 62] 59.5 8 476
7
X
f · P M = 2592
i=1
k
X 7
X
f · PM f · PM
i=1 i=1 2592
x̄ = = = = 43.2
n n 60
4.4.2. Moda
En un conjunto de datos la moda es la observación que se presenta con mayor frecuencia, para datos
agrupados en una distribución de frecuencias partimos de esta hipótesis, localizando la clase con la ma-
yor frecuencia y que se denomina clase modal. Para calcular la moda en una distribución de frecuencias
se usa la siguiente ecuación.
Da
Mo = Lmo + ·W (4.4.2)
Db + Da
Donde Lmo es límite inferior de la clase modal; Da es la diferencia entre la frecuencia de la clase modal
y la clase que antecede; Db es la diferencia entre la frecuencia de la clase modal y la clase que se sigue
y W es la amplitud o ancho de la clase modal.
Ejemplo 4.4.2.
Calcular la moda para la distribución de frecuencias del número de bebés nacidos en 60 hospitales de una
comunidad mostrada en el Ejemplo 4.4.1.
Da 15 − 9
Mo = Lmo + · W = 51 + ·6
Db + Da (15 − 8) + (15 − 9)
15 − 9 6
= 51 + · 6 = 51 + ·6
(15 − 8) + (15 − 9) 7+6
6
Mo = 51 + · 6 = 51 + (0.46)(6) = 51 + 2.8 = 53.8
13
4.4.3. Mediana
Para calcular la mediana, primero hay que localizar la clase mediana en la distribución de frecuencias,
n
la clase mediana es la primera clase con frecuencia acumulada mayor o igual a , en seguida se aplica
2
la siguiente ecuación.
n/2 − F
Me = Lmd + ·W (4.4.3)
fmd
Donde Lmd es límite inferior de la clase mediana; F es la frecuencia acumulada de la clase que antecede
a la clase mediana; fmd es la frecuencia de la clase mediana y W es el ancho o amplitud de la clase
mediana.
Ejemplo 4.4.3.
Calcular la mediana para la distribución de frecuencias del número de bebés nacidos en 60 hospitales de
una comunidad mostrada en el Ejemplo 4.4.1.
n 60
La primera clase con frecuencia acumulada mayor que = = 30 es la correspondiente a la clase
2 2
[45 − 50], la mediana está dada por:
n/2 − F 30 − 28 2
Me = Lmd + · W = 45 + · 6 = 45 + · 6 = 45 + (0.05)(6) = 45 + 0.3 = 45.3
fmd 37 37
4.5.1. Varianza
k
X
f · P M 2 − nx̄2
i=1
s2 = (4.5.1)
n−1
4.5. MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS 45
Ejemplo 4.5.1.
k
X
f · P M 2 − nx̄2
i=1 120693 − (60)(43.2)2 120693 − 111974.4 8718.6
s2 = = = = = 147.8
n−1 59 59 59
v
u k
uX
u
u f · P M 2 − nx̄2
t i=1
s= (4.5.2)
n−1
Ejemplo 4.5.2.
√ √
s= s2 = 147.8 = 12.2 ≈ 12niños
46 CAPÍTULO 4. ÍNDICES ESTADÍSTICOS
4.6. Ejercicios
1. Los siguientes datos son las producciones (en libras) de lúpulos
3.9 3.4 5.1 2.7 4.4 7.0 5.6 2.6 4.8 5.6
7.0 4.8 5.0 6.8 4.8 3.7 5.8 3.6 4.0 5.6
Determine:
2. Los siguientes datos son las calificaciones del curso Matemática para la vida de un grupo de
estudiantes del propedéutico 2017, impartido en URACCAN-Recinto las Minas.
67 85 76 79 85 91 79 79 79
85 91 79 91 56 67 79 79 84
91 67 76 85 76 44 67 84 79
Calcule e interprete:
3. Los siguientes datos representan la altura total del árbol (en metros) y fueron recolectados en la
comunidad Llano Sucio, municipio de Prinzapolka, en una práctica de dasometría impartida en el
año 2015 por el maestro Efraín Peralta Tercero.
28 7 8 7 9 8 25 3 30 26 25 24
31 24 17 23 23 21 23 20 22 23 18 17
19 21 19 20 33 32 19 32 30 26 24 18
18 20 28 29 28 31 28 30 12 20 28 30
31 30 20 32 32 30 28 25 10 30 29 27
30 32 30
Calcule e interprete:
a. La mediana
b. El primer y tercer cuartil
c. Construya una distribución de frecuencias y encuentre la media, mediana y moda.
4. Las edades de una muestra que se tomó de turistas canadienses que vuelan de Toronto a Hong
Kong fueron fueron: 32, 21, 60, 47, 54, 17, 72, 55, 33 y 41. Calcule la desviación estándar.
5. Debido a que las tasas de interés cayeron a comienzos de 1997, se encontró que una muestra de
las tasas hipotecarias para hipotecas a 15 años de las instituciones de crédito en Peoria, Illinos
era: 7.1 %, 7.3 %, 7.0 %, 6.9 %, 6.6 %, 6.9 %, 6.5 %, 7.3 %, 6.8 %.
6. Los siguientes datos corresponden a la estatura en metros y el peso en kilogramos de seis perso-
nas.
¿Hay más variabilidad en la estatura o en el peso?
4.6. EJERCICIOS 47
Costo de electricidad f
[80 − 100) 3
[100 − 120) 8
[120 − 140) 12
[140 − 160) 16
[160 − 180) 7
[180 − 200) 4
7. La siguiente distribución de frecuencias contiene los costos (en dólares) de electricidad de una
muestra de 50 departamentos de dos recámaras en Albuquerque, Nuevo México, durante el mes
de mayo del año pasado.
8. Bidwell Electronics, Inc., recién tomó una muestra de empleados para determinar la distancia a la
que viven de las oficinas centrales de la empresa. Los resultados aparecen a continuación. Calcule
la media y la desviación estándar.
Distancia (miles) f
[0 − 5) 4
[5 − 10) 15
[10 − 15) 27
[15 − 20) 18
[20 − 25) 6
Total devengado 6, 560.49 10, 653.00 9, 215.93 10, 223.45 35, 337.72 16, 619.93
Antigüedad 2 15 17 7 21 8
10. Estudiantes de II año de contabilidad de URACCAN-Recinto Las Minas aplicaron una encuesta en
las modalidades sabatina y por encuentro, para obtener información sobre los módulos de inglés.
Una de las variables fue la edad (en años).
19 20 23 24 25 26 28 19 35 18 18 18 31 26 25 24 23 21
11. Una muestra de familias que ha contratado los servicios de la United Bell Phone Company reveló
el siguiente número de llamadas recibidas por familia la semana pasada. Determine el número
medio y la mediana de llamadas recibidas.
52 43 30 38 30 42 12 46
39 37 34 46 32 18 41 5
12. Algunos estudiantes de estadística participaron en un experimento con el fin de probar su capa-
cidad para determinar el transcurso de 1 minuto (o 60 segundos). A continuación se presentan
los resultados en segundos. Identifique al menos una buena razón por la que la media de esta
muestra no sería un buen estimador del promedio de a población de adultos.
53 52 75 62 68 58 49 49
48 CAPÍTULO 4. ÍNDICES ESTADÍSTICOS
14. Es bien sabido que los hombres tienden a pesar más y a ser más altos que las mujeres. El índice
de masa corporal (IMC) es una medida que se basa en el peso y la estatura. A continuación se
listan los valores de IMC de hombres y mujeres elegidos de manera aleatoria. ¿Parece existir una
diferencia notable?, ¿parece haber diferencias en la variación entre los dos conjunto de datos?
Hombres 23.8 23.2 24.6 26.2 23.5 24.5 21.5 31.4 26.4 22.7 27.8 28.1
Mujeres 19.6 23.8 19.6 29.1 25.2 21.4 22.0 27.5 33.5 20.6 29.9 17.7
15. Ya que la media es muy sensible a los valores extremos, decimos que no es una medida de ten-
dencia central resistente. La media recortada es más resistente. Para calcular la media recortada
del 10 % de un conjunto de datos, primero se acomodan los datos en orden, después se elimina el
10 % de los valores inferiores y el 10 % de los valores superiores y luego se calcula la media de los
valores restantes. Para los pesos de los osos en el conjunto de datos mostrados a continuación.
80 344 416 348 166 220 262 360 204 144 332 34
140 180 105 166 204 26 120 436 125 132 90 40
220 46 154 116 182 150 65 356 316 94 86 150
270 202 202 365 79 148 446 62 236 212 60 64
114 76 48 29 514 140
Calcule:
a. La media
b. La media recortada del 10 %
c. La media recortada del 20 %
d. ¿Qué diferencias hay en los resultados?
Capı́tulo 5
Probabilidades
Resultados de aprendizaje
El diccionario de la lengua española (Real Academia Española) define probabilidad como, cualidad de
probable, es decir, algo que puede suceder. Para darnos más ideas la palabra probabilidad es sinónimo
de posibilidad.
Muchas veces nos hacemos preguntas como, ¿qué posibilidades hay que vengas hoy?, ¿es posible que
nos veamos la semana que viene?, ¿será que llueva mañana dado que hoy llovió?, ¿qué posibilidad hay
que los Leones de León se coronen campeones en el Pomares 2017?, etc. Todas estas preguntas están
basadas en las probabilidades, sin embargo, en nuestra vida diaria no usamos cálculo alguno para dar
respuestas a estas interrogantes.
El uso de la teoría de la probabilidad se ha extendido a muchas áreas por mencionar algunas, la bio-
logía, física, administración, contaduría, economía y los recursos naturales con la finalidad de obtener
conclusiones sobre la probabilidad de sucesos que ocurren en estas áreas.
El estudio del capítulo lo iniciamos revisando un poco de historia de la probabilidad, conceptos bási-
cos como: experimento, espacio muestral, sucesos, operaciones con sucesos, concepto de probabilidad,
enfoques de la probabilidad y las reglas que serán de utilidad en el cálculo de probabilidades.
Con la finalidad de abordar aspectos históricos de la probabilidad, Anónimo (s.f) señala lo mostrado en
los siguientes cinco párrafos.
49
50 CAPÍTULO 5. PROBABILIDADES
La historia de la probabilidad comienza en el siglo XVII cuando Pierre Fermat y Blaise Pascal tratan
de resolver algunos problemas relacionados con los juegos de azar. Aunque algunos marcan sus inicios
cuando Cardano (jugador donde los haya) escribió sobre 1520 El Libro de los Juegos de Azar (aunque
no fue publicado hasta más de un siglo después, sobre 1660) no es hasta dicha fecha que comienza a
elaborarse una teoría aceptable sobre los juegos.
Christian Huygens conoció la correspondencia entre Blaise Pascal y Pierre Fermat suscitada por el
caballero De Meré, se planteó el debate de determinar la probabilidad de ganar una partida, y publicó
(en 1657) el primer libro sobre probabilidad: De Ratiociniis in Ludo Aleae, (Calculating in Games of
Chance), un tratado sobre juegos de azar.
Durante el siglo XVIII, debido muy particularmente a la popularidad de los juegos de azar, el cálculo
de probabilidades tuvo un notable desarrollo sobre la base de la anterior definición de probabilidad.
Destacan en 1713 el teorema de Bernoulli y la distribución binomial, y en 1738 el primer caso particular
estudiado por De Moivre, del teorema central del límite. En 1809 Gauss inició el estudio de la teoría de
errores y en 1810 Laplace, que había considerado anteriormente el tema, completó el desarrollo de esta
teoría. En 1812 Pierre Laplace publicó Théorie analytique des probabilités en el que expone un análisis
matemático sobre los juegos de azar.
A mediados del siglo XIX, un fraile agustino austríaco, Gregor Mendel, inició el estudio de la herencia,
la genética, con sus interesantes experimentos sobre el cruce de plantas de diferentes características.
Su obra, La matemática de la Herencia, fue una de las primeras aplicaciones importantes de la teoría
de probabilidad a las ciencias naturales.
Desde los orígenes la principal dificultad para poder considerar la probabilidad como una rama de la
matemática fue la elaboración de una teoría suficientemente precisa como para que fuese aceptada como
una forma de matemática. A principios del siglo XX el matemático ruso Andrei Kolmogorov la definió de
forma axiomática y estableció las bases para la moderna teoría de la probabilidad que en la actualidad
es parte de una teoría más amplia como es la teoría de la medida.
En esta sección se definen algunos conceptos básicos previos al estudio de la probabilidad, se recomien-
da estudiarlos con calma y tratar de interpretarlos, para esto se puede apoyar en los ejemplos.
5.2.1. Experimento
Comúnmente le llamamos experimento al proceso que realizamos mediante el cual recolectamos in-
formación, ya sea numérica o de carácter descriptivo, o bien, cuando se trata contrastar una o varias
hipótesis relacionadas con teorías de una determinada área científica.
Sea cual sea la metodología que usemos para el desarrollo de un experimento, siempre obtendremos
resultados, de esto definimos un experimento como sigue.
Ejemplo 5.2.1.
Anotar el sexo de bebés recién nacidos en el hospital Carlos Centeno del municipio de Siuna, registrar
la temperatura de Siuna a las siete de la mañana todos los día de un mes específico, lanzar al aire un
dado y anotar el resultado, entrevistar a un grupo de estudiantes de URACCAN sobre una regla agreda
recientemente al reglamento estudiantil, etc.
5.2. CONCEPTOS BÁSICOS DE LA PROBABILIDAD 51
Es aquel que bajo el mismo conjunto aparente de condiciones iniciales, conduce a un resultado cierto o
seguro.
Ejemplo 5.2.2.
Es aquel que bajo el mismo conjunto aparente de condiciones iniciales, puede presentar resultados dife-
rentes.
Una característica del experimento aleatorio es que si se repite un número suficientemente grande de
veces, entonces es posible predecir el número aproximado de ocurrencias del resultado.
Ejemplo 5.2.3.
Lanzar una moneda o un dado al aire y anotar la cara (número) que cae.
Ejemplo 5.2.4.
Nota 5.2.1. El estudio de las probabilidades está basado en experimentos aleatorios, por tanto, siempre
que nos refiramos a un experimento debe ser aleatorio aunque no lo especifiquemos.
Ejemplo 5.2.5.
Supongamos que un experimento consiste en lanzar al aire una moneda. Los resultados se muestran en el
espacio muestral, el cual está dado por:
S = {N, E}
Ejemplo 5.2.6.
Supongamos ahora que el experimento consistió en lanzar al aire dos monedas. El espacio muestral será:
S = {N N, N E, EN, EE}
Ejemplo 5.2.7.
Al registrar el sexo de un bebé recién nacido en el hospital Carlos Centeno del municipio de Siuna, obtene-
mos el siguiente espacio muestral S = {F, M }.
Ejemplo 5.2.8.
Ejemplo 5.2.9.
Julissa Castillo tiene una pequeña tienda de computadoras. Un día tiene tres Gateway y dos Compaq
en existencias. Supongamos que Juan Blandón entra en la tienda a comprar dos computadoras. A Juan
le da igual la marca (todas los computadoras tienen las mismas especificaciones técnicas), por lo que
selecciona las computadoras puramente al azar: cualquiera de las computadoras del estante tienen la
misma probabilidad de ser elegidas. El espacio muestral está dado por:
S = {G1 C1 , G1 C2 , G2 C1 , G2 C2 , G3 C1 , G3 C2 , G1 G2 , G1 G3 , G2 G3 , C1 C2 }
5.2.3. Sucesos
Ejemplo 5.2.10.
Un experimento consiste en lanzar al aire un dado. Los resultados se encuentran el espacio muestral
S = {1, 2, 3, 4, 5, 6}.
5.2. CONCEPTOS BÁSICOS DE LA PROBABILIDAD 53
Obtener un uno: S1∗ = {1}; obtener un número par: S2∗ = {2, 4, 6}; obtener un número impar: S3∗ = {1, 3, 5};
sacar un número divisible por 3: S4∗ = {3, 6}.
Cada uno de los sucesos descritos anteriormente son subconjuntos del espacio muestral S = {1, 2, 3, 4, 5, 6},
es decir, Si∗ ⊂ S, para i = 1, 2, 3, 4.
Un suceso puede ser elemental o compuesto, es elemental si está formado por un único elemento del
espacio muestral. Por ejemplo, S1∗ definido en el ejemplo 5.2.10 es un suceso elemental.
Un suceso es compuesto si está formado por más de un elemento del espacio muestral. Por ejemplo S2∗ ,
S3∗ y S4∗ definidos en el ejemplo 5.2.10 son sucesos compuestos.
Los tipos de sucesos se clasifican según su posibilidad de ocurrencia, entre los que existen:
Suceso seguro: Está formado por todos los resultados posibles del espacio muestral, es decir, el que se
cumple siempre.
Suceso imposible: El suceso imposible es el que nunca ocurre. Se expresa con el símbolo de vacío ∅.
Suceso complementario: Suceso contrario a otro suceso, para un suceso A su complementario es Ā,
el suceso complementario ocurre cuando A no puede ocurrir y viceversa.
Ejemplo 5.2.11.
El suceso obtener cualquier número después de lanzar un dado, es un suceso seguro; obtener un 10
después de lanzar un dado es un suceso imposible y obtener un número par es el suceso complementario
al suceso de obtener un impar.
Como un suceso es subconjunto del espacio muestral (que es un conjunto), significa entonces, que
serán conjuntos con cardinalidad menor que la del espacio muestral, es decir, |S| > |S ∗ |. En teoría de
conjuntos la cardinalidad se refiere a la cantidad de elementos del conjunto, así, si el conjunto S tiene
n elementos su cardinalidad es |S| = n.
Ya que los sucesos son conjuntos, cumplen con las operaciones fundamentales de la teoría de conjuntos
como: la unión, intersección y el complemento.
Suponga que tiene dos sucesos, a saber A y B, la unión estará formada por todos los elementos de los
sucesos que pertenecen a A y a B y se representa por A ∪ B.
Ejemplo 5.2.12. Sea el experimento, lanzar un dado al aire. El suceso A lo definimos como obtener un
número impar y B obtener un dos. Los sucesos y su unión están dados por:
Ejemplo 5.2.13.
Sean los sucesos, H: seleccionar a un hombre del grupo de II año de Ingeniería Agroforestal y M : seleccio-
nar a una mujer del mismo grupo. La unión H ∪ M está formada por los estudiantes hombres y mujeres de
II año de Ingeniería Agroforestal, por tanto, la unión será: Estudiantes de II año de Ingeniería Agroforestal.
La intersección de dos sucesos A y B, está formada por todos los elementos que están tanto en el suceso
A como en el B y se representa por A∩B. Si dos sucesos son disjuntos, es decir, que no tienen elementos
en común su intersección es el vacío (∅).
Ejemplo 5.2.14. Algunos trabajadores hombres y mujeres de URACCAN-Recinto las Minas usan lentes.
Sea A el suceso conjunto de trabajadores hombres, B trabajadoras mujeres, C es el conjunto que usa
lentes y D es el conjunto de trabajadores que no usa lentes.
La intersección, A ∩ C es el conjunto formado por los trabajadores hombres que usan lentes. Para formar
la intersección, seleccionamos del conjunto A a los hombres que usen lentes y del conjunto C solo a los
hombres que usan lentes.
En este caso A ∩ B es vacía, es decir, A ∩ B = ∅, ya que, un trabajador no puede ser hombre y mujer a la
vez. Con respecto al sexo los sucesos A y B son disjuntos.
La intersección, B ∩ D es el conjunto formado por las mujeres que no usan lentes. Para formar la intersec-
ción seleccionamos del conjunto B a las mujeres que no usan lentes y del conjunto D sólo a las mujeres
que no usan lentes.
Dos sucesos son complementarios si al ocurrir uno de ellos el otro no ocurre. Dado un suceso A, su
complemento se suele representar por Ac , A0 o bien Ā, aquí usaremos la última forma para referirnos al
complemento de un suceso.
Ejemplo 5.2.15.
5.3. Probabilidad
La probabilidad consiste en asignar una medida numérica a cada suceso, esta medida está comprendida
en la escala 0 y 1 y representa la posibilidad de que un determinado suceso ocurra.
La definición 5.3.1 establece que la probabilidad de un suceso debe estar entre 0 y 1, es decir no menor
que cero, ni mayor que uno. A los sucesos imposibles de ocurrir se les asigna probabilidad cero y a los
sucesos seguros, se les asigna 1 como probabilidad.
5.4. ENFOQUES DE LA PROBABILIDAD 55
Entre más próxima a uno esté la probabilidad de un suceso significa que éste tiene más posibilidades
de ocurrir y entre más se aproxime a cero menos probabilidad tendrá de ocurrir. Para representar la
probabilidad asociada a un suceso se escribe P (S ∗ ).
Ejemplo 5.3.1.
Supongamos que denotamos con L el suceso que llueva hoy y su probabilidad asociada es 0.30, entonces,
lo escribimos como P (L) = 0.30.
Nota 5.3.1. Es frecuente escribir las probabilidades de un suceso en forma de porcentaje, para el ejemplo
anterior sería P (L) = 30 %.
Ejemplo 5.3.2.
El estudio de las probabilidades se desarrolla partiendo de dos enfoques, el objetivo y el subjetivo, dentro
del objetivo están la probabilidad clásica y empírica, tal y como se presenta a continuación.
La probabilidad clásica es la relacionada con los juegos de azar, es decir, barajas, dados, ruletas, etc.
Este tipo de probabilidades parten de la hipótesis de que los resultados de un experimento son igual-
mente posibles, esto es, todos los resultados del experimento tienen la misma posibilidad de ocurrir.
Para calcular la probabilidad con el enfoque clásico, haremos uso de la siguiente ecuación.
Ejemplo 5.4.1.
Al lanzar un dado al aire, que caiga el número 3 sólo puede ocurrir en una de seis formas posibles, así su
1
probabilidad de selección es P (3) = .
6
Ejemplo 5.4.2.
Siguiendo con el dado, que caiga un número impar ocurre en tres (1, 3 y 5) de seis formas posibles, así, su
probabilidad de selección es:
3 1
P (número impar) = = = 0.50 = 50 %
6 2
56 CAPÍTULO 5. PROBABILIDADES
Ejemplo 5.4.3.
Un tazón contiene tres pelotas rojas y dos amarillas. Dos de ellas se seleccionan al azar y se registran sus
colores.
Solución: La selección se hace al azar, entonces, cada opción debe ser igualmente probable.
S = {R1 R2 , R1 R3 , R1 A1 , R1 A2 , R2 R1 , R2 R3 , R2 A1 , R2 A2 , R3 R1 , R3 R2 , R3 A1 , R3 A2 , A1 R1 , A1 R2 , A1 R3
A1 A2 , A2 R1 , A2 R2 , A2 R3 , A2 A1 }
b. Sea R el evento “ambas pelotas son rojas”, este puede ocurrir en seis formas posibles de 20, por tanto,
R = {R1 R2 , R1 R3 , R2 R1 , R2 R3 , R3 R1 , R3 R2 }, y la probabilidad está dada por:
6 3
P (R) = = = 0.30
20 10
c. Sea RA el evento “la primera pelota es roja y la segunda amarilla”, entonces,
RA = {R1 A1 , R1 A2 , R2 A1 , R2 A2 , R3 A1 , R3 A2 }
La probabilidad es:
6 3
P (RA) = = = 0.30
20 10
Ejemplo 5.4.4.
Sandor Guido #7 primera base de los Leones de León ha conseguido 15 hits en 40 turnos al bate, ¿cuál es
la probabilidad que en el siguiente turno al bate Sandor batee un hit?
Solución: Sandor ha dado de hit en 31 de 40 turnos que tuvo al bate, por tanto, la probabilidad de que
en el siguiente turno batee un hit, está dada por:
31
P (Hit) = = 0.775 = 77.5 %
40
Ejemplo 5.4.5.
La siguiente tabla muestra estudiantes de URACCAN-Recinto Las Minas que cursan distintas carreras.
Carrera Estudiantes
Contabilidad 10
Ingeniería Agroforestal 5
Medicina Veterinaria 4
Administración 6
Informática 9
Si elige un estudiante al azar y anota la carrera. ¿Cuál es la probabilidad que estudie Agroforestal?
Solución: Hay 5 estudiantes que cursan la carrera de Ingeniería Agroforestal de un total de 34, por tanto,
seleccionar a un estudiante de esta carrera puede ser en cinco de 34 formas posibles, la probabilidad es:
5
P (Ingeniería Agroforestal) = ≈ 0.1471 = 14.71 %
34
Este enfoque se da cuando no hay de datos o información previa de un evento, por tanto, las probabili-
dades se estiman en base al mejor criterio personal de un experto. A continuación se muestran algunos
ejemplos del enfoque de probabilidad subjetiva.
• Probabilidad que la deuda externa de Nicaragua se reduzca a la mitad en los siguientes 10 años.
• Probabilidad que la selección mayor de béisbol de Nicaragua gane el clásico mundial de 2021.
• Probabilidad que una mujer indígena sea electa presidente de Nicaragua en 2021.
• Probabilidad que una mujer juegue en un equipo de MLB (Mayor League Baseball).
La probabilidad condicional de dos eventos es la probabilidad de que el primer evento ocurra condicio-
nado a que ya ha ocurrido el primero. En otras palabras, la probabilidad condicional de un evento es la
probabilidad obtenida en base a la información de algún otro evento que ya ocurrió.
Dado dos eventos A1 y A2 , la probabilidad condicional del evento A1 , dado que el evento A2 ha ocurrido
está dada por la siguiente ecuación.
P (A1 ∩ A2 )
P (A1 |A2 ) = , P (A2 ) 6= 0 (5.5.1)
P (A2 )
58 CAPÍTULO 5. PROBABILIDADES
La probabilidad condicional del evento A2 , dado que el evento A1 ha ocurrido está dada por:
P (A1 ∩ A2 )
P (A2 |A1 ) = , P (A1 ) 6= 0 (5.5.2)
P (A1 )
Ejemplo 5.5.2.
Suponga que cuando un candidato llega a una entrevista para un trabajo en la RJB Enterprises, la
probabilidad de que desee el trabajo (A) después de la entrevista es 0.68. Del mismo modo, la probabilidad
que RJB desee al candidato (B) es 0.36. La probabilidad P (A|B) = 0.88. Encuentre P (B|A).
P (A ∩ B)
P (A|B) = ⇒ P (A ∩ B) = P (B)P (A|B) = (0.36)(0.88) = 0.3168
P (B)
P (A ∩ B) 0.3168
P (B|A) = = = 0.4659
P (A) 0.68
La probabilidad que RBJ desee al candidato dado que éste también desea el trabajo después de la entre-
vista es 0.4659.
Ejemplo 5.5.3.
Un embarque de toronjas llegó conteniendo las siguientes proporciones de tipos: 10 % rosas sin semilla,
20 % blancas sin semilla, 30 % rosas con semillas, y 40 % blancas con semillas. Una toronja se selecciona
al azar del embarque. Encuentre la probabilidad de que sea rosa dado que es sin semilla y sin semilla
dado que es rosa.
Solución: Sean los eventos: R es rosa, S con semilla, S sin semilla, entonces:
P (R ∩ S)
P (R|S) =
P (S)
La probabilidad de rosa sin semilla está dada por P (R ∩ S) = 10 % = 0.1. El 10 % de las toronjas son rosas
sin semillas y el 20 % blancas sin semillas, por tanto, las toronjas sin semillas entre rosas y blancas son:
30 % 0.30
P (S) = = = 0.30
100 % 1.0
P (R ∩ S) 0.1
P (R|S) = = = 0.333
P (S̄) 0.30
P (S ∩ R)
P (S|R) =
P (R)
5.6. REGLAS DE LA PROBABILIDAD 59
La probabilidad de sin semilla y rosa es la misma que rosa sin semilla, es decir, P (R ∩ S) = 10 % = 0.1.
El 10 % de las toronjas son rosas sin semillas y el 30 % rosas con semillas, por tanto, las toronjas rosas,
tanto, con semillas como sin semillas son:
40 % 0.40
P (R) = = = 0.40
100 % 1.0
P (S ∩ R) 0.1
P (S|R) = = = 0.25
P (R) 0.40
En esta sección se definirán reglas para la adición y multiplicación de probabilidades para emplearlas
en cálculo de posibilidad de ocurrencia de dos o más eventos.
Dado los eventos A1 , A2 , . . . , An colectivamente exhaustivos, es decir, ocurren al mismo tiempo, entonces
la probabilidad que ocurra uno de ellos está dada por la probabilidad de la unión menos la probabilidad
de la intersección.
Ejemplo 5.6.1.
Una cadena de hamburgueserías observó que el 75 por ciento de todos los clientes consume mostaza, el
80 por ciento consume ketchup y el 65 por ciento consume los dos. ¿Cuál es la probabilidad de que un
cliente consuma al menos uno de los dos?
Solución: Sea A el evento “el cliente consume mostaza” y B el evento “el cliente consume ketchup”, por
tanto, P (A) = 0.75, P (B) = 0.80 y P (A ∩ B) = 0.65, así:
Ejemplo 5.6.2.
Una organización benéfica vende 1000 billetes de lotería. Hay 10 premios grandes y 100 premios pequeños
y todos deben repartirse. El proceso de selección de los ganadores es tal que al principio todos los billetes
tienen las mismas probabilidades de ganar un premio grande y todos tienen las mismas probabilidades
de ganar un premio pequeño. Ninguno puede ganar más de un premio.
Solución:
a. De los 1000 billetes, 10 ganarán premios grandes. Sea A: el billete seleccionado gana un premio grande.
10
P (A) = = 0.01 = 1 %
1000
b. 100 billetes ganarán premios pequeños. Sea B: el billete seleccionado gana un premio pequeño.
100
P (A) = = 0.1 = 10 %
1000
c. El evento “el billete gana algún premio” es la unión de los sucesos A y B. Como solo se permite un
premio, éstos son mutuamente excluyentes, y
P (A1 ∩ A2 ∩ · · · ∩ An ) = P (A1 )P (A2 |A1 )P (A3 |A1 ∩ A2 ) · · · P (An |A1 ∩ A2 ∩ · · · ∩ An−1 ) (5.6.4)
La ecuación 5.6.4 está escrita de manera general, en el caso particular de dos eventos dependientes A1
y A2 , la probabilidad que A1 y A2 ocurran es:
Ejemplo 5.6.3.
Wally, propietario de Wally’s Workout World, desea construir un perfil de miembros para desarrollar una
campaña publicitaria que atraiga a clientes potenciales típicos de quienes actualmente prefieren este gim-
nasio. El 30 % de los miembros actuales son mujeres, el 80 % de ellas es menor de 30 años. El 60 % de
los hombres son menores de 30 años. Cuál es la probabilidad de que un miembro seleccionado de manera
aleatoria sea:
d. Mayor de 30 años
e. Un hombre o una mujer mayor de 30 años
Solución: Sean M “el cliente es mujer”, H “el cliente es hombre” y m “el cliente es menor de 30 años”.
P (A2 |A1 ) = P (A2 ), P (A3 |A1 ∩ A2 ) = P (A3 ), . . . , P (An |A1 ∩ A2 ∩ · · · ∩ An−1 ) = P (An ) (5.6.6)
Para dos eventos, se dice que dos eventos A1 y A2 son independientes si y sólo si la probabilidad de A1
no cambia la probabilidad A2 y viceversa, además cumplen las siguientes condiciones:
• P (A|B) = P (A)
• P (B|A) = P (B)
• P (A ∩ B) = P (A)P (B)
Ejemplo 5.6.4.
Solución: Sea T el evento de sobrevivir a la operación de trasplante y R el evento el cuerpo del paciente
rechace el trasplante en menos de un mes, así:
P (T ) = 0.55, P (R) = 0.20. La probabilidad de que el cuerpo del paciente no rechace el trasplante en menos
de un mes está dada por P (R) = 1 − P (R) = 1 − 0.20 = 0.80. La probabilidad que sobreviva a la operación
de trasplante y no lo rechace en menos de un mes, es:
Ejemplo 5.6.5.
La fábrica Ford inscribe en una carrera tres pilotos A, B y C. La probabilidad de llegar entre los tres
primeros lugares son: P (A) = 0.1, P (B) = 0.2 y P (C) = 0.3. Calcule la probabilidad que ninguno de los tres
clasifique y la probabilidad que los tres clasifiquen.
Solución: En este caso la probabilidad del piloto A no está influenciada por la de B y C, la de B no afecta
a la de A y C y así sucesivamente, por tanto, los eventos son mutuamente independientes.
P (A) = 1 − P (A) = 1 − 0.1 = 0.9; P (B) = 1 − P (B) = 1 − 0.2 = 0.8 y P (C) = 1 − P (C) = 1 − 0.3 = 0.7
Ejemplo 5.6.6.
Las dos estrellas del equipo profesional de baloncesto Miami Heat son muy diferentes cuando se trata de
tiros libres. La ESPN.com informa que Jason Williams encesta alrededor de 80 % de sus tiros libres, en tanto
que Shaquille O’Neal encesta sólo 53 % de sus tiros libres. Suponga que los tiros libres son independientes
y que cada jugador toma dos tiros libres durante un juego en particular.
b. Se quiere que enceste uno de los dos, entonces, seguiremos el orden: encesta el primero y no el segundo,
luego, no encesta el primero
y encesta el segundo. La probabilidad de que no enceste el segundo está
dada por P segundo = 1 − 0.53 = 0.47 y la de no encestar el primero es P primero = 1 − 0.53 = 0.47,
así:
P primero ∩ segundo = P primero · P (segundo) = (0.47)(0.53) = 0.2491
P primero ∩ segundo = P (primero) · P segundo = (0.53)(0.47) = 0.2491
La probabilidad que enceste exactamente un tiro libre está dada por:
¯ = P (S) · P (J)
P (S ∩ J) ¯ = (0.2809)(0.04) = 0.011236
5.7. REGLA DE BAYES 63
Se aborda el primer caso en el que se desea calcular la probabilidad total de un determinado evento a
partir de probabilidades condicionales, veamos el siguiente teorema llamado teorema de probabilidad
total o regla de eliminación.
Si los eventos B1 , B2 , . . . , Bn constituyen una partición del espacio muestral S, tal que P (Bi ) 6= 0 para
i = 1, 2, . . . , n, entonces, para cualquier evento A de S,
k
X k
X
P (A) = P (Bi ∩ A) = P (Bi )P (A|Bi ) (5.7.1)
i=1 i=1
Ejemplo 5.7.1.
Una empresa de transportes cubre tres líneas: A, B y C con el 50, 30 y 20 % de sus camiones. La proba-
bilidad de que estos queden en pana son 3 %, 4 % y 1 % respectivamente. Determinar la probabilidad que
un día haya un camión en pana.
Solución: Sea P el evento el camión está en pana, entonces: P (P |A) = 0.03, P (P |B) = 0.04, P (P |C) =
0.01, P (A) = 0.50, P (B) = 0.30 y P (C) = 0.20, por el teorema de la probabilidad total se tiene:
Ejemplo 5.7.2.
En una población el 70 % de los habitantes son mestizos (M ), el 25 % son garífunas (G) y el 5 % mayangnas
(My ). El 70 % de los mestizos son católicos (C) y lo mismo ocurre con el 60 % de los garífunas y el 10 % de
los mayangnas. Se toma una persona al azar, calcule la probabilidad que la persona sea católica.
Solución: P (M ) = 0.70, P (G) = 0.25, P (My ) = 0.05, P (C|M ) = 0.70, P (C|G) = 0.60 y P (C|My ) = 0.10, por el
teorema de la probabilidad total, tenemos:
La regla de Bayes es llamada así en honor al reverendo Thomas Bayes (1702-1761), quien desarrolló
este concepto útil para calcular probabilidades condicionales de cualquier evento aleatorio.
64 CAPÍTULO 5. PROBABILIDADES
Si los eventos B1 , B2 , . . . , Bn constituyen una partición del espacio muestral S, tal que P (Bi ) 6= 0 para
i = 1, 2, . . . , n, entonces, para cualquier evento A de S, con P (A) 6= 0
Ejemplo 5.7.3.
Un empresario tiene dos negocios N1 y N2 . El negocio N1 produce una ganancia (G) de 20 % y N2 solo un
4 %. Se toma un balance al azar. ¿Probabilidad que sea del negocio N1 ?
Solución: P (G|N1 ) = 0.20, P (G|N2 ) = 0.04, P (N1 ) = 0.50 y P (N2 ) = 0.50, por la regla de Bayes, tenemos:
0.10 0.10
= = = 0.8333
0.10 + 0.02 0.12
Ejemplo 5.7.4.
Una empresa de transportes cubre tres líneas: A, B y C con el 50, 30 y 20 % de sus camiones. La probabi-
lidad de que estos queden en pana (P ) son 3 %, 4 % y 1 % respectivamente. Sabiendo que un camión está
en pana, determine la probabilidad que sea de la línea B.
Solución: P (P |A) = 0.03, P (P |B) = 0.04, P (P |C) = 0.01, P (A) = 0.50, P (B) = 0.30 y P (C) = 0.20, por la
regla de Bayes, tenemos:
P (B)P (P |B)
P (B|P ) =
P (B)P (P |B) + P (A)P (P |A) + P (C)P (P |C)
(0.30)(0.04) 0.012
= =
(0.30)(0.04) + (0.50)(0.03) + (0.20)(0.01) 0.012 + 0.015 + 0.002
0.012
= = 0.4138
0.029
La probabilidad que el camión sea de la línea B, dado que esté en pana es de 0.4138.
Las tablas de contingencia son útiles para calcular probabilidades de eventos. La Tabla 5.1 mostrada a
continuación es un ejemplo de tabla de contingencia.
5.8. TABLAS DE CONTINGENCIA 65
Los valores en los márgenes de la tabla se llaman probabilidades marginales, por ejemplo, la probabi-
lidad de seleccionar a una persona de la etnia mayangna es 0.2581 y la probabilidad de seleccionar a
una mujer es 0.4194.
Las probabilidades de intersección son los valores que se encuentran en la intersección de una fila con
una columna, por ejemplo la probabilidad de que sea hombre y mestizo es P (Hombre ∩ Mestizo) = 0.2581
y la probabilidad de seleccionar a una mujer Miskitu es P (Mujer ∩ Miskitu) = 0.0323.
También es posible calcular probabilidades condicionales, a partir de las tablas de probabilidad, por
ejemplo, supongamos que queremos calcular la probabilidad de seleccionar a una persona Mayangna
dado que es hombre.
5.9. Ejercicios
1. Un experimento consta de tres pasos; para el primer paso hay tres resultados posibles, para
el segundo hay dos resultados posibles y para el tercer paso hay cuatro resultados posibles.
¿Cuántos resultados distintos hay para el experimento completo?
2. Un experimento que tiene tres resultados es repetido 50 veces y se ve que E1 aparece 20 veces,
E2 13 veces y E3 17 veces. Asigne probabilidades a los resultados. ¿Qué enfoque empleó?
3. Hay personas que apoyan la reducción de los impuestos federales con el fin de incrementar los
gastos del consumidor, aunque otros están en contra. Se seleccionan dos personas y se registran
sus opiniones. Si ninguna está indecisa, elabore una lista de los posibles resultados.
4. Un inspector de control de calidad selecciona una pieza para probarla. Enseguida, la pieza se
declara aceptable, reparable o chatarra. Entonces se prueba otra pieza. Elabore una lista de los
posibles resultados de este experimento relacionado con dos piezas.
5. Una compañía grande que debe contratar un nuevo presidente, prepara una lista final de cinco
candidatos, todos los cuales tienen las mismas cualidades. Dos de los candidatos son miembros
de un grupo minoritario. Para evitar que el prejuicio influya al momento de elegir al candidato, la
compañía decide elegir al presidente por sorteo.
a. ¿Cuál es la probabilidad de que uno de los candidatos que pertenece a un grupo minoritario
sea contratado?
b. ¿Qué enfoque de probabilidad utilizó para hacer este cálculo?
6. Douglas Bobadilla, jardinero izquierdo del equipo de béisbol de Siuna consigue 30 hits en 100
turnos al bate. Calcule la probabilidad de que consiga un hit en su siguiente turno al, ¿qué
enfoque de probabilidad utilizó?
7. Una empresa promoverá a dos empleados de un grupo de seis hombres y tres mujeres.
a. Elabore una lista de los resultados de este experimento, si existe un interés particular con
la igualdad de género.
b. ¿Qué enfoque de probabilidad utilizaría para calcular estas probabilidades?
8. Se selecciona al azar una carta de una baraja convencional de 52 cartas. ¿Cuál es la probabilidad
de que la carta resulte reina?, ¿qué enfoque de la probabilidad empleó para responder la pregunta?
9. El Center for Child Care publica información sobre 539 niños, así como el estado civil de sus
padres. Hay 333 casados, 182 divorciados y 24 viudos. ¿Cuál es la probabilidad de que un niño
elegido al azar tenga un padre divorciado?, ¿qué enfoque utilizó?
10. Una jugadora de baloncesto acierta en 70 % de sus tiros libres. Cuando ella lanza un par de tiros
libres, los cuatro eventos sencillos posibles y tres de sus probabilidades asociadas se dan en la
siguiente tabla.
11. Durante el año anterior, las ventas semanales en Petunia’s Pet Shoppe han sido “bajas” durante
16 semanas, “considerables” durante 27 semanas y “altas” el resto de las semanas. Cuál es la
probabilidad de que las ventas de esta semana sean:
a. Considerables
b. Bajas
c. Altas
d. Por lo menos considerables
5.9. EJERCICIOS 67
Probabilidad condicional
12. En un estudio de Morgan Stanley Consumer Research se muestrearon hombres y mujeres y se
les preguntó qué preferían tomar: agua de botella o una bebida deportiva como Gatorade o Propel
Fitness (The Atlanta Journal-Constitution, 28 de diciembre de 2005). Suponga que en el estudio
hayan participado 200 hombres y 200 mujeres y que de todos 280 hayan preferido el agua de
botella. En el grupo de los que preferían bebidas deportivas, 80 eran hombres y 40 eran mujeres.
Sea
M el evento el consumidor es hombre W el evento el consumidor es mujer B el evento el consu-
midor prefiere agua de botella S el evento el consumidor prefiere una bebida deportiva
a. ¿Cuál es la probabilidad de que en este estudio una persona prefiera agua de botella?
b. ¿De que en este estudio una persona prefiera una bebida deportiva?
c. ¿Cuáles son las probabilidades condicionales P(M |S) y P (W |S)?
d. Dado que un consumidor es hombre, ¿cuál es la probabilidad de que prefiera una bebida
deportiva?
e. Ya que un consumidor es mujer, ¿cuál es la probabilidad de que prefiera una bebida depor-
tiva?
Género
Femenino Masculino
Satisfecho 80 55
No satisfecho 120 45
a. P (Satisfecho)
b. P (Satisfecho|Femenino)
b. P (Satisfecho|Masculino)
15. A y B son eventos definidos en un espacio muestral, con P (B) = 0.4 y P (A ∩ B) = 0.5. Encuentre
P (A|B).
16. Juan vive en una gran ciudad y viaja diariamente a su trabajo en transporte colectivo metro o en
taxi. Toma el metro 80 % del tiempo porque cuesta menos, y toma taxi el otro 20 % del tiempo.
Cuando toma el metro, llega a su trabajo a tiempo 70 % de las veces, mientras que llega a tiempo
90 % de las veces cuando viaja en taxi.
17. Suponga que A y B son eventos definidos en un espacio muestral común y que se conocen las
siguientes probabilidades: P (A) = 0.4, P (B) = 0.3, y P (A ∪ B) = 0.66. Encuentre P (A|B).
18. Suponga que A y B son eventos definidos en un espacio muestral común y que se conocen las
siguientes probabilidades: P (A) = 0.5, P (A ∩ B) = 0.24, y P (A|B) = 0.4. Encuentre P (A ∪ B).
68 CAPÍTULO 5. PROBABILIDADES
Reglas de la probabilidad
19. Las autoridades de Clarkson University realizaron un sondeo entre sus alumnos para conocer su
opinión acerca de su universidad. Una pregunta fue si la universidad no satisface sus expecta-
tivas, si las satisface o si supera sus expectativas. Encontraron que 4 % de los interrogados no
dieron una respuesta, 26 % respondieron que la universidad no llenaba sus expectativas y 56 %
indicó que la universidad superaba sus expectativas.
a. Si toma un alumno al azar, ¿cuál es la probabilidad de que diga que la universidad supera
sus expectativas?
b. Si toma un alumno al azar, ¿cuál es la probabilidad de que diga que la universidad satisface
o supera sus expectativas?
20. A Casey le gusta mucho tomar café a media mañana y siempre para en una de sus cafeterías
preferidas para tomarlo. Cuando toma comida para llevar, hay un 0.6 de probabilidad de que
siempre coma un pastel. Toma café y pastel como comida para llevar con una probabilidad de
0.48. ¿Cuál es la probabilidad de que tome comida para llevar?
21. En una encuesta aplicada a los suscriptores de una revista se encontró que en los últimos 12
meses 45.8 % habían rentado un automóvil por razones de trabajo, 54 % por razones personales
y 30 % por razones de trabajo y personales.
22. Jason asiste a reuniones de su secundaria. De los que asisten, 50 % son mujeres. El conocimiento
común dice que 88 % de las personas son derechas. Siendo zurdo, Jason sabe que de un grupo
grande de personas, sólo alrededor de 6 % son zurdos, hombres. Si Jason habla a la primera
persona que se encuentre en la reunión, ¿cuál es la probabilidad de que la persona sea hombre o
zurdo?
23. Reggie Miller de los Indiana Pacers tiene el record de la National Basketball Association de más
canastas de 3 puntos anotadas en toda una carrera, acertando en 85 % de sus tiros (USA Today,
22 de enero de 2004). Suponga que ya casi al final de un juego cometen una falta contra él y le
conceden dos tiros.
24. Un establecimiento de piezas de repuesto vende piezas nuevas y usadas. Sesenta por ciento de
las piezas en existencia son usadas. Sesenta y uno por ciento son piezas usadas o defectuosas.
Si 5 % de las piezas del establecimiento son defectuosas, ¿qué porcentaje es de partes usadas y
defectuosas?
25. Un sistema detector de humo utiliza dos aparatos, A y B. Si hay humo, la probabilidad de que
éste sea detectado por el aparato A es 0.95; por el aparato B, 0.98; y por ambos aparatos, 0.94.
a. Si hay humo, encuentre la probabilidad de que éste sea detectado por el aparato A o el B o
por ambos aparatos.
b. Encuentre la probabilidad de que el humo no sea detectado.
26. Un estudiante se selecciona del alumnado de su universidad. Defina los siguientes eventos: M, el
estudiante seleccionado es masculino; F, el estudiante seleccionado es femenino; S, el estudiante
seleccionado está registrado para estadística.
27. Un estudiante es seleccionado al azar de un grupo de 200 estudiantes que se sabe está formado
por 140 estudiantes de tiempo completo (80 mujeres y 60 hombres) y 60 estudiantes de tiem-
po parcial (40 mujeres y 20 hombres). El evento A es “el estudiante seleccionado es de tiempo
completo”, y el evento C es “el estudiante seleccionado es mujer”.
28. Una caja contiene cuatro fichas de póker rojas y tres azules. Tres fichas de póker han de ser
seleccionadas, una a la vez.
a. ¿Cuál es la probabilidad de que las tres fichas sean rojas si la selección se hace con restitu-
ción?
b. ¿Cuál es la probabilidad de que las tres fichas sean rojas si la selección se hace sin restitu-
ción?
29. El presidente de la junta directiva afirma: “Hay 50 % de posibilidades de que esta compañía obten-
ga utilidades; 30 % de que termine sin pérdidas ni ganancias y 20 % de que pierda dinero durante
el próximo trimestre.”
a. Aplique una de las reglas de la adición para determinar la probabilidad de que la compañía
no pierda dinero el siguiente trimestre.
b. Aplique la regla del complemento para determinar la probabilidad de que no pierda dinero
el próximo trimestre.
30. Una caja contiene 25 piezas, de las cuales 3 son defectuosas y 22 no son defectuosas. Si 2 partes
se seleccionan sin restitución, encuentre las siguientes probabilidades:
31. Suponga que la probabilidad de que saque una A en esta clase es de 0.25 y que la probabilidad
de obtener una B es de 0.50. ¿Cuál es la probabilidad de que su calificación sea mayor que C?
32. Use relaciones de evento para llenar los espacios en blanco de la tabla siguiente.
33. Un estudiante toma dos cursos, historia y matemáticas. La probabilidad de que el estudiante pase
el curso de historia es de 0.60 y la probabilidad de que pase el curso de matemáticas es de 0.70.
La probabilidad de pasar ambos es de 0.50. ¿Cuál es la probabilidad de pasar por lo menos uno?
34. Una encuesta sobre tiendas de comestibles del sureste de Estados Unidos reveló que 40 % tenían
farmacia, 50 % tenían florería y 70 % tenían salchichonería. Suponga que 10 % de de las tiendas
cuentan con los tres departamentos, 30 % tienen tanto farmacia como salchichonería, 25 % tienen
florería y salchichonería y 20 % tienen tanto farmacia como florería.
a. ¿Cuál es la probabilidad de seleccionar una tienda de manera aleatoria y hallar que cuenta
con farmacia y florería?
b. ¿Cuál es la probabilidad de seleccionar una tienda de manera aleatoria y hallar que cuenta
con farmacia y salchichonería?
c. ¿Cuál es la probabilidad de seleccionar una tienda que no incluya los tres departamentos?
35. Un banco local informa que 80 % de sus clientes tienen cuenta de cheques; 60 % tiene cuenta de
ahorros y 50 % cuentan con ambas. Si se elige un cliente al azar, ¿cuál es la probabilidad de que
el cliente tenga ya sea una cuenta de cheques o una cuenta de ahorros?
36. All Seasons Plumbing tiene dos camiones de servicio que se descomponen con frecuencia. Si la
probabilidad de que el primer camión esté disponible es de 0.75, la probabilidad de que el segundo
camión esté disponible es de 0.50 y la probabilidad de que ambos estén disponibles es de 0.30,
¿cuál es la probabilidad de que ningún camión se encuentre disponible?
70 CAPÍTULO 5. PROBABILIDADES
37. De 1,000 jóvenes de 18 años, 600 tienen empleo y 800 son bachilleres. De los 800 bachilleres,
500 tienen trabajo. Cuál es la probabilidad de que un joven de 18 años tomado aleatoriamente
sea:
38. Sammy’s Sweat Shop vende dos tipos de zapatos para correr, los Mercury y los Racer. Las proba-
bilidades de que un cliente dado compre los Mercury es de P (M ) = 0.40 y la probabilidad de que
compre los Racer es de P (R) = 0.30. La probabilidad de que compre ambos es P (M ∩ R) = 0.10.
¿Cuál es la probabilidad de que un cliente compre o M o R?
39. Un corredor de bolsa sabe por experiencias anteriores que la probabilidad de que un cliente
compre acciones es del 65 %. La probabilidad de que el cliente compre un bono del gobierno si ya
tiene acciones es del 35 %.
40. La ruta utilizada por un automovilista para trasladarse a su trabajo contiene dos intersecciones
con señales de tránsito. La probabilidad de que tenga que detenerse en la primera señal es 0.4, el
problema análogo para la segunda señal es 0.5 y la probabilidad de que tenga que detenerse en
por lo menos una de las dos señales es 0.6. ¿Cuál es la probabilidad de que tenga que detenerse
a. en ambas señales?
b. en la primera señal pero no en la segunda?
c. en exactamente una señal?
Tablas contingencia
41. Usted recolectó datos sobre 500 economistas en la academia, la industria privada, y el gobierno
respecto a sus opiniones sobre si la economía podría ser estable, podría expandirse o podría entrar
en un período de contracción en el futuro próximo. Sin embargo, parte de la información se perdió,
resultando la siguiente tabla de contingencia parcial. Con base en los datos restantes, cree una
tabla de probabilidad.
Economía
Economistas Estable (S) Expansión (E) Contracción (C) Total
Academia (A) 125 100
Industria privada (I) 35 110
Gobierno (G) 25 40 65
Total 200
a. P (G) c. P (A ∩ E)
b. P (A ∩ S) d. P (G ∩ C)
42. La revista Forbes (febrero de 1997) clasificó las 120 ciudades de Estados Unidos de acuerdo con
la calidad de vida, con base en parte del porcentaje de empleados que tenían título universitario.
Los resultados se ven en la siguiente tabla de contingencia parcial, en donde A es menos del 15 %
con título universitario, B es del 15 al 20 % con título universitario y C es más del 20 % con título
universitario. Realice una tabla de probabilidad y responda las preguntas que se presentan en la
siguiente tabla.
De la tabla de probabilidad halle:
5.9. EJERCICIOS 71
Calidad de vida
Porcentaje con título universitario Pobre (P) Bueno (G) Excelente (E) Total
A 10 20 40
B 20
C 10 20
Total 20 60
a. P (A) d. P (E ∩ C)
c. P (P ∩ B) e. P (A ∩ G)
43. Es frecuente que hombres y mujeres no estén de acuerdo en qué piensan acerca de seleccionar
una pareja. Suponga que una encuesta hecha a 1000 personas de entre 20 y 30 años dio las
siguientes respuestas, a la pregunta si es más importante para su futura pareja ser capaz de
comunicar sus sentimientos (F) de los que es para esa persona vivir bien (G).
Si al zar se selecciona una persona de entre este grupo de 1000, calcule las siguientes probabili-
dades:
a. P (F ) d. P (F |M )
b. P (G) e. P (H|F )
c. P (F |H) f. P (M |G)
44. Durante la temporada inaugural de la liga mayor de fútbol soccer en Estados Unidos, los equipos
médicos documentaron 256 lesiones que causaron la pérdida de tiempo de participación a jugado-
res. Los resultados de esta investigación, publicados en The American Journal of Sports Medicine,
se muestran en la tabla siguiente.
Si un individuo es sacado al azar de entre este grupo de 256 jugadores de fútbol soccer, encuentre
las siguientes probabilidades:
a. P (A) e. P (G|B)
b. P (G) f. P (G|C)
c. P (A ∩ G) g. P (C|P )
d. P (G|A) h. P B
47. Un bolso contiene 3 monedas, una de las cuales tiene dos caras, mientras las otras dos son
normales. Se toma una moneda al azar y se lanza 4 veces sucesivamente obteniéndose 4 caras.
Probabilidad que la moneda tomada sea la de dos caras.
48. Un curso tiene un 60 % de alumnos y 40 % de alumnas. El 40 % de los hombres y el 60 % de las
mujeres fuman. Probabilidad que, tomado al azar un estudiante que fume, sea hombre.
49. Una empresa telefónica regional opera tres estaciones de retransmisión idénticas en diferentes
sitios. A continuación se muestra el número de desperfectos en cada estación reportados durante
un año y las causas de éstos.
Estación
Problema A B C
Con el suministro de electricidad 2 1 1
Falla de la computadora 4 3 2
Fallas del equipo eléctrico 5 4 2
Fallas ocasionadas por otros errores humanos 7 5 5
Suponga que se reporta una falla y que se descubre que fue ocasionada por otros errores huma-
nos. ¿Cuál es la probabilidad de que provenga de la estación C?
50. Una cadena de tiendas de pintura produce y vende pintura de látex y semiesmaltada. De acuerdo
con las ventas a largo plazo, la probabilidad de que un cliente compre pintura de látex es 0.75.
De los que compran pintura de látex, 60 % también compra rodillos. Sin embargo, sólo 30 % de
los que compran pintura semiesmaltada compra rodillos. Un comprador que se selecciona al azar
adquiere un rodillo y una lata de pintura. ¿Cuál es la probabilidad de que sea pintura de látex?
51. Una población se puede dividir en dos subgrupos que se presentan con probabilidades de 60 %
y 40 %, respectivamente. Un evento A ocurre 30 % del tiempo en el primer subgrupo y 50 % del
tiempo en el segundo subgrupo. ¿Cuál es la probabilidad incondicional del evento A, cualquiera
que sea el subgrupo de donde venga?
52. Los registros de delincuencia urbana muestran que 20 % de todos los delitos son violentos y que
80 % no lo son, abarcando robo, falsificación, etcétera. Noventa por ciento de los delitos violentos
son denunciados contra 70 % de los no violentos.
53. El equipo de béisbol Leones de Léon, participa en la liga de primera división de béisbol Germán
Pomares Ordóñez de Nicaragua, juega 80 % de sus partidos por la noche y 20 % de día. El equipo
gana 90 % de los juegos nocturnos y 70 % de los juegos de día. De acuerdo con el reporte del
periódico de hoy, ganaron el día de ayer. ¿Cuál es la probabilidad de que el partido se haya jugado
de noche?
54. Una empresa de consultoría presenta una oferta para un gran proyecto de investigación. El di-
rector de la firma piensa inicialmente que tiene 50 % de posibilidades de obtener el proyecto. Sin
embargo, mas tarde, el organismo al que se le hizo la oferta pide más información sobre la oferta.
Por experiencia se sabe que en 75 % de las ofertas aceptadas y en 40 % de las ofertas no aceptadas,
este organismo solicita más información.
a. ¿Cuál es la probabilidad previa de que la oferta sea aceptada (es decir, antes de la solicitud
dé más información)?
b. ¿Cuál es la probabilidad condicional de que se solicite más información dado que la oferta
será finalmente aceptada?
c. Calcule la probabilidad posterior de que la oferta sea aceptada dado que se solicitó más
información.
55. En los automóviles pequeños el rendimiento de la gasolina es mayor, pero no son tan seguros como
los coches grandes. Los automóviles pequeños constituyen 18 % de los vehículos en circulación,
pero en accidentes con automóviles pequeños se registraron 11, 898 victimas mortales en uno
de los últimos años (Reader’s Digest, mayo de 2000). Suponga que la probabilidad de que un
automóvil pequeño tenga un accidente es 0.18. La probabilidad de que en un accidente con un
automóvil pequeño haya una víctima mortal es 0.128 y la probabilidad de que haya una víctima
mortal si el automóvil no es pequeño es 0.05. Usted se entera de un accidente en el que hubo una
víctima mortal. ¿Cuál es la probabilidad de que el accidente lo haya tenido un automóvil pequeño?
Capı́tulo 6
Modelos probabilísticos
Resultados de aprendizaje
Los modelos probabilísticos cambian en función del tipo de variable (discreta o continua) y con respecto
a las características del experimento. En este capítulo se estudian los modelos de probabilidad discreta:
distribución binomial y Poisson, y la distribución normal como modelo de probabilidad continua.
Una variable aleatoria es una función que asigna un valor, usualmente numérico, al resultado de un expe-
rimento aleatorio.
Ejemplo 6.1.1.
Lanzamos un dado dos veces y se anota el número de veces que sale el dos. El número dos puede aparecer
ni una vez, una vez y dos veces. La variable aleatoria es el número de 2 que se obtienen y los posibles
resultados (0, 1 y 2) son los valores de la variable aleatoria.
Las variables aleatorias se clasifican en discretas o continuas, es discreta si sus valores son números
enteros, este tipo de variables resultan principalmente del conteo. En el caso del ejemplo 6.1.1, la
variable aleatoria (número de dos que se obtienen) es discreta, porque sus valores son 0, 1 y 2.
73
74 CAPÍTULO 6. MODELOS PROBABILÍSTICOS
Las variables aleatorias continuas son aquellas cuyos valores admiten números decimales, es decir,
toma valores dentro de un rango dado, estas variables resultan de la medición.
Ejemplo 6.1.2.
La distribución binomial es una distribución de probabilidad para variable aleatoria discreta. En esta
distribución cada ensayo termina en sólo uno de dos resultados mutuamente excluyentes, uno de los
cuales se identifica como éxito (p) y el otro como fracaso (1 − p).
n!
P (X = x) = px (1 − p)n−x =n Cx (p)x (1 − p)n−x (6.2.1)
x!(n − x)!
µ = E(x) = np (6.2.2)
La desviación estándar de la distribución binomial es la raíz cuadrada del producto de su media con la
probabilidad de fracaso, es decir:
p
σ= np(1 − p) (6.2.3)
6.2. DISTRIBUCIÓN BINOMIAL 75
Arlen Wong, es agente de seguros, contacta con cinco personas y cree que la probabilidad de vender un
seguro a cada una es de 0.40.
Solución: En este caso tenemos dos posibles resultados, vender o no vender seguros, los datos iniciales
son: p = 0.40, 1 − p = 1 − 0.40 = 0.60 y n = 5, así:
Ejemplo 6.2.2.
Solución:
Este modelo de probabilidad para variable aleatoria discreta fue desarrollado por el matemático francés
Simeon Poisson (1781-1840), con el propósito de estimar la probabilidad de un evento aleatorio sobre
algún intervalo de tiempo o espacio. La función de probabilidad de Poisson se expresa mediante la
siguiente ecuación.
µx e−µ
P (X = x) = (6.3.1)
x!
donde x es el número de veces que ocurre el evento, µ es el promedio de ocurrencias por unidad de
tiempo o de espacio y e ≈ 2.71828 es la base del logaritmo natural. La distribución de Poisson tiene las
siguientes características:
• La probabilidad de ocurrencia del evento es la misma para dos intervalos cualesquiera de tiempo o
espacio.
• La ocurrencia del evento en un intervalo es independiente de la ocurrencia de cualquier otro intervalo.
Ejemplo 6.3.1.
El gerente de control de calidad de Marylin’s Cookies inspecciona un lote de galletas de chispas de choco-
late que sale del horno. Si el proceso de producción está bajo control, el promedio de chispas de chocolate
por galleta es 6.0, ¿cuál es la probabilidad de que en cualquier galleta inspeccionada, se encuentren
60 e−6 (1)(0.002479)
P (X = 0) = = = 0.002479
0! 1
61 e−6 (6)(0.002479)
P (X = 1) = = = 0.014874
1! 1
62 e−6 (36)(0.002479)
P (X = 2) = = = 0.044622
2! 2
63 e−6 (216)(0.002479)
P (X = 3) = = = 0.089244
3! 6
64 e−6 (1296)(0.002479)
P (X = 4) = = = 0.133866
4! 24
1 1 X−µ 2
f (X) = √ e− 2 ( σ ) , X ∈ R (6.4.1)
σ 2π
• Tiene forma de campana con un pico en el centro de la distribución. La media aritmética, la mediana
y la moda son iguales, y se localizan en el centro de la distribución. El área total bajo la curva es de
1.00. La mitad del área bajo la curva normal se localiza a la derecha de este punto central, y la otra
mitad, a la izquierda.
• Es simétrica con respecto a la media. La parte derecha aglomera la mitad del área total, 0.500, al
igual que la parte izquierda.
• La distribución es asintótica, es decir, las colas de la curva se extienden indefinidamente en ambas
direcciones sin tocar el eje x.
• La localización de una distribución normal se determina mediante la media, µ. La dispersión o propa-
gación de la distribución se determina por medio de la desviación estándar σ.
La Figura 6.1 muestra la representación gráfica de la distribución normal con algunas de las propiedades
descritas anteriormente.
0.5000 0.5000
Cola izquierda Cola derecha
−∞ µ = x̄ = Me +∞
En muchas ocasiones se desea que las observaciones se localicen a una, dos o tres desviaciones estándar
con respecto a la media, sin tener en cuenta el valor de la media o la desviación estándar.
Un valor Z es la distancia positiva o negativa entre un valor seleccionado, a saber X, y la media µ, dividida
por la desviación estándar, σ.
X −µ
Z= (6.4.2)
σ
En pocas palabras, el valor Z representa la distancia o diferencia entre un valor particular X y la media
aritmética en unidades de desviaciones estándar.
Estandarizadas las observaciones con distribución normal, los valores Z se distribuyen normalmen-
te con una media de 0 y una desviación estándar de 1. Por tanto, la distribución Z posee todas las
características de cualquier distribución de probabilidad normal.
La tabla de la distribución normal (apéndice A.1) contiene una lista de las probabilidades de la distri-
bución de probabilidad normal estándar. Para usar la taba primero se debe desplazar por la primera
columna (Z) y luego a las filas.
Ejemplo 6.4.1.
Solución: La Tabla 6.1 es un fragmento de la tabla del apéndice A.1. Para calcular P (Z = 0.27), bajamos
en la columna hasta 0.2 y en la fila nos ubicamos en 0.07, obteniendo de esta manera que P (Z = 0.27) =
0.1064.
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
..
.
Ejemplo 6.4.2.
Solución: Bajamos en la columna hasta 0.1 y en la fila a 0.05, de esta manera encontramos que P (Z =
−0.15) = 0.0596, de hecho, P (Z = 0.15) = 0.0596.
6.4. DISTRIBUCIÓN NORMAL 79
Para calcular probabilidades bajo la distribución normal hay que convertir los valores de X en una
distribución normal estándar, es decir, expresar X como un valor Z y usar la tabla de la distribución
normal estándar del apéndice A.1 para calcular la probabilidad del valor Z bajo la campana de la
distribución normal.
Ejemplo 6.4.3.
X −µ 75 − 100
Z= = = −2.50
σ 10
De la tabla del apéndice A.1, tenemos que la probabilidad de Z = −2.50, es:
La siguiente figura muestra el área bajo la distribución normal que es equivalente a P (X > 75).
σ = 10
X
75 µ = 100
X −µ 85 − 100 X −µ 75 − 100
Z= = = −1.50 y Z= = = −2.50
σ 10 σ 10
De la tabla del apéndice A.1, tenemos que las probabilidades de Z = −1.50 y Z = −2.50, son:
En la siguiente figura se muestra el área bajo la distribución normal equivalente a P (75 < X < 85).
σ = 10
X
75 85 µ = 100
80 CAPÍTULO 6. MODELOS PROBABILÍSTICOS
X −µ 85 − 100
Z= = = −1.50
σ 10
De la tabla del apéndice A.1, tenemos que la probabilidad de Z = −1.50, es:
En la figura de abajo se representa P (X < 85) como área bajo la distribución normal.
σ = 10
X
85 µ = 100
Ejemplo 6.4.4.
En un proceso fotográfico, el tiempo de revelado de impresiones se puede considerar como una variable
aleatoria distribuida normalmente con µ = 15.40 segundos y σ = 0.48 segundos. Encuentre las probabili-
dades de que el tiempo que toma revelar una de las impresiones será
X −µ 16 − 15.40
Z= = = 1.25
σ 0.48
De la tabla del apéndice A.1, tenemos que la probabilidad de Z = 1.25, es:
La siguiente figura representa el área bajo la distribución normal que es equivalente a P (X ≥ 16.00).
σ = 0.48
X
µ = 15.40 16.0
X −µ 14.20 − 15.40
Z= = = −2.50
σ 0.48
6.4. DISTRIBUCIÓN NORMAL 81
σ = 0.48
X
14.20 µ = 15.40
La figura de abajo muestra P (15.00 < x < 15.80) como área bajo la distribución normal.
σ = 0.48
X
15.00 µ = 15.40 15.80
82 CAPÍTULO 6. MODELOS PROBABILÍSTICOS
6.5. Ejercicios
Distribución binomial
1. Determine lo siguiente:
a. X = 4? c. X < 2?
b. X ≤ 3? d. X > 1?
3. El Departamento de Transporte de Estados Unidos reportó que en 2009 Southwest superó a todas
las aerolíneas de ese país en las llegadas a tiempo para vuelos nacionales. con una tasa de 0.825.
Utilizando la distribución binomial, ¿cuál es la probabilidad de que en los siguientes seis vuelos
4. El 10 % de los discos de computador producidos por un nuevo proceso salen defectuosos. Si hay
20 discos en una caja:
5. Sólo 20 % de los empleados de la población civil que está en una base militar restringida porta
su identificación personal. Si llegan 10 empleados, cuál es la probabilidad de que el guardia de
seguridad encuentre:
6. Usted ha contratado 8 recepcionistas telefónicas para que tomen los pedidos telefónicos para
una línea de productos deportivos que su empresa está comercializando. Una recepcionista está
ocupada el 30 % del tiempo catalogando un pedido. Usted no desea que la probabilidad de que una
llamada del cliente se reciba con una señal de ocupado exceda del 50 %. ¿Debería usted contratar
más recepcionistas si 3 clientes llaman?
7. Un estudiante debe obtener por lo menos el 60 % en un examen de verdadero y falso con 18
preguntas por responder. Si el estudiante lanza una moneda para determinar la respuesta a cada
pregunta, ¿cuál es la probabilidad de que el estudiante pase?
8. Los radares militares y los sistemas para detección de misiles tienen por objeto advertir a un país
de un ataque enemigo. Una cuestión de confiabilidad es si el sistema de detección será capaz de
detectar un ataque y emitir un aviso. Suponga que la probabilidad de que un determinado sistema
de detección detecte un ataque con misiles es 0.90. Use la distribución de probabilidad binomial
para responder las preguntas siguientes.
c. Si se instalan tres sistemas, ¿cuál es la probabilidad de que por lo menos uno de los sistemas
detecte el ataque?
10. Veintitrés por ciento de los automóviles no cuenta con un seguro (CNN, 23 de febrero de 2006).
En un fin de semana determinado hay 35 automóviles que sufren un accidente.
Distribución de Poisson
11. Suponga una distribución Poisson.
12. Suponga que el número de errores de red experimentados en un día en una red de área local
(LAN) se distribuye como una variable aleatoria de Poisson. El número medio de errores de red
experimentados en un día es de 2.4, ¿cuál es la probabilidad de que en cualquier día dado
13. El gerente de control de calidad de Marilyn’s Cookies está inspeccionando de galletas con chispas
de chocolate que acaba de homearse. Si el proceso de producción está bajo control, el número
medio de partes de chocolate por galleta es 6.0. ¿Cuál es la probabilidad de que en cualquier
galleta en particular inspeccionada
14. A un conmutador de la oficina principal de la compañía llegan llamadas a un promedio de dos por
minuto y se sabe que tienen distribución de Poisson. Si el operador está distraído por un minuto,
cuál es la probabilidad de que el número de llamadas no respondidas sea:
a. ¿Cero?
b. ¿Por lo menos una?
c. ¿Entre 3 y 5, inclusive?
15. Un proceso de fabricación utilizado para hacer artefactos plásticos Incas presenta una tasa de
defectos de 5 por cada 100 unidades. Las unidades se envían a los distribuidores en lotes de 200.
Si la probabilidad de que más de 3 salgan defectuosos supera el 30 %, usted planea vender en su
lugar, camisetas Grateful Dead. ¿Cuál artículo agregará usted al inventario?
16. El Departamento de Transporte de Estados Unidos registra datos estadísticos de las quejas de
los consumidores por cada 100,000 pasajeros de aerolínea. Durante los primeros nueve meses
de 2009, las quejas de los consumidores fueron 0.99 por cada 100,000 pasajeros. ¿Cuál es la
probabilidad de que entre los siguientes 100,000 pasajeros
a. no haya quejas?
b. haya al menos una queja?
c. haya al menos dos quejas?
17. A la oficina de reservaciones de una aerolínea regional llegan 48 llamadas por hora.
18. Durante el periodo en que una universidad recibe inscripciones por teléfono, llegan llamadas a
una velocidad de una cada dos minutos.
19. Los pasajeros de las aerolíneas llegan en forma aleatoria e independiente al mostrador de revisión
de pasajeros. La tasa media de llegada es 10 pasajeros por minuto.
20. Cada año ocurren en promedio 15 accidentes aéreos (The World Almanac and Book of Facts, 2004).
Distribución normal
21. Suponga que durante los periodos de meditación trascendental la reducción del consumo de
oxígeno de una persona es una variable aleatoria que tiene una distribución normal con µ = 37.6 cc
por minuto y σ = 4.6 cc por minuto. Encuentre las probabilidades de que durante un periodo de
meditación trascendental el consumo de oxígeno de una persona se reducirá por
22. Suponga que la variable aleatoria z sigue una distribución normal estándar.
23. Se sabe que la cantidad de dinero que gastan los estudiantes en libros de texto en un año en una
universidad sigue una distribución normal que tiene una media de $380 y una desviación típica
de $50.
24. La demanda de consumo de un producto prevista para el próximo mes puede representarse por
medio de una variable aleatoria normal que tiene una media de 1,200 unidades y una desviación
típica de 100 unidades.
25. Una empresa produce sacos de un producto químico y le preocupa la cantidad de impurezas que
contienen. Se cree que el peso de las impurezas por saco sigue una distribución normal que tiene
una media de 12.2 gramos y una desviación típica de 2.8 gramos. Se elige aleatoriamente un saco.
26. Un contratista considera que el coste de cumplir un contrato es una variable aleatoria que sigue
una distribución normal que tiene una media de $500.000 y una desviación típica de $50.000.
¿Cuál es la probabilidad de que el coste de cumplir el contrato esté entre $460.000 y $540.000?
27. Se reportó que en 2008 el consumo de café per cápita en Estados Unidos era de 4.2 kg o 9.24
libras. Suponga que el consumo de café per cápita en Estados Unidos se distribuye aproxima-
damente como una variable aleatoria normal, con una media de 9.24 libras y una desviación
estándar de 3 libra.
28. Toby’s Trucking Company determinó que la distancia que cada camión recorre al año se distribuye
normalmente con una media de 50,000 millas y una desviación estándar de 12,000 millas. ¿Cuál
es la probabilidad de que un camión recorra entre 34,000 y 50,000 millas?
29. Un conjunto de las puntuaciones obtenidas en el examen final de un curso de estadística se
distribuyen de manera normal con una media de 73 y una desviación estándar de 8.
a. ¿Cuál es la probabilidad de que un estudiante haya obtenido una puntuación menor que 91
en este examen?
b. ¿Cuál es la probabilidad de que un estudiante haya obtenido una puntuación entre 65 y
897?
30. Un análisis estadístico de 1,000 llamadas telefónicas de larga distancia, realizadas sobre las ofici-
nas centrales de Bricks and Clicks Computer Corporation, indica que la duración de esas llamadas
se distribuye de forma normal con µ = 240 segundos y σ = 40 segundos.
a. ¿Cuál es la probabilidad de que una llamada haya durado menos de 180 segundos?
b. ¿Cuál es la probabilidad de que una llamada haya durado entre 180 y 300 segundos?
c. ¿Cuál es la probabilidad de que una llamada haya durado entre 110 y 180 segundos?
31. Una persona con una buena historia crediticia tiene una deuda promedio de $15, 015 (Business-
Week, 20 de marzo de 2006). Suponga que la desviación estándar es de $3,540 y que los montos
de las deudas están distribuidos normalmente.
a. ¿Cuál es la probabilidad de que la deuda de una persona con buena historia crediticia sea
mayor a $18,000?
b. ¿De que la deuda de una persona con buena historia crediticia sea de menos de $10,000?
c. ¿De que la deuda de una persona con buena historia crediticia esté entre $12,000 y $18,000?
d. ¿De que la deuda de una persona con buena historia crediticia sea mayor a $14,000?
32. El tiempo necesario para hacer un examen final en un determinado curso de una universidad
tiene una distribución normal cuya media es 80 minutos con desviación estándar de 10 minutos.
Conteste las preguntas siguientes
33. De acuerdo con la Sleep Foundation, en promedio se duermen 6 .8 horas por noche. Suponga que
la desviación estándar es 0.6 horas y que la distribución de probabilidad es normal.
a. ¿Cuál es la probabilidad de que una persona seleccionada al azar duerma más de ocho
horas?
b. ¿De que una persona tomada aleatoriamente duerma seis horas o menos?
Apéndice A
Tablas
87
88 APÉNDICE A. TABLAS
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1215 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2398 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4191 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.44452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4995 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998
3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000
A.2. TABLA DE LA DISTRIBUCIÓN T 89
0.900 0.700 0.500 0.300 0.200 0.100 0.050 0.020 0.010 Valor α Prueba de
0.100 0.300 0.500 0.700 0.800 0.900 0.950 0.980 0.990 IC dos colas
0.450 0.350 0.250 0.150 0.100 0.050 0.025 0.010 0.005 Valor α Prueba de
0.550 0.650 0.750 0.850 0.900 0.950 0.975 0.990 0.995 IC una cola
g.l Valores de t
1 0.158 0.510 1.000 1.963 3.078 6.314 12.706 31.821 63.657
2 0.142 0.445 0.816 1.386 1.886 2.920 4.303 6.965 9.925
3 0.137 0.424 0.765 1.250 1.638 2.353 3.182 4.541 5.841
4 0.134 0.414 0.741 1.190 1.533 2.132 2.776 3.747 4.604
5 0.132 0.408 0.727 1.156 1.476 2.015 2.571 3.365 4.032
6 0.131 0.404 0.718 1.134 1.440 1.943 2.447 3.143 3.707
7 0.130 0.402 0.711 1.119 1.415 1.895 2.365 2.998 3.499
8 0.130 0.399 0.706 1.108 1.397 1.860 2.306 2.896 3.355
9 0.129 0.398 0.703 1.100 1.383 1.833 2.262 2.821 3.250
10 0.129 0.397 0.700 1.093 1.372 1.812 2.228 2.764 3.169
11 0.129 0.396 0.697 1.088 1.363 1.796 2.201 2.718 3.106
12 0.128 0.395 0.695 1.083 1.356 1.782 2.179 2.681 3.055
13 0.128 0.394 0.694 1.079 1.350 1.771 2.160 2.650 3.012
14 0.128 0.393 0.692 1.076 1.345 1.761 2.145 2.624 2.977
15 0.128 0.393 0.691 1.074 1.341 1.753 2.131 2.602 2.947
16 0.128 0.392 0.690 1.071 1.337 1.746 2.120 2.583 2.921
17 0.128 0.392 0.689 1.069 1.333 1.740 2.110 2.567 2.898
18 0.127 0.392 0.688 1.067 1.330 1.734 2.101 2.552 2.878
19 0.127 0.391 0.688 1.066 1.328 1.729 2.093 2.539 2.861
20 0.127 0.391 0.687 1.064 1.325 1.725 2.086 2.528 2.845
21 0.127 0.391 0.686 1.063 1.323 1.721 2.080 2.518 2.831
22 0.127 0.390 0.686 1.061 1.321 1.717 2.074 2.508 2.819
23 0.127 0.390 0.685 1.060 1.319 1.714 2.069 2.500 2.807
24 0.127 0.390 0.685 1.059 1.318 1.711 2.064 2.492 2.797
25 0.127 0.390 0.684 1.058 1.316 1.708 2.060 2.485 2.787
26 0.127 0.390 0.684 1.058 1.315 1.706 2.056 2.479 2.779
27 0.127 0.389 0.684 1.057 1.314 1.703 2.052 2.473 2.771
28 0.127 0.389 0.683 1.056 1.313 1.701 2.048 2.467 2.763
29 0.127 0.389 0.683 1.055 1.311 1.699 2.045 2.462 2.756
30 0.127 0.389 0.683 1.055 1.310 1.697 2.042 2.457 2.750
40 0.126 0.388 0.681 1.050 1.303 1.684 2.021 2.423 2.704
60 0.126 0.387 0.679 1.045 1.296 1.671 2.000 2.390 2.660
120 0.126 0.386 0.677 1.041 1.289 1.658 1.980 2.358 2.617
∞ 0.126 0.385 0.674 1.036 1.282 1.645 1.960 2.326 2.576
90 APÉNDICE A. TABLAS
v 0.995 0.99 0.975 0.95 0.90 0.10 0.05 0.025 0.01 0.005
1 − − 0.001 0.004 0.016 2.706 3.841 5.024 6.635 7.879
2 0.010 0.020 0.051 0.103 0.211 4.605 5.991 7.378 9.210 10.597
3 0.072 0.115 0.216 0.352 0.584 6.251 7.815 9.348 11.345 12.838
4 0.207 0.297 0.484 0.711 1.064 7.779 9.488 11.143 13.277 14.860
5 0.412 0.554 0.831 1.145 1.610 9.236 11.071 12.833 15.086 16.650
6 0.676 0.872 1.237 1.635 2.204 10.645 12.592 14.449 16.812 18.548
7 0.989 1.239 1.690 2.167 2.833 12.017 14.067 16.013 18.475 20.278
8 1.344 1.646 2.180 2.733 3.490 13.362 15.507 17.535 20.090 21.955
9 1.735 2.088 2.700 3.325 4.168 14.684 16.919 19.023 21.666 23.589
10 2.156 2.558 3.247 3.940 4.865 15.987 18.307 20.483 23.209 25.188
11 2.603 3.053 3.816 4.575 5.578 17.275 19.675 21.290 24.725 26.757
12 3.074 3.571 4.404 5.226 6.304 18.549 21.026 23.337 26.217 28.299
13 3.565 4.107 5.009 5.892 7.042 19.812 22.362 24.736 27.688 29.819
14 4.075 4.660 5.629 6.571 7.790 21.064 23.685 26.119 29.141 31.319
15 4.601 5.229 6.262 7.261 8.547 22.307 24.996 27.488 30.578 32.801
16 5.142 5.812 6.908 7.962 9.312 23.542 26.296 28.845 32.000 34.267
17 5.697 6.408 7.564 8.672 10.085 24.769 27.587 30.191 33.409 35.718
18 6.265 7.015 8.231 9.390 10.865 25.989 28.869 31.526 34.805 37.156
19 6.844 7.633 8.907 10.117 11.651 27.204 30.144 32.852 36.191 38.582
20 7.434 8.260 9.591 10.851 12.443 28.412 31.410 34.170 37.566 39.997
21 8.034 8.897 10.283 11.591 13.240 29.615 32.671 35.479 38.932 41.401
22 8.643 9.542 10.982 12.338 14.042 30.813 33.924 36.871 40.289 42.796
23 9.260 10.196 11.689 13.091 14.848 32.007 35.172 38.076 41.638 44.181
24 9.886 10.856 12.401 13.848 15.659 33.196 36.415 39.364 42.980 45.559
25 10.520 11.524 13.120 14.611 16.473 34.382 37.652 40.646 44.314 46.928
26 11.160 12.198 13.844 15.379 17.292 35.563 38.885 41.923 45.642 48.290
27 11.808 12.879 14.573 16.151 18.114 36.741 40.113 43.194 46.963 49.645
28 12.461 13.565 15.308 16.928 18.939 37.916 41.337 44.461 48.278 50.993
29 13.121 14.257 16.047 17.708 19.768 39.087 42.557 45.722 49.588 52.336
30 13.787 14.954 16.791 18.493 20.599 40.256 43.773 46.979 50.892 53.672
40 20.707 22.164 24.433 26.509 29.051 51.805 55.758 59.342 63.691 66.766
50 27.991 29.707 32.357 34.764 37.689 63.167 67.5058 71.420 76.154 79.490
60 35.534 37.485 40.482 43.188 46.459 74.397 79.082 83.298 88.379 91.952
70 43.275 45.442 48.758 51.739 55.329 85.527 90.531 95.023 100.425 104.215
80 51.172 53.540 57.153 60.391 64.278 96.578 101.879 106.629 112.329 116.321
90 59.196 61.754 65.647 69.126 73.291 107.565 113.145 118.136 124.116 128.299
100 67.328 70.065 74.222 77.929 82.358 118.498 124.342 129.561 135.807 140.169
Bibliografía
Acosta, M., E., Piña, L., & Espallargas, D. (2008). Curso breve de estadística. La Habana, Cuba: Dpt.
Estadística-Informática, Facultad de Economía, Universidad de la Habana.
Besterfield, D., H. (2009). Control de calidad (8va ed.). México: Pearson Educación, S. A. de C. V.
Cáceres, J. (2007). Conceptos básicos de estadística para ciencias sociales. España: Delta, Publicacio-
nes Universitarias.
Cobo, E., Muñoz, P., & González, J., A. (2007). Bioestadística para no estadísticos: Bases para interpre-
tar artículos científicos. Barcelona, España: Elsevier Doyma, S. L.
Instituto Nacional de Información de Desarrollo (2017). Anuario estadístico 2017. Managua: Autor.
Recuperado de https://www.inide.gob.ni/docs/Anuarios/Anuario2017.pdf
Johnson, R., & Kuby, P. (2012). Estadística elemental (11ra ed.). México: Cengage Learning, S. A. de C.
V.
Levine, D., M., Krehbiel, T., C., & Berenson, M., L. (2014). Estadística para administración (6ta ed.).
México: Pearson Educación S. A. de C. V.
Levin, R., I., & Rubin, D., S. (2004). Estadística para administración y economía (7ma ed.). México:
Pearson Educación, S. A. de C. V.
Lind, D., A., Marchal, W., G., & Wathe, S., A. (2012). Estadística aplicada a los negocios y la economía
(15 ta ed). México: McGraw-Hill/Interamericana, S. A. de C. V.
Newbold, P., Carlson, W., L., & Thorne, B. (2008). Estadística para administración y economía. (6ta ed).
Madrid, España: Pearson Educación, S. A.
Walpole, R., E., Meyers, R., H., Meyers, S., L., & Ye, K. (2012). Probabilidad y estadística para ingeniería
y ciencias (9na ed.). México: Pearson Educación S. A. de C. V.
91
92 BIBLIOGRAFÍA
Webster, A., L. (2000). Estadística aplicada a los negocios y la economía. (3ra ed.). Santa Fé de Bogotá,
Colombia: McGraw-Hill Interamericana, S. A.
Índice alfabético
93
94 ÍNDICE ALFABÉTICO
Población finita, 4
Población infinita, 4
Probabilidad, 54
probabilidad clásica, 55
Probabilidad condicional, 57
Probabilidad empírica, 56
Probabilidad marginal, 65
Probabilidad objetiva, 55
Probabilidad subjetiva, 57
Probabilidad total, 63
Probabilidades acumuladas, 75
Probabilidades bajo la distribución normal, 79
Pruebas paramétrica, 3
Simeon Poisson, 76
sir John Sinclair, 1
Suceso, 52
Suceso complementario, 53
Suceso compuesto, 53
Suceso imposible, 53
Suceso seguro, 53
Sucesos elemental, 53
Tablas de contingencia, 64
Thomas Bayes, 63
Unidad experimental, 6
Unión de sucesos, 53
Valor Z, 78
Valor esperado, 74
Valores tipificados, 78
Variable, 10
Variable aleatoria, 73
Variable aleatoria continua, 74
Variable aleatoria discreta, 73
Variable cualitativa, de atributos o categórica, de
atributos o categórica, 11
Variable cuantitativa continua, 11
Variable cuantitativa discreta, 11
Variable cuantitativa o numérica, 11
Variable dicotómica, 11
Varianza, 37