100% encontró este documento útil (1 voto)
491 vistas100 páginas

Estadística Descriptiva

ESTADISTICA BASICA

Cargado por

Urania Cantarero
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
491 vistas100 páginas

Estadística Descriptiva

ESTADISTICA BASICA

Cargado por

Urania Cantarero
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

E STADÍSTICA D ESCRIPTIVA

J. O SMAR A R TOLA G ARCÍA

Á REA DE C IENCIA , T ECNOLOGÍA Y M EDIO A MBIENTE


URACCAN-R ECINTO L AS M INAS
Copyright © 2020 J. Osmar Artola García

Correo electrónico: [email protected]

URACCAN-R ECINTO L AS M INAS , S IUNA , N ICARAGUA

Este documento fue creado en la versión TeX 3.14159265 (TeX Live 2019/Debian) y la versión de LATEX
pdfTeX 3.14159265-2.6-1.40.20 (TeX Live 2019/Debian) en el sistema operativo Ubuntu 20.04 LTS
x64. La publicación del mismo es de dominio público, se puede imprimir y distribuir libre de gastos en
su forma original.
Índice general

1. Introducción a la estadística 1

1.1. Origen de la estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2. Breve historia de la estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.3. Evolución de la estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.4. Definición de estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.4.1. Tipos de estadísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.5. Conceptos básicos de la estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2. Variables y su nivel de medición 10

2.1. Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2. Clasificación de las variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3. Niveles de medición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.3.1. Nivel nominal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.3.2. Nivel ordinal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.3.3. Nivel de intervalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.3.4. Nivel de razón . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3. Organización y representación de datos 16

3.1. Diagrama de tallo y hoja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3.2. Distribución de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

i
ii ÍNDICE GENERAL

3.3. Representación de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.3.1. Gráficas para datos cualitativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.3.1.1. Gráfica de sectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.3.1.2. Gráfica de barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.3.2. Gráficas para datos cuantitativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.3.2.1. Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.3.2.2. Diagrama de caja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.3.2.3. Gráfico de líneas o polígono . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.3.2.4. Ojiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.3.2.5. Gráfica de puntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4. Índices estadísticos 33

4.1. Medidas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

4.1.1. Media aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

4.1.2. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.1.3. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.2. Medidas de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.2.1. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.2.2. Desviación estándar o típica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.2.3. Coeficiente de variación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

4.3. Medidas de posición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.3.1. Cuartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.3.2. Percentiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4.4. Medidas de tendencia central para datos agrupados . . . . . . . . . . . . . . . . . . . . . . . 42

4.4.1. Media aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.4.2. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.4.3. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.5. Medidas de dispersión para datos agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.5.1. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
ÍNDICE GENERAL iii

4.5.2. Desviación estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

5. Probabilidades 49

5.1. Breve historia de la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

5.2. Conceptos básicos de la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

5.2.1. Experimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

5.2.1.1. Tipos de experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.2.2. Espacio muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.2.3. Sucesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

5.2.3.1. Tipos de sucesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5.2.4. Operaciones con sucesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5.2.4.1. Unión de sucesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5.2.4.2. Intersección de sucesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

5.2.4.3. Complemento de sucesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

5.3. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

5.4. Enfoques de la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

5.4.1. Probabilidad objetiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

5.4.1.1. Probabilidad clásica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

5.4.1.2. Probabilidad empírica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

5.4.2. Probabilidad subjetiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

5.5. Probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

5.6. Reglas de la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

5.6.1. Regla de la adición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

5.6.2. Regla de la multiplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

5.7. Regla de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

5.8. Tablas de contingencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

5.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

6. Modelos probabilísticos 73

6.1. Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73


iv ÍNDICE GENERAL

6.2. Distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

6.2.1. Media de la distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

6.2.2. Desviación estándar de la distribución binomial . . . . . . . . . . . . . . . . . . . . . 74

6.2.3. Distribución binomial acumulada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

6.3. Distribución de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

6.4. Distribución normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

6.4.1. Distribución normal estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

6.4.2. Probabilidades bajo la distribución normal . . . . . . . . . . . . . . . . . . . . . . . . 79

6.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

Apéndice A. Tablas 87

A.1. Tabla de la distribución normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

A.2. Tabla de la distribución t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

A.3. Tabla de la distribución chi cuadrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

Bibliografía 91

Índice alfabético 93
Capı́tulo 1
Introducción a la estadística

Resultados de aprendizaje

• Describe el origen, historia y evolución de la estadística.

• Define estadística, estadística descriptiva, inferencial, población, muestra, dato, datos, parámetro,
estadístico, unidad experimental, datos univariados y multivariados.

• Identifica diferencias entre población y muestra, población finita e infinita, estadístico y parámetro.

• Clasifica información en estadística descriptiva o inferencial, población en finita o infinita.

• Identifica población, muestra, parámetro, estadístico y unidad experimental en situaciones relaciona-


das con las ciencias administrativas.

• Reflexiona sobre la utilidad de la estadística en el área de las ciencias económicas y administrativas.

1.1. Origen de la estadística

La estadística surge en el Estado o Gobierno, con la necesidad de realizar censos poblacionales para es-
timar la cantidad de habitantes en una población con el fin de cuantificar los ingresos que se obtendrían
a partir de los impuestos generados por esa cantidad de habitantes.

Como este tipo de cuestiones eran preocupaciones del estado, es decir, eran los trabajadores del gobierno
que buscaban dar respuestas a esta problemática, de allí surge el nombre estadística.

Sobre el origen de la estadística, Levin y Rubin (2004) describen:

El vocablo estatistik proviene de la palabra italiana statista (que significa “estadista”). Fue utilizada
por primera vez por Gottfried Achenwall (1719-1772), un profesor de Marlborough y de Göttingen.
El Dr. E. A. W. Zimmerman introdujo el término statistics (estadística) a Inglaterra. Su uso fue
popularizado por sir John Sinclair en su obra Statistical Account of Scotland 1791-1799 (“Informe
estadístico sobre Escocia 1719-1799”). Sin embargo, mucho antes del siglo XVIII, la gente ya utilizaba
y registraba datos. (p. 3)

1
2 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA

1.2. Breve historia de la estadística

No fue fácil que la estadística se consolidara como ciencia, pues tomó alrededor de 200 años para
lograrlo, al respecto Cáceres (2007) concluye:

Los primeros intentos de construir una disciplina con entidad propia fueron consolidándose a lo lar-
go de los siglos XVII y XVIII, a medida que crecía la complejidad administrativa del estado. En esta
época es posible distinguir dos direcciones contemporáneas: la descriptiva o histórica y la investiga-
dora, cuyos protagonistas eran los aritméticos políticos ingleses, preocupados por la búsqueda de
leyes cuantitativas que regularan los comportamientos sociales. (p. 2)

Para dar ideas sobre la existencia de la estadística, Levin y Rubin (2004) describen:

La estadística oficial es tan vieja como la historia registrada. El Viejo Testamento contiene varios
informes sobre levantamiento de censos. Los gobiernos de los antiguos Babilonia, Egipto y Roma
reunieron registros detallados sobre población y recursos. En la edad media, los gobernantes em-
pezaron a registrar la propiedad de la tierra. En el año 762 de nuestra era, Carlomagno pidió una
descripción detallada de las propiedades de la Iglesia. A principios del siglo IX terminó la enumera-
ción estadística de los siervos que habitan los feudos. Por el año 1806, Guillermo el Conquistador
ordenó que se escribiera Domesday Book, un registro de la propiedad, extensión y valor de las tierras
de Inglaterra. Este trabajo fue el primer resumen estadístico de Inglaterra. (p. 3)

1.3. Evolución de la estadística

En la actualidad el uso de la estadística se ha extendido más allá de sus orígenes como un servicio
al Estado o al gobierno. Personas, organizaciones y centros de enseñanza usan la estadística para
entender datos y tomar decisiones. La aplicación de la estadística se ha extendido a casi todas las áreas
del conocimiento, por mencionar algunas, ciencias naturales, sociales, medicina, negocios, educación y
deportes.

En épocas anteriores se definía a la estadística como una rama de la matemática; sin embargo, ésta ha
crecido sustancialmente, hasta llegar a ser considerada una ciencia por si sola, tanto así que, muchas
instituciones de educación superior han creado departamentos académicos de matemática y estadística
por separado.

La aparición de los ordenadores ha incidido para que la estadística obtenga mejoras significativas, con
la estadística asistida por ordenador es posible el procesamiento y análisis estadístico de enormes can-
tidades de datos y trabajar con herramientas estadísticas (gráficas, modelos lineales y no lineales, test
estadísticos, análisis de series temporales, control estadístico de la calidad, algoritmos de clasificación
y agrupamiento, etc.).

1.4. Definición de estadística

Definición 1.4.1. Estadística

Es la ciencia encargada de recolectar, organizar, presentar y analizar datos, con la finalidad de tomar
decisiones.

La recolección de datos se hace mediante instrumentos de medición o recolección de datos como el cues-
tionario, las guías de observación, la entrevista, encuesta y grupos focales, por mencionar algunos. La
organización de datos se estudia en la sección ??, en ocasiones la toma de decisiones no está en nues-
tras manos; por tal razón hay autores que no agregan este factor a la definición, por ejemplo, Johnson
y Kuby (2012) definen estadística como “ciencia que se encarga de obtener, describir e interpretar los
datos” (p. 1), aquí se ha agregado, ya que, la razón de ser de la estadística es estudiar los datos para
hacer ajustes pertinentes.
1.4. DEFINICIÓN DE ESTADÍSTICA 3

1.4.1. Tipos de estadísticas

La estadística se divide en descriptiva e inferencial, otros prefieren llamarlas estadística paramétrica y no


paramétrica, es importante dominar los dos tipos de estadística, puesto que ambas responden a técnicas
diferentes, sin embargo, la estadística inferencial se apoya en la descriptiva para sacar conclusiones de
una población.

Definición 1.4.2. Estadística descriptiva

Conjunto de métodos para organizar, resumir y presentar datos de manera numérica.

Definición 1.4.3. Estadística inferencial

Conjunto de métodos para determinar una propiedad de una población con base en la información de una
muestra.

Dentro de la estadística paramétrica están la descriptiva y la estadística inferencial. Según Triola (2018)
“las pruebas paramétricas tienen requisitos sobre la distribución de las poblaciones involucradas” (p.
599), es decir, la estadística paramétrica se fundamenta en el muestreo de una población con parámetros
específicos, como la media µ, la desviación estándar σ o la proporción p.

Con respecto a las pruebas no paramétricas, Triola (2018) describe:

El término pruebas no paramétricas es engañoso en el sentido de que sugiere que las pruebas
no se basan en un parámetro, pero hay algunas pruebas no paramétricas que se basan en un
parámetro como la mediana. Debido al uso generalizado del término prueba no paramétrica, usamos
esa terminología, pero la definimos como una prueba que no requiere una distribución particular.
(p. 599)

El mundo en el que vivimos está lleno de información que encontramos en distintos medios como libros,
periódicos, revistas, páginas web, programas de televisión, redes sociales, etc. Es importante identificar
si esta información proviene de una estadística descriptiva o inferencial, veamos los siguientes ejemplos,
en los cuales usaremos las definiciones 1.4.2 y 1.4.3.

Ejemplo 1.4.1. Estadística descriptiva

1. Según datos del Banco Central de Nicaragua (BCN, 2017), la población de Nicaragua es de 6.3 millones
de habitantes, equivalente a 6,300,000 habitantes.
2. La Comisión Nacional de Salario Mínimo ratificó que el salario mínimo a partir del 1/03/2020 para el
sector gobierno central y municipal, será de 5,345.25 córdobas mensuales.
3. El gobierno de Nicaragua informó que en el año 2005 la población era de 5,142,098 habitantes, en el
2013 era de 6,080,000 habitantes.
4. Según datos del BCN (2017), la esperanza de vida al nacer en el período 2015/2020 es de 75.7 años.
5. Según datos del Instituto Nacional de Información de Desarrollo (INIDE, 2017), la población de Nicara-
gua en el 2018 era de 6,460,411 habitantes, de los cuales, 3,187,500 son hombres y 3,272,911 son
mujeres.

La información del tercer caso no sería información de estadística descriptiva si estos datos se utilizaran
para calcular la población de Nicaragua en el año 2020 o el crecimiento porcentual de 2013 a 2020.

Ejemplo 1.4.2. Estadística inferencial

1. El gobierno de Nicaragua estima que en el año 2025 la población será aproximadamente 8, 629,000
habitantes.
2. De la población estudiantil de URACCAN, 58 % son mujeres (dato hipotético).
3. Una encuesta aplicada a trabajadores de URACCAN mostró que 40 % de éstos dominan la filosofía ins-
titucional, además, 90 % de los trabajadores describe la misión y visión de URACCAN (dato hipotético).
4 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA

1.5. Conceptos básicos de la estadística

A continuación se estudia la terminología básica de la estadística, es decir, conceptos en los cuales se


fundamenta la estadística descriptiva, se recomienda interpretar y analizar cada uno de los ejemplos
propuestos.

Definición 1.5.1. Población

Conjunto completo de personas u objetos a estudiar.

Ejemplo 1.5.1. Población

1. Se desea hacer un sondeo sobre la opinión que tienen los nicaragüenses acerca de la ley 779. En este
caso la población está compuesta por la ciudadanía nicaragüense.
2. Para estimar el ingreso económico de los habitantes del municipio de Siuna, la población son las perso-
nas que habitan en el municipio de Siuna.
3. Conjunto de todos los árboles de la especie caoba en el municipio de Rosita.
4. Base de datos de registro académico de URACCAN con información de los estudiantes matriculados.

Las poblaciones se clasifican según la cantidad de elementos que éstas posean, por tanto, pueden ser
finitas e infinitas. Una población es finita cuando podemos enumerar físicamente todos sus elementos,
en otras palabras, para las poblaciones en las que es posible obtener una lista de todos y cada uno de
sus elementos, son poblaciones finitas.

Ejemplo 1.5.2. Población finita

1. La población estudiantil de URACCAN-Recinto Las Minas. Una lista del estudiantado la podemos obte-
ner en Registro académico.
2. Conjunto de libros de la biblioteca de URACCAN-Recinto Las Minas. El personal de biblioteca maneja
una base de datos en la que podemos obtener una lista de todos los libros de la biblioteca.
3. La población activa para votar en las futuras elecciones nacionales de Nicaragua, es una población
finita muy grande. El personal del Consejo Supremo Electoral maneja una lista por juntas receptoras
de voto de la población activa que puede ejercer su derecho al voto.

Una población es infinita cuando sus elementos son ilimitados, es decir, es difícil obtener una lista de
todos ellos.

Ejemplo 1.5.3. Población infinita

1. Cantidad de personas que poseen una cuenta de correo electrónico. Es difícil tener una lista de la
cantidad exacta de personas que tienen una cuenta de correo electrónico a nivel mundial.
2. Cantidad de personas hipertensas a nivel mundial. Al igual que el ejemplo anterior es difícil obtener un
listado de todas las personas que padecen hipertensión en todo el mundo.

A pesar que las poblaciones sean finitas, en muchas situaciones se vuelve imposible estudiar a todos
y cada unos de sus elementos, ya ni digamos en el caso de las poblaciones infinitas. Para resolver
esta inconveniente se selecciona una muestra de la población, así que el estudio se concentra en los
elementos que integran la muestra.

Definición 1.5.2. Muestra

Es una parte representativa de la población, que se selecciona para ser estudiada.


1.5. CONCEPTOS BÁSICOS DE LA ESTADÍSTICA 5

Ejemplo 1.5.4. Muestra

1. Para el caso (1.) propuesto en el Ejemplo 1.5.1, una muestra podría estar conformada por hombres y
mujeres (mayores de edad) de cada uno de los departamentos de Nicaragua.
2. Un docente investigador de URACCAN estudia la relación entre el desempeño académico y la etnia. La
muestra podrá estar conformada por una proporción de elementos de cada una de las etnias.
3. Base de datos de registro académico de URACCAN-Recinto Las Minas con información de los estudian-
tes matriculados.

La metodología a seguir para definir una muestra, depende del rigor de la investigación, no es lo mismo
definir una muestra para un sondeo de opinión como una para realizar estudios en las ciencias médi-
cas. Las técnicas que permiten obtener muestras de poblaciones se denominan técnicas de muestreo o
simplemente muestreo y es un estudio posterior a la estadística descriptiva.

Definición 1.5.3. Dato

Información o cifra que se recoge, analiza y resume para su presentación e interpretación.

Ejemplo 1.5.5. Dato

1. Dell es la marca de computadora usada por el profesor Noel Altamirano.


2. El disco duro de la computadora del profesor Yesser tiene capacidad de 1 TB.
3. La estatura de Juan es de 1.70 metros.
4. El peso de Martha es de 60.0 kg.

Definición 1.5.4. Datos

Conjunto de informaciones y cifras que se recogen, analizan y resumen para su presentación e interpreta-
ción.

Ejemplo 1.5.6. Datos

Base de datos con valores relacionados a la edad, sexo, etnia e ingreso de los estudiantes de segundo año
de Contabilidad Pública y Auditoría.

Definición 1.5.5. Parámetro

Es una medición que describe características numéricas de una población.

Ejemplo 1.5.7. Parámetro

1. El 58.5 % de la población nicaragüense pertenecen a la religión católica.


2. Un estudio aplicado a la población estudiantil de URACCAN reveló que el 12 % de éstos pertenecen a la
etnia mayangna (dato hipotético).

Los parámetros poblacionales son la media (µ), varianza (σ 2 ) y la desviación típica (σ).
6 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA

Definición 1.5.6. Estadístico

Es una medición que describe características numéricas de una muestra.

Ejemplo 1.5.8. Estadístico

1. Al realizar un estudio a 300 personas del municipio de Siuna, se determinó que el ingreso promedio de
estos habitantes es de 9,500 córdobas.
2. La estatura promedio de los estudiantes varones de URACCAN-Recinto Las Minas es de 1.69 metros.

Los estadísticos son la media (x̄), mediana (Me ), moda (M0 ), varianza (s2 ) y desviación típica (s), todos
calculadas en base a la muestra y se usan para estimar los parámetros poblacionales.

Definición 1.5.7. Unidad experimental

Es el individuo u objeto en el que se mide una variable.

Ejemplo 1.5.9. Unidad experimental

1. Un conjunto formado por 50 personas del municipio de Siuna se recolectan los datos sobre edad, sexo,
ingreso, religión y ocupación. La unidad experimental en la que se recolectan los datos es una persona
del municipio en particular.
2. Los estudiantes de ingeniería Agroforestal realizan un trabajo de curso en la clase Estadística general,
éste consiste en establecer un cultivo de ciclo corto (tomate, pepino, ayote, pipián, etc.) en el que reco-
lectan datos como altura, largo de hoja, ancho de hoja, germinación de semilla, largo de guía, etc. En
este caso la unidad experimental es una planta en particular, en la cual recolectan los datos.

Definición 1.5.8. Datos univariados

Resultan cuando se mide una sola variable en una sola unidad experimental.

Ejemplo 1.5.10. Datos univariados

Calificación de la primera evaluación parcial del curso estadística descriptiva impartido en II año de Con-
tabilidad Pública y Auditoría.

Definición 1.5.9. Datos multivariados

Resultan cuando se miden más de dos variables en una unidad experimental.

Ejemplo 1.5.11. Datos multivariados

Registro académico de URACCAN-Recinto Las Minas en el período de matrícula recolecta información rela-
cionadas con los nombres completos, edad, etnia, estado civil, carrera y año a cursar, semestre, asignatu-
ras y calificaciones del estudiante
1.6. EJERCICIOS 7

1.6. Ejercicios
1. Determine cuál de las siguientes frases es descriptiva en su naturaleza y cuál es inferencial.

a. De todos los maestros de jardín de niños en Estados Unidos, 32 % dicen que “Conocer el
alfabeto” es una habilidad esencial.
b. De los 800 maestros que fueron entrevistados en Estados Unidos, 32 % indican que “Conocer
el alfabeto” es una habilidad esencial.
c. De los centros vacacionales estudiados en 2004, 72 % se clasifican como centros vacaciona-
les de un día.
d. De todas las visitas a centros vacacionales en 2003, 23 % fueron visitas por hombres.

2. El 50 % de los automóviles vendidos en Estados Unidos en 2009 son de empresas asiáticas. ¿Se
llegó a esta conclusión a partir de una muestra o una población?
3. Un conjunto de datos contiene las edades al fallecimiento de cada uno de los anteriores 38 presi-
dentes de Estados Unidos ahora desaparecidos. ¿Este conjunto de mediciones es una población o
una muestra?
4. En los siguientes casos determine si el grupo representa una muestra o una población.

a. Los participantes en el estudio de un nuevo fármaco contra el colesterol.


b. Los conductores que recibieron una multa por exceso de velocidad en la ciudad de Managua
el último mes.
c. Beneficiarios del programa Casas para el pueblo en la ciudad de León.

5. En los siguientes problemas indique si recogería información utilizando una muestra o una po-
blación.

a. Bioestadística es un curso que se imparte en la universidad. El profesor Milton Carvajal ha


enseñado acerca de 2000 estudiantes los pasados 10 años. Usted quiere conocer el grado
promedio de los estudiantes que toman el curso.
b. Usted espera graduarse y conseguir su primer empleo como vendedor en una de las 5 prin-
cipales compañías farmacéuticas. Al hacer planes para sus entrevistas, necesitará conocer
la emisión de la empresa, rentabilidad, productos y mercado.
c. Usted se encuentra comprando un nuevo reproductor de música MP3, como el iPod de Apple.
El fabricante anuncia la cantidad de pistas que almacena la memoria. Considere que los
anunciantes toman en cuenta piezas de música popular cortas para calcular la cantidad de
pistas que pueden almacenarse. Sin embargo, usted prefiere las melodías de Broadway, que
son más largas. Usted desea calcular cuántas melodías de Broadway podrá guardar en su
reproductor MP3.

6. Identifique las unidades experimentales en los que se miden las variables siguientes:

a. Género de un estudiante
b. Número de errores en una prueba diagnóstica
c. Edad de un paciente con cáncer
d. Número de flores en una planta de ayote
e. Color de un auto que entra a un estacionamiento

7. La International Commucations Research (ICR) realizó el Estudio Nacional de Limpieza de Pri-


mavera para la Asociación de Jabones y Detergentes (Soap and Detergent Association). La ICR
entrevistó a 1000 hombres y mujeres jefes de familia respecto a las actitudes de limpieza que
toman en sus casas. El estudio tiene un margen de error de más o menos 5 %.
8. Para los siguientes casos determine la población y la muestra.

a. Un docente investigador selecciona al azar a 25 de los 100 docentes de URACCAN - Recinto


las Minas, y luego calcula la cantidad de tiempo que han prestado servicio.
b. Durante el juego de campeonato de la liga de Béisbol Superior Comandante Germán Pomares
Ordóñez, una encuesta realizada a 7121 hogares elegidos al azar revela que el 60 % de ellos
tienen sus televisores sintonizados en el juego.
c. En una encuesta de Gallup de 1059 adultos seleccionados al azar, el 39 % respondió que “si
cuando se les preguntó, ¿tiene un arma en su casa?”
8 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA

d. Una estudiante de posgrado de la Universidad de Newport realiza un proyecto de investi-


gación sobre la comunicación. Ella envía por correo una encuesta a los 500 adultos que
conoce, y les pide que respondan y regresen por correo la siguiente pregunta: “¿Prefiere uti-
lizar el correo electrónico o el correo ordinario (el servicio postal)?” Ella recibe 65 respuestas,
y 42 de ellas indican una preferencia por el correo ordinario.

a. ¿Cuál es la población?
b. ¿Cuántas personas fueron interrogadas?
c. ¿Qué información se obtuvo de cada persona?

9. Un fabricante de medicamentos está interesado en la proporción de personas que tienen hiper-


tensión (presión sanguínea elevada) considerando que esta condición puede controlarse con un
medicamento nuevo que la compañía ha perfeccionado. Se efectúa un estudio que abarca 5000
personas que padecen hipertensión, y se encuentra que 80 % de ellas pueden controlar su hiper-
tensión con el medicamento. Suponiendo que las 5000 personas sean representativas del grupo
que tiene hipertensión, conteste las siguientes preguntas:

a. ¿Cuál es la población?
b. ¿Cuál es la muestra?
c. Identifique el parámetro de interés
d. Identifique el estadístico y de su valor
e. ¿Conocemos el valor del parámetro?

10. Determine si el valor dado es un estadístico o un parámetro.

a. Se selecciona una muestra de hogares y el número promedio (media) de personas por familia
es de 2.58.
b. En la actualidad el 42 % de los gobernantes de las 50 entidades de Estados Unidos son
demócratas.
c. En un estudio de los 2223 pasajeros del Titanic, se encontró que 706 sobrevivieron cuando
se hundió.
d. Se selecciona una muestra de niños del municipio de Siuna y se descubre que la cantidad
de tiempo promedio (media) que ven televisión es de 6.5 horas al día.

11. Un técnico de control de calidad selecciona ciertas piezas ensambladas en una línea de montaje y
registra la siguiente información sobre cada pieza:
A: defectuosa o no defectuosa; B: el número de identificación del trabajador que ensambló la pieza;
C: el peso de la pieza.

a. ¿Cuál es la población?
b. La población, ¿es finita o infinita?
c. ¿Cuál es la muestra?

12. Seleccione 10 estudiantes que estén inscritos en su ciclo escolar y recolecte datos para las tres
variables siguientes:
X: número de cursos en los que está inscrito; Y: costo total de libros de texto y el material para los
cursos; Z: método de pago para cubrir el importe de los libros de texto y el material de los cursos.

a. ¿Cuál es la población?
b. La población, ¿es finita o infinita?
c. ¿Cuál es la muestra?

13. La empresa Aventis Pharmaceutica realizó un estudio para medir los efectos colaterales de Allegra,
un medicamento que se utiliza en el tratamiento de alergias estacionales. A una muestra de 679
personas que sufren de alergias en Estados Unidos se les administraron 60 mg del medicamento
dos veces al día. Los pacientes informaron si durante ese período experimentaron alivio de sus
alergias, así como cualquier otro efecto colateral adverso (infección viral, náusea, somnolencia,
etc.).

a. ¿Cuál es la población bajo estudio?


b. ¿Cuál es la muestra?
1.6. EJERCICIOS 9

c. ¿Cuáles son las características de interés acerca de cada uno de los elementos de la pobla-
ción?

14. Un investigador médico desea estimar el tiempo de supervivencia de un paciente, después del
inicio de un tipo particular de cáncer y después de un régimen particular de radioterapia.

a. Identifique la población de interés para el investigador


b. Describa la forma en que el investigador podría seleccionar una muestra de entre la pobla-
ción.
c. ¿Qué problemas podrían surgir al muestrear desde esta población?

15. Un investigador educacional desea evaluar la efectividad de un nuevo método de enseñanza de


lectura a estudiantes sordos. El logro al final de un periodo de enseñanza es medido por la califi-
cación de un estudiante en un examen de lectura.

a. ¿Cuál es la unidad experimental?


b. Identifique la población de interés para el experimentador.

16. Se seleccionan seis vehículos, de entre los que tienen permiso para estacionarse, y se registran
los siguientes datos:

Vehículo Tipo Marca ¿Colectivo? Antiguedad (en años)


1 Auto Honda No 6
2 Auto KIA No 2
3 Camión Ford No 3
4 Moto YAMAHA No 1
5 Van Dodge Sí 4
6 Auto Chevrolet No 9

a. ¿Cuáles son las unidades experimentales?


b. ¿Estos son datos univariados, bivariados o multivariados?
Capı́tulo 2
Variables y su nivel de medición

Resultados de aprendizaje

• Define variable estadística, tipos de variables y niveles de medición para variables cualitativas y cuan-
titativas.
• Interpreta los niveles de medición nominal, ordinal, de intervalo y de razón como método para clasifi-
car datos.
• Identifica la diferencia entre variables cuantitativas discretas y continuas.
• Clasifica variables en dicotómicas, categóricas, cuantitativas discretas o cuantitativas continuas.

2.1. Variables

Una variable es lo que en realidad interesa conocer de los elementos que conforman la población o
muestra, la siguiente definición fue tomada de Johnson y Kuby (2012, p. 5).

Definición 2.1.1. Variable

Es una característica de interés acerca de cada elemento individual de una población o muestra.

Ejemplo 2.1.1. Variables

1. Edad, sexo, etnia, ocupación y religión de un conjunto de personas de una población.


2. Marca de teléfono celular usada por el estudiantado de II año de Contabilidad.
3. Costo de la canasta básica en el municipio de Siuna.
4. Tiempo diario que un estudiante usa la app de Facebook.

2.2. Clasificación de las variables

Para Newbold, Carlson, y Thorne (2008), las variables pueden clasificarse de varias formas, “uno de los
métodos de clasificación se refiere al tipo y la cantidad de información que contienen los datos. Los datos
son categóricos o numéricos” (2008, p. 10).

10
2.2. CLASIFICACIÓN DE LAS VARIABLES 11

Definición 2.2.1. Variable cualitativa, de atributos o categórica

Es toda aquella que expresa cualidades o atributos (palabras) de una población o muestra.

Ejemplo 2.2.1. Variables cualitativas

Sexo, estado civil, ocupación, número de cédula de una persona, placa de un automóvil, número de telé-
fono, enfermedades que afectan a los perros de raza pitbull en el municipio de Siuna, marca de ordenado-
res, color de los teléfonos celulares de un grupo de personas, calidad de la internet en URACCAN-Recinto
Las Minas, sistema operativo de los ordenadores de los docentes de URACCAN-Recinto Las Minas.

El número de cédula, placa de un automóvil y el número de teléfono son cualitativas a pesar de estar
compuestas por números, lo que ocurre es que aunque estén compuestas de dígito no tienen auténtico
significado de número.

Las variables cualitativas se denominan categóricas, porque, producen respuestas que pertenecen a
grupos o categorías, por ejemplo, la variable estado civil tiene como categorías: soltero, casado, viudo,
divorciado, en unión de hecho estable, etc.

En el caso de la variable sexo, ésta permite elegir entre dos opciones, es decir, femenino o masculino,
como tiene dos categoría recibe el nombre de variable dicotómica.

Definición 2.2.2. Variable cuantitativa o numérica

Es la que expresa características numéricas de una población o muestra.

Ejemplo 2.2.2. Variables cuantitativas

Edad, estatura, peso, número de hermanos, ingresos, costo de un artículo, kilómetros recorridos por un
auto, temperatura, cantidad de habitantes de una población, diámetro de un árbol, altura del fuste de un
árbol, tiempo diario de uso de la app de Facebook, tiempo de conexión a internet, tiempo que un ordenador
pasa encendido.

Al recolectar variables cuantitativas es posible obtener resultados expresados en valores enteros o pun-
tos decimales, esto obedece a subclasificar las variables cuantitativas en discretas y continuas.

Definición 2.2.3. Variable cuantitativa discreta

Es la que toma valores particulares distintos y ningún valor entre ellos.

Ejemplo 2.2.3. Variables cuantitativas discretas

Edad, número de hermanos, habitantes en una población, autos en un aparcamiento, estudiantes en un


salón de clases, pacientes atendidos por día en un hospital, celulares vendidos por día, placas entregadas
por la Policía Nacional en un mes, ordenadores en un laboratorio de computación, periféricos de entrada
de un ordenador.

Definición 2.2.4. Variable cuantitativa continua

Es la que toma cualquier valor en un intervalo dado.


12 CAPÍTULO 2. VARIABLES Y SU NIVEL DE MEDICIÓN

Ejemplo 2.2.4. Variable cuantitativa continua

Estatura, peso, ingresos, costo de un artículo, temperatura, kilómetros recorridos por un auto, diámetro de
un árbol, altura del fuste de un árbol, tiempo de conexión a internet, costo de un ordenador, tiempo de uso
de la app de Facebook, tiempo empleado para estudiar estadística.

Las variables del Ejemplo 2.2.4 son continuas, en el caso de la estatura de una persona, ésta puede
tomar valores como 1.70 metros o 1.82 metros y así sucesivamente. Lo mismo ocurre para las otras
variables.

2.3. Niveles de medición

Los niveles de medición no son más que otro método para clasificar datos cualitativos o cuantitativos.

2.3.1. Nivel nominal

El nivel de medida nominal es útil para caracterizar variables cualitativas. La palabra nominal indica
nombre para las variables, debido a que las variables cualitativas consisten en nombres, etiquetas o
categorías, por tanto, no son clasificables ni ordenables.

Según Cobo, Muñoz y González (2007), “la escala nominal clasifica las unidades de acuerdo con ciertas
características, de forma que dos unidades de la misma categoría son iguales entre sí y diferentes de las
restantes categorías” (p. 2).

Ejemplo 2.3.1. Nivel nominal

Número de cédula, número de teléfono, sexo, etnia, estado civil, color de los autos aparcados en URACCAN-
Recinto Las Minas, religión, idiología política.

La variable sexo tiene dos categorías y no importa que en el informe estadístico se reporte primero el
sexo masculino seguido del femenino o viceversa, lo mismo ocurre con las otras variables del Ejemplo
2.3.1.

2.3.2. Nivel ordinal

Se usa para caracterizar variables cualitativas pero en este caso si es importante el orden (la palabra
ordinal se refiere a orden), en otras palabras este nivel cumple las propiedades del nivel nominal y lo
adicional es que ordena las categorías.

Ejemplo 2.3.2. Nivel ordinal

Nivel académico, evaluación cualitativa de un estudiante, grado del personal del Ejército y Policía Nacional,
grado de intensidad (grave, moderado y leve) de los enfermos en un centro de salud, clase social (alta,
media y baja), clasificación de los peloteros en la Liga Nacional de Béisbol Superior Germán Pomares
Ordóñez (Clase A, B y C), posición jerárquica en una determinada empresa.

La evaluación cualitativa de un estudiante puede ser excelente, muy bueno, bueno y deficiente. El nivel
de medida es ordinal, ya que, un estudiante excelente tiene mejor calificación que uno muy bueno y así
sucesivamente.
2.3. NIVELES DE MEDICIÓN 13

2.3.3. Nivel de intervalo

Es útil para caracterizar variables cuantitativas discretas o continuas, en las que los intervalos tienen
significado y las variables en este nivel no tienen un punto de partida cero natural inherente (el cero no
es real), además, las diferencias entre dos valores cualesquiera tienen sentido.

Según Cobo et al. (2017), “la escala de intervalo cumple las propiedades de la escala ordinal y, además,
dispone de unidad de medida” (p. 3).

Ejemplo 2.3.3. Nivel de intervalo

La temperatura. Las temperaturas en los primeros cinco días del mes de diciembre a las siete de la mañana
en el municipio de Siuna fueron 24.80, 24.50, 23.50, 23.00 y 24.00 grados Celsius. Estos datos se pueden
clasificar y calcular diferencias entre ellos, además el cero es arbitrario, pues no implica que en realidad
haya cero (ninguna) temperatura.

El siguiente ejemplo fue tomado de Lind, Marchal y Wathen (2012, p. 12).

Ejemplo 2.3.4. Talla de ropa para mujeres

Tallas de ropa para mujeres, ya que, conforme la talla cambia 2 unidades cada medida (busto, cintura
y cadera) aumenta dos pulgadas, es decir, los intervalos son los mismos. Por otro lado, no existe un cero
que represente una talla. Una prenda talla cero no está hecha de cero material, más bien, se trata de una
prenda con 24 pulgadas de busto, 16 pulgadas de cintura y 27 de cadera.

Ejemplo 2.3.5. Calificaciones

Las calificaciones obtenidas por los estudiantes de Ingeniería en Sistemas en el curso análisis matemático
II. Las diferencias tienen sentido, la calificación de Cristhel fue 83, de Jorge 71 y Heyling 64, así, Jorge
obtuvo 7 puntos más que Heyling y 12 menos que Cristhel.

Ejemplo 2.3.6. Varios

Peso de una persona, animal u objeto, número de cigarrillos fumados al día por una persona fumadora,
índice de inteligencia de una persona.

2.3.4. Nivel de razón

Útil para clasificar variables cuantitativas discretas o continuas, en ésta los intervalos y las razones
tienen sentido, además, existe un punto de partida cero natural, es decir, el cero es real y absoluto.

El cero absoluto indica ausencia o la no existencia de un valor determinado.

Ejemplo 2.3.7. Nivel de razón

Número de hijos, ingresos, ventas de un determinado producto, metros cuadrados de una construcción,
consumo de un alimento o medicamento, número de hermanos, costo de un automóvil, edad, pacientes
atendidos en un centro de salud, llamadas atendidas por el servicio al cliente de Claro.
14 CAPÍTULO 2. VARIABLES Y SU NIVEL DE MEDICIÓN

2.4. Ejercicios
1. En la actualidad se estudia la severidad de los efectos colaterales que experimentan ciertos pa-
cientes cuando reciben tratamiento con un medicamento particular. Esta severidad se mide en la
escala: ninguna, benigna, moderada, grave, muy grave.

a. Menciones la variable de interés.


b. Identifique el tipo de variable.

2. Al cuerpo docente de la universidad URACCAN se le hizo la siguiente pregunta “qué tan satisfecho
estuvo usted con el sistema de biblioteca 2016?”. Sus respuestas fueron clasificadas como “muy
satisfecho”, “un poco satisfecho”, “ni satisfecho ni insatisfecho”, “un poco insatisfecho”, o “muy
insatisfecho”.

a. Menciones la variable de interés.


b. Identifique el tipo de variable.

3. Se pregunta a varios estudiantes el peso de los libros y demás materiales que llevan a clases.

a. Identifique la variable de interés.


b. Identifique el tipo de variable.

4. identifique las siguientes expresiones como ejemplos (1) variables cualitativas o (2) variables cuan-
titativas:

a. Lugar de nacimiento de una persona


b. Color de pelo de los niños de la escuela Rafaela Herrera de Siuna
c. El número de hojas en una planta
d. Marca de los ordenadores de los estudiantes de URACCAN - Recinto las Minas
e. Número de pasaporte
f. Cantidad de mensajes recibidos en su número celular
g. Duración de un partido de béisbol
h. Esperanza de vida de una mujer en Nicaragua
i. Número de televisores por casas en el municipio de Siuna
j. Cantidad de niños vendedores públicos en el municipio de Siuna
k. Números de ancianos pensionados
l. Deportes practicados por la población de Siuna
m. Si una persona tiene una cuenta de Facebook
n. Si un miembro de la familia posee un teléfono celular con capacidad Wi-Fi

5. Determine cuál de los cuatro niveles de medición (nominal, ordinal, de intervalo o razón) es el más
apropiado.

a. Los números en las camisetas de los jugadores de básquetbol


b. Los números del INSS
c. Los salarios de mujeres profesoras de educación secundaria
d. Calificaciones de las películas de una estrella, dos estrellas, tres estrellas y cuatro estrellas
e. La distancia que viajan los estudiantes para llegar a clases
f. Número de horas que los estudiantes estudian a la semana
g. Número de periódicos vendidos en un día domingo
h. Género
i. Volumen de ventas de colchones indufoam en la tienda del Gallo más Gallo del municipio de
Siuna.
j. Preferencia por los refrescos
k. Altura del dosel de un árbol
l. Metros cúbicos de agua que consume al mes una familia
2.4. EJERCICIOS 15

m. Carrera que estudia


n. Código postal

6. Un grupo de estudiantes elabora una escala para calificar la calidad de los alimentos en la cafete-
ría, donde 0 representa “neutral: ni buena ni mala”. A las comidas malas se les asignan números
negativos y a las comidas buenas números positivos, y a la magnitud del número corresponde al
grado de lo bueno o lo malo. Las primeras tres comidas se califican con 2, 4 y -5. ¿Cuál es el nivel
de medición de este tipo de calificaciones? Explique su respuesta.
7. Un investigador médico desea estimar el tiempo de supervivencia de un paciente, después del
inicio de un tipo particular de cáncer y después de un régimen particular de radioterapia.

a. ¿Cuál es la variable de interés para el investigador?


b. ¿La variable del inciso (a) es cualitativa, cuantitativa discreta o cuantitativa continua?

8. Un investigador educacional desea evaluar la efectividad de un nuevo método de enseñanza de


lectura a estudiantes sordos. El logro al final de un período de enseñanza es medido por la califi-
cación de un estudiante en un examen de lectura.

a. ¿Cuál es la variable a medir?


b. ¿Qué tipo de variable es?

9. Un profesor propone a sus estudiantes del curso de Matemática Aplicada una prueba con 10
ejercicios de cálculo. Si al resolverla alguno de los ejercicios presenta algún error, el profesor
califica toda la prueba con 0, de otro modo la califica con 20. ¿Qué tipo de escala empleó?
10. En un censo de estudiantes de una universidad se ha considerado como variables importantes
para obtener cierto tipo de información a las siguientes: facultad de pertenencia, año de ingreso,
nacionalidad, tiempo de residencia en el país, número de semestres que lleva en la universidad,
grado en la escala de pensiones, grado de instrucción del padre, número de hermanos e ingreso
mensual familiar promedio. Hacer una clasificación de las variables que se usaron en el censo,
indicando la escala apropiada para determinar los valores de estas variables.
11. Con la finalidad de medir el nivel de satisfacción de sus clientes, un banco usó una encuesta
de opinión en donde se consultó acerca del servicio en general del banco. Las respuestas a las
preguntas podían ser: pésimo, regular, bueno y excelente. ¿Qué tipo de variable representa a las
respuestas, cualitativa o cuantitativa? ¿Qué escala se usó?
12. A un fumador se le solicita que diga el orden de preferencia de cuatro tipos de cigarrillos de marcas
A, B, C y D. Indicar el tipo de escala utilizada.
Capı́tulo 3
Organización y representación de
datos

Resultados de aprendizaje

• Define diagrama de tallo y hoja, distribución de frecuencias, tipos de frecuencias, gráficos para varia-
bles cualitativas y cuantitativas, criterios y normas para la representación de datos.
• Comprende los criterios y normas establecidas en la estadística para organizar y representar datos.
• Interpreta distribuciones de frecuencias y gráficos estadísticos, extrayendo información relevante.
• Organiza datos cualitativos y cuantitativos en distribuciones de frecuencias.
• Identifica el tipo de gráfico estadístico adecuado para representar un conjunto de datos.
• Representa distribuciones de frecuencias para datos cualitativos y cuantitativos mediante gráficos
estadísticos.

3.1. Diagrama de tallo y hoja

El diagrama de tallo y hoja es una combinación de la técnica de gráficas y la de ordenar, acá, lo estudia-
mos con el fin de ordenar un conjunto de datos. Para construir el diagrama de tallo y hoja se necesita
que la variable sea cuantitativa con al menos dos dígitos, seguido se separa el dígito principal (de la
izquierda) del segundo (de la derecha). El dígito principal será el tallo y se alinea verticalmente, el dígito
secundario es la hoja y se alinea horizontalmente.

Ejemplo 3.1.1. Los datos dados a continuación son las calificaciones de la asignatura Física general: 52,
66, 58, 63, 60, 77, 81, 82, 91, 90, 60, 87. Construya un diagrama de tallo y hoja.

La cantidad más pequeña es 52 y la más grande 91, además hay calificaciones entre 52 y 91, por tanto,
el tallo estará formado por los dígitos 5, 6, 7, 8 y 9, veamos a continuación el diagrama de tallo y hoja.

5 2, 8
6 0, 0, 3, 6
7 7
8 1, 2, 7
9 0, 1

A partir del diagrama tallo y hoja es posible escribir los datos ordenados de menor a mayor con más
facilidad: 52, 58, 60, 60, 63, 66, 77, 81, 82, 87, 90 y 91.

16
3.2. DISTRIBUCIÓN DE FRECUENCIAS 17

Para datos con tres dígitos, se separan los primeros dos dígitos principales para formar el tallo, el dígito
restante será la hoja, veamos el siguiente ejemplo.

Ejemplo 3.1.2. Suponga que cotizó juguetes para sus niños en las tiendas del mercado local de Siuna y
recolectó los siguientes datos: 350, 180, 466, 223, 541, 195, 220, 341, 278, 190, 342 y 188. E diagrama
de tallo y hoja se muestra a continuación.

18 0, 88
19 0, 5
22 0, 3
27 8
34 1, 2
35 0
46 6
54 1

Si la variable es de cuatro dígitos, tome los primeros dos para formar el tallo y los dos restantes para las
hojas, por ejemplo, 4456 el tallo sería 44 y la hoja 56.

Nota 3.1.1. En la actualidad con el desarrollo de los ordenadores el diagrama de tallo y hoja no es de
uso común, ya que, cualquier software para procesamiento de datos contiene funciones de ordenamiento.

3.2. Distribución de frecuencias

Cuando son muchos los valores recolectados de una variable se recomienda organizar los datos por
clases o intervalos, esto permite hacer un mejor análisis. La técnica usada para organizar o agrupar
datos en clases se llama distribución de frecuencias.

Definición 3.2.1. Distribución de frecuencias

Tabla que muestra las frecuencias de los datos agrupados en categorías o de manera individual.

La definición 3.2.1 exige definir los distintos tipo de frecuencias en un conjunto de datos.

Definición 3.2.2. Frecuencia absoluta f

Es el número de veces que aparece un determinado valor en el conjunto de datos.

La frecuencia de una clase o categoría es el número de valores que están dentro de esa clase o categoría.

Ejemplo 3.2.1.

La siguientes datos corresponden a la etnia de un grupo de estudiantes de URACCAN: mestizo, mestizo,


mayangna, miskitu, mayangna, mestizo, mestizo, creol, creol, creol. Las clases o categoría son las etnias.

Clases f
Mestizo 4
Mayangna 2
Miskitu 1
Creol 3

De los estudiantes de URACCAN cuatro pertenecen a la etnia mestiza y uno a la etnia miskita.
18 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS

Nota 3.2.1. En toda distribución de frecuencias, la suma de las frecuencias es igual al número total de
datos N . En Ejemplo 3.2.1, la suma de las frecuencias es N = 4 + 2 + 1 + 3 = 10, es decir, ese grupo de
estudiantes de URACCAN está formado por 10 estudiantes distribuidos en las etnias mestizo, mayangna,
miskitu y creol.

Definición 3.2.3. Frecuencia relativa fr

Es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.

ni
La frecuencia relativa de la i-ésima observación está dada por fr = , donde N es el total de datos.
N

Ejemplo 3.2.2.

La distribución de frecuencias relativas para la etnia del grupo de estudiantes del Ejemplo3.2.1, es:

Clases fr
Mestizo 4/10 = 0.4
Mayagna 2/10 = 0.2
Miskitu 1/10 = 0.1
Creol 3/10 = 0.3

Nota 3.2.2. La suma de las frecuencias relativas, en cualquier distribución de frecuencias, es igual a 1.

En estadísticas es más usual trabajar con las frecuencias relativas porcentuales, veamos a continuación
la definición.

Definición 3.2.4. Frecuencia relativa porcentual fr %

Es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos, multiplicado
por 100.

En otras palabras, la definición 3.2.4 quiere decir que la frecuencia relativa porcentual es el valor de la
frecuencia relativa multiplicada por 100.

Ejemplo 3.2.3.

La distribución de frecuencias relativas porcentuales para la etnia del grupo de estudiantes presentados
en 3.2.1, es:

Clases fr %
Mestizo 0.4 ∗ 100 = 40 %
Mayangna 0.2 ∗ 100 = 20 %
Miskitu 0.1 ∗ 100 = 10 %
Creol 0.3 ∗ 100 = 30 %

En la tabla lo más relevante es: 40 % de los estudiantes pertenecen a la etnia mestiza y 30 % a la creol.

Nota 3.2.3. En cualquier distribución de frecuencias, la suma de las frecuencias relativas porcentuales
es igual a 100 %.
3.2. DISTRIBUCIÓN DE FRECUENCIAS 19

Definición 3.2.5. Frecuencia acumulada fa

Es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

Ejemplo 3.2.4.

Distribución de frecuencias acumuladas para la etnia del grupo de estudiantes del Ejemplo 3.2.1.

Clases f fa
Mestizo 4 4
Mayagna 2 6
Miskitu 1 7
Creol 3 10

La tabla se interpreta: hay 6 estudiantes entre mestizos y mayangnas, otra interpretación puede ser:
Existen 7 estudiantes entre mestizos, mayangnas y miskitus.

Definición 3.2.6. Frecuencia relativa acumulada fra

Es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos.

Ejemplo 3.2.5.

Distribución de fra para la etnia de los estudiantes del Ejemplo 3.2.1.

Clases fa fra
Mestizo 4 4/10 = 0.4
Mayagna 6 6/10 = 0.6
Miskitu 7 7/10 = 0.7
Creol 10 1/10 = 1.0

Definición 3.2.7. Frecuencia relativa acumulada porcentual fra %

Es el cociente entre la frecuencia acumulada de una clase y el número total de datos multiplicado por 100,
o bien, es el producto de la frecuencia relativa acumulada de una clase por 100.

Ejemplo 3.2.6.

Distribución de fra % para la etnia de los estudiantes del Ejemplo 3.2.1.

Clases fra %
Mestizo 0.4 ∗ 100 = 40 %
Mayagna 0.6 ∗ 100 = 60 %
Miskitu 0.7 ∗ 100 = 70 %
Creol 1.0 ∗ 100 = 100 %

De la tabla se deduce: el 60 % de los estudiantes está entre las etnias mestiza y mayangna, otra interpre-
tación puede ser: existe un 70 % de los estudiantes entre mestizos, mayangnas y miskitus.
20 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS

Si la tabla contiene solo la frecuencia absoluta se llama distribución de frecuencia, si presenta la fre-
cuencia acumulada se llama distribución de frecuencia acumulada, distribución de frecuencia relati-
va si muestra la frecuencia relativa. Una distribución de frecuencias es una tabla que contiene: las
frecuencias absolutas, relativas, relativas porcentuales, acumuladas, relativas acumuladas y relativas
acumuladas porcentuales.

Ejemplo 3.2.7.

La siguiente tabla es distribución de frecuencias para la etnia de los estudiantes del Ejemplo 3.2.1.

Clases f fr fr % fa fra fra %


Mestizo 4 0.4 40 % 4 0.4 40 %
Mayagna 2 0.2 20 % 6 0.6 60 %
Mískitu 1 0.1 10 % 7 0.7 70 %
Creol 3 0.3 30 % 10 1.0 100 %

Hasta ahora se ha mostrado el cálculo de una distribución de frecuencias para variable cualitativa,
consideremos ahora el caso de las variables cuantitativas.

Primero se calcula la cantidad de clases (k) que debe tener la distribución de frecuencias, en libros
de referencia estadística se específica que una distribución no debe tener menos de 4 ni más de 20
clases, es decir, 4 ≤ k ≤ 20, por mencionar una, Besterfield (2009) describe que la cantidad de clases
en una distribución de frecuencia depende principalmente del juicio del analista, además, describe los
siguientes lineamientos generales:

• Usar de 5 a 9 clases cuando la cantidad de observaciones es menor que 100.


• Usar de 8 a 17 clases cuando la cantidad de observaciones es entre 100 y 500.
• Usar de 15 a 20, cuando la cantidad de observaciones es mayor de 500.

Para estimar la cantidad de clases se hace uso de la regla de Sturges, donde n es la cantidad de datos y
log el logaritmo en base 10.

k = 1 + 3.322 log(n) (3.2.1)

Otro parámetro a calcular el ancho de cada clase, para esto se precisa calcular el rango, el cual se define
mediante la siguiente ecuación.

R = Omáx − Omín (3.2.2)

donde Omáx y Omín son la observación más grande y más pequeña en el conjunto de datos. El ancho de
cada clase está dado por:

R
W = (3.2.3)
k

Cada clase está delimitada por el límite inferior de clase y el límite superior de clase, en la clase [21 − 29],
21 es el límite inferior y 29 el límite superior de clase. Si la variable es discreta y el valor del ancho
de clase es un decimal, redondee hacia abajo o hacia arriba, según sea conveniente. Si la variable es
continua, redondee a la cantidad de dígitos de la variable.

Nota 3.2.4. El límite inferior de la primera clase es el dato más pequeño Omín , sin embargo, el límite
superior de la última clase no necesariamente es la observación más grande (Omáx ).
3.2. DISTRIBUCIÓN DE FRECUENCIAS 21

Definición 3.2.8. Punto medio (P M )

El punto medio o marca de clase es el punto que está a la mitad de las fronteras de cada clase y es
representativo de los datos que están en esa clase. Es la semisuma de las fronteras de clase, es decir, es
la suma el límite superior e inferior de cada clase, el resultado se divide por dos.

Ejemplo 3.2.8.

Los datos muestran el número de bebés nacidos durante un año en 60 hospitales de una comunidad.
Construir una distribución de frecuencias.

30 55 27 45 56 48 45 49 32 57 47 56 37 55 52 34 54 42 32 59
35 46 24 57 32 26 40 28 53 54 29 42 42 54 53 59 39 56 59 58
49 53 30 53 21 34 28 50 52 57 43 46 54 31 22 31 24 24 57 29

Solución: n = 60, Omáx = 59 , Omín = 21 y R = 59 − 21 = 38. Cantidad de clases

k = 1 + 3.322 log(60) = 1 + 3.322(1.77815125) = 1 + 5.907018454 = 6.907018454 ∴ k≈7

R 38
Ancho de clase W = = = 5.428571429 ∴ W ≈ 6. La distribución de frecuencias es:
K 7

Clases PM f fr fr % fa fra fra %


[21 − 26] 23.5 6 0.1 10 % 6 0.1 10 %
[27 − 32] 29.5 12 0.2 20 % 18 0.3 30 %
[33 − 38] 35.5 4 0.07 7% 22 0.37 37 %
[39 − 44] 41.5 6 0.1 10 % 28 0.47 47 %
[45 − 50] 47.5 9 0.15 15 % 37 0.62 62 %
[51 − 56] 53.5 15 0.25 25 % 52 0.87 87 %
[57 − 62] 59.5 8 0.13 13 % 60 1.0 100 %

La distribución de frecuencias permite hacer cualquiera de los siguientes análisis.

• En cuatro hospitales de la comunidad han nacido entre 33 y 38 niños, inclusive, en tanto, en seis de los
hospitales han nacido entre 21 y 26 niños.
• En el 25 % de los hospitales han nacido entre 51 y 56 niños inclusive.
• En el 37 % de los hospitales han nacido como máximo 38 niños.

Ejemplo 3.2.9.

Los siguientes datos1 muestran “el diámetro (en cm) de la base del árbol con corteza”, construya una
distribución de frecuencias.

70.5 28.0 28.0 27.0 23.0 15.0 50.0 6.00 75.0 47.0 45.0 38.0 62.5 52.5 21.0 44.0
42.0 51.6 53.5 40.0 51.0 51.5 31.5 40.5 38.0 46.0 38.0 40.0 61.0 54.5 16.6 62.0
56.5 30.0 34.0 22.0 22.0 23.5 40.0 44.0 42.0 51.0 45.0 50.5 15.0 21.0 40.5 49.0
55.0 54.0 20.0 48.0 58.0 53.0 38.0 44.5 12.0 58.2 47.0 28.5 39.0 65.0 46.0
1
Estos datos fueron recolectados por Efraín Peralta Tercero, M. Sc., con los estudiantes de IV año de
Ingeniería Agroforestal 2015, como producto de una práctica de la asignatura dasometría en la comuni-
dad Llano Sucio, municipio de Prinzapolka.
22 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS

Solución: n = 63, Omáx = 75.0 , Omín = 6.00 y R = 75.0 − 6.00 = 69.0

k = 1 + 3.322 log(63) = 1 + 3.322(1.799340549) = 1 + 5.977409305 = 6.977409305 ∴ k≈7

R 69.0
Ancho de cada clase, W = = = 9.857142857 ∴ W ≈ 9.86
K 7

Clases PM f fr fr % fa fra fra %


[6.00 − 15.9] 11.0 4 0.06 6% 4 0.06 6%
[16.0 − 25.9] 21.0 8 0.13 13 % 12 0.19 19 %
[26.0 − 35.9] 31.0 7 0.11 11 % 19 0.30 30 %
[36.0 − 45.9] 41.0 17 0.27 27 % 36 0.57 57 %
[46.0 − 55.9] 51.0 18 0.29 29 % 54 0.86 86 %
[56.0 − 65.9] 61.0 7 0.11 11 % 61 0.97 97 %
[66.0 − 75.9] 71.0 2 0.03 3% 63 1.00 100 %

La distribución de frecuencias, permite realizar los siguientes análisis:

• 35 árboles tienen diámetro de la base con corteza entre 36.0 y 55.9 centímetros.
• El 3 % de árboles tienen diámetro de la base con corteza entre 66.0 y 75.9 centímetros, inclusive.
• El 57 % de los árboles tiene como máximo 45.9 centímetros de diámetro de la base con corteza.

3.3. Representación de datos

Esta sección se divide en dos partes, la primera aborda los gráficos más comunes para representar
variables cualitativas (categóricas) y la segunda, los gráficos para presentar variables cuantitativas.
Para construir los gráficos se hace uso de las frecuencias (absoluta, relativa, relativa porcentual); pero
es más común representar las frecuencias relativas porcentuales, sin embargo, hay gráficos como la
ojiva que usan frecuencias acumuladas.

3.3.1. Gráficas para datos cualitativos

Los datos categóricos son los que no provienen de mediciones, sino que se organizan en categorías, por
ejemplo: sexo, color de ojos, estado civil, religión, profesión, etc. Las gráficas para variables cualitativas
son los diagramas de sectores o pastel, gráfico de barras (horizontales y verticales), pictogramas y gráfico
de dona, aunque estos dos últimos no son considerados en este texto.

Qué gráfico elegir depende del propósito, al respecto Levine, Krehbiel y Berenson (2014) describen:

La gráfica que elija para hacer una representación gráfica de los datos de una sola variable categó-
rica depende de si objetivo consiste en comparar las categorías entre sí de manera directa (gráfica
de barras), en destacar la manera en que las categorías forman parte de un todo (gráfica circular),
o de que los datos se encuentren solamente en algunas de las categorías (gráfica de Pareto). (p. 39)

3.3.1.1. Gráfica de sectores

Este tipo de gráficas es útil cuando se quiere que las categorías formen parte de un todo, además,
muestran la cantidad de datos que pertenecen a cada una de las categorías como parte proporcional de
un círculo.

Para construir un diagrama de sectores partimos de que el círculo completo tiene 360◦ , así, hay que
calcular el espacio en grados para cada una de las frecuencias de cada categoría o clases.
3.3. REPRESENTACIÓN DE DATOS 23

El espacio en grados para frecuencias relativas porcentuales, está dado por:

fr × 360◦
Espacio en grados = (3.3.1)
100 %

Para frecuencias relativas, se tiene:

Espacio en grados = fr × 360◦ (3.3.2)

Para frecuencias absolutas, el espacio en grados es:

f × 360◦
Espacio en grados = (3.3.3)
n

Ejemplo 3.3.1.

La tabla de abajo muestra la frecuencia relativa para el color de ojos de un grupo de estudiantes. Se ha
calculado el espacio en grados que ocupará cada frecuencia relativa en la circunferencia.

Clases fr Espacio en grados


Negros 0.319 114.8
Café 0.340 122.4
Azules 0.086 31.0
Verdes 0.255 91.8

La Figura 3.1 muestra que el 31.9 % de los estudiantes tienen color de ojos negros, 34 % café y 8.5 % poseen
color de ojos azules.

Color de ojos de un grupo de estudiantes

Negros

31.9 %

Café 34.0 %

25.5 %
8.6 %
Verdes
Azules

Figura 3.1. Gráfica de sectores

3.3.1.2. Gráfica de barras

Las gráficas de barras tal y como lo plantean Johnson y Kuby (2012) muestran cantidad de datos de
cada categoría en un área rectangular de tamaño proporcional.

Por otro lado, Levine, Krehbiel y Berenson (2014) describen: “Una gráfica de barras compara diferentes
categorías utilizando barras individuales para representar los conteos de cada categoría. La longitud
de una barra representa la cantidad, la frecuencia o el porcentaje de datos que caen dentro de una
categoría” (p. 40).
24 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS

En una gráfica de barras, las clases están ubicadas en el eje horizontal y en el vertical las frecuencias
absolutas, relativas o relativas porcentuales de cada clase. Si se usan las frecuencias relativas para
construir el gráfico, entonces, éste se llama gráfico de barras de frecuencias relativas.

En el pie de cada barra se agrega el nombre de cada clase, también, es preferible agregar una etiqueta
en cada barra que específica la frecuencia perteneciente a cada clase, esa etiqueta se suele poner en la
parte superior de cada barra, o bien, centrada en el interior de la barra.

Ejemplo 3.3.2.

La Figura 3.2 es un gráfico de barras para la cantidad de estudiantes en las carreras Administración
de Empresas (Admon), Ingeniería Agroforestal (Agrof), Contabilidad (Conta) y Desarrollo Local (DL) de
URACCAN-Recinto Las Minas.

Grupo de estudiantes por carrera

10
9
8
7
6
f 5
4
3
2
1
Admon Agrof Conta Infor DL
Carreras

Figura 3.2. Gráfica de barras

Si el gráfico no dispone de etiquetas en el eje horizontal para cada barra como en la Figura 3.2, se agrega
una leyenda. Una leyenda es un recuadro en el que se describe el nombre de cada clase representada
en el gráfico, mediante un cuadro pequeño con el color de cada barra.

Ejemplo 3.3.3.

La Figura 3.3 es una gráfica de barras con leyendas.

Grupo de estudiantes por carrera

10 Administración
9 Agroforestal
8
7 Contabilidad
6 Informática
f 5
4 Desarrollo Local
3
2
1

Carreras

Figura 3.3. Gráfica de barras con leyendas

En los gráficos 3.2 y 3.3 es difícil ver a simple vista la frecuencia de cada carrera por lo que se puede
agregar una etiqueta en cada barra especificando la frecuencia de cada clase. La etiqueta se puede poner
en la parte superior de cada barra, o bien, centrada en el interior de la barra.
3.3. REPRESENTACIÓN DE DATOS 25

Ejemplo 3.3.4.

La Figura 3.4 es un gráfico de barras con etiquetas de datos en la parte superior de cada barra.

Marcas de celulares más vendidas en Siuna, 2017

43.2 %
40

30
fr 23.2 %
20

10 8.7 %
6.5 % 5.9 %

Samsung Plum Huewei Blu LG


Marcas de celulares

Figura 3.4. Gráfica de barras con etiquetas de datos

Para presentar gráficamente la información de dos variables cualitativas, se usan las gráficas de barras
agrupadas, veamos el siguiente ejemplo.

Ejemplo 3.3.5.

La Figura 3.5 es una gráfica de barras agrupadas que muestra información de un conjunto de estudiantes
por carrera y sexo.

Figura 3.5. Gráfica de barras agrupadas

De la Figura 3.5 se interpreta que en Agroforestal e Informática hay más hombres que mujeres, en tanto,
en Administración y Ciencias de la Educación hay más mujeres que hombres.

3.3.2. Gráficas para datos cuantitativos

Para representar datos cuantitativos están los histogramas, polígonos, ojivas y diagramas de cajas. Las
variables cuantitativas continuas quedan mejor representadas en histogramas o diagramas de cajas
(box-plot), las discretas en polígonos u ojivas.
26 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS

3.3.2.1. Histograma

Con respecto al histograma, Cobo et al. (2007) describe:

El histograma es una extensión del gráfico de barras que dibuja los rectángulos unidos entre sí,
indicando de este modo que existe continuidad en los valores de las variables. Un histograma es,
por tanto, un gráfico de variable continua dividida en intervalos de los que se eleva un rectángulo
con área proporcional a su frecuencia. (p. 36)

En el histograma las clases se señalan en el eje horizontal y las frecuencias (absolutas, relativas o
relativas porcentual) en el vertical. Muchas veces, es más práctico representar las marcas de clases a lo
largo del eje horizontal.

Ejemplo 3.3.6.

Los siguientes datos muestran la temperatura de Siuna a las nueve de la noche durante todo el mes de
octubre del 2016.

28.00 28.50 29.00 27.00 27.00 27.00 26.00 25.50 25.00 27.00 26.50
26.50 27.00 26.00 25.50 25.00 26.00 25.50 25.50 25.50 25.00 26.00
25.00 25.00 24.50 26.00 27.00 27.00 27.50 27.50 26.00

La Figura 3.6 muestra el histograma de los datos, en éste se aprecia que en diez días del mes de octubre,
la temperatura de Siuna a las nueve de la noche, osciló entre los 25 y 26 grados Celsius. En dos días del
mes de octubre en Siuna la temperatura osciló entre 28 y 29 grados Celsius a las nueve de la noche.

Temperatura de Siuna a las 09:00 p.m.

10
9
8
7
6
f 5
4
3
2
1
24 25 26 27 28 29
Temperatura

Figura 3.6. Histograma

3.3.2.2. Diagrama de caja

El diagrama de caja facilita mucha información, ya que, representa el rango intercuartil de los datos en
una caja que contiene la mediana representada.

Sobre el diagrama de cajas Walpole, Meyers, Meyers y Ye (2012) describen:

El rango intercuartil tiene como extremos el percentil 75 (cuartil superior) y el percentil 25 (cuartil
inferior). Además de la caja se prolongan “bigotes”, que indican las observaciones alejadas en la
muestra. Para muestras razonablemente grandes la presentación indica el centro de localización, la
variabilidad y el grado de asimetría. (p. 24)

Además, la gráfica da información de las observaciones (valores) atípicas o extremas. Los valores atípicos
son observaciones que se consideran inusualmente alejadas de la masa de datos, esto es, datos muy
pequeños o muy grandes.
3.3. REPRESENTACIÓN DE DATOS 27

Ejemplo 3.3.7.

La Figura 3.7 representa el diagrama de caja para la temperatura de Siuna a las nueve de la noche.

Temperatura de Siuna a las 09:00 p.m.

29
28
27
26
25

Figura 3.7. Diagrama de caja

La temperatura es mayor que 24.50◦ C y menor que 29.00◦ C, en el 25 % de los días del mes de octubre
la temperatura fue menor a los 25.50 grados. La temperatura mediana fue aproximadamente 66 grados
Celsius, la distribución de la variable temperatura es ligeramente asimétrica a la derecha (hay más trozo
de la caja por encima de la mediana).

3.3.2.3. Gráfico de líneas o polígono

El polígono es un segmentos de rectas conectados mediante puntos que se localizan directamente por
encima de los valores de las marcas de clases, por tanto, para su construcción en el eje horizontal se
representan las marcas de clases y en el vertical las frecuencias absolutas o relativas.

Si se han usado las frecuencias absolutas para graficar un polígono, éste se llama polígono de frecuen-
cias o bien un polígonos de frecuencias relativas si se han usado las frecuencias relativas.

Ejemplo 3.3.8.

Un experimento consistió en conocer el número de flores por plantas, para una muestra de 50 plantas,
cuyos datos se muestran a continuación.

10 8 4 6 5 8 10 3 7 3 6 7 2 8 2 3 9 7 8 1 9 10 5 6 4
7 6 5 7 3 5 8 4 7 6 4 6 3 9 8 6 3 7 8 7 9 2 6 6 0

Represente los datos en un polígono de frecuencias.

Solución: Por la fórmula de Sturges k = 6 clases, R = 10 − 0 = 10, la amplitud de cada clase es de W = 2


unidades. La distribución de frecuencias es:

Clases PM f fr fr % fa fra fra %


[0 − 1] 0.5 2 0.04 4% 2 0.04 4%
[2 − 3] 2.5 9 0.18 18 % 11 0.22 22 %
[4 − 5] 4.5 8 0.16 16 % 19 0.38 38 %
[6 − 7] 6.5 17 0.34 34 % 36 0.72 72 %
[8 − 9] 8.5 11 0.22 22 % 47 0.94 94 %
[10 − 11] 10.5 3 0.06 6% 50 1.00 100 %

La Figura 3.8 es el polígono de frecuencias, en éste observamos que 17 de las plantas tienen entre 6 y 7
flores, por otro lado, 11 plantas tienen entre 8 y 9 flores.
28 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS

Número de flores por plantas

17.0
14.2
11.4
f
8.5
5.7
2.84

0.5 2.5 4.5 6.5 8.5 10.5

Marcas de clase

Figura 3.8. Polígono de frecuencias

3.3.2.4. Ojiva

La ojiva o polígono acumulado es una gráfica de línea, en la que en el eje horizontal se trazan los límites
inferiores de cada clase y cierra con el límite superior de la última clase. En el eje vertical las frecuen-
cias acumuladas (fa ), frecuencias relativas acumuladas (fra ) o las frecuencias relativas acumuladas
porcentuales (fra %).

El límite inferior de la primera frontera en la ojiva, toma el valor cero, para indicar que no existen valores
acumulados por debajo de él, la frecuencia absoluta o relativa acumulada se escribe en el límite superior
de cada clase de la ojiva. La ojiva es útil para determinar el número de valores que se encuentran por
debajo de un valor específico.

Ejemplo 3.3.9.

La Figura 3.9 muestra la ojiva con frecuencias relativas acumuladas para el número de flores por plantas.

Número de flores por plantas

1.0

0.75
fra
0.50

0.25

0 2 4 6 8 10 12

Flores

Figura 3.9. Ojiva

De la ojiva se interpreta que el 72 % de las plantas tienen menos de 8 flores.

3.3.2.5. Gráfica de puntos

Sobre los gráficos de puntos, Triola (2018) describe que “Una gráfica de puntos consiste en un gráfico
de datos cuantitativos en el que cada valor de datos se representa como un punto sobre una escala
horizontal de valores. Los puntos que representan valores iguales se apilan” (p. 57).
3.3. REPRESENTACIÓN DE DATOS 29

Ejemplo 3.3.10.

La Figura 3.10 muestra la gráfica de puntos para el número de flores por plantas.

0 1 2 3 4 5 6 7 8 9 10

Número de flores

Figura 3.10. Diagrama de puntos

Los dos primeros puntos de la izquierda representan que una planta no tiene flores, y también hay una
con una flor. Los nueve puntos que se apilan por encima de seis, indican que nueve plantas tienen seis
flores.
30 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS

3.4. Ejercicios
1. Los siguientes datos muestran la etnia de un grupo de estudiantes de URACCAN.

Mestizo Creol Mestizo Mayagna Creol Miskitu


Mayagna Mestizo Miskitu Mestizo Creol Creol
Creol Mayagna Mestizo Miskitu Miskitu Miskitu
Mestizo Mayagna Mestizo Miskitu Mayagna Miskitu
Mayagna Mayagna Mestizo Miskitu Mayagna Miskitu
Mestizo Mayagna Mestizo Miskitu Mayagna Miskitu
Mestizo Creol Mestizo Mestizo Mayagna Mestizo
Mestizo Mayagna Mestizo Mestizo Mayagna Creol
Mestizo Mayagna Mestizo Miskitu Creol Miskitu

a. Construya una distribución de frecuencias completa


b. ¿Cuántos estudiantes son mayangnas?
c. ¿Qué porcentaje de los estudiantes es mestizo?
d. Construya e interprete un gráfico de barras en el que se representen las frecuencias relativas
e. Construya un gráfico de pastel en el que se presenten las frecuencias absolutas

2. Un conjunto de datos contiene 100 observaciones, la más grande es 315 y la más pequeña es 56.
a. ¿Cuántas clases debería tener la tabla de frecuencias?
b. ¿Cuál es el ancho de cada clase?
c. ¿Cuáles son las clases y las marcas de clases?
3. Complete la información de la siguiente tabla

Clases f fr fa
[0 − 10) 60 60
[10 − 20) 0.4
[20 − 30) 30 170
[30 − 40) 0.1
[40 − 50) 200

4. Las velocidades de 55 automóviles fueron medidas por un aparato radar en una calle citadina:

27 23 22 38 43 24 35 26 28 18 20
25 23 22 52 31 30 41 45 29 27 43
29 28 27 25 29 28 24 37 28 29 18
26 33 25 27 25 34 32 36 22 32 33
21 23 24 18 48 23 16 38 26 21 23

a. Ordene los datos usando un diagrama de tallo y hoja


b. Construya una distribución completa de frecuencias
c. Construya e interprete una ojiva

5. En un año reciente, 5524 personas murieron mientras trabajaban. Las causas fueron las siguien-
tes: transporte (2375), contacto con sujetos o equipo (884), asaltos o actos violentos (829), caídas
(718), exposición a sustancias dañinas o a un ambiente nocivo (552), incendios y explosiones
(166). Construya una gráfica de sectores que represente los datos.
6. Los siguientes datos muestran la temperatura (en grados Celsius) de Siuna, éstos fueron reco-
lectados a las cinco de la tarde y a las nueve de la noche durante todo el mes de julio del año
2016.

a. Represente los datos de la temperatura a las cinco de la tarde en un histograma de frecuen-


cias relativas
3.4. EJERCICIOS 31

5:00 pm
28.00 29.00 30.00 29.50 27.50 27.00 27.00 24.00 28.00 28.00
27.00 25.00 28.00 28.00 29.00 27.00 27.00 24.00 25.00 27.00
27.00 26.50 26.00 30.00 28.00 27.80 28.00 29.50 27.00 27.00
26.00
9:00 pm
26.50 26.50 27.00 27.00 28.00 27.00 26.00 24.00 26.50 26.50
26.00 24.00 27.00 26.50 27.00 26.00 26.50 24.00 24.00 25.50
26.00 26.00 26.00 27.50 26.30 27.50 37.00 27.00 25.00 26.00
25.50

b. Para la temperatura a las cinco de la tarde construya e interprete una ojiva de frecuencias
relativas acumuladas y para las nueve una ojiva de frecuencias acumuladas
c. Use un polígono de frecuencia para comparar las distribuciones de frecuencias de la tempe-
ratura de Siuna a las cinco de la tarde y a las nueve de la noche
d. ¿En cuales de estas dos horas es más amena la temperatura?

7. Se realizó un estudio para determinar la cantidad de personas que obtienen un empleo. La si-
guiente tabla incluye datos de 400 sujetos seleccionados al azar. Los datos se basan en resultados
del National Center for Carreer Strategies. Construya una gráfica de Pareto que corresponda a los
datos. Si alguien quiere conseguir un empleo, ¿cuál parece ser la técnica más efectiva?

Fuentes de empleo de los sujetos encuestados f


Anuncios clasificados 56
Empresas de búsquedas de ejecutivos 44
Contactos profesionales 280
Correo masivo 20

8. Remítase a los datos del ejercicio 7 y construya una gráfica de sectores. Compare esta gráfica con
la gráfica de Pareto. ¿Puede determinar qué gráfica es más efectiva para mostrar la importancia
relativa de las fuentes de empleo?
9. En un estudio de mercado, se pidió a 100 consumidores que seleccionaran el mejor reproductor
musical digital entre iPod, iRiver y Magic Star MP3. Con la finalidad de resumir las respuestas de
los consumidores en una tabla de frecuencias, ¿cuántas clases tendría la distribución de frecuen-
cias?
10. Se preguntó a un total de 1 000 residentes de Minnesota qué estación del año preferían. Los
resultados fueron que a 100 les gustaba más el invierno; a 300, la primavera; a 400, el verano y
a 200, el otoño. Si se resumieran los datos en una tabla de frecuencias, ¿cuántas clases serían
necesarias?, ¿cuáles serían las frecuencias relativas de cada clase?
11. Los siguientes datos representan la altura total de árboles (en metros), fueron recolectados en la
comunidad Llano Sucio, municipio de Prinzapolka, en una práctica de dasometría impartida en el
año 2015 por el maestro Efraín Peralta Tercero.

28 7 8 7 9 8 25 3 30 26 25 24
31 24 17 23 23 21 23 20 22 23 18 17
19 21 19 20 33 32 19 32 30 26 24 18
18 20 28 29 28 31 28 30 12 20 28 30
31 30 20 32 32 30 28 25 10 30 29 27
30 32 30

a. Construya una distribución de frecuencias


b. Represente los datos en una ojiva e interprete el resultado
c. Construya e interprete un polígono de frecuencias

12. Los siguientes datos muestran la edad de 24 niños del barrio Gilberto Romero del municipio de
Siuna.
32 CAPÍTULO 3. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS

2 1 5 5 5 5 4 4 5 6 1 6
2 1 5 8 7 6 2 5 7 3 4 5

a. Represente los datos en un gráfico de puntos


b. ¿Qué interpreta del gráfico del apartado a.?

13. La siguiente tabla muestra información de un grupo de personas por etnia y sexo. Construya e
interprete una gráfica de barras agrupadas.

Etnia Femenino Masculino


Mestizos 120 80
Mayagnas 70 90
Mískitus 20 50
Creoles 33 23
Garífunas 2 4

14. Los estudiantes de II año de contabilidad de URACCAN-Recinto las Minas aplicaron una encuesta
a las modalidades sabatina y por encuentro, con el propósito de obtener información sobre los
módulos de inglés. Una de las variables fue la edad (en años) del estudiantado, cuyos datos se
muestran a continuación.

19 20 23 24 25 26 28 19 35 18 18 18 31 26 25 24 23 21
21 21 20 36 17 19 18 28 30 36 23 25 27 27 24 31 36 20
22 35 23 27 25 23 21 24 19 20 18 23 16 32 24 20 19 30

a. Use un diagrama de tallo y hoja para organizar los datos


b. Construya una distribución de frecuencias completa
c. Trace e interprete una ojiva de frecuencias relativas
Capı́tulo 4
Índices estadísticos

Resultados de aprendizaje

• Define medidas de tendencia central, dispersión y posición de conjuntos de datos.


• Describe cómo se aglutinan y dispersan los datos con respecto al centro.
• Comprende propiedades de la media aritmética, varianza muestral, desviación estándar, cuartiles y
percentiles.
• Analiza la forma de la distribución de los datos, mediante el coeficiente de sesgo P de Pearson.
• Identifica la mejor medida de tendencia central de un conjunto de datos.
• Calcula medidas de tendencia central, dispersión y posición para datos agrupados y no agrupados.
• Usa el coeficiente de variación para comparar la dispersión entre varios conjuntos de datos expresados
en diferentes unidades.
• Interpreta medidas de tendencia central, dispersión y posición de un conjunto de datos.

Los índices estadísticos son útiles para describir características numéricas de una población o muestra
mediante cantidades llamadas parámetros y estadísticos. Las medidas descriptivas se dividen en tres
grupos: medidas de tendencia central, medidas de variabilidad o posición y medidas, todas válidas
para variables cuantitativas, excepto, la moda, ya que, puede determinarse en variables cualitativas y
cuantitativas.

4.1. Medidas de tendencia central

Las medidas de tendencia central permiten analizar como se aglutinan los datos con respecto a un
centro puede ser la media, la moda o la mediana, según cual sea la mejor medida de tendencia central.

4.1.1. Media aritmética

La media aritmética, media o promedio de un conjunto de datos es el centro de gravedad de la distribu-


ción de la variable, por tanto, no se debe pensar en que esta medida se llama media, porque reparte a
los datos en dos partes iguales, para aclarar esto veamos el siguiente ejemplo.

33
34 CAPÍTULO 4. ÍNDICES ESTADÍSTICOS

Ejemplo 4.1.1. Centro de masa

Suponga que se coloca una persona adulta (con masa 190 libras) en un extremo de un sube y bajas, en el
otro extremo se colocan tantos niños (hasta que sus masas sumen 190 libras) hasta que el sube y bajas
esté equilibrado, cuando esto ocurre se ha encontrado el centro de gravedad del total de masas, es decir, la
media de las masas, sin embargo, los extremos no contienen la misma cantidad de elementos (personas),
esto mismo ocurre con la media de un conjunto de datos.

Para calcular la media aritmética es preciso saber de antemano si los datos provienen de una población
o una muestra. La siguientes ecuaciones corresponden a la media de una población y una muestra,
respectivamente.

N
X
xi
i=1 x1 + x2 + · · · + xN
µ= = (4.1.1)
N N

n
X
xi
i=1 x1 + x2 + · · · + xn
x̄ = = (4.1.2)
n n

La media es única, es decir, un conjunto de datos tiene una sola media, además, la unidad de medida
de la media es la misma unidad de medida de la variable. El resultado de la media se debe expresar con
la misma cantidad de cifras significativas que presentes en la variable.

Ejemplo 4.1.2. Edad promedio

Los siguientes datos representan la edad de una población formada por 7 personas adultas: 45, 56, 50,
49, 53, 48, 50. La edad media en poblacional formada por siete personas está dada por:

N
X
xi
i=1 x1 + x2 + · · · + xN 45 + 56 + 50 + 49 + 53 + 48 + 50
µ= = = ≈ 50
N N 7

Ejemplo 4.1.3. Peso promedio

Los siguientes pesos (en kg) fueron recolectados en una muestra de cinco niños: 10.20, 11.02, 10.90, 9.95
y 8.99. El peso medio está dado por:

n
X
xi
i=1 x1 + x2 + · · · + xn 10.20 + 11.02 + 10.90 + 9.95 + 8.99
x̄ = = = ≈ 10.21
n n 5

La principal desventaja de la media es que se ve afectada por valores extremos, es decir, datos muy
pequeños o muy grandes, veamos el siguiente ejemplo.

Ejemplo 4.1.4. Media aumentada

Las edades de un grupo de personas son 24, 33, 25, 28, 30 y 80. Sea x la edad, entonces, la edad media
está dada por:

n
X
xi
i=1 24 + 33 + 25 + 28 + 30 + 80 220
x̄ = = = ≈ 37
n 6 6
4.1. MEDIDAS DE TENDENCIA CENTRAL 35

La edad media 37 años se ve afectada por el último valor (80), por tanto, ésta no es representativa del
grupo, ya que todos, salvo dos personas tienen edades entre 24 y 33 años. La edad 80 años afecta en
exceso la media.

4.1.2. Moda

La moda se define como la observación que tiene mayor frecuencia en un conjunto de datos, matemáti-
camente se define mediante la siguiente ecuación.

M0 = Máx{fi : i ∈ {1, . . . , n}} (4.1.3)

La moda es útil para resumir todos los niveles de datos, nominal, ordinal, de razón y de intervalo. Por
otro lado, a diferencia de la media la moda no se ve afectada por valores extremos.

Ejemplo 4.1.5. Sondeo

En un estudio de sondeo público se entrevistó a 100 personas, de las cuales 30 eran profesores, 20
mecánicos, 10 médicos, 15 albañiles, 18 taxistas y 7 comerciantes. La mayoría de los entrevistados fueron
profesores, por lo que la profesión profesores es la moda.

Ejemplo 4.1.6. Salarios

Los salarios de 7 personas son: 7,000; 8,000; 7,000, 9,500; 12,350; 7,000 y 35,900 córdobas. La moda
es M0 = 7, 000 córdobas, ya que, la frecuencia es 3, el salario modal es 7,000 córdobas.

Es posible que un conjunto de datos no tenga moda o tenga de más de una moda. Si ningún valor se
repite no hay moda, si hay una moda el conjunto de datos es unimodal, bimodal con dos y multimodal
con más de dos modas. Cuando un conjunto de datos es multimodal, el uso de la moda puede resultar
confuso.

Ejemplo 4.1.7. Moda

El conjunto de datos 2.1, 1.10, 16.1, 45.7, 67.9 no tiene moda, ya que, ningún valor se repite, en tanto 20,
33, 45, 45, 45, 90, 105, 105, 105 es un conjunto de datos bimodal con modas M0 = 45 y M0 = 105, ya
que, ambos se repiten con la misma frecuencia.

4.1.3. Mediana

La mediana Me divide al conjunto de datos en dos partes exactamente iguales, el 50 % por debajo de
la mediana y el otro 50 % por encima de ésta. Para calcular manualmente la mediana primero hay que
ordenar los datos en orden ascendente, es decir, de menor a mayor, si se implementa un software el
proceso de ordenamiento no es necesario.

El cálculo de la mediana depende de la cantidad de datos (impar o par). Si el número de valores es


impar, la mediana será el valor que está en medio y se determina a partir de la posición de la mediana
(número de posiciones desde cualquiera de los extremos) y se define mediante la siguiente ecuación.

n+1
P Me = (4.1.4)
2

La mediana será el valor que corresponde al dato en esa posición ordenada.


36 CAPÍTULO 4. ÍNDICES ESTADÍSTICOS

Ejemplo 4.1.8. Mediana con n impar

Calcule la mediana de los datos 45, 52, 49, 76, 60, 48, 56.

Solución: Datos ordenados: 45, 48, 49, 52, 56, 60, 76, con n = 7, la posición de la mediana es:

n+1 7+1
P Me = = =4
2 2

La mediana es el dato de la cuarta posición (de izquierda a derecha o de derecha a izquierda) en los datos
ordenados, Me = 52. Por debajo y encima de 52 se encuentran exactamente tres valores.

Si el número de observaciones es par, no hay una sola observación en medio, sino dos, en este caso se
promedia ambas observaciones, ese promedio es la mediana.

Ejemplo 4.1.9. Mediana con n par

Calcular la mediana de 45, 52, 49, 40, 76, 60, 48, 56.

Solución: Se ordenan los datos de manera ascendente 40, 45, 48, 49, 52, 56, 60, 76. Para n = 8, la
posición de la mediana es:

n+1 8+1
P Me = = = 4.5
2 2

La mediana es el promedio de los datos de la cuarta y quinta posición en los datos ordenados, es decir,
49 + 52
Me = = 50.5. Por debajo y encima de 49 y 52 se encuentran exactamente tres valores.
2

Para conocer la forma o patrón de la distribución (simétrica o sesgada) de los datos a lo largo del rango
completo de todos los valores se comparan la media con la mediana, resultando los siguientes casos:

• Media < mediana, la distribución es negativa o sesgada hacia la izquierda.


• Media = mediana, la distribución es simétrica o sin sesgo.
• Media > mediana, la distribución es positiva o sesgada hacia la derecha.

En la mayoría de los casos, cuando los datos están sesgados la mejor medida de tendencia central es la
mediana.

Ejemplo 4.1.10. Calificaciones

Los siguientes datos son las calificaciones del curso física general 80, 90, 54, 33, 60, 66, 89, 80, 71, 63,
65, 71, 95. Calcule e identifique la mejor medida de tendencia central. La media (al entero más cercano)
está dada por:

80 + 90 + 54 + 33 + 60 + 66 + 89 + 80 + 71 + 63 + 65 + 71 + 95
x̄ = = 71 puntos
13

La moda es 71 y 80 puntos, por tanto, es un conjunto de datos bimodal. Para calcular la mediana se
ordenan los datos, 33, 54, 60, 63, 65, 66, 71, 71, 80 80, 89, 90, 95. La posición de la mediana es:

13 + 1
P Me = =7 ∴ Me = 71 puntos
2

La media y la mediana son iguales, por tanto, la distribución de los datos es simétrica, la medida de
tendencia central puede ser la media o la mediana.
4.2. MEDIDAS DE DISPERSIÓN 37

4.2. Medidas de dispersión

Las medidas de dispersión proporcionan información sobre la manera que los datos se dispersan o
varían con respecto a un centro que puede ser la media o mediana, Johnson y Kuby (2012) concluyen
que “describen la cantidad de dispersión o variabilidad que se encuentra entre los datos: los datos
estrechamente agrupados tienen valores relativamente pequeños y los datos más ampliamente dispersos
tienen valores más grandes” (p. 74).

4.2.1. Varianza

La varianza es una medida numérica que mide las variación de los datos en una población o una
muestra. Webster (2000) describe que “la varianza es el promedio de las observaciones con respecto a su
media elevadas al cuadrado” (p. 48). La varianza mide la dispersión, por tanto, a mayor varianza mayor
dispersión de los datos con respecto a la media.

La ecuación para calcular la varianza poblacional está dada por la siguiente ecuación.

N
X
(xi − µ)2
i=1 (x1 − µ)2 + (x2 − µ)2 + · · · + (xN − µ)2
σ2 = = (4.2.1)
N N

La ecuación de la varianza muestral es similar a la de la varianza poblacional, con la diferencia que se


divide por n − 1, debido a que se tienen n − 1 grados de libertad (el número de grados de libertad es
igual al número de observaciones menos toda restricción impuesta en tales observaciones), ya que, la
muestra está menos dispersa de la población de la cual se tomó.

n
X
(xi − x̄)2
i=1 (x1 − x̄)2 + (x2 − x̄)2 + · · · + (xn − x̄)2
s2 = = (4.2.2)
n−1 n−1

Las desventajas de la varianza es que al igual que la media, es un índice muy sensible a las puntuaciones
extremas, además, la unidad de medida difiere de la unidad de medida del conjunto de los datos, es decir,
la varianza se mide en unidades cuadradas, lo que la hace más difícil de interpretar en relación con los
datos.

Ejemplo 4.2.1. ingresos

Los siguientes datos son los ingresos (en córdobas) de una muestra de cinco persona, 12,000; 16,500;
18,120; 17,300 y 15,090. La varianza está dada por:

12, 000 + 16, 500 + 18, 120 + 17, 300 + 15, 090
x̄ = = 15, 802
5

(12000 − 15802)2 + (16500 − 15802)2 + (18120 − 15802)2 + (17300 − 15802)2 + (15090 − 15802)2
s2 =
4

(−3802)2 + (698)2 + (2318)2 + (1498)2 + (−712)2 14455204 + 487204 + 5373124 + 2244004 + 506944
= =
4 4

23066480
= ≈ 5, 766, 620
4

La varianza es de 5, 766, 620 córdobas al cuadrado.


38 CAPÍTULO 4. ÍNDICES ESTADÍSTICOS

4.2.2. Desviación estándar o típica

La desviación estándar es la raíz cuadrada de la varianza y se representa por, s la varianza muestral y σ


la poblacional. La desviación estándar es más fácil de interpretar en relación con los datos, ya que, tiene
la misma unidad de medida que el conjunto de datos. Cobo et al. (2007) describe que “la desviación
estándar representa el alejamiento prototípico con el centro” (p. 22).

Sobre la utilidad de la desviación estándar, Webster (2000) describe:

El concepto de desviación estándar es muy importante en los negocios y en la economía. Por ejem-
plo, en finanzas la desviación estándar se utiliza como medida de riesgo relacionada con varias
oportunidades de inversión. Mediante el uso de la desviación estándar para medir la variabilidad
en las tasas de rendimiento ofrecidas por diferentes inversiones, el analista financiero puede medir
el nivel de riesgo que tiene cada activo financiero. Generalmente, entre mayor sea la desviación es-
tándar de la tasa de rendimiento de una inversión en particular, mayor será el grado de riesgo. (p.
49)

Ejemplo 4.2.2. Desviación estándar


√ √
La desviación estándar de los datos del Ejemplo 4.2.1, está dada por s = s2 = 5766620 = 2, 401.
La desviación estándar de los ingresos es de 2, 401 córdobas, los ingresos se alejan en promedio 2, 401
córdobas con respecto al ingreso medio.

En la sección 4.1.3 se abordó la forma de la distribución de los datos comparando la media con la
mediana, una forma alternativa es calcular el coeficiente de sesgo, P de Pearson, el cual se define
mediante la siguiente ecuación.

3(x̄ − Me )
P = (4.2.3)
s

La forma de la distribución está dada por:

• Si P < 0, la distribución está sesgada hacia la izquierda


• Si P = 0, la distribución es simétrica, es decir, los datos se distribuyen normalmente
• Si P > 0, la distribución está sesgada hacia la derecha

Ejemplo 4.2.3. Sesgo

Los siguientes datos representan la cantidad de horas que un grupo de niños ve televisión durante el día:
2, 3, 5, 1, 2, 3, 6 y 4. La media, mediana y la desviación estándar son:

2+3+5+1+2+3+6+4
x̄ = = 3.25
8

Datos ordenados: 1, 2, 2, 3, 3, 4, 5 y 6

n+1 8+1 3+3


P Me = = = 4.5 ∴ Me = =3
2 2 2

Realizando el cálculo de la desviación estándar obtiene s = 1.67. El coeficiente de sesgo de Pearson está
dado por:

3(x̄ − Me ) 3(3.25 − 3) 3(0.25)


P = = = = 0.45 > 0
s 1.67 1.67
4.2. MEDIDAS DE DISPERSIÓN 39

El conjunto de datos está sesgado hacia la derecha, es decir, la mayoría de los valores se encuentran en
la parte superior de la distribución.

4.2.3. Coeficiente de variación

Sobre el coeficiente de variación, Acosta, Piña y Espallargas (2008) concluyen:

En ocasiones resulta necesario contar con un estadígrafo que refleje la dispersión sin depender de la
magnitud de las observaciones, esto es que sea un valor relativo. Esta necesidad surge generalmente
cuando se comparan las dispersiones entre varios conjuntos expresados en unidades diferentes, o
incluso entre variables expresadas en las mismas unidades pero con diferencias significativas en
sus valores medios. Este estadístico es el denominado coeficiente de variación. (p. 25)

El coeficiente de variación es el cociente de la desviación estándar y la media, multiplicado por cien.

s
CV = 100 (4.2.4)

Sobre los valores que toma el coeficiente de variación, Wikipedia (2020) describe:

A mayor valor del coeficiente de variación mayor heterogeneidad de los valores de la variable; y a
menor coeficiente de variación, mayor homogeneidad en los valores de la variable. Por ejemplo, si el
coeficiente de variación es menor o igual al 80 %, significa que la media aritmética es representativa
del conjunto de datos, por ende el conjunto de datos es "Homogéneo". Por el contrario, si el coefi-
ciente de variación supera al 80 %, el promedio no será representativo del conjunto de datos (por lo
que resultará "Heterogéneo").

Ejemplo 4.2.4. Coeficiente de variación

Calcular el coeficiente de variación para la edad (años) y el peso (libras) de cinco personas, cuyos datos se
muestran en la siguiente tabla.

Edad: 31 27 35 21 30
Peso: 140 160 170 145 180

Solución: Trabajando los datos por separado, se tiene:

Edad

31 + 27 + 35 + 21 + 30
x̄ = = 28.8 años
5
r
(31 − 28.8)2 + (27 − 28.8)2 + (35 − 28.8)2 + (21 − 28.8)2 + (30 − 28.8)2
s = = 5.22 años
4
s  
5.22
CV = 100 ⇒ CV = 100 = 18.1 %
x̄ 28.8
40 CAPÍTULO 4. ÍNDICES ESTADÍSTICOS

Peso

140 + 160 + 170 + 145 + 180


x̄ = = 159 libras
5
r
(140 − 159)2 + (160 − 159)2 + (170 − 159)2 + (145 − 159)2 + (180 − 159)2
s = = 16.7 libras
4
s  
16.7
CV = 100 CV = 100 = 10.5 %
x̄ 159

Conclusión: Comparando ambos coeficientes, hay más variación en la edad (18.1 %) que en el peso
(10.5 %) de los estudiantes, en ambos casos CV < 80 %, por tanto, la media aritmética es representati-
va del conjunto de datos, lo que significa que tanto el peso y la edad son datos homogéneos.

4.3. Medidas de posición

Las medidas de posición también miden la dispersión de un conjunto de datos, por tanto, son medidas
alternativas a las medidas de dispersión, sobre el uso de éstas Johnson y Kuby (2012) describen “las
medidas de posición se usan para describir la posición que un valor de datos específico posee en relación
con el resto de los datos cuando están en orden clasificado” (p. 82). Dentro de las medidas de posición
están los cuartiles, deciles y percentiles, aquí se estudian los dos más comunes, cuartiles y percentiles.

4.3.1. Cuartiles

Los cuartiles dividen al conjunto de datos en cuatro partes iguales, resultando de esta forma tres cuar-
tiles. El primer cuartil Q1 separa al 25 % de los valores más pequeños del otro 75 % más grande. El
segundo cuartil Q2 es la mediana; 50 % de los datos son más pequeños o iguales que el cuartil dos y 50 %
mayores o iguales que éste. El tercer cuartil Q3 separa al 75 % de los valores más pequeños del otro 25 %
más grande.

El segundo cuartil es la mediana, por eso no es común calcularlo; pero si los cuartiles uno y tres. Antes
de calcular los cuartiles, primero hay que determinar la posición de cada uno en los datos ordenados
ascendentemente. La posición del primer y tercer cuartil, está dada mediante las siguientes ecuaciones:

n+1
P Q1 = (4.3.1)
4

3(n + 1)
P Q3 = (4.3.2)
4

Para determinar el cuartil en la serie de datos ordenados, se hace uso de las siguientes reglas.

Regla 4.3.1. Regla 1

Si el valor ordenado es un número entero, el cuartil es igual al valor que corresponde a ese dato ordenado.

Regla 4.3.2. Regla 2

Si el valor ordenado es una mitad fraccionaria (0.5, 1.5, 2.5, 3.5, 4.5, 5.5, etc.) , el cuartil es igual al valor
que corresponde al promedio de los valores de los datos ordenados implicados.
4.3. MEDIDAS DE POSICIÓN 41

Regla 4.3.3. Regla 3

Si el valor ordenado no es un número entero ni una mitad fraccionaria, se redondea el resultado al entero
más cercano y se selecciona el valor correspondiente a ese dato ordenado.

Ejemplo 4.3.1. Cuartiles

Calcular el primer y tercer cuartil para la temperatura (grados Celsius) de Siuna a la siete de la mañana du-
rante los primeros diez días del mes de diciembre del año 2016. Los datos son: 24.80, 24.50, 23.50, 23.00, 24.00,
24.00, 25.00, 23.50, 23.50, 23.50

Solución: Datos ordenados: 23.0, 23.5, 23.5, 23.5, 23.5, 24.0, 24.0, 24.524.8, 25.0. A continuación se muestra el
cálculo para cada cuartil especificando la regla usada para determinar la posición en el conjunto de datos
ordenados.

Primer cuartil

n+1 10 + 1
P Q1 = = = 2.75 ≈ 3.00 Regla 3
4 4

En los datos ordenados Q1 es el valor de la tercera posición Q1 = 23.50. El 25 % de las temperaturas a la


siete de la mañana en el mes de diciembre de 2016 fueron menores o iguales a 23.50◦ C, en tanto, el 75 %
de las temperaturas excedieron este valor.

Tercer cuartil

3(n + 1) 3(10 + 1)
P Q3 = = = 8.25 ≈ 8.00 Regla 3
2 4

El tercer cuartil es el dato que ocupa la octava posición en los datos ordenados, Q3 = 24.50. El 75 % de las
temperaturas a la siete de la mañana en el mes de diciembre de 2016 fueron menores o iguales a 24.50◦ C
y 25 % de éstas fueron mayores o iguales a los 24.50◦ C.

4.3.2. Percentiles

Los percentiles dividen los datos en cien partes iguales, y por tanto, todo conjunto de datos tendrá 99
percentiles. El primer percentil es el valor por debajo del cual se encuentra el 1 % de las observaciones
y el resto, 99 % se encuentran por encima de ese valor.

Los percentiles se representan mediante subíndices, por ejemplo el quinto percentil se representa por
P5 y su ubicación (en los datos ordenados) es L5 . La posición del P -ésimo percentil se obtiene mediante
la siguiente ecuación:

P
LP = (n + 1) (4.3.3)
100

En todo conjunto de datos el percentil 25 coincide con el primer cuartil Q1 , es decir, P25 = Q1 , también,
P50 = Q2 = Me y P75 = Q3 . Para determinar el valor del percentil en la serie de datos ordenados, se
aplica cualquiera de las siguientes reglas.

Regla 4.3.4. Regla 1

Si el valor ordenado es un número entero, el percentil es igual al valor que corresponde a ese dato ordenado.
42 CAPÍTULO 4. ÍNDICES ESTADÍSTICOS

Regla 4.3.5. Regla 2

Si el valor ordenado es un número decimal, el percentil es igual al valor que corresponde a ese dato
ordenado, más el producto del punto decimal con la diferencia de la observación que está en la posición
k + 1 y la posición k.

Ejemplo 4.3.2. Percentiles

Calcular el percentil 35 de los datos del Ejemplo 4.3.1.

P 35
Solución: L35 = (n + 1) = (10 + 1) = (11)(0.35) = 3.85. Por la Regla 2, el percentil 35 será el valor
100 100
correspondiente a la tercera posición, más el producto de 0.85 con la diferencia de la cuarta y tercera
posición, es decir:

P35 = 23.5 + 0.85(23.5 − 23.5) = 23.5 + 0.85(0) = 23.5

4.4. Medidas de tendencia central para datos agrupados

En esta sección se muestra el cálculo de las medidas de tendencia central: media, moda y mediana para
datos agrupados en distribuciones de frecuencias.

4.4.1. Media aritmética

La media en una distribución de frecuencias se calcula como, el cociente de la suma del producto de las
frecuencias (f ) con los puntos medios de cada clase (P M ) y el tamaño de la muestra (n) es decir:

k
X
f · PM
i=1
x̄ = (4.4.1)
n

donde k es la cantidad de clases de la distribución de frecuencias. La media acá tiene exactamente la


misma interpretación que la media para datos no agrupados.

Ejemplo 4.4.1.

Calcular la media para la distribución de frecuencias del número de bebés nacidos en 60 hospitales de
una comunidad.

Solución: La distribución de frecuencias es:

Clases PM f fr fr % fa fra fra %


[21 − 26] 23.5 6 0.1 10 % 6 0.1 10 %
[27 − 32] 29.5 12 0.2 20 % 18 0.3 30 %
[33 − 38] 35.5 4 0.07 7% 22 0.37 37 %
[39 − 44] 41.5 6 0.1 10 % 28 0.47 47 %
[45 − 50] 47.5 9 0.15 15 % 37 0.62 62 %
[51 − 56] 53.5 15 0.25 25 % 52 0.87 87 %
[57 − 62] 59.5 8 0.13 13 % 60 1.0 100 %

Se calcula el producto de las frecuencias con los puntos medios de cada clase y la sumatoria, veamos.
4.4. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS 43

Clases PM f f · PM
[21 − 26] 23.5 6 141
[27 − 32] 29.5 12 354
[33 − 38] 35.5 4 142
[39 − 44] 41.5 6 249
[45 − 50] 47.5 9 427.5
[51 − 56] 53.5 15 802.5
[57 − 62] 59.5 8 476
7
X
f · P M = 2592
i=1

k
X 7
X
f · PM f · PM
i=1 i=1 2592
x̄ = = = = 43.2
n n 60

En los 60 hospitales de esa comunidad, nacen en promedio 43.2 niños.

4.4.2. Moda

En un conjunto de datos la moda es la observación que se presenta con mayor frecuencia, para datos
agrupados en una distribución de frecuencias partimos de esta hipótesis, localizando la clase con la ma-
yor frecuencia y que se denomina clase modal. Para calcular la moda en una distribución de frecuencias
se usa la siguiente ecuación.

 
Da
Mo = Lmo + ·W (4.4.2)
Db + Da

Donde Lmo es límite inferior de la clase modal; Da es la diferencia entre la frecuencia de la clase modal
y la clase que antecede; Db es la diferencia entre la frecuencia de la clase modal y la clase que se sigue
y W es la amplitud o ancho de la clase modal.

Ejemplo 4.4.2.

Calcular la moda para la distribución de frecuencias del número de bebés nacidos en 60 hospitales de una
comunidad mostrada en el Ejemplo 4.4.1.

Solución: Por la ecuación 4.4.2, se tiene:

   
Da 15 − 9
Mo = Lmo + · W = 51 + ·6
Db + Da (15 − 8) + (15 − 9)
   
15 − 9 6
= 51 + · 6 = 51 + ·6
(15 − 8) + (15 − 9) 7+6
 
6
Mo = 51 + · 6 = 51 + (0.46)(6) = 51 + 2.8 = 53.8
13

Lo común es que en los 60 hospitales de la comunidad nazcan alrededor de 54 bebés.


44 CAPÍTULO 4. ÍNDICES ESTADÍSTICOS

4.4.3. Mediana

Para calcular la mediana, primero hay que localizar la clase mediana en la distribución de frecuencias,
n
la clase mediana es la primera clase con frecuencia acumulada mayor o igual a , en seguida se aplica
2
la siguiente ecuación.

 
n/2 − F
Me = Lmd + ·W (4.4.3)
fmd

Donde Lmd es límite inferior de la clase mediana; F es la frecuencia acumulada de la clase que antecede
a la clase mediana; fmd es la frecuencia de la clase mediana y W es el ancho o amplitud de la clase
mediana.

Ejemplo 4.4.3.

Calcular la mediana para la distribución de frecuencias del número de bebés nacidos en 60 hospitales de
una comunidad mostrada en el Ejemplo 4.4.1.

Solución: La distribución de frecuencias se muestra a continuación.

Clases PM f fr fr % fa fra fra %


[21 − 26] 23.5 6 0.1 10 % 6 0.1 10 %
[27 − 32] 29.5 12 0.2 20 % 18 0.3 30 %
[33 − 38] 35.5 4 0.07 7% 22 0.37 37 %
[39 − 44] 41.5 6 0.1 10 % 28 0.47 47 %
[45 − 50] 47.5 9 0.15 15 % 37 0.62 62 %
[51 − 56] 53.5 15 0.25 25 % 52 0.87 87 %
[57 − 62] 59.5 8 0.13 13 % 60 1.0 100 %

n 60
La primera clase con frecuencia acumulada mayor que = = 30 es la correspondiente a la clase
2 2
[45 − 50], la mediana está dada por:

     
n/2 − F 30 − 28 2
Me = Lmd + · W = 45 + · 6 = 45 + · 6 = 45 + (0.05)(6) = 45 + 0.3 = 45.3
fmd 37 37

Los nacimientos medianos en los 60 hospitales de la comunidad son aproximadamente 46 niños.

4.5. Medidas de dispersión para datos agrupados

En esta sección se calcula la varianza y desviación estándar para datos agrupados.

4.5.1. Varianza

La siguiente ecuación permite calcular a varianza en una distribución de frecuencias, donde n es la


cantidad de datos, k clases y P M puntos medios.

k
X
f · P M 2 − nx̄2
i=1
s2 = (4.5.1)
n−1
4.5. MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS 45

Ejemplo 4.5.1.

Calcular la varianza para la distribución de frecuencias del Ejemplo 4.4.1.

Solución: La información se debe preparar en base a la fórmula 4.5.1.

Clases PM f PM2 f · PM2


[21 − 26] 23.5 6 552.25 3313.5
[27 − 32] 29.5 12 870.25 10443
[33 − 38] 35.5 4 1260.25 5041
[39 − 44] 41.5 6 1722.25 10333.5
[45 − 50] 47.5 9 2256.25 20306.25
[51 − 56] 53.5 15 2862.25 42933.75
[57 − 62] 59.5 8 3540.25 28322
n
X 7
X
fi = 60 f · P M 2 = 120693
i=1 i=1

k
X
f · P M 2 − nx̄2
i=1 120693 − (60)(43.2)2 120693 − 111974.4 8718.6
s2 = = = = = 147.8
n−1 59 59 59

4.5.2. Desviación estándar

La desviación estándar es la raíz cuadrada de la varianza, entonces:

v
u k
uX
u
u f · P M 2 − nx̄2
t i=1
s= (4.5.2)
n−1

Ejemplo 4.5.2.

Calcular la desviación típica para la distribución de frecuencias del Ejemplo 4.4.1.

Solución: La varianza de la distribución de frecuencias se calculó en el Ejemplo 4.5.1.

√ √
s= s2 = 147.8 = 12.2 ≈ 12niños
46 CAPÍTULO 4. ÍNDICES ESTADÍSTICOS

4.6. Ejercicios
1. Los siguientes datos son las producciones (en libras) de lúpulos

3.9 3.4 5.1 2.7 4.4 7.0 5.6 2.6 4.8 5.6
7.0 4.8 5.0 6.8 4.8 3.7 5.8 3.6 4.0 5.6

Determine:

a. La media, la moda y la mediana


b. ¿Cuál es la mejor medida de tendencia central?
c. La desviación estándar
d. Encuentre los cuartiles primero y tercero de las producciones

2. Los siguientes datos son las calificaciones del curso Matemática para la vida de un grupo de
estudiantes del propedéutico 2017, impartido en URACCAN-Recinto las Minas.

67 85 76 79 85 91 79 79 79
85 91 79 91 56 67 79 79 84
91 67 76 85 76 44 67 84 79

Calcule e interprete:

a. La nota media, la nota modal y la nota mediana


b. ¿Cuál es la mejor medida de tendencia central que podemos usar para describir los datos?
c. ¿Existe algún sesgo en la calificación obtenida por el estudiantado?
d. El coeficiente de variación
e. Encuentre el percentil 33 y 63.

3. Los siguientes datos representan la altura total del árbol (en metros) y fueron recolectados en la
comunidad Llano Sucio, municipio de Prinzapolka, en una práctica de dasometría impartida en el
año 2015 por el maestro Efraín Peralta Tercero.

28 7 8 7 9 8 25 3 30 26 25 24
31 24 17 23 23 21 23 20 22 23 18 17
19 21 19 20 33 32 19 32 30 26 24 18
18 20 28 29 28 31 28 30 12 20 28 30
31 30 20 32 32 30 28 25 10 30 29 27
30 32 30

Calcule e interprete:

a. La mediana
b. El primer y tercer cuartil
c. Construya una distribución de frecuencias y encuentre la media, mediana y moda.

4. Las edades de una muestra que se tomó de turistas canadienses que vuelan de Toronto a Hong
Kong fueron fueron: 32, 21, 60, 47, 54, 17, 72, 55, 33 y 41. Calcule la desviación estándar.
5. Debido a que las tasas de interés cayeron a comienzos de 1997, se encontró que una muestra de
las tasas hipotecarias para hipotecas a 15 años de las instituciones de crédito en Peoria, Illinos
era: 7.1 %, 7.3 %, 7.0 %, 6.9 %, 6.6 %, 6.9 %, 6.5 %, 7.3 %, 6.8 %.

a. Calcule e interprete la media, moda y mediana


b. ¿Estos datos están sesgado a la izquierda, a la derecha, o están distribuidos normalmente?
Calcule el coeficiente de Pearson como medida de sesgo
c. Calcule e interpreta la varianza y la desviación estándar

6. Los siguientes datos corresponden a la estatura en metros y el peso en kilogramos de seis perso-
nas.
¿Hay más variabilidad en la estatura o en el peso?
4.6. EJERCICIOS 47

Estatura 1.72 1.77 1.64 1.63 1.63 1.67


Peso 76.24 73.00 53.64 53.27 73.64 77.36

Costo de electricidad f
[80 − 100) 3
[100 − 120) 8
[120 − 140) 12
[140 − 160) 16
[160 − 180) 7
[180 − 200) 4

7. La siguiente distribución de frecuencias contiene los costos (en dólares) de electricidad de una
muestra de 50 departamentos de dos recámaras en Albuquerque, Nuevo México, durante el mes
de mayo del año pasado.

a. Calcule el costo medio


b. Aproxime la desviación estándar

8. Bidwell Electronics, Inc., recién tomó una muestra de empleados para determinar la distancia a la
que viven de las oficinas centrales de la empresa. Los resultados aparecen a continuación. Calcule
la media y la desviación estándar.

Distancia (miles) f
[0 − 5) 4
[5 − 10) 15
[10 − 15) 27
[15 − 20) 18
[20 − 25) 6

9. La Siguiente información muestra el salario total devengado y la antigüedad (tiempo de laborar en


la institución) de ciertos trabajadores de URACCAN-Recinto las Minas. ¿Qué aspecto varía más de
un trabajador a otro, el salario total devengado o la antigüedad?

Total devengado 6, 560.49 10, 653.00 9, 215.93 10, 223.45 35, 337.72 16, 619.93
Antigüedad 2 15 17 7 21 8

10. Estudiantes de II año de contabilidad de URACCAN-Recinto Las Minas aplicaron una encuesta en
las modalidades sabatina y por encuentro, para obtener información sobre los módulos de inglés.
Una de las variables fue la edad (en años).

19 20 23 24 25 26 28 19 35 18 18 18 31 26 25 24 23 21

a. ¿Cuál es la mejor medida de tendencia central?


b. ¿Están sesgados los datos?

11. Una muestra de familias que ha contratado los servicios de la United Bell Phone Company reveló
el siguiente número de llamadas recibidas por familia la semana pasada. Determine el número
medio y la mediana de llamadas recibidas.

52 43 30 38 30 42 12 46
39 37 34 46 32 18 41 5

12. Algunos estudiantes de estadística participaron en un experimento con el fin de probar su capa-
cidad para determinar el transcurso de 1 minuto (o 60 segundos). A continuación se presentan
los resultados en segundos. Identifique al menos una buena razón por la que la media de esta
muestra no sería un buen estimador del promedio de a población de adultos.

53 52 75 62 68 58 49 49
48 CAPÍTULO 4. ÍNDICES ESTADÍSTICOS

13. Investigadores de la Universidad de Pennsylvania realizaron experimentos con álamos. A con-


tinuación se muestran los pesos (en kg) de álamos que no recibieron tratamiento y de álamos
tratados con fertilizantes y riego. ¿Parece existir una diferencia entre las dos medias?, ¿parece
que el tratamiento con fertilizante y riego es efectivo para incrementar el peso de los álamos?,
¿parece haber diferencias en las dos desviaciones estándar?

Sin tratamiento 0.15 0.02 0.16 0.37 0.22


Con fertilizante y riego 2.03 0.27 0.92 1.07 2.38

14. Es bien sabido que los hombres tienden a pesar más y a ser más altos que las mujeres. El índice
de masa corporal (IMC) es una medida que se basa en el peso y la estatura. A continuación se
listan los valores de IMC de hombres y mujeres elegidos de manera aleatoria. ¿Parece existir una
diferencia notable?, ¿parece haber diferencias en la variación entre los dos conjunto de datos?

Hombres 23.8 23.2 24.6 26.2 23.5 24.5 21.5 31.4 26.4 22.7 27.8 28.1
Mujeres 19.6 23.8 19.6 29.1 25.2 21.4 22.0 27.5 33.5 20.6 29.9 17.7

15. Ya que la media es muy sensible a los valores extremos, decimos que no es una medida de ten-
dencia central resistente. La media recortada es más resistente. Para calcular la media recortada
del 10 % de un conjunto de datos, primero se acomodan los datos en orden, después se elimina el
10 % de los valores inferiores y el 10 % de los valores superiores y luego se calcula la media de los
valores restantes. Para los pesos de los osos en el conjunto de datos mostrados a continuación.

80 344 416 348 166 220 262 360 204 144 332 34
140 180 105 166 204 26 120 436 125 132 90 40
220 46 154 116 182 150 65 356 316 94 86 150
270 202 202 365 79 148 446 62 236 212 60 64
114 76 48 29 514 140

Calcule:
a. La media
b. La media recortada del 10 %
c. La media recortada del 20 %
d. ¿Qué diferencias hay en los resultados?
Capı́tulo 5
Probabilidades

Resultados de aprendizaje

• Describe aspectos históricos de la probabilidad.


• Define experimento, tipos de experimentos, espacio muestral, suceso, tipos de sucesos, operaciones
con sucesos, probabilidad, probabilidad condicional, reglas de la probabilidad y probabilidad margi-
nal.
• Interpreta enfoques de probabilidad, probabilidad de eventos condicionados y reglas de la probabili-
dad.
• Aplica enfoques y reglas para calcular la probabilidad de distintos eventos.
• Calcula la probabilidad total de eventos, a partir de probabilidades condicionales.
• Simula situaciones relacionadas a las ciencias económicas y administrativas y las resuelve usando
probabilidad de eventos condicionados, reglas de la probabilidad y probabilidad total.

El diccionario de la lengua española (Real Academia Española) define probabilidad como, cualidad de
probable, es decir, algo que puede suceder. Para darnos más ideas la palabra probabilidad es sinónimo
de posibilidad.

Muchas veces nos hacemos preguntas como, ¿qué posibilidades hay que vengas hoy?, ¿es posible que
nos veamos la semana que viene?, ¿será que llueva mañana dado que hoy llovió?, ¿qué posibilidad hay
que los Leones de León se coronen campeones en el Pomares 2017?, etc. Todas estas preguntas están
basadas en las probabilidades, sin embargo, en nuestra vida diaria no usamos cálculo alguno para dar
respuestas a estas interrogantes.

El uso de la teoría de la probabilidad se ha extendido a muchas áreas por mencionar algunas, la bio-
logía, física, administración, contaduría, economía y los recursos naturales con la finalidad de obtener
conclusiones sobre la probabilidad de sucesos que ocurren en estas áreas.

El estudio del capítulo lo iniciamos revisando un poco de historia de la probabilidad, conceptos bási-
cos como: experimento, espacio muestral, sucesos, operaciones con sucesos, concepto de probabilidad,
enfoques de la probabilidad y las reglas que serán de utilidad en el cálculo de probabilidades.

5.1. Breve historia de la probabilidad

Con la finalidad de abordar aspectos históricos de la probabilidad, Anónimo (s.f) señala lo mostrado en
los siguientes cinco párrafos.

49
50 CAPÍTULO 5. PROBABILIDADES

La historia de la probabilidad comienza en el siglo XVII cuando Pierre Fermat y Blaise Pascal tratan
de resolver algunos problemas relacionados con los juegos de azar. Aunque algunos marcan sus inicios
cuando Cardano (jugador donde los haya) escribió sobre 1520 El Libro de los Juegos de Azar (aunque
no fue publicado hasta más de un siglo después, sobre 1660) no es hasta dicha fecha que comienza a
elaborarse una teoría aceptable sobre los juegos.

Christian Huygens conoció la correspondencia entre Blaise Pascal y Pierre Fermat suscitada por el
caballero De Meré, se planteó el debate de determinar la probabilidad de ganar una partida, y publicó
(en 1657) el primer libro sobre probabilidad: De Ratiociniis in Ludo Aleae, (Calculating in Games of
Chance), un tratado sobre juegos de azar.

Durante el siglo XVIII, debido muy particularmente a la popularidad de los juegos de azar, el cálculo
de probabilidades tuvo un notable desarrollo sobre la base de la anterior definición de probabilidad.
Destacan en 1713 el teorema de Bernoulli y la distribución binomial, y en 1738 el primer caso particular
estudiado por De Moivre, del teorema central del límite. En 1809 Gauss inició el estudio de la teoría de
errores y en 1810 Laplace, que había considerado anteriormente el tema, completó el desarrollo de esta
teoría. En 1812 Pierre Laplace publicó Théorie analytique des probabilités en el que expone un análisis
matemático sobre los juegos de azar.

A mediados del siglo XIX, un fraile agustino austríaco, Gregor Mendel, inició el estudio de la herencia,
la genética, con sus interesantes experimentos sobre el cruce de plantas de diferentes características.
Su obra, La matemática de la Herencia, fue una de las primeras aplicaciones importantes de la teoría
de probabilidad a las ciencias naturales.

Desde los orígenes la principal dificultad para poder considerar la probabilidad como una rama de la
matemática fue la elaboración de una teoría suficientemente precisa como para que fuese aceptada como
una forma de matemática. A principios del siglo XX el matemático ruso Andrei Kolmogorov la definió de
forma axiomática y estableció las bases para la moderna teoría de la probabilidad que en la actualidad
es parte de una teoría más amplia como es la teoría de la medida.

5.2. Conceptos básicos de la probabilidad

En esta sección se definen algunos conceptos básicos previos al estudio de la probabilidad, se recomien-
da estudiarlos con calma y tratar de interpretarlos, para esto se puede apoyar en los ejemplos.

5.2.1. Experimento

Comúnmente le llamamos experimento al proceso que realizamos mediante el cual recolectamos in-
formación, ya sea numérica o de carácter descriptivo, o bien, cuando se trata contrastar una o varias
hipótesis relacionadas con teorías de una determinada área científica.

Sea cual sea la metodología que usemos para el desarrollo de un experimento, siempre obtendremos
resultados, de esto definimos un experimento como sigue.

Definición 5.2.1. Experimento

Un experimento es el proceso mediante el cual se obtiene un resultado o medición.

Ejemplo 5.2.1.

Anotar el sexo de bebés recién nacidos en el hospital Carlos Centeno del municipio de Siuna, registrar
la temperatura de Siuna a las siete de la mañana todos los día de un mes específico, lanzar al aire un
dado y anotar el resultado, entrevistar a un grupo de estudiantes de URACCAN sobre una regla agreda
recientemente al reglamento estudiantil, etc.
5.2. CONCEPTOS BÁSICOS DE LA PROBABILIDAD 51

5.2.1.1. Tipos de experimentos

Básicamente existen dos tipos de experimentos, determinista y aleatorio.

Definición 5.2.2. Experimento determinista

Es aquel que bajo el mismo conjunto aparente de condiciones iniciales, conduce a un resultado cierto o
seguro.

Al realizar varias réplicas de un experimento determinista, y si partimos de las mismas condiciones


iniciales, entonces, podremos conocer con certeza lo que va a ocurrir. Todos los experimentos que siguen
las leyes de la física clásica son deterministas, veamos el siguiente ejemplo.

Ejemplo 5.2.2.

Lanzar un objeto al vacío desde una altura de cierto edificio.

Definición 5.2.3. Experimento aleatorio

Es aquel que bajo el mismo conjunto aparente de condiciones iniciales, puede presentar resultados dife-
rentes.

Una característica del experimento aleatorio es que si se repite un número suficientemente grande de
veces, entonces es posible predecir el número aproximado de ocurrencias del resultado.

Ejemplo 5.2.3.

Lanzar una moneda o un dado al aire y anotar la cara (número) que cae.

Ejemplo 5.2.4.

Seleccionar un estudiante al azar de un determinado grupo y registrar su estatura.

Nota 5.2.1. El estudio de las probabilidades está basado en experimentos aleatorios, por tanto, siempre
que nos refiramos a un experimento debe ser aleatorio aunque no lo especifiquemos.

5.2.2. Espacio muestral

Después de realizado un determinado experimento, obtenemos resultados, los cuales se almacenan en


un conjunto, éste se denomina espacio muestral y lo representamos mediante la letra mayúscula S,
veamos la siguiente definición.

Definición 5.2.4. Espacio muestral

Es el conjunto donde se almacenan todos los posibles resultados de un experimento.


52 CAPÍTULO 5. PROBABILIDADES

Ejemplo 5.2.5.

Supongamos que un experimento consiste en lanzar al aire una moneda. Los resultados se muestran en el
espacio muestral, el cual está dado por:

S = {N, E}

Donde N es número y E es escudo.

Ejemplo 5.2.6.

Supongamos ahora que el experimento consistió en lanzar al aire dos monedas. El espacio muestral será:

S = {N N, N E, EN, EE}

Ejemplo 5.2.7.

Al registrar el sexo de un bebé recién nacido en el hospital Carlos Centeno del municipio de Siuna, obtene-
mos el siguiente espacio muestral S = {F, M }.

Ejemplo 5.2.8.

Al registrar el sexo de dos bebés, obtendríamos el siguiente espacio muestral S = {F F, F M, M F, M M }.

Ejemplo 5.2.9.

Julissa Castillo tiene una pequeña tienda de computadoras. Un día tiene tres Gateway y dos Compaq
en existencias. Supongamos que Juan Blandón entra en la tienda a comprar dos computadoras. A Juan
le da igual la marca (todas los computadoras tienen las mismas especificaciones técnicas), por lo que
selecciona las computadoras puramente al azar: cualquiera de las computadoras del estante tienen la
misma probabilidad de ser elegidas. El espacio muestral está dado por:

S = {G1 C1 , G1 C2 , G2 C1 , G2 C2 , G3 C1 , G3 C2 , G1 G2 , G1 G3 , G2 G3 , C1 C2 }

5.2.3. Sucesos

En varias ocasiones, nuestro propósito es obtener resultados particulares de un espacio muestral, es


decir, nuestro interés se centra en un subconjunto del (conjunto) espacio muestral, a estos resultados
los denominamos sucesos. Un suceso lo representaremos mediante S ∗ .

Definición 5.2.5. Suceso

Un suceso o acontecimiento es cualquier subconjunto del espacio muestral de un experimento.

Ejemplo 5.2.10.

Un experimento consiste en lanzar al aire un dado. Los resultados se encuentran el espacio muestral
S = {1, 2, 3, 4, 5, 6}.
5.2. CONCEPTOS BÁSICOS DE LA PROBABILIDAD 53

Algunos sucesos en los que podríamos estar interesados serían:

Obtener un uno: S1∗ = {1}; obtener un número par: S2∗ = {2, 4, 6}; obtener un número impar: S3∗ = {1, 3, 5};
sacar un número divisible por 3: S4∗ = {3, 6}.

Cada uno de los sucesos descritos anteriormente son subconjuntos del espacio muestral S = {1, 2, 3, 4, 5, 6},
es decir, Si∗ ⊂ S, para i = 1, 2, 3, 4.

Un suceso puede ser elemental o compuesto, es elemental si está formado por un único elemento del
espacio muestral. Por ejemplo, S1∗ definido en el ejemplo 5.2.10 es un suceso elemental.

Un suceso es compuesto si está formado por más de un elemento del espacio muestral. Por ejemplo S2∗ ,
S3∗ y S4∗ definidos en el ejemplo 5.2.10 son sucesos compuestos.

5.2.3.1. Tipos de sucesos

Los tipos de sucesos se clasifican según su posibilidad de ocurrencia, entre los que existen:

Suceso seguro: Está formado por todos los resultados posibles del espacio muestral, es decir, el que se
cumple siempre.
Suceso imposible: El suceso imposible es el que nunca ocurre. Se expresa con el símbolo de vacío ∅.
Suceso complementario: Suceso contrario a otro suceso, para un suceso A su complementario es Ā,
el suceso complementario ocurre cuando A no puede ocurrir y viceversa.

Ejemplo 5.2.11.

El suceso obtener cualquier número después de lanzar un dado, es un suceso seguro; obtener un 10
después de lanzar un dado es un suceso imposible y obtener un número par es el suceso complementario
al suceso de obtener un impar.

5.2.4. Operaciones con sucesos

Como un suceso es subconjunto del espacio muestral (que es un conjunto), significa entonces, que
serán conjuntos con cardinalidad menor que la del espacio muestral, es decir, |S| > |S ∗ |. En teoría de
conjuntos la cardinalidad se refiere a la cantidad de elementos del conjunto, así, si el conjunto S tiene
n elementos su cardinalidad es |S| = n.

Ya que los sucesos son conjuntos, cumplen con las operaciones fundamentales de la teoría de conjuntos
como: la unión, intersección y el complemento.

5.2.4.1. Unión de sucesos

Suponga que tiene dos sucesos, a saber A y B, la unión estará formada por todos los elementos de los
sucesos que pertenecen a A y a B y se representa por A ∪ B.

Ejemplo 5.2.12. Sea el experimento, lanzar un dado al aire. El suceso A lo definimos como obtener un
número impar y B obtener un dos. Los sucesos y su unión están dados por:

A = {1, 3, 5}, B = {2} ∴ A ∪ B = {1, 2, 3, 5}


54 CAPÍTULO 5. PROBABILIDADES

Ejemplo 5.2.13.

Sean los sucesos, H: seleccionar a un hombre del grupo de II año de Ingeniería Agroforestal y M : seleccio-
nar a una mujer del mismo grupo. La unión H ∪ M está formada por los estudiantes hombres y mujeres de
II año de Ingeniería Agroforestal, por tanto, la unión será: Estudiantes de II año de Ingeniería Agroforestal.

5.2.4.2. Intersección de sucesos

La intersección de dos sucesos A y B, está formada por todos los elementos que están tanto en el suceso
A como en el B y se representa por A∩B. Si dos sucesos son disjuntos, es decir, que no tienen elementos
en común su intersección es el vacío (∅).

Ejemplo 5.2.14. Algunos trabajadores hombres y mujeres de URACCAN-Recinto las Minas usan lentes.
Sea A el suceso conjunto de trabajadores hombres, B trabajadoras mujeres, C es el conjunto que usa
lentes y D es el conjunto de trabajadores que no usa lentes.

La intersección, A ∩ C es el conjunto formado por los trabajadores hombres que usan lentes. Para formar
la intersección, seleccionamos del conjunto A a los hombres que usen lentes y del conjunto C solo a los
hombres que usan lentes.

En este caso A ∩ B es vacía, es decir, A ∩ B = ∅, ya que, un trabajador no puede ser hombre y mujer a la
vez. Con respecto al sexo los sucesos A y B son disjuntos.

La intersección, B ∩ D es el conjunto formado por las mujeres que no usan lentes. Para formar la intersec-
ción seleccionamos del conjunto B a las mujeres que no usan lentes y del conjunto D sólo a las mujeres
que no usan lentes.

5.2.4.3. Complemento de sucesos

Dos sucesos son complementarios si al ocurrir uno de ellos el otro no ocurre. Dado un suceso A, su
complemento se suele representar por Ac , A0 o bien Ā, aquí usaremos la última forma para referirnos al
complemento de un suceso.

Ejemplo 5.2.15.

Consideremos nuevamente el experimento de lanzar un dado al aire. Si definimos el suceso A: obtener un



número par, esto es, SA = {2, 4, 6}; su complemento está dado por el conjunto de obtener un número impar,

SĀ = {1, 3, 5}. Claro está entonces, que si no se obtiene un número par se obtiene un impar y viceversa.

5.3. Probabilidad

La probabilidad consiste en asignar una medida numérica a cada suceso, esta medida está comprendida
en la escala 0 y 1 y representa la posibilidad de que un determinado suceso ocurra.

Definición 5.3.1. Probabilidad

Es una medida numérica cuyos valores se encuentran en el intervalo [0, 1].

La definición 5.3.1 establece que la probabilidad de un suceso debe estar entre 0 y 1, es decir no menor
que cero, ni mayor que uno. A los sucesos imposibles de ocurrir se les asigna probabilidad cero y a los
sucesos seguros, se les asigna 1 como probabilidad.
5.4. ENFOQUES DE LA PROBABILIDAD 55

Entre más próxima a uno esté la probabilidad de un suceso significa que éste tiene más posibilidades
de ocurrir y entre más se aproxime a cero menos probabilidad tendrá de ocurrir. Para representar la
probabilidad asociada a un suceso se escribe P (S ∗ ).

Ejemplo 5.3.1.

Supongamos que denotamos con L el suceso que llueva hoy y su probabilidad asociada es 0.30, entonces,
lo escribimos como P (L) = 0.30.

Nota 5.3.1. Es frecuente escribir las probabilidades de un suceso en forma de porcentaje, para el ejemplo
anterior sería P (L) = 30 %.

Ejemplo 5.3.2.

La probabilidad que un hombre de a luz es P (H) = 0 = 0 %, es decir, es un suceso imposible de ocurrir.

5.4. Enfoques de la probabilidad

El estudio de las probabilidades se desarrolla partiendo de dos enfoques, el objetivo y el subjetivo, dentro
del objetivo están la probabilidad clásica y empírica, tal y como se presenta a continuación.

5.4.1. Probabilidad objetiva

El enfoque de probabilidad objetiva se subdivide en probabilidad clásica y probabilidad empírica.

5.4.1.1. Probabilidad clásica

La probabilidad clásica es la relacionada con los juegos de azar, es decir, barajas, dados, ruletas, etc.
Este tipo de probabilidades parten de la hipótesis de que los resultados de un experimento son igual-
mente posibles, esto es, todos los resultados del experimento tienen la misma posibilidad de ocurrir.
Para calcular la probabilidad con el enfoque clásico, haremos uso de la siguiente ecuación.

Número de resultados favorables


P (Evento) = (5.4.1)
Número de posibles resultados

Ejemplo 5.4.1.

Al lanzar un dado al aire, que caiga el número 3 sólo puede ocurrir en una de seis formas posibles, así su
1
probabilidad de selección es P (3) = .
6

Ejemplo 5.4.2.

Siguiendo con el dado, que caiga un número impar ocurre en tres (1, 3 y 5) de seis formas posibles, así, su
probabilidad de selección es:

3 1
P (número impar) = = = 0.50 = 50 %
6 2
56 CAPÍTULO 5. PROBABILIDADES

Ejemplo 5.4.3.

Un tazón contiene tres pelotas rojas y dos amarillas. Dos de ellas se seleccionan al azar y se registran sus
colores.

a. Determine el espacio muestral


b. ¿Cuál es la probabilidad que ambas pelotas sean rojas?
c. ¿Cuál es la probabilidad que la primera sea roja y la segunda amarilla

Solución: La selección se hace al azar, entonces, cada opción debe ser igualmente probable.

a. Teniendo en cuenta el orden en que se sacan las pelotas, tenemos:

S = {R1 R2 , R1 R3 , R1 A1 , R1 A2 , R2 R1 , R2 R3 , R2 A1 , R2 A2 , R3 R1 , R3 R2 , R3 A1 , R3 A2 , A1 R1 , A1 R2 , A1 R3
A1 A2 , A2 R1 , A2 R2 , A2 R3 , A2 A1 }

b. Sea R el evento “ambas pelotas son rojas”, este puede ocurrir en seis formas posibles de 20, por tanto,
R = {R1 R2 , R1 R3 , R2 R1 , R2 R3 , R3 R1 , R3 R2 }, y la probabilidad está dada por:
6 3
P (R) = = = 0.30
20 10
c. Sea RA el evento “la primera pelota es roja y la segunda amarilla”, entonces,

RA = {R1 A1 , R1 A2 , R2 A1 , R2 A2 , R3 A1 , R3 A2 }
La probabilidad es:

6 3
P (RA) = = = 0.30
20 10

5.4.1.2. Probabilidad empírica

La probabilidad empírica, también conocida probabilidad de frecuencia relativa es la probabilidad que


se determina a partir de datos recolectados en el pasado. Es muy común estimar la probabilidad de que
un evento ocurra en el presente, a partir de datos calculados en el pasado. Para estimar probabilidades
con el enfoque empírico, usaremos la siguiente ecuación.

Número de veces que ha ocurrido el evento


P (Evento) = (5.4.2)
Número total de observaciones

Ejemplo 5.4.4.

Sandor Guido #7 primera base de los Leones de León ha conseguido 15 hits en 40 turnos al bate, ¿cuál es
la probabilidad que en el siguiente turno al bate Sandor batee un hit?

Solución: Sandor ha dado de hit en 31 de 40 turnos que tuvo al bate, por tanto, la probabilidad de que
en el siguiente turno batee un hit, está dada por:

31
P (Hit) = = 0.775 = 77.5 %
40

Es probable que Sandor conecte un hit.


5.5. PROBABILIDAD CONDICIONAL 57

Ejemplo 5.4.5.

La siguiente tabla muestra estudiantes de URACCAN-Recinto Las Minas que cursan distintas carreras.

Carrera Estudiantes
Contabilidad 10
Ingeniería Agroforestal 5
Medicina Veterinaria 4
Administración 6
Informática 9

Si elige un estudiante al azar y anota la carrera. ¿Cuál es la probabilidad que estudie Agroforestal?

Solución: Hay 5 estudiantes que cursan la carrera de Ingeniería Agroforestal de un total de 34, por tanto,
seleccionar a un estudiante de esta carrera puede ser en cinco de 34 formas posibles, la probabilidad es:

5
P (Ingeniería Agroforestal) = ≈ 0.1471 = 14.71 %
34

5.4.2. Probabilidad subjetiva

Este enfoque se da cuando no hay de datos o información previa de un evento, por tanto, las probabili-
dades se estiman en base al mejor criterio personal de un experto. A continuación se muestran algunos
ejemplos del enfoque de probabilidad subjetiva.

Ejemplo 5.4.6. Probabilidades subjetivas

• Probabilidad que la deuda externa de Nicaragua se reduzca a la mitad en los siguientes 10 años.
• Probabilidad que la selección mayor de béisbol de Nicaragua gane el clásico mundial de 2021.
• Probabilidad que una mujer indígena sea electa presidente de Nicaragua en 2021.
• Probabilidad que una mujer juegue en un equipo de MLB (Mayor League Baseball).

5.5. Probabilidad condicional

La probabilidad condicional de dos eventos es la probabilidad de que el primer evento ocurra condicio-
nado a que ya ha ocurrido el primero. En otras palabras, la probabilidad condicional de un evento es la
probabilidad obtenida en base a la información de algún otro evento que ya ocurrió.

Ejemplo 5.5.1. Probabilidades condicionadas

• Probabilidad que llueva hoy dado que ayer llovió.


• Probabilidad de obtener un cinco al lanzar un dado, condicionado a que ya se ha obtenido un tres.
• Probabilidad de que una mujer de a luz a un niño, dado que su parto anterior fue una niña.

Dado dos eventos A1 y A2 , la probabilidad condicional del evento A1 , dado que el evento A2 ha ocurrido
está dada por la siguiente ecuación.

P (A1 ∩ A2 )
P (A1 |A2 ) = , P (A2 ) 6= 0 (5.5.1)
P (A2 )
58 CAPÍTULO 5. PROBABILIDADES

La probabilidad condicional del evento A2 , dado que el evento A1 ha ocurrido está dada por:

P (A1 ∩ A2 )
P (A2 |A1 ) = , P (A1 ) 6= 0 (5.5.2)
P (A1 )

Ejemplo 5.5.2.

Suponga que cuando un candidato llega a una entrevista para un trabajo en la RJB Enterprises, la
probabilidad de que desee el trabajo (A) después de la entrevista es 0.68. Del mismo modo, la probabilidad
que RJB desee al candidato (B) es 0.36. La probabilidad P (A|B) = 0.88. Encuentre P (B|A).

Solución: Dan la probabilidad de A dado B, entonces, obtenemos la probabilidad de intersección de la


siguiente manera.

P (A ∩ B)
P (A|B) = ⇒ P (A ∩ B) = P (B)P (A|B) = (0.36)(0.88) = 0.3168
P (B)

P (A ∩ B) 0.3168
P (B|A) = = = 0.4659
P (A) 0.68

La probabilidad que RBJ desee al candidato dado que éste también desea el trabajo después de la entre-
vista es 0.4659.

Ejemplo 5.5.3.

Un embarque de toronjas llegó conteniendo las siguientes proporciones de tipos: 10 % rosas sin semilla,
20 % blancas sin semilla, 30 % rosas con semillas, y 40 % blancas con semillas. Una toronja se selecciona
al azar del embarque. Encuentre la probabilidad de que sea rosa dado que es sin semilla y sin semilla
dado que es rosa.

Solución: Sean los eventos: R es rosa, S con semilla, S sin semilla, entonces:

Probabilidad de rosa dado que es sin semilla

P (R ∩ S)
P (R|S) =
P (S)

La probabilidad de rosa sin semilla está dada por P (R ∩ S) = 10 % = 0.1. El 10 % de las toronjas son rosas
sin semillas y el 20 % blancas sin semillas, por tanto, las toronjas sin semillas entre rosas y blancas son:

30 % 0.30
P (S) = = = 0.30
100 % 1.0

P (R ∩ S) 0.1
P (R|S) = = = 0.333
P (S̄) 0.30

Probabilidad de sin semilla dado que es rosa

P (S ∩ R)
P (S|R) =
P (R)
5.6. REGLAS DE LA PROBABILIDAD 59

La probabilidad de sin semilla y rosa es la misma que rosa sin semilla, es decir, P (R ∩ S) = 10 % = 0.1.
El 10 % de las toronjas son rosas sin semillas y el 30 % rosas con semillas, por tanto, las toronjas rosas,
tanto, con semillas como sin semillas son:

40 % 0.40
P (R) = = = 0.40
100 % 1.0

P (S ∩ R) 0.1
P (S|R) = = = 0.25
P (R) 0.40

5.6. Reglas de la probabilidad

En esta sección se definirán reglas para la adición y multiplicación de probabilidades para emplearlas
en cálculo de posibilidad de ocurrencia de dos o más eventos.

5.6.1. Regla de la adición

Dado los eventos A1 , A2 , . . . , An colectivamente exhaustivos, es decir, ocurren al mismo tiempo, entonces
la probabilidad que ocurra uno de ellos está dada por la probabilidad de la unión menos la probabilidad
de la intersección.

P (A1 ∪ A2 ∪ · · · ∪ An ) = P (A1 ) + P (A2 ) + · · · + P (An ) − P (A1 ∩ A2 ∩ · · · ∩ An ) (5.6.1)

Para tres eventos, se tiene:

P (A1 ∪ A2 ∪ A3 ) = P (A1 ) + P (A2 ) + P (A3 ) − P (A1 ∩ A2 ) − P (A1 ∩ A3 ) − P (A2 ∩ A3 ) + P (A1 ∩ A2 ∩ A3 ) (5.6.2)

Si los eventos A1 , A2 , . . . , An son mutuamente excluyentes, es decir, no pueden ocurrir simultáneamente,


entonces, la probabilidad de su intersección es nula, por tanto, la ecuación 5.6.1 se reduce a:

P (A1 ∪ A2 ∪ · · · ∪ An ) = P (A1 ) + P (A2 ) + · · · + P (An ) (5.6.3)

Ejemplo 5.6.1.

Una cadena de hamburgueserías observó que el 75 por ciento de todos los clientes consume mostaza, el
80 por ciento consume ketchup y el 65 por ciento consume los dos. ¿Cuál es la probabilidad de que un
cliente consuma al menos uno de los dos?

Solución: Sea A el evento “el cliente consume mostaza” y B el evento “el cliente consume ketchup”, por
tanto, P (A) = 0.75, P (B) = 0.80 y P (A ∩ B) = 0.65, así:

P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 0.75 + 0.80 − 0.65 = 0.90 = 90 %

Es muy probable que un cliente consuma al menos mostaza o ketchup.


60 CAPÍTULO 5. PROBABILIDADES

Ejemplo 5.6.2.

Una organización benéfica vende 1000 billetes de lotería. Hay 10 premios grandes y 100 premios pequeños
y todos deben repartirse. El proceso de selección de los ganadores es tal que al principio todos los billetes
tienen las mismas probabilidades de ganar un premio grande y todos tienen las mismas probabilidades
de ganar un premio pequeño. Ninguno puede ganar más de un premio.

a. ¿Cuál es la probabilidad de ganar un premio grande con un único billete?


b. ¿Cuál es la probabilidad de ganar un premio pequeño?
c. ¿Cuál es la probabilidad de ganar algún premio?

Solución:

a. De los 1000 billetes, 10 ganarán premios grandes. Sea A: el billete seleccionado gana un premio grande.

10
P (A) = = 0.01 = 1 %
1000
b. 100 billetes ganarán premios pequeños. Sea B: el billete seleccionado gana un premio pequeño.

100
P (A) = = 0.1 = 10 %
1000
c. El evento “el billete gana algún premio” es la unión de los sucesos A y B. Como solo se permite un
premio, éstos son mutuamente excluyentes, y

P (A ∪ B) = P (A) + P (B) = 0.01 + 0.1 = 0.11 = 11 %

5.6.2. Regla de la multiplicación

Sean A1 , A2 , . . . , An eventos dependientes, es decir, la ocurrencia de un evento depende de la ocurrencia


de otros, entonces la probabilidad que todos ocurran es la probabilidad de la intersección tal y como se
muestra en la siguiente ecuación.

P (A1 ∩ A2 ∩ · · · ∩ An ) = P (A1 )P (A2 |A1 )P (A3 |A1 ∩ A2 ) · · · P (An |A1 ∩ A2 ∩ · · · ∩ An−1 ) (5.6.4)

La ecuación 5.6.4 está escrita de manera general, en el caso particular de dos eventos dependientes A1
y A2 , la probabilidad que A1 y A2 ocurran es:

P (A1 ∩ A2 ) = P (A1 )P (A2 |A1 ) (5.6.5)

Ejemplo 5.6.3.

Wally, propietario de Wally’s Workout World, desea construir un perfil de miembros para desarrollar una
campaña publicitaria que atraiga a clientes potenciales típicos de quienes actualmente prefieren este gim-
nasio. El 30 % de los miembros actuales son mujeres, el 80 % de ellas es menor de 30 años. El 60 % de
los hombres son menores de 30 años. Cuál es la probabilidad de que un miembro seleccionado de manera
aleatoria sea:

a. Una mujer menor de 30 años


b. Una mujer mayor de 30 años
c. Un hombre mayor de 30 años o una mujer menor de 30 años
5.6. REGLAS DE LA PROBABILIDAD 61

d. Mayor de 30 años
e. Un hombre o una mujer mayor de 30 años

Solución: Sean M “el cliente es mujer”, H “el cliente es hombre” y m “el cliente es menor de 30 años”.

a. P (M ∩ m) = P (M ) · P (m|M ). La probabilidad de mujer es P (M ) = 0.30, el 80 % de ellas son menores


de 30 años, por tanto, dado que el cliente es mujer, la probabilidad de que tenga menos de 30 años es
P (m|M ) = 0.80. Entonces P (M ∩ m) = (0.30)(0.80) = 0.24

b. P (M ∩ m) = P (M ) · P (m|M ). La probabilidad de mujer es P (M ) = 0.30, el 80 % de ellas son menores de


30 años, por tanto, el 20 % son mayores a los 30 años, así, dado que el cliente es mujer, la probabilidad
de que tenga más de 30 años es P (m|M ) = 0.20. Entonces P (M ∩ m) = (0.30)(0.20) = 0.06

c. P [(H ∩ m) ∪ (M ∩ m)] = P (H ∩ m) + P (M ∩ m). La probabilidad de hombre es P (M ) = 0.70, el 60 % de


ellos son menores de 30 años, por tanto, el 40 % son mayores a los 30 años, así, dado que el cliente
es hombre, la probabilidad de que tenga más de 30 años es P (m|H) = 0.40. Entonces P (H ∩ m) =
P (H) · P (m|H) = (0.70)(0.40) = 0.28. De esto, P [(H ∩ m) ∪ (M ∩ m)] = 0.28 + 0.24 = 0.52

d. P (m) = P (M ∩ m) + P (H ∩ m) = 0.06 + 0.28 = 0.34

e. P [(H ∩ m) ∪ (M ∩ m)] = P (H ∩ m) + P (M ∩ m) = 0.28 + 0.06 = 0.34

Si los A1 , A2 , . . . , An son eventos independientes, es decir, la probabilidad de un evento en particular es


la misma ya sea que los otros eventos o curran o no, entonces:

P (A2 |A1 ) = P (A2 ), P (A3 |A1 ∩ A2 ) = P (A3 ), . . . , P (An |A1 ∩ A2 ∩ · · · ∩ An−1 ) = P (An ) (5.6.6)

Así, la ecuación 5.6.4 se escribe como:

P (A1 ∩ A2 ∩ · · · ∩ An ) = P (A1 )P (A2 )P (A3 ) · · · P (An ) (5.6.7)

Para dos eventos, se dice que dos eventos A1 y A2 son independientes si y sólo si la probabilidad de A1
no cambia la probabilidad A2 y viceversa, además cumplen las siguientes condiciones:

• P (A|B) = P (A)
• P (B|A) = P (B)
• P (A ∩ B) = P (A)P (B)

Ejemplo 5.6.4.

La probabilidad de sobrevivir a una cierta operación de trasplante es 0.55. Si un paciente sobrevive la


operación, la probabilidad de que su cuerpo rechace el trasplante en menos de un mes es 0.20. ¿Cuál es
la probabilidad de que sobreviva a estas etapas críticas?

Solución: Sea T el evento de sobrevivir a la operación de trasplante y R el evento el cuerpo del paciente
rechace el trasplante en menos de un mes, así:

P (T ) = 0.55, P (R) = 0.20. La probabilidad de que el cuerpo del paciente no rechace el trasplante en menos
de un mes está dada por P (R) = 1 − P (R) = 1 − 0.20 = 0.80. La probabilidad que sobreviva a la operación
de trasplante y no lo rechace en menos de un mes, es:

P (T ∩ R) = P (T ) · P (R) = (0.55)(0.80) = 0.44

Hay un 44 % de probabilidad de que el paciente sobreviva a las etapas críticas.


62 CAPÍTULO 5. PROBABILIDADES

Ejemplo 5.6.5.

La fábrica Ford inscribe en una carrera tres pilotos A, B y C. La probabilidad de llegar entre los tres
primeros lugares son: P (A) = 0.1, P (B) = 0.2 y P (C) = 0.3. Calcule la probabilidad que ninguno de los tres
clasifique y la probabilidad que los tres clasifiquen.

Solución: En este caso la probabilidad del piloto A no está influenciada por la de B y C, la de B no afecta
a la de A y C y así sucesivamente, por tanto, los eventos son mutuamente independientes.

Probabilidad que ninguno de los tres clasifique

P (A) = 1 − P (A) = 1 − 0.1 = 0.9; P (B) = 1 − P (B) = 1 − 0.2 = 0.8 y P (C) = 1 − P (C) = 1 − 0.3 = 0.7

P (A ∩ B ∩ C) = P (A) · P (B) · P (C) = (0.9)(0.8)(0.7) = 0.504

Probabilidad que los tres clasifiquen

P (A ∩ B ∩ C) = P (A) · P (B) · P (C) = (0.1)(0.2)(0.3) = 0.006

Ejemplo 5.6.6.

Las dos estrellas del equipo profesional de baloncesto Miami Heat son muy diferentes cuando se trata de
tiros libres. La ESPN.com informa que Jason Williams encesta alrededor de 80 % de sus tiros libres, en tanto
que Shaquille O’Neal encesta sólo 53 % de sus tiros libres. Suponga que los tiros libres son independientes
y que cada jugador toma dos tiros libres durante un juego en particular.

a. ¿Cuál es la probabilidad de que Jason enceste sus dos tiros libres?


b. ¿Cuál es la probabilidad de que Shaq enceste exactamente uno de sus dos tiros libres?
c. ¿Cuál es la probabilidad de que Shaq enceste sus dos tiros libres y que Jason no enceste ninguno de
los suyos?

Solución: Como los eventos son independientes, tenemos:

a. P (primero ∩ segundo) = (0.8)(0.8) = 0.64

b. Se quiere que enceste uno de los dos, entonces, seguiremos el orden: encesta el primero y no el segundo,
luego, no encesta el primero
 y encesta el segundo. La probabilidad de que no enceste  el segundo está
dada por P segundo = 1 − 0.53 = 0.47 y la de no encestar el primero es P primero = 1 − 0.53 = 0.47,
así:
 
P primero ∩ segundo = P primero · P (segundo) = (0.47)(0.53) = 0.2491

 
P primero ∩ segundo = P (primero) · P segundo = (0.53)(0.47) = 0.2491
La probabilidad que enceste exactamente un tiro libre está dada por:

P (primera ∪ segunda) = P (primera) + P (segunda) = 0.2491 + 0.2491 = 0.4982


c. La probabilidad que Shaq enceste sus dos tiros libres es P (primero∩segundo) = P (primero)·P (segundo) =
(0.53)(0.53) = 0.2809. La probabilidad que Jason no enceste ninguno de sus tiros libres es:
  
P primero ∩ segundo = P primero · P segundo = (0.2)(0.2) = 0.04
Sean S y J¯ los eventos: Shaq encesta sus dos tiros libres y Jason no encesta ninguno.

¯ = P (S) · P (J)
P (S ∩ J) ¯ = (0.2809)(0.04) = 0.011236
5.7. REGLA DE BAYES 63

5.7. Regla de Bayes

Sobre la estadística bayesiana, Walpole et al. (2012) expresan:

La estadística bayesiana es un conjunto de herramientas que se utiliza en un tipo especial de


inferencia estadística que se aplica en el análisis de datos experimentales en muchas situaciones
prácticas de ciencia e ingeniería. La regla de Bayes es una de las normas más importantes de la
teoría de probabilidad, ya que es el fundamento de la inferencia bayesiana. (p. 72)

Se aborda el primer caso en el que se desea calcular la probabilidad total de un determinado evento a
partir de probabilidades condicionales, veamos el siguiente teorema llamado teorema de probabilidad
total o regla de eliminación.

Teorema 5.7.1. Probabilidad total

Si los eventos B1 , B2 , . . . , Bn constituyen una partición del espacio muestral S, tal que P (Bi ) 6= 0 para
i = 1, 2, . . . , n, entonces, para cualquier evento A de S,

k
X k
X
P (A) = P (Bi ∩ A) = P (Bi )P (A|Bi ) (5.7.1)
i=1 i=1

Ejemplo 5.7.1.

Una empresa de transportes cubre tres líneas: A, B y C con el 50, 30 y 20 % de sus camiones. La proba-
bilidad de que estos queden en pana son 3 %, 4 % y 1 % respectivamente. Determinar la probabilidad que
un día haya un camión en pana.

Solución: Sea P el evento el camión está en pana, entonces: P (P |A) = 0.03, P (P |B) = 0.04, P (P |C) =
0.01, P (A) = 0.50, P (B) = 0.30 y P (C) = 0.20, por el teorema de la probabilidad total se tiene:

P (P ) = P (A)P (P |A) + P (B)P (P |B) + P (C)P (P |C)


= (0.50)(0.03) + (0.30)(0.04) + (0.20)(0.01) = 0.015 + 0.012 + 0.002 = 0.029

La probabilidad que un día haya un camión en pana es de 0.029.

Ejemplo 5.7.2.

En una población el 70 % de los habitantes son mestizos (M ), el 25 % son garífunas (G) y el 5 % mayangnas
(My ). El 70 % de los mestizos son católicos (C) y lo mismo ocurre con el 60 % de los garífunas y el 10 % de
los mayangnas. Se toma una persona al azar, calcule la probabilidad que la persona sea católica.

Solución: P (M ) = 0.70, P (G) = 0.25, P (My ) = 0.05, P (C|M ) = 0.70, P (C|G) = 0.60 y P (C|My ) = 0.10, por el
teorema de la probabilidad total, tenemos:

P (C) = P (M )P (C|M ) + P (G)P (C|G) + P (M y)P (C|M y)


= (0.70)(0.70) + (0.25)(0.60) + (0.05)(0.10) = 0.49 + 0.15 + 0.005 = 0.645

La probabilidad que una persona (elegida al azar) sea católica es 0.645.

La regla de Bayes es llamada así en honor al reverendo Thomas Bayes (1702-1761), quien desarrolló
este concepto útil para calcular probabilidades condicionales de cualquier evento aleatorio.
64 CAPÍTULO 5. PROBABILIDADES

Teorema 5.7.2. Regla de Bayes

Si los eventos B1 , B2 , . . . , Bn constituyen una partición del espacio muestral S, tal que P (Bi ) 6= 0 para
i = 1, 2, . . . , n, entonces, para cualquier evento A de S, con P (A) 6= 0

P (Br ∩ A) P (Br )P (A|Br )


P (Br |A) = n = n para r = 1, 2, . . . , n (5.7.2)
X X
P (Bi ∩ A) P (Bi )P (A|Bi )
i=1 i=1

Ejemplo 5.7.3.

Un empresario tiene dos negocios N1 y N2 . El negocio N1 produce una ganancia (G) de 20 % y N2 solo un
4 %. Se toma un balance al azar. ¿Probabilidad que sea del negocio N1 ?

Solución: P (G|N1 ) = 0.20, P (G|N2 ) = 0.04, P (N1 ) = 0.50 y P (N2 ) = 0.50, por la regla de Bayes, tenemos:

P (N1 )P (G|N1 ) (0.50)(0.20)


P (N1 |G) = =
P (N1 )P (G|N1 ) + P (N2 )P (G|N2 ) (0.50)(0.20) + (0.50)(0.04)

0.10 0.10
= = = 0.8333
0.10 + 0.02 0.12

La probabilidad que la ganancia reportada sea del negocio N1 es de 0.8333.

Ejemplo 5.7.4.

Una empresa de transportes cubre tres líneas: A, B y C con el 50, 30 y 20 % de sus camiones. La probabi-
lidad de que estos queden en pana (P ) son 3 %, 4 % y 1 % respectivamente. Sabiendo que un camión está
en pana, determine la probabilidad que sea de la línea B.

Solución: P (P |A) = 0.03, P (P |B) = 0.04, P (P |C) = 0.01, P (A) = 0.50, P (B) = 0.30 y P (C) = 0.20, por la
regla de Bayes, tenemos:

P (B)P (P |B)
P (B|P ) =
P (B)P (P |B) + P (A)P (P |A) + P (C)P (P |C)

(0.30)(0.04) 0.012
= =
(0.30)(0.04) + (0.50)(0.03) + (0.20)(0.01) 0.012 + 0.015 + 0.002

0.012
= = 0.4138
0.029

La probabilidad que el camión sea de la línea B, dado que esté en pana es de 0.4138.

5.8. Tablas de contingencia

Las tablas de contingencia son útiles para calcular probabilidades de eventos. La Tabla 5.1 mostrada a
continuación es un ejemplo de tabla de contingencia.
5.8. TABLAS DE CONTINGENCIA 65

Género Mestizo Mayangna Miskitu Total


Hombre 40 30 20 90
Mujer 50 10 5 65
Total 90 40 25 155

Tabla 5.1. Tabla de contingencia

A partir de la tabla de contingencia, se construye la tabla de probabilidades como la mostrada en la


Tabla 5.2.

Género Mestizo Mayangna Miskitu Total


Hombre 40/155 = 0.2581 30/155 = 0.1935 20/155 = 0.1290 90/155 = 0.5806
Mujer 50/155 = 0.3226 10/155 = 0.0645 5/155 = 0.0323 65/155 = 0.4194
Total 90/155 = 0.5806 40/155 = 0.2581 25/155 = 0.1613 155/155 = 1.0000

Tabla 5.2. Tabla de probabilidades

Los valores en los márgenes de la tabla se llaman probabilidades marginales, por ejemplo, la probabi-
lidad de seleccionar a una persona de la etnia mayangna es 0.2581 y la probabilidad de seleccionar a
una mujer es 0.4194.

Las probabilidades de intersección son los valores que se encuentran en la intersección de una fila con
una columna, por ejemplo la probabilidad de que sea hombre y mestizo es P (Hombre ∩ Mestizo) = 0.2581
y la probabilidad de seleccionar a una mujer Miskitu es P (Mujer ∩ Miskitu) = 0.0323.

Una manera alternativa de obtener la probabilidad de elegir a un hombre es la siguiente:

P (Hombre) = P (Hombre ∩ Mestizo) + P (Hombre ∩ Mayangna) + P (Hombre ∩ Miskitu)


= 0.2581 + 0.1935 + 0.1290 = 0.5806

También es posible calcular probabilidades condicionales, a partir de las tablas de probabilidad, por
ejemplo, supongamos que queremos calcular la probabilidad de seleccionar a una persona Mayangna
dado que es hombre.

P (Mayagna ∩ Hombre) 0.1935


P (Mayangna|Hombre) = = = 0.3333
P (Hombre) 0.5806
66 CAPÍTULO 5. PROBABILIDADES

5.9. Ejercicios
1. Un experimento consta de tres pasos; para el primer paso hay tres resultados posibles, para
el segundo hay dos resultados posibles y para el tercer paso hay cuatro resultados posibles.
¿Cuántos resultados distintos hay para el experimento completo?
2. Un experimento que tiene tres resultados es repetido 50 veces y se ve que E1 aparece 20 veces,
E2 13 veces y E3 17 veces. Asigne probabilidades a los resultados. ¿Qué enfoque empleó?
3. Hay personas que apoyan la reducción de los impuestos federales con el fin de incrementar los
gastos del consumidor, aunque otros están en contra. Se seleccionan dos personas y se registran
sus opiniones. Si ninguna está indecisa, elabore una lista de los posibles resultados.
4. Un inspector de control de calidad selecciona una pieza para probarla. Enseguida, la pieza se
declara aceptable, reparable o chatarra. Entonces se prueba otra pieza. Elabore una lista de los
posibles resultados de este experimento relacionado con dos piezas.
5. Una compañía grande que debe contratar un nuevo presidente, prepara una lista final de cinco
candidatos, todos los cuales tienen las mismas cualidades. Dos de los candidatos son miembros
de un grupo minoritario. Para evitar que el prejuicio influya al momento de elegir al candidato, la
compañía decide elegir al presidente por sorteo.

a. ¿Cuál es la probabilidad de que uno de los candidatos que pertenece a un grupo minoritario
sea contratado?
b. ¿Qué enfoque de probabilidad utilizó para hacer este cálculo?

6. Douglas Bobadilla, jardinero izquierdo del equipo de béisbol de Siuna consigue 30 hits en 100
turnos al bate. Calcule la probabilidad de que consiga un hit en su siguiente turno al, ¿qué
enfoque de probabilidad utilizó?
7. Una empresa promoverá a dos empleados de un grupo de seis hombres y tres mujeres.

a. Elabore una lista de los resultados de este experimento, si existe un interés particular con
la igualdad de género.
b. ¿Qué enfoque de probabilidad utilizaría para calcular estas probabilidades?

8. Se selecciona al azar una carta de una baraja convencional de 52 cartas. ¿Cuál es la probabilidad
de que la carta resulte reina?, ¿qué enfoque de la probabilidad empleó para responder la pregunta?
9. El Center for Child Care publica información sobre 539 niños, así como el estado civil de sus
padres. Hay 333 casados, 182 divorciados y 24 viudos. ¿Cuál es la probabilidad de que un niño
elegido al azar tenga un padre divorciado?, ¿qué enfoque utilizó?
10. Una jugadora de baloncesto acierta en 70 % de sus tiros libres. Cuando ella lanza un par de tiros
libres, los cuatro eventos sencillos posibles y tres de sus probabilidades asociadas se dan en la
siguiente tabla.

Evento Primer tiro Segundo tiro Probabilidad


1 Encesta Encesta 0.49
2 Encesta Falla ?
3 Falla Encesta 0.21
4 Falla Falla 0.09

a. Encuentre la probabilidad de que la jugadora enceste en el primer tiro y falle en el segundo.


b. Encuentre la probabilidad de que la jugadora enceste en al menos uno de los dos tiros libres.

11. Durante el año anterior, las ventas semanales en Petunia’s Pet Shoppe han sido “bajas” durante
16 semanas, “considerables” durante 27 semanas y “altas” el resto de las semanas. Cuál es la
probabilidad de que las ventas de esta semana sean:

a. Considerables
b. Bajas
c. Altas
d. Por lo menos considerables
5.9. EJERCICIOS 67

Probabilidad condicional
12. En un estudio de Morgan Stanley Consumer Research se muestrearon hombres y mujeres y se
les preguntó qué preferían tomar: agua de botella o una bebida deportiva como Gatorade o Propel
Fitness (The Atlanta Journal-Constitution, 28 de diciembre de 2005). Suponga que en el estudio
hayan participado 200 hombres y 200 mujeres y que de todos 280 hayan preferido el agua de
botella. En el grupo de los que preferían bebidas deportivas, 80 eran hombres y 40 eran mujeres.
Sea
M el evento el consumidor es hombre W el evento el consumidor es mujer B el evento el consu-
midor prefiere agua de botella S el evento el consumidor prefiere una bebida deportiva

a. ¿Cuál es la probabilidad de que en este estudio una persona prefiera agua de botella?
b. ¿De que en este estudio una persona prefiera una bebida deportiva?
c. ¿Cuáles son las probabilidades condicionales P(M |S) y P (W |S)?
d. Dado que un consumidor es hombre, ¿cuál es la probabilidad de que prefiera una bebida
deportiva?
e. Ya que un consumidor es mujer, ¿cuál es la probabilidad de que prefiera una bebida depor-
tiva?

Explique usando la información sobre las probabilidades.


13. Un estudio realizado en personas de una región determinada mostró que 20 % de ellas eran fuma-
doras. La probabilidad de muerte debida a cáncer pulmonar, dado que una persona fumaba, era
alrededor de 10 veces la probabilidad de muerte debida a cáncer pulmonar de una persona que
no fumaba. Si la probabilidad de muerte debida a cáncer pulmonar en la región es .006, ¿cuál es
la probabilidad de muerte debida a cáncer pulmonar dado que una persona es fumadora?
14. A trescientos televidentes se les preguntó si estaban satisfechos con la cobertura de un reciente
desastre por TV.

Género
Femenino Masculino
Satisfecho 80 55
No satisfecho 120 45

Un televidente se ha de seleccionar al azar de entre todos los encuestados, encuentre:

a. P (Satisfecho)
b. P (Satisfecho|Femenino)
b. P (Satisfecho|Masculino)

15. A y B son eventos definidos en un espacio muestral, con P (B) = 0.4 y P (A ∩ B) = 0.5. Encuentre
P (A|B).
16. Juan vive en una gran ciudad y viaja diariamente a su trabajo en transporte colectivo metro o en
taxi. Toma el metro 80 % del tiempo porque cuesta menos, y toma taxi el otro 20 % del tiempo.
Cuando toma el metro, llega a su trabajo a tiempo 70 % de las veces, mientras que llega a tiempo
90 % de las veces cuando viaja en taxi.

a. ¿Cuál es la probabilidad de que Juan tome el metro y llegue a su trabajo a tiempo en


cualquier día determinado?
b. ¿Cuál es la probabilidad de que Juan tome un taxi y llegue a su trabajo a tiempo en cualquier
día determinado?

17. Suponga que A y B son eventos definidos en un espacio muestral común y que se conocen las
siguientes probabilidades: P (A) = 0.4, P (B) = 0.3, y P (A ∪ B) = 0.66. Encuentre P (A|B).
18. Suponga que A y B son eventos definidos en un espacio muestral común y que se conocen las
siguientes probabilidades: P (A) = 0.5, P (A ∩ B) = 0.24, y P (A|B) = 0.4. Encuentre P (A ∪ B).
68 CAPÍTULO 5. PROBABILIDADES

Reglas de la probabilidad
19. Las autoridades de Clarkson University realizaron un sondeo entre sus alumnos para conocer su
opinión acerca de su universidad. Una pregunta fue si la universidad no satisface sus expecta-
tivas, si las satisface o si supera sus expectativas. Encontraron que 4 % de los interrogados no
dieron una respuesta, 26 % respondieron que la universidad no llenaba sus expectativas y 56 %
indicó que la universidad superaba sus expectativas.

a. Si toma un alumno al azar, ¿cuál es la probabilidad de que diga que la universidad supera
sus expectativas?
b. Si toma un alumno al azar, ¿cuál es la probabilidad de que diga que la universidad satisface
o supera sus expectativas?

20. A Casey le gusta mucho tomar café a media mañana y siempre para en una de sus cafeterías
preferidas para tomarlo. Cuando toma comida para llevar, hay un 0.6 de probabilidad de que
siempre coma un pastel. Toma café y pastel como comida para llevar con una probabilidad de
0.48. ¿Cuál es la probabilidad de que tome comida para llevar?
21. En una encuesta aplicada a los suscriptores de una revista se encontró que en los últimos 12
meses 45.8 % habían rentado un automóvil por razones de trabajo, 54 % por razones personales
y 30 % por razones de trabajo y personales.

a. ¿Cuál es la probabilidad de que un suscriptor haya rentado un automóvil en los últimos 12


meses por razones de trabajo o por razones personales?
b. ¿Cuál es la probabilidad de que un suscriptor no haya rentado un automóvil en los últimos
12 meses ni por razones de trabajo ni por razones personales?

22. Jason asiste a reuniones de su secundaria. De los que asisten, 50 % son mujeres. El conocimiento
común dice que 88 % de las personas son derechas. Siendo zurdo, Jason sabe que de un grupo
grande de personas, sólo alrededor de 6 % son zurdos, hombres. Si Jason habla a la primera
persona que se encuentre en la reunión, ¿cuál es la probabilidad de que la persona sea hombre o
zurdo?
23. Reggie Miller de los Indiana Pacers tiene el record de la National Basketball Association de más
canastas de 3 puntos anotadas en toda una carrera, acertando en 85 % de sus tiros (USA Today,
22 de enero de 2004). Suponga que ya casi al final de un juego cometen una falta contra él y le
conceden dos tiros.

a. ¿Cuál es la probabilidad de que acierte en los dos tiros?


b. ¿De que acierte en por lo menos uno de los dos tiros?
c. ¿De que no acierte en ninguno de los dos tiros?

24. Un establecimiento de piezas de repuesto vende piezas nuevas y usadas. Sesenta por ciento de
las piezas en existencia son usadas. Sesenta y uno por ciento son piezas usadas o defectuosas.
Si 5 % de las piezas del establecimiento son defectuosas, ¿qué porcentaje es de partes usadas y
defectuosas?
25. Un sistema detector de humo utiliza dos aparatos, A y B. Si hay humo, la probabilidad de que
éste sea detectado por el aparato A es 0.95; por el aparato B, 0.98; y por ambos aparatos, 0.94.

a. Si hay humo, encuentre la probabilidad de que éste sea detectado por el aparato A o el B o
por ambos aparatos.
b. Encuentre la probabilidad de que el humo no sea detectado.

26. Un estudiante se selecciona del alumnado de su universidad. Defina los siguientes eventos: M, el
estudiante seleccionado es masculino; F, el estudiante seleccionado es femenino; S, el estudiante
seleccionado está registrado para estadística.

a. ¿Los eventos M y F son mutuamente excluyentes? Explique.


b. ¿Los eventos M y S son mutuamente excluyentes? Explique.
c. ¿Los eventos F y S son mutuamente excluyentes? Explique.
d. ¿Los eventos M y F son complementarios? Explique.
e. ¿Los eventos M y S son complementarios? Explique.
5.9. EJERCICIOS 69

27. Un estudiante es seleccionado al azar de un grupo de 200 estudiantes que se sabe está formado
por 140 estudiantes de tiempo completo (80 mujeres y 60 hombres) y 60 estudiantes de tiem-
po parcial (40 mujeres y 20 hombres). El evento A es “el estudiante seleccionado es de tiempo
completo”, y el evento C es “el estudiante seleccionado es mujer”.

a. ¿Son independientes los eventos A y C? Justifique su respuesta.


b. Encuentre la probabilidad P (A ∩ C).

28. Una caja contiene cuatro fichas de póker rojas y tres azules. Tres fichas de póker han de ser
seleccionadas, una a la vez.

a. ¿Cuál es la probabilidad de que las tres fichas sean rojas si la selección se hace con restitu-
ción?
b. ¿Cuál es la probabilidad de que las tres fichas sean rojas si la selección se hace sin restitu-
ción?

29. El presidente de la junta directiva afirma: “Hay 50 % de posibilidades de que esta compañía obten-
ga utilidades; 30 % de que termine sin pérdidas ni ganancias y 20 % de que pierda dinero durante
el próximo trimestre.”

a. Aplique una de las reglas de la adición para determinar la probabilidad de que la compañía
no pierda dinero el siguiente trimestre.
b. Aplique la regla del complemento para determinar la probabilidad de que no pierda dinero
el próximo trimestre.

30. Una caja contiene 25 piezas, de las cuales 3 son defectuosas y 22 no son defectuosas. Si 2 partes
se seleccionan sin restitución, encuentre las siguientes probabilidades:

a. P(ambas sean defectuosas)


b. P(exactamente una sea defectuosa)
c. P(ninguna sea defectuosa)

31. Suponga que la probabilidad de que saque una A en esta clase es de 0.25 y que la probabilidad
de obtener una B es de 0.50. ¿Cuál es la probabilidad de que su calificación sea mayor que C?
32. Use relaciones de evento para llenar los espacios en blanco de la tabla siguiente.

P (A) P (B) Condiciones para eventos A y B P (A ∩ B) P (A ∪ B) P (A|B)


0.3 0.4
0.1 0.5 Mutuamente excluyentes 0.1
0.2 0.5 Independientes 0 0.1

33. Un estudiante toma dos cursos, historia y matemáticas. La probabilidad de que el estudiante pase
el curso de historia es de 0.60 y la probabilidad de que pase el curso de matemáticas es de 0.70.
La probabilidad de pasar ambos es de 0.50. ¿Cuál es la probabilidad de pasar por lo menos uno?
34. Una encuesta sobre tiendas de comestibles del sureste de Estados Unidos reveló que 40 % tenían
farmacia, 50 % tenían florería y 70 % tenían salchichonería. Suponga que 10 % de de las tiendas
cuentan con los tres departamentos, 30 % tienen tanto farmacia como salchichonería, 25 % tienen
florería y salchichonería y 20 % tienen tanto farmacia como florería.

a. ¿Cuál es la probabilidad de seleccionar una tienda de manera aleatoria y hallar que cuenta
con farmacia y florería?
b. ¿Cuál es la probabilidad de seleccionar una tienda de manera aleatoria y hallar que cuenta
con farmacia y salchichonería?
c. ¿Cuál es la probabilidad de seleccionar una tienda que no incluya los tres departamentos?

35. Un banco local informa que 80 % de sus clientes tienen cuenta de cheques; 60 % tiene cuenta de
ahorros y 50 % cuentan con ambas. Si se elige un cliente al azar, ¿cuál es la probabilidad de que
el cliente tenga ya sea una cuenta de cheques o una cuenta de ahorros?
36. All Seasons Plumbing tiene dos camiones de servicio que se descomponen con frecuencia. Si la
probabilidad de que el primer camión esté disponible es de 0.75, la probabilidad de que el segundo
camión esté disponible es de 0.50 y la probabilidad de que ambos estén disponibles es de 0.30,
¿cuál es la probabilidad de que ningún camión se encuentre disponible?
70 CAPÍTULO 5. PROBABILIDADES

37. De 1,000 jóvenes de 18 años, 600 tienen empleo y 800 son bachilleres. De los 800 bachilleres,
500 tienen trabajo. Cuál es la probabilidad de que un joven de 18 años tomado aleatoriamente
sea:

a. ¿Un bachiller empleado?


b. ¿Empleado pero no bachiller?
c. ¿Desempleado o un bachiller?
d. ¿Desempleado o no bachiller?

38. Sammy’s Sweat Shop vende dos tipos de zapatos para correr, los Mercury y los Racer. Las proba-
bilidades de que un cliente dado compre los Mercury es de P (M ) = 0.40 y la probabilidad de que
compre los Racer es de P (R) = 0.30. La probabilidad de que compre ambos es P (M ∩ R) = 0.10.
¿Cuál es la probabilidad de que un cliente compre o M o R?
39. Un corredor de bolsa sabe por experiencias anteriores que la probabilidad de que un cliente
compre acciones es del 65 %. La probabilidad de que el cliente compre un bono del gobierno si ya
tiene acciones es del 35 %.

a. ¿Cuál es la probabilidad de que el cliente posea ambos?


b. ¿Son B y S independientes? Explique.

40. La ruta utilizada por un automovilista para trasladarse a su trabajo contiene dos intersecciones
con señales de tránsito. La probabilidad de que tenga que detenerse en la primera señal es 0.4, el
problema análogo para la segunda señal es 0.5 y la probabilidad de que tenga que detenerse en
por lo menos una de las dos señales es 0.6. ¿Cuál es la probabilidad de que tenga que detenerse

a. en ambas señales?
b. en la primera señal pero no en la segunda?
c. en exactamente una señal?

Tablas contingencia
41. Usted recolectó datos sobre 500 economistas en la academia, la industria privada, y el gobierno
respecto a sus opiniones sobre si la economía podría ser estable, podría expandirse o podría entrar
en un período de contracción en el futuro próximo. Sin embargo, parte de la información se perdió,
resultando la siguiente tabla de contingencia parcial. Con base en los datos restantes, cree una
tabla de probabilidad.

Economía
Economistas Estable (S) Expansión (E) Contracción (C) Total
Academia (A) 125 100
Industria privada (I) 35 110
Gobierno (G) 25 40 65
Total 200

De la tabla de probabilidad halle:

a. P (G) c. P (A ∩ E)
b. P (A ∩ S) d. P (G ∩ C)

42. La revista Forbes (febrero de 1997) clasificó las 120 ciudades de Estados Unidos de acuerdo con
la calidad de vida, con base en parte del porcentaje de empleados que tenían título universitario.
Los resultados se ven en la siguiente tabla de contingencia parcial, en donde A es menos del 15 %
con título universitario, B es del 15 al 20 % con título universitario y C es más del 20 % con título
universitario. Realice una tabla de probabilidad y responda las preguntas que se presentan en la
siguiente tabla.
De la tabla de probabilidad halle:
5.9. EJERCICIOS 71

Calidad de vida
Porcentaje con título universitario Pobre (P) Bueno (G) Excelente (E) Total
A 10 20 40
B 20
C 10 20
Total 20 60

a. P (A) d. P (E ∩ C)
c. P (P ∩ B) e. P (A ∩ G)

43. Es frecuente que hombres y mujeres no estén de acuerdo en qué piensan acerca de seleccionar
una pareja. Suponga que una encuesta hecha a 1000 personas de entre 20 y 30 años dio las
siguientes respuestas, a la pregunta si es más importante para su futura pareja ser capaz de
comunicar sus sentimientos (F) de los que es para esa persona vivir bien (G).

Sentimientos (F) Vivir bien (G) Totales


Hombres (H) 0.35 0.20 0.55
Mujeres (M) 0.36 0.09 0.45
Totales 0.71 0.29 1.00

Si al zar se selecciona una persona de entre este grupo de 1000, calcule las siguientes probabili-
dades:

a. P (F ) d. P (F |M )
b. P (G) e. P (H|F )
c. P (F |H) f. P (M |G)

44. Durante la temporada inaugural de la liga mayor de fútbol soccer en Estados Unidos, los equipos
médicos documentaron 256 lesiones que causaron la pérdida de tiempo de participación a jugado-
res. Los resultados de esta investigación, publicados en The American Journal of Sports Medicine,
se muestran en la tabla siguiente.

Severidad Práctica (P) Juego (G) Total


Menor (A) 66 88 154
Moderada (B) 23 44 67
Grave (C) 12 23 35
Total 101 155 256

Si un individuo es sacado al azar de entre este grupo de 256 jugadores de fútbol soccer, encuentre
las siguientes probabilidades:

a. P (A) e. P (G|B)
b. P (G) f. P (G|C)
c. P (A ∩ G) g. P (C|P )

d. P (G|A) h. P B

Probabilidad total y regla de Bayes


45. En una población el 70 % de los habitantes son mestizos (M ), el 25 % son garífunas (G) y el 5 %
mayangnas (My ). El 70 % de los mestizos son católicos (C) y lo mismo ocurre con el 60 % de los
garífunas y el 10 % de los mayangnas. Se toma una persona al azar, calcule la probabilidad que
la persona sea un mestizo católico.
46. Tres máquinas A, B y C producen respectivamente el 3 %, 2 % y 1 % de piezas defectuosas. Un
determinado día han producido un total de 200; 100 y 50 piezas. De ellas se toma una al azar que
resulta ser defectuosa. ¿Cuál es la probabilidad que haya sido producida por la máquina B?
72 CAPÍTULO 5. PROBABILIDADES

47. Un bolso contiene 3 monedas, una de las cuales tiene dos caras, mientras las otras dos son
normales. Se toma una moneda al azar y se lanza 4 veces sucesivamente obteniéndose 4 caras.
Probabilidad que la moneda tomada sea la de dos caras.
48. Un curso tiene un 60 % de alumnos y 40 % de alumnas. El 40 % de los hombres y el 60 % de las
mujeres fuman. Probabilidad que, tomado al azar un estudiante que fume, sea hombre.
49. Una empresa telefónica regional opera tres estaciones de retransmisión idénticas en diferentes
sitios. A continuación se muestra el número de desperfectos en cada estación reportados durante
un año y las causas de éstos.

Estación
Problema A B C
Con el suministro de electricidad 2 1 1
Falla de la computadora 4 3 2
Fallas del equipo eléctrico 5 4 2
Fallas ocasionadas por otros errores humanos 7 5 5

Suponga que se reporta una falla y que se descubre que fue ocasionada por otros errores huma-
nos. ¿Cuál es la probabilidad de que provenga de la estación C?
50. Una cadena de tiendas de pintura produce y vende pintura de látex y semiesmaltada. De acuerdo
con las ventas a largo plazo, la probabilidad de que un cliente compre pintura de látex es 0.75.
De los que compran pintura de látex, 60 % también compra rodillos. Sin embargo, sólo 30 % de
los que compran pintura semiesmaltada compra rodillos. Un comprador que se selecciona al azar
adquiere un rodillo y una lata de pintura. ¿Cuál es la probabilidad de que sea pintura de látex?
51. Una población se puede dividir en dos subgrupos que se presentan con probabilidades de 60 %
y 40 %, respectivamente. Un evento A ocurre 30 % del tiempo en el primer subgrupo y 50 % del
tiempo en el segundo subgrupo. ¿Cuál es la probabilidad incondicional del evento A, cualquiera
que sea el subgrupo de donde venga?
52. Los registros de delincuencia urbana muestran que 20 % de todos los delitos son violentos y que
80 % no lo son, abarcando robo, falsificación, etcétera. Noventa por ciento de los delitos violentos
son denunciados contra 70 % de los no violentos.

a. ¿Cuál es el porcentaje general de denuncias por delitos urbanos?


b. Si un delito está ocurriendo y es denunciado a la policía, ¿cuál es la probabilidad de que sea
violento?, ¿cuál es la probabilidad de que no sea violento?

53. El equipo de béisbol Leones de Léon, participa en la liga de primera división de béisbol Germán
Pomares Ordóñez de Nicaragua, juega 80 % de sus partidos por la noche y 20 % de día. El equipo
gana 90 % de los juegos nocturnos y 70 % de los juegos de día. De acuerdo con el reporte del
periódico de hoy, ganaron el día de ayer. ¿Cuál es la probabilidad de que el partido se haya jugado
de noche?
54. Una empresa de consultoría presenta una oferta para un gran proyecto de investigación. El di-
rector de la firma piensa inicialmente que tiene 50 % de posibilidades de obtener el proyecto. Sin
embargo, mas tarde, el organismo al que se le hizo la oferta pide más información sobre la oferta.
Por experiencia se sabe que en 75 % de las ofertas aceptadas y en 40 % de las ofertas no aceptadas,
este organismo solicita más información.

a. ¿Cuál es la probabilidad previa de que la oferta sea aceptada (es decir, antes de la solicitud
dé más información)?
b. ¿Cuál es la probabilidad condicional de que se solicite más información dado que la oferta
será finalmente aceptada?
c. Calcule la probabilidad posterior de que la oferta sea aceptada dado que se solicitó más
información.

55. En los automóviles pequeños el rendimiento de la gasolina es mayor, pero no son tan seguros como
los coches grandes. Los automóviles pequeños constituyen 18 % de los vehículos en circulación,
pero en accidentes con automóviles pequeños se registraron 11, 898 victimas mortales en uno
de los últimos años (Reader’s Digest, mayo de 2000). Suponga que la probabilidad de que un
automóvil pequeño tenga un accidente es 0.18. La probabilidad de que en un accidente con un
automóvil pequeño haya una víctima mortal es 0.128 y la probabilidad de que haya una víctima
mortal si el automóvil no es pequeño es 0.05. Usted se entera de un accidente en el que hubo una
víctima mortal. ¿Cuál es la probabilidad de que el accidente lo haya tenido un automóvil pequeño?
Capı́tulo 6
Modelos probabilísticos

Resultados de aprendizaje

• Define variable aleatoria, modelos de probabilidad, distribución binomial, Poisson y normal.


• Comprende el cálculo de probabilidades, usando la tabla de la distribución normal estándar.
• Analiza propiedades de las distribuciones binomial, Poisson y normal.
• Calcula probabilidades puntuales y acumulados bajo los modelos de probabilidad binomial, Poisson
y normal.
• Representa gráficamente probabilidades bajo la distribución normal.
• Simula situaciones relacionadas a las ciencias económicas y administrativas y las resuelve usando
los modelos de probabilidad binomial, Poisson y normal.

Los modelos probabilísticos cambian en función del tipo de variable (discreta o continua) y con respecto
a las características del experimento. En este capítulo se estudian los modelos de probabilidad discreta:
distribución binomial y Poisson, y la distribución normal como modelo de probabilidad continua.

6.1. Variables aleatorias

Definición 6.1.1. Variable aleatoria

Una variable aleatoria es una función que asigna un valor, usualmente numérico, al resultado de un expe-
rimento aleatorio.

Ejemplo 6.1.1.

Lanzamos un dado dos veces y se anota el número de veces que sale el dos. El número dos puede aparecer
ni una vez, una vez y dos veces. La variable aleatoria es el número de 2 que se obtienen y los posibles
resultados (0, 1 y 2) son los valores de la variable aleatoria.

Las variables aleatorias se clasifican en discretas o continuas, es discreta si sus valores son números
enteros, este tipo de variables resultan principalmente del conteo. En el caso del ejemplo 6.1.1, la
variable aleatoria (número de dos que se obtienen) es discreta, porque sus valores son 0, 1 y 2.

73
74 CAPÍTULO 6. MODELOS PROBABILÍSTICOS

Las variables aleatorias continuas son aquellas cuyos valores admiten números decimales, es decir,
toma valores dentro de un rango dado, estas variables resultan de la medición.

Ejemplo 6.1.2.

Estatura, peso e ingresos del estudiantado de primer año de Medicina Veterinaria.

A continuación se aborda el cálculo de probabilidades de variables aleatorias discretas, a partir de la


distribuciones binomial y Poisson.

6.2. Distribución binomial

La distribución binomial es una distribución de probabilidad para variable aleatoria discreta. En esta
distribución cada ensayo termina en sólo uno de dos resultados mutuamente excluyentes, uno de los
cuales se identifica como éxito (p) y el otro como fracaso (1 − p).

La función de densidad de una distribución binomial, es decir, P (X = x) en una muestra de tamaño n


está dada por:

n!
P (X = x) = px (1 − p)n−x =n Cx (p)x (1 − p)n−x (6.2.1)
x!(n − x)!

Nota 6.2.1. El valor de n Cx es la combinación de n en x y lo obtenemos directamente en cualquier calcu-


ladora científica.

Algunas propiedades de la distribución binomial son:

• Deben haber exactamente dos posibles resultados.


• Las probabilidades de éxito y fracaso no cambian de un ensayo a otro.
• La probabilidad de éxito en cualquier ensayo es totalmente independiente de cualquier otro ensayo.
• El experimento puede repetirse muchas veces.

6.2.1. Media de la distribución binomial

La media, esperanza matemática o valor esperado µ de la distribución binomial es igual al tamaño de la


muestra n multiplicado por la probabilidad de éxito, esto es:

µ = E(x) = np (6.2.2)

6.2.2. Desviación estándar de la distribución binomial

La desviación estándar de la distribución binomial es la raíz cuadrada del producto de su media con la
probabilidad de fracaso, es decir:

p
σ= np(1 − p) (6.2.3)
6.2. DISTRIBUCIÓN BINOMIAL 75

Ejemplo 6.2.1. Venta de seguros

Arlen Wong, es agente de seguros, contacta con cinco personas y cree que la probabilidad de vender un
seguro a cada una es de 0.40.

a. Halle la probabilidad de que no venda ningún seguro


b. Halle la probabilidad de que venda dos seguros
c. ¿Cuántos seguros espera vender?

Solución: En este caso tenemos dos posibles resultados, vender o no vender seguros, los datos iniciales
son: p = 0.40, 1 − p = 1 − 0.40 = 0.60 y n = 5, así:

a. Para x = 0, tenemos P (X = 0) = 5C0 (0.40)0 (0.60)5−0 = (1)(1)(0.0778)


P (X = 0) = 0.07778 = 7.7780 %. La probabilidad de que Arlen no venda ni un sólo seguro es de aproxi-
madamente 7.8 %

b. Para x = 2, tenemos P (X = 2) = 5C2 (0.40)2 (0.60)5−2 = (10)(0.16)(0.216)


P (X = 2) = 0.3456 = 34.56 %. La probabilidad de que Arlen venda dos seguros es de 34.56 %

c. La cantidad de seguros que Arlen espera vender está dada por:


µ = np = (5)(0.40) = 2. Es decir, Arlen esperaría vender dos seguros.

6.2.3. Distribución binomial acumulada

La distribución binomial acumulada surge a partir de la estimación probabilidades de un rango de


valores en lugar de un valor específico. En las probabilidades acumuladas los valores de x pueden ser:
X < x, X ≤ x, X > x, X ≥ x o bien x1 ≤ X ≤ x2 .

Ejemplo 6.2.2.

Para el caso de la gerente de seguros Arlen Wong, calculemos ahora:

a. Halle la probabilidad de que venda como máximo un seguro


b. Halle la probabilidad de que venda entre dos y cuatro seguros (inclusive)
c. Probabilidad de que venda al menos dos seguros

Solución:

a. P (como máximo un seguro) = P (X ≤ 1) = P (0) + P (1)

P (ningún seguro) = P (0) = 5C0 (0.4)0 (0.60)5−0 = (1)(1)(0.07776) = 0.078


P (un seguro) = P (1) = 5C1 (0.4)1 (0.60)5−1 = (5)(0.4)(0.1296) = 0.259
P (como máximo un seguro) = 0.078 + 0.259 = 0.337 = 33.7 %

b. P (2 ≤ X ≤ 4) = P (2) + P (3) + P (4)

P (2) = 5C2 (0.4)2 (0.60)5−2 = (10)(0.16)(0.216) = 0.346


P (3) = 5C3 (0.4)3 (0.60)5−3 = (10)(0.064)(0.36) = 0.230
P (4) = 5C4 (0.4)4 (0.60)5−4 = (5)(0.026)(0.60) = 0.077
P (2 ≤ X ≤ 4) = 0.346 + 0.230 + 0.077 = 0.653 = 65.3 %
76 CAPÍTULO 6. MODELOS PROBABILÍSTICOS

c. La probabilidad de que venda al menos dos seguros está dada por:

P (al menos dos seguros) = P (2) + P (3) + P (4) + P (5) = 1 − P (X ≤ 1)


= 1 − 0.337 = 0.663 = 66.3 %

6.3. Distribución de Poisson

Este modelo de probabilidad para variable aleatoria discreta fue desarrollado por el matemático francés
Simeon Poisson (1781-1840), con el propósito de estimar la probabilidad de un evento aleatorio sobre
algún intervalo de tiempo o espacio. La función de probabilidad de Poisson se expresa mediante la
siguiente ecuación.

µx e−µ
P (X = x) = (6.3.1)
x!

donde x es el número de veces que ocurre el evento, µ es el promedio de ocurrencias por unidad de
tiempo o de espacio y e ≈ 2.71828 es la base del logaritmo natural. La distribución de Poisson tiene las
siguientes características:

• La probabilidad de ocurrencia del evento es la misma para dos intervalos cualesquiera de tiempo o
espacio.
• La ocurrencia del evento en un intervalo es independiente de la ocurrencia de cualquier otro intervalo.

Ejemplo 6.3.1.

El gerente de control de calidad de Marylin’s Cookies inspecciona un lote de galletas de chispas de choco-
late que sale del horno. Si el proceso de producción está bajo control, el promedio de chispas de chocolate
por galleta es 6.0, ¿cuál es la probabilidad de que en cualquier galleta inspeccionada, se encuentren

a. menos de cinco chispas de chocolate?


b. exactamente cinco chispas de chocolate?
c. cinco o más chispas de chocolate?

Solución: Por la distribución de Poisson, con µ = 6, tenemos:

a. P (x < 5) = P (0) + P (1) + P (2) + P (3) + P (4)

60 e−6 (1)(0.002479)
P (X = 0) = = = 0.002479
0! 1
61 e−6 (6)(0.002479)
P (X = 1) = = = 0.014874
1! 1
62 e−6 (36)(0.002479)
P (X = 2) = = = 0.044622
2! 2
63 e−6 (216)(0.002479)
P (X = 3) = = = 0.089244
3! 6
64 e−6 (1296)(0.002479)
P (X = 4) = = = 0.133866
4! 24

P (X < 5) = 0.002479 + 0.014874 + 0.044622 + 0.089244 + 0.133866 = 0.285 = 28.5 %


6.4. DISTRIBUCIÓN NORMAL 77

65 e−6 (7, 776)(0.002479) 19.277


b. P (x = 5) = = = = 0.161 = 16.1 %
5! 120 120

c. P (x ≥ 5) = 1 − P (x < 5) = 1 − 0.285 = 0.715 = 71.5 %

6.4. Distribución normal

La distribución normal, distribución de Gauss o distribución gaussiana, es una de las distribuciones de


probabilidad de variable continua que aparece con más frecuencia en fenómenos reales. Una variable
aleatoria continua X que sigue una distribución normal de parámetros µ y σ se denota mediante X ∼
N (µ, σ) y su función de densidad está dada por:

1 1 X−µ 2
f (X) = √ e− 2 ( σ ) , X ∈ R (6.4.1)
σ 2π

Los parámetros µ y σ son la media y la desviación estándar respectivamente, π es la constante matemá-


tica natural cuyo valor es aproximadamente 3.1416. La letra e es otra constante, es decir, la base del
logaritmo natural y su valor aproximado es 2.7183 y X es el valor de una determinada variable aleatoria
continua. A continuación se describen las características de la distribución normal.

• Tiene forma de campana con un pico en el centro de la distribución. La media aritmética, la mediana
y la moda son iguales, y se localizan en el centro de la distribución. El área total bajo la curva es de
1.00. La mitad del área bajo la curva normal se localiza a la derecha de este punto central, y la otra
mitad, a la izquierda.
• Es simétrica con respecto a la media. La parte derecha aglomera la mitad del área total, 0.500, al
igual que la parte izquierda.
• La distribución es asintótica, es decir, las colas de la curva se extienden indefinidamente en ambas
direcciones sin tocar el eje x.
• La localización de una distribución normal se determina mediante la media, µ. La dispersión o propa-
gación de la distribución se determina por medio de la desviación estándar σ.

La Figura 6.1 muestra la representación gráfica de la distribución normal con algunas de las propiedades
descritas anteriormente.

0.5000 0.5000
Cola izquierda Cola derecha

−∞ µ = x̄ = Me +∞

Figura 6.1. Características de la distribución normal

En muchas ocasiones se desea que las observaciones se localicen a una, dos o tres desviaciones estándar
con respecto a la media, sin tener en cuenta el valor de la media o la desviación estándar.

• El 68 % de las observaciones están a una desviación estándar de la media.


• El 95.5 % de las observaciones están a dos desviaciones estándar de la media.
• El 99.7 % de las observaciones están a tres desviaciones estándar de la media.
78 CAPÍTULO 6. MODELOS PROBABILÍSTICOS

6.4.1. Distribución normal estándar

La distribución normal es estándar si la media µ = 0 y la desviación típica es σ = 1. Es posible estanda-


rizar cualquier distribución normal, al respecto Lind et al. (2008) señalan que “cualquier distribución de
probabilidad normal puede convertirse en una distribución de probabilidad normal estándar al restar la
media de cada observación y dividir esta diferencia entre la desviación estándar. Los resultados reciben
el nombre de valores Z o valores tipificados” (p. 229).

Definición 6.4.1. Valor z

Un valor Z es la distancia positiva o negativa entre un valor seleccionado, a saber X, y la media µ, dividida
por la desviación estándar, σ.

Matemáticamente el valor Z se representa mediante la siguiente ecuación.

X −µ
Z= (6.4.2)
σ

En pocas palabras, el valor Z representa la distancia o diferencia entre un valor particular X y la media
aritmética en unidades de desviaciones estándar.

Estandarizadas las observaciones con distribución normal, los valores Z se distribuyen normalmen-
te con una media de 0 y una desviación estándar de 1. Por tanto, la distribución Z posee todas las
características de cualquier distribución de probabilidad normal.

La tabla de la distribución normal (apéndice A.1) contiene una lista de las probabilidades de la distri-
bución de probabilidad normal estándar. Para usar la taba primero se debe desplazar por la primera
columna (Z) y luego a las filas.

Ejemplo 6.4.1.

Calcular la probabilidad de que Z = 0.27, a partir de la tabla del apéndice A.1.

Solución: La Tabla 6.1 es un fragmento de la tabla del apéndice A.1. Para calcular P (Z = 0.27), bajamos
en la columna hasta 0.2 y en la fila nos ubicamos en 0.07, obteniendo de esta manera que P (Z = 0.27) =
0.1064.

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
..
.

Tabla 6.1. Distribución normal

Si el valor de Z es negativo, usamos la tabla de la misma manera, ya que la distribución normal es


simétrica.

Ejemplo 6.4.2.

Determinar la probabilidad que Z = −0.15.

Solución: Bajamos en la columna hasta 0.1 y en la fila a 0.05, de esta manera encontramos que P (Z =
−0.15) = 0.0596, de hecho, P (Z = 0.15) = 0.0596.
6.4. DISTRIBUCIÓN NORMAL 79

6.4.2. Probabilidades bajo la distribución normal

Para calcular probabilidades bajo la distribución normal hay que convertir los valores de X en una
distribución normal estándar, es decir, expresar X como un valor Z y usar la tabla de la distribución
normal estándar del apéndice A.1 para calcular la probabilidad del valor Z bajo la campana de la
distribución normal.

Ejemplo 6.4.3.

Dada una distribución normal con µ = 100 y σ = 10,

a. ¿Cuál es la probabilidad de que X > 75?

Solución: Calculamos primero el valor de Z.

X −µ 75 − 100
Z= = = −2.50
σ 10
De la tabla del apéndice A.1, tenemos que la probabilidad de Z = −2.50, es:

P (Z = −2.50) = P (75 ≤ X ≤ 100) = 0.4938


P (X > 75) = P (75 ≤ X ≤ 100) + P (Z > 0) = 0.4938 + 0.5000 = 0.9938

La siguiente figura muestra el área bajo la distribución normal que es equivalente a P (X > 75).

σ = 10

X
75 µ = 100

b. ¿Cuál es la probabilidad de que 75 < X < 85?

Solución: Calculamos z para cada uno de los valores de X, es decir:

X −µ 85 − 100 X −µ 75 − 100
Z= = = −1.50 y Z= = = −2.50
σ 10 σ 10
De la tabla del apéndice A.1, tenemos que las probabilidades de Z = −1.50 y Z = −2.50, son:

P (Z = −1.50) = P (85 ≤ X ≤ 100) = 0.4332


P (Z = −2.50) = P (75 ≤ X ≤ 100) = 0.4938
P (75 < X < 85) = P (75 ≤ X ≤ 100) − P (85 ≤ X ≤ 100) = 0.4938 − 0.4332 = 0.0606

En la siguiente figura se muestra el área bajo la distribución normal equivalente a P (75 < X < 85).

σ = 10

X
75 85 µ = 100
80 CAPÍTULO 6. MODELOS PROBABILÍSTICOS

c. ¿Cuál es la probabilidad de que X < 85?

Solución: Calculamos primero el valor de z, así:

X −µ 85 − 100
Z= = = −1.50
σ 10
De la tabla del apéndice A.1, tenemos que la probabilidad de Z = −1.50, es:

P (z = −1.50) = P (85 ≤ X ≤ 100) = 0.4332


P (X < 85) = P (z < 0) − P (85 ≤ X ≤ 100) = 0.5000 − 0.4332 = 0.0668

En la figura de abajo se representa P (X < 85) como área bajo la distribución normal.

σ = 10

X
85 µ = 100

Ejemplo 6.4.4.

En un proceso fotográfico, el tiempo de revelado de impresiones se puede considerar como una variable
aleatoria distribuida normalmente con µ = 15.40 segundos y σ = 0.48 segundos. Encuentre las probabili-
dades de que el tiempo que toma revelar una de las impresiones será

a. al menos 16.00 segundos;

Solución: Primero se calcula el valor de Z, así:

X −µ 16 − 15.40
Z= = = 1.25
σ 0.48
De la tabla del apéndice A.1, tenemos que la probabilidad de Z = 1.25, es:

P (Z = 1.25) = P (15.40 ≤ X ≤ 16.00) = 0.3944


P (X ≥ 16.00) = P (z > 0) − P (15.40 ≤ X ≤ 16.00) = 0.5000 − 0.3944 = 0.1056

La siguiente figura representa el área bajo la distribución normal que es equivalente a P (X ≥ 16.00).

σ = 0.48

X
µ = 15.40 16.0

b. cuando mucho 14.20 segundos;

Solución: Calculamos primero el valor de Z, así:

X −µ 14.20 − 15.40
Z= = = −2.50
σ 0.48
6.4. DISTRIBUCIÓN NORMAL 81

De la tabla del apéndice A.1, tenemos que la probabilidad de Z = −2.50, es:

P (z = −2.50) = P (14.20 ≤ X ≤ 15.40) = 0.4938


P (X ≤ 14.20) = P (z < 0) − P (14.20 ≤ X ≤ 15.40) = 0.5000 − 0.4938 = 0.0062

La siguiente figura muestra P (X ≤ 14.20) como área bajo la distribución normal.

σ = 0.48

X
14.20 µ = 15.40

c. cualquier valor entre 15.00 y 15.80 segundos.

Solución: Calculamos Z para cada uno de los valores de X, es decir:

X −µ 15 − 15.40 X −µ 15.80 − 15.40


Z= = = −0.83 y Z= = = 0.83
σ 0.48 σ 0.48
De la tabla del apéndice A.1, tenemos que las probabilidades de Z = −0.83 y Z = 0.83, son:

P (z = −0.83) = P (15.00 ≤ X ≤ 15.40) = 0.2967

P (z = 0.83) = P (15.40 ≤ X ≤ 15.80) = 0.2967


P (15.00 < x < 15.80) = P (15.00 ≤ X ≤ 15.40) + P (15.40 ≤ X ≤ 15.80) = 0.2967 + 0.2967 = 0.5934

La figura de abajo muestra P (15.00 < x < 15.80) como área bajo la distribución normal.

σ = 0.48

X
15.00 µ = 15.40 15.80
82 CAPÍTULO 6. MODELOS PROBABILÍSTICOS

6.5. Ejercicios
Distribución binomial

1. Determine lo siguiente:

a. P (X = 0), n = 4 y p = 0.12 c. P (X = 5), n = 6 y p = 0.83


b. P (X = 9), n = 10 y p = 0.40 d. P (X < 5), n = 6 y p = 0.83

2. Si n = 10 y p = 0.40, ¿cuál es la probabilidad de que

a. X = 4? c. X < 2?
b. X ≤ 3? d. X > 1?

3. El Departamento de Transporte de Estados Unidos reportó que en 2009 Southwest superó a todas
las aerolíneas de ese país en las llegadas a tiempo para vuelos nacionales. con una tasa de 0.825.
Utilizando la distribución binomial, ¿cuál es la probabilidad de que en los siguientes seis vuelos

a. cuatro vuelos lleguen a tiempo?


b. los seis vuelos lleguen a tiempo?
c. al menos cuatro vuelos lleguen a tiempo?
d. cuáles son la media y la desviación estándar del número de llegadas a tiempo?

4. El 10 % de los discos de computador producidos por un nuevo proceso salen defectuosos. Si hay
20 discos en una caja:

a. ¿Cuántos esperaría usted que salieran defectuosos?


b. ¿Cuál es la probabilidad de que el número de discos defectuosos sea igual al número espe-
rado que usted determinó en su respuesta a la parte a?
c. ¿Cuál variación se encontraría en los discos defectuosos de una caja a otra?

5. Sólo 20 % de los empleados de la población civil que está en una base militar restringida porta
su identificación personal. Si llegan 10 empleados, cuál es la probabilidad de que el guardia de
seguridad encuentre:

a. ¿Ocho empleados con identificación?


b. ¿Cuatro empleados con identificación?
c. ¿Por lo menos 4 empleados con identificación?
d. ¿A lo sumo 5 empleados con identificación?
e. ¿Entre 4 y 7 empleados inclusive con identificación?

6. Usted ha contratado 8 recepcionistas telefónicas para que tomen los pedidos telefónicos para
una línea de productos deportivos que su empresa está comercializando. Una recepcionista está
ocupada el 30 % del tiempo catalogando un pedido. Usted no desea que la probabilidad de que una
llamada del cliente se reciba con una señal de ocupado exceda del 50 %. ¿Debería usted contratar
más recepcionistas si 3 clientes llaman?
7. Un estudiante debe obtener por lo menos el 60 % en un examen de verdadero y falso con 18
preguntas por responder. Si el estudiante lanza una moneda para determinar la respuesta a cada
pregunta, ¿cuál es la probabilidad de que el estudiante pase?
8. Los radares militares y los sistemas para detección de misiles tienen por objeto advertir a un país
de un ataque enemigo. Una cuestión de confiabilidad es si el sistema de detección será capaz de
detectar un ataque y emitir un aviso. Suponga que la probabilidad de que un determinado sistema
de detección detecte un ataque con misiles es 0.90. Use la distribución de probabilidad binomial
para responder las preguntas siguientes.

a. ¿Cuál es la probabilidad de que un solo sistema de detección detecte un ataque?


b. Si se instalan dos sistemas de detección en una misma área y los dos operan independiente-
mente, ¿cuál es la probabilidad de que por lo menos uno de los sistemas detecte el ataque?
6.5. EJERCICIOS 83

c. Si se instalan tres sistemas, ¿cuál es la probabilidad de que por lo menos uno de los sistemas
detecte el ataque?

9. En una universidad se encontró que 20 % de los estudiantes no terminan el primer curso de


estadística, al curso se inscriben 20 estudiantes.

a. Calcule la probabilidad de que dos o menos no terminen.


b. De que cuatro, exactamente, no terminen.
c. De que más de tres no terminen.
d. ¿Cuál es el número esperado de estudiantes que no terminan?

10. Veintitrés por ciento de los automóviles no cuenta con un seguro (CNN, 23 de febrero de 2006).
En un fin de semana determinado hay 35 automóviles que sufren un accidente.

a. ¿Cuál es el número esperado de estos automóviles que no cuentan con un seguro?


b. ¿Cuál es la varianza y la desviación estándar?
84 CAPÍTULO 6. MODELOS PROBABILÍSTICOS

Distribución de Poisson
11. Suponga una distribución Poisson.

a. Si µ = 2.5, calcule P (X = 2) f. Si µ = 8.0, calcule P (X ≥ 3)


b. Si µ = 8.0, calcule P (X = 8) g. Si µ = 0.5, calcule P (X = 1)
c. Si µ = 0.5, calcule P (X = 1) h. Si µ = 0.5, calcule P (X ≤ 1)
d. Si µ = 3.7, calcule P (X = 0) i. Si µ = 4.0, calcule P (X ≥ 1)
e. Si µ = 2.0, calcule P (X ≥ 2) j. Si µ = 5.0, calcule P (X ≤ 3)

12. Suponga que el número de errores de red experimentados en un día en una red de área local
(LAN) se distribuye como una variable aleatoria de Poisson. El número medio de errores de red
experimentados en un día es de 2.4, ¿cuál es la probabilidad de que en cualquier día dado

a. ocurran cero errores de red?


b. ocurra exactamente un error de red?
c. ocurran dos o más errores de red?
d. ocurran menos de tres errores de red?

13. El gerente de control de calidad de Marilyn’s Cookies está inspeccionando de galletas con chispas
de chocolate que acaba de homearse. Si el proceso de producción está bajo control, el número
medio de partes de chocolate por galleta es 6.0. ¿Cuál es la probabilidad de que en cualquier
galleta en particular inspeccionada

a. se encuentren cuatro o cinco partes de chocolate?


b. ¿Cuántas galletas en un lote de 100 debe esperar el gerente que sean descartadas si las
políticas de la empresa exigen que todas las galletas con chispas de chocolate tengan al
menos cuatro partes de chocolate?

14. A un conmutador de la oficina principal de la compañía llegan llamadas a un promedio de dos por
minuto y se sabe que tienen distribución de Poisson. Si el operador está distraído por un minuto,
cuál es la probabilidad de que el número de llamadas no respondidas sea:

a. ¿Cero?
b. ¿Por lo menos una?
c. ¿Entre 3 y 5, inclusive?

15. Un proceso de fabricación utilizado para hacer artefactos plásticos Incas presenta una tasa de
defectos de 5 por cada 100 unidades. Las unidades se envían a los distribuidores en lotes de 200.
Si la probabilidad de que más de 3 salgan defectuosos supera el 30 %, usted planea vender en su
lugar, camisetas Grateful Dead. ¿Cuál artículo agregará usted al inventario?
16. El Departamento de Transporte de Estados Unidos registra datos estadísticos de las quejas de
los consumidores por cada 100,000 pasajeros de aerolínea. Durante los primeros nueve meses
de 2009, las quejas de los consumidores fueron 0.99 por cada 100,000 pasajeros. ¿Cuál es la
probabilidad de que entre los siguientes 100,000 pasajeros

a. no haya quejas?
b. haya al menos una queja?
c. haya al menos dos quejas?

17. A la oficina de reservaciones de una aerolínea regional llegan 48 llamadas por hora.

a. Calcule la probabilidad de recibir cinco llamadas en un lapso de 5 minutos.


b. Estime la probabilidad de recibir exactamente 10 llamadas en un lapso de 15 minutos.

18. Durante el periodo en que una universidad recibe inscripciones por teléfono, llegan llamadas a
una velocidad de una cada dos minutos.

a. ¿Cuál es el número esperado de llamadas en una hora?


b. ¿Cuál es la probabilidad de que haya tres llamadas en cinco minutos?
c. ¿De que no haya llamadas en un lapso de cinco minutos?
6.5. EJERCICIOS 85

19. Los pasajeros de las aerolíneas llegan en forma aleatoria e independiente al mostrador de revisión
de pasajeros. La tasa media de llegada es 10 pasajeros por minuto.

a. Calcule la probabilidad de que no llegue ningún pasajero en un lapso de un minuto.


b. Calcule la probabilidad de que lleguen tres o menos pasajeros en un lapso de un minuto.
c. De que no llegue ningún pasajero en un lapso de 15 segundos.
d. De que llegue por lo menos un pasajero en un lapso de 15 segundos.

20. Cada año ocurren en promedio 15 accidentes aéreos (The World Almanac and Book of Facts, 2004).

a. Calcule el número medio de accidentes aéreos por mes.


b. Calcule la probabilidad de que no haya ningún accidente en un mes.
c. De que haya exactamente un accidente en un mes.
d. De que haya más de un accidente en un mes.

Distribución normal
21. Suponga que durante los periodos de meditación trascendental la reducción del consumo de
oxígeno de una persona es una variable aleatoria que tiene una distribución normal con µ = 37.6 cc
por minuto y σ = 4.6 cc por minuto. Encuentre las probabilidades de que durante un periodo de
meditación trascendental el consumo de oxígeno de una persona se reducirá por

a. al menos 44.5 cc por minuto;


b. cuando mucho 35.0 cc por minuto;
c. cualquier valor entre 30.0 y 40.0 cc por minuto.

22. Suponga que la variable aleatoria z sigue una distribución normal estándar.

a. Halle P (z < 1.20) e. Halle P (z > −1.00)


b. Halle P (z > 1.33) f. Halle P (1.20 < z < 1.33)
c. Halle P (z > 0) g. Halle P (−1.70 < z < 1.20)
d. Halle P (z < −1.70) h. Halle P (−1.70 < z < −1.00)

23. Se sabe que la cantidad de dinero que gastan los estudiantes en libros de texto en un año en una
universidad sigue una distribución normal que tiene una media de $380 y una desviación típica
de $50.

a. ¿Cuál es la probabilidad de que un estudiante elegido aleatoriamente gaste menos de $400


en libros de texto en un año?
b. ¿Cuál es la probabilidad de que un estudiante elegido aleatoriamente gaste más de $360 en
libros de texto en un año?
c. ¿Cuál es la probabilidad de que un estudiante elegido aleatoriamente gaste entre $300 y
$400 en libros de texto en un año?

24. La demanda de consumo de un producto prevista para el próximo mes puede representarse por
medio de una variable aleatoria normal que tiene una media de 1,200 unidades y una desviación
típica de 100 unidades.

a. ¿Cuál es la probabilidad de que las ventas superen las 1,000 unidades?


b. ¿Cuál es la probabilidad de que las ventas se encuentren entre 1,100 y 1,300 unidades?

25. Una empresa produce sacos de un producto químico y le preocupa la cantidad de impurezas que
contienen. Se cree que el peso de las impurezas por saco sigue una distribución normal que tiene
una media de 12.2 gramos y una desviación típica de 2.8 gramos. Se elige aleatoriamente un saco.

a. ¿Cuál es la probabilidad de que contenga menos de 10 gramos de impurezas?


b. ¿Cuál es la probabilidad de que contenga más de 15 gramos de impurezas?
c. ¿Cuál es la probabilidad de que contenga entre 12 y 15 gramos de impurezas?
86 CAPÍTULO 6. MODELOS PROBABILÍSTICOS

26. Un contratista considera que el coste de cumplir un contrato es una variable aleatoria que sigue
una distribución normal que tiene una media de $500.000 y una desviación típica de $50.000.
¿Cuál es la probabilidad de que el coste de cumplir el contrato esté entre $460.000 y $540.000?
27. Se reportó que en 2008 el consumo de café per cápita en Estados Unidos era de 4.2 kg o 9.24
libras. Suponga que el consumo de café per cápita en Estados Unidos se distribuye aproxima-
damente como una variable aleatoria normal, con una media de 9.24 libras y una desviación
estándar de 3 libra.

a. ¿Cuál es la probabilidad de que un individuo en Estados Unidos haya consumido más de 10


libras de café en 2008?
b. ¿Cuál es la probabilidad de que un individuo en Estados Unidos haya consumido entre 3 y
5 libras de café en 2008?
c. ¿Cuál es la probabilidad de que un individuo en Estados Unidos haya consumido menos de
5 libras de café en 2008?

28. Toby’s Trucking Company determinó que la distancia que cada camión recorre al año se distribuye
normalmente con una media de 50,000 millas y una desviación estándar de 12,000 millas. ¿Cuál
es la probabilidad de que un camión recorra entre 34,000 y 50,000 millas?
29. Un conjunto de las puntuaciones obtenidas en el examen final de un curso de estadística se
distribuyen de manera normal con una media de 73 y una desviación estándar de 8.

a. ¿Cuál es la probabilidad de que un estudiante haya obtenido una puntuación menor que 91
en este examen?
b. ¿Cuál es la probabilidad de que un estudiante haya obtenido una puntuación entre 65 y
897?

30. Un análisis estadístico de 1,000 llamadas telefónicas de larga distancia, realizadas sobre las ofici-
nas centrales de Bricks and Clicks Computer Corporation, indica que la duración de esas llamadas
se distribuye de forma normal con µ = 240 segundos y σ = 40 segundos.

a. ¿Cuál es la probabilidad de que una llamada haya durado menos de 180 segundos?
b. ¿Cuál es la probabilidad de que una llamada haya durado entre 180 y 300 segundos?
c. ¿Cuál es la probabilidad de que una llamada haya durado entre 110 y 180 segundos?

31. Una persona con una buena historia crediticia tiene una deuda promedio de $15, 015 (Business-
Week, 20 de marzo de 2006). Suponga que la desviación estándar es de $3,540 y que los montos
de las deudas están distribuidos normalmente.

a. ¿Cuál es la probabilidad de que la deuda de una persona con buena historia crediticia sea
mayor a $18,000?
b. ¿De que la deuda de una persona con buena historia crediticia sea de menos de $10,000?
c. ¿De que la deuda de una persona con buena historia crediticia esté entre $12,000 y $18,000?
d. ¿De que la deuda de una persona con buena historia crediticia sea mayor a $14,000?

32. El tiempo necesario para hacer un examen final en un determinado curso de una universidad
tiene una distribución normal cuya media es 80 minutos con desviación estándar de 10 minutos.
Conteste las preguntas siguientes

a. ¿Cuál es la probabilidad de terminar el examen en una hora o menos?


b. ¿Cuál es la probabilidad de que un estudiante termine el examen en más de 60 minutos
pero en menos de 75 minutos?

33. De acuerdo con la Sleep Foundation, en promedio se duermen 6 .8 horas por noche. Suponga que
la desviación estándar es 0.6 horas y que la distribución de probabilidad es normal.

a. ¿Cuál es la probabilidad de que una persona seleccionada al azar duerma más de ocho
horas?
b. ¿De que una persona tomada aleatoriamente duerma seis horas o menos?
Apéndice A
Tablas

87
88 APÉNDICE A. TABLAS

A.1. Tabla de la distribución normal

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1215 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2398 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4191 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.44452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4995 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998
3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000
A.2. TABLA DE LA DISTRIBUCIÓN T 89

A.2. Tabla de la distribución t

0.900 0.700 0.500 0.300 0.200 0.100 0.050 0.020 0.010 Valor α Prueba de
0.100 0.300 0.500 0.700 0.800 0.900 0.950 0.980 0.990 IC dos colas
0.450 0.350 0.250 0.150 0.100 0.050 0.025 0.010 0.005 Valor α Prueba de
0.550 0.650 0.750 0.850 0.900 0.950 0.975 0.990 0.995 IC una cola
g.l Valores de t
1 0.158 0.510 1.000 1.963 3.078 6.314 12.706 31.821 63.657
2 0.142 0.445 0.816 1.386 1.886 2.920 4.303 6.965 9.925
3 0.137 0.424 0.765 1.250 1.638 2.353 3.182 4.541 5.841
4 0.134 0.414 0.741 1.190 1.533 2.132 2.776 3.747 4.604
5 0.132 0.408 0.727 1.156 1.476 2.015 2.571 3.365 4.032
6 0.131 0.404 0.718 1.134 1.440 1.943 2.447 3.143 3.707
7 0.130 0.402 0.711 1.119 1.415 1.895 2.365 2.998 3.499
8 0.130 0.399 0.706 1.108 1.397 1.860 2.306 2.896 3.355
9 0.129 0.398 0.703 1.100 1.383 1.833 2.262 2.821 3.250
10 0.129 0.397 0.700 1.093 1.372 1.812 2.228 2.764 3.169
11 0.129 0.396 0.697 1.088 1.363 1.796 2.201 2.718 3.106
12 0.128 0.395 0.695 1.083 1.356 1.782 2.179 2.681 3.055
13 0.128 0.394 0.694 1.079 1.350 1.771 2.160 2.650 3.012
14 0.128 0.393 0.692 1.076 1.345 1.761 2.145 2.624 2.977
15 0.128 0.393 0.691 1.074 1.341 1.753 2.131 2.602 2.947
16 0.128 0.392 0.690 1.071 1.337 1.746 2.120 2.583 2.921
17 0.128 0.392 0.689 1.069 1.333 1.740 2.110 2.567 2.898
18 0.127 0.392 0.688 1.067 1.330 1.734 2.101 2.552 2.878
19 0.127 0.391 0.688 1.066 1.328 1.729 2.093 2.539 2.861
20 0.127 0.391 0.687 1.064 1.325 1.725 2.086 2.528 2.845
21 0.127 0.391 0.686 1.063 1.323 1.721 2.080 2.518 2.831
22 0.127 0.390 0.686 1.061 1.321 1.717 2.074 2.508 2.819
23 0.127 0.390 0.685 1.060 1.319 1.714 2.069 2.500 2.807
24 0.127 0.390 0.685 1.059 1.318 1.711 2.064 2.492 2.797
25 0.127 0.390 0.684 1.058 1.316 1.708 2.060 2.485 2.787
26 0.127 0.390 0.684 1.058 1.315 1.706 2.056 2.479 2.779
27 0.127 0.389 0.684 1.057 1.314 1.703 2.052 2.473 2.771
28 0.127 0.389 0.683 1.056 1.313 1.701 2.048 2.467 2.763
29 0.127 0.389 0.683 1.055 1.311 1.699 2.045 2.462 2.756
30 0.127 0.389 0.683 1.055 1.310 1.697 2.042 2.457 2.750
40 0.126 0.388 0.681 1.050 1.303 1.684 2.021 2.423 2.704
60 0.126 0.387 0.679 1.045 1.296 1.671 2.000 2.390 2.660
120 0.126 0.386 0.677 1.041 1.289 1.658 1.980 2.358 2.617
∞ 0.126 0.385 0.674 1.036 1.282 1.645 1.960 2.326 2.576
90 APÉNDICE A. TABLAS

A.3. Tabla de la distribución chi cuadrada

v 0.995 0.99 0.975 0.95 0.90 0.10 0.05 0.025 0.01 0.005
1 − − 0.001 0.004 0.016 2.706 3.841 5.024 6.635 7.879
2 0.010 0.020 0.051 0.103 0.211 4.605 5.991 7.378 9.210 10.597
3 0.072 0.115 0.216 0.352 0.584 6.251 7.815 9.348 11.345 12.838
4 0.207 0.297 0.484 0.711 1.064 7.779 9.488 11.143 13.277 14.860
5 0.412 0.554 0.831 1.145 1.610 9.236 11.071 12.833 15.086 16.650
6 0.676 0.872 1.237 1.635 2.204 10.645 12.592 14.449 16.812 18.548
7 0.989 1.239 1.690 2.167 2.833 12.017 14.067 16.013 18.475 20.278
8 1.344 1.646 2.180 2.733 3.490 13.362 15.507 17.535 20.090 21.955
9 1.735 2.088 2.700 3.325 4.168 14.684 16.919 19.023 21.666 23.589
10 2.156 2.558 3.247 3.940 4.865 15.987 18.307 20.483 23.209 25.188
11 2.603 3.053 3.816 4.575 5.578 17.275 19.675 21.290 24.725 26.757
12 3.074 3.571 4.404 5.226 6.304 18.549 21.026 23.337 26.217 28.299
13 3.565 4.107 5.009 5.892 7.042 19.812 22.362 24.736 27.688 29.819
14 4.075 4.660 5.629 6.571 7.790 21.064 23.685 26.119 29.141 31.319
15 4.601 5.229 6.262 7.261 8.547 22.307 24.996 27.488 30.578 32.801
16 5.142 5.812 6.908 7.962 9.312 23.542 26.296 28.845 32.000 34.267
17 5.697 6.408 7.564 8.672 10.085 24.769 27.587 30.191 33.409 35.718
18 6.265 7.015 8.231 9.390 10.865 25.989 28.869 31.526 34.805 37.156
19 6.844 7.633 8.907 10.117 11.651 27.204 30.144 32.852 36.191 38.582
20 7.434 8.260 9.591 10.851 12.443 28.412 31.410 34.170 37.566 39.997
21 8.034 8.897 10.283 11.591 13.240 29.615 32.671 35.479 38.932 41.401
22 8.643 9.542 10.982 12.338 14.042 30.813 33.924 36.871 40.289 42.796
23 9.260 10.196 11.689 13.091 14.848 32.007 35.172 38.076 41.638 44.181
24 9.886 10.856 12.401 13.848 15.659 33.196 36.415 39.364 42.980 45.559
25 10.520 11.524 13.120 14.611 16.473 34.382 37.652 40.646 44.314 46.928
26 11.160 12.198 13.844 15.379 17.292 35.563 38.885 41.923 45.642 48.290
27 11.808 12.879 14.573 16.151 18.114 36.741 40.113 43.194 46.963 49.645
28 12.461 13.565 15.308 16.928 18.939 37.916 41.337 44.461 48.278 50.993
29 13.121 14.257 16.047 17.708 19.768 39.087 42.557 45.722 49.588 52.336
30 13.787 14.954 16.791 18.493 20.599 40.256 43.773 46.979 50.892 53.672
40 20.707 22.164 24.433 26.509 29.051 51.805 55.758 59.342 63.691 66.766
50 27.991 29.707 32.357 34.764 37.689 63.167 67.5058 71.420 76.154 79.490
60 35.534 37.485 40.482 43.188 46.459 74.397 79.082 83.298 88.379 91.952
70 43.275 45.442 48.758 51.739 55.329 85.527 90.531 95.023 100.425 104.215
80 51.172 53.540 57.153 60.391 64.278 96.578 101.879 106.629 112.329 116.321
90 59.196 61.754 65.647 69.126 73.291 107.565 113.145 118.136 124.116 128.299
100 67.328 70.065 74.222 77.929 82.358 118.498 124.342 129.561 135.807 140.169
Bibliografía

Acosta, M., E., Piña, L., & Espallargas, D. (2008). Curso breve de estadística. La Habana, Cuba: Dpt.
Estadística-Informática, Facultad de Economía, Universidad de la Habana.

Anónimo. (s.f). Historia de la probabilidad. Recuperado de http://www.estadisticaparatodos.es/


historia/histo_proba.html

Banco Central de Nicaragua (2017). Nicaragua en Cifras. Managua: Autor. Recuperado de


https://www.bcn.gob.ni/publicaciones/periodicidad/anual/nicaragua_cifras/
nicaragua_cifras.pdf

Besterfield, D., H. (2009). Control de calidad (8va ed.). México: Pearson Educación, S. A. de C. V.

Cáceres, J. (2007). Conceptos básicos de estadística para ciencias sociales. España: Delta, Publicacio-
nes Universitarias.

Cobo, E., Muñoz, P., & González, J., A. (2007). Bioestadística para no estadísticos: Bases para interpre-
tar artículos científicos. Barcelona, España: Elsevier Doyma, S. L.

Coeficiente de variación. (7 de marzo de 2020). En Wikipedia. https://es.wikipedia.org/wiki/


Coeficiente_de_variaci%C3%B3n

Instituto Nacional de Información de Desarrollo (2017). Anuario estadístico 2017. Managua: Autor.
Recuperado de https://www.inide.gob.ni/docs/Anuarios/Anuario2017.pdf

Johnson, R., & Kuby, P. (2012). Estadística elemental (11ra ed.). México: Cengage Learning, S. A. de C.
V.

Levine, D., M., Krehbiel, T., C., & Berenson, M., L. (2014). Estadística para administración (6ta ed.).
México: Pearson Educación S. A. de C. V.

Levin, R., I., & Rubin, D., S. (2004). Estadística para administración y economía (7ma ed.). México:
Pearson Educación, S. A. de C. V.

Lind, D., A., Marchal, W., G., & Wathe, S., A. (2012). Estadística aplicada a los negocios y la economía
(15 ta ed). México: McGraw-Hill/Interamericana, S. A. de C. V.

Newbold, P., Carlson, W., L., & Thorne, B. (2008). Estadística para administración y economía. (6ta ed).
Madrid, España: Pearson Educación, S. A.

Triola, M., F. (2018). Estadística (12 da ed.). México: Pearson Educación, S. A. de C. V.

Walpole, R., E., Meyers, R., H., Meyers, S., L., & Ye, K. (2012). Probabilidad y estadística para ingeniería
y ciencias (9na ed.). México: Pearson Educación S. A. de C. V.

91
92 BIBLIOGRAFÍA

Webster, A., L. (2000). Estadística aplicada a los negocios y la economía. (3ra ed.). Santa Fé de Bogotá,
Colombia: McGraw-Hill Interamericana, S. A.
Índice alfabético

Asintótica, 77 Frecuencia relativa acumulada, 19


Frecuencia relativa acumulada porcentual, 19
Blaise Pascal, 50 Frecuencia relativa porcentual, 18
Breve historia de la estadística, 2 Función de densidad, 74

Clasificación de las variables, 10 Gauss, 77


Coeficiente de sesgo P de Pearson, 38 Gottfried Achenwall, 1
Coeficiente de variación, 39 Grados de libertad, 37
Complemento de sucesos, 54 Gregor Mendel, 50
Conceptos básicos de la estadística, 4 Gráfica de barras, 23
Cuartiles, 40 Gráfica de sectores, 22
Gráficas para datos cualitativos, 22
Dato, 5 Gráfico de líneas o polígono, 27
Datos, 5
Datos multivariados, 6 Histograma, 26
Datos univariados, 6 Historia de la probabilidad, 50
De Moivre, 50
Desviación estándar, 38 Intersección de sucesos, 54
Desviación estándar de la distribución binomial,
74 Límite inferior de clase, 20
Desviación estándar de la media, 77 Límite superior de clase, 20
Diagrama de caja, 26
Diagrama de tallo y hoja, 16 Marca de clase, 21
Dispersión, 77 Media aritmética, 33
Distribución binomial, 74 Mediana, 35
Distribución binomial acumulada, 75 Medidas de dispersión, 37
Distribución de frecuencias, 17 Medidas de dispersión para datos agrupados, 44
Distribución de Poisson, 76 Medidas de posición, 40
Distribución de probabilidad normal estándar, 78 Medidas de tendencia central, 33
Distribución gaussiana, 77 Medidas de tendencia central para datos agrupa-
Distribución normal, 77 dos, 42
Distribución sesgada, 36 Moda, 35
Distribución simétrica, 36 Muestra, 4

E. A. W. Zimmerman, 1 Nivel de intervalo, 13


Espacio muestral, 51 Nivel de razón, 13
Estadística, 2 Nivel nominal, 12
Estadística bayesiana, 63 Nivel ordinal, 12
Estadística descriptiva, 3 Niveles de medición de las variables, 12
Estadística inferencial, 3
Estadístico, 6 Observación atípica, 26
Evoluación de la estadística, 2 Ojiva, 28
Experimento, 50 Operaciones con sucesos, 53
Experimento aleatorio, 51 Origen de la estadística, 1
Experimento determinista, 51
Parámetro, 5
Frecuencia absoluta, 17 Percentiles, 41
Frecuencia acumulada, 19 Pierre Fermat, 50
Frecuencia relativa, 18 Población, 4

93
94 ÍNDICE ALFABÉTICO

Población finita, 4
Población infinita, 4
Probabilidad, 54
probabilidad clásica, 55
Probabilidad condicional, 57
Probabilidad empírica, 56
Probabilidad marginal, 65
Probabilidad objetiva, 55
Probabilidad subjetiva, 57
Probabilidad total, 63
Probabilidades acumuladas, 75
Probabilidades bajo la distribución normal, 79
Pruebas paramétrica, 3

Regla de Bayes, 63, 64


Regla de la adición, 59
Regla de la multiplicación, 60
Regla de Sturges, 20

Simeon Poisson, 76
sir John Sinclair, 1
Suceso, 52
Suceso complementario, 53
Suceso compuesto, 53
Suceso imposible, 53
Suceso seguro, 53
Sucesos elemental, 53

Tablas de contingencia, 64
Thomas Bayes, 63

Unidad experimental, 6
Unión de sucesos, 53

Valor Z, 78
Valor esperado, 74
Valores tipificados, 78
Variable, 10
Variable aleatoria, 73
Variable aleatoria continua, 74
Variable aleatoria discreta, 73
Variable cualitativa, de atributos o categórica, de
atributos o categórica, 11
Variable cuantitativa continua, 11
Variable cuantitativa discreta, 11
Variable cuantitativa o numérica, 11
Variable dicotómica, 11
Varianza, 37

Área bajo la curva normal, 77

También podría gustarte