Distribuciones de Probabilidad
Tema 5 página 1
Definiciones básicas
Variable aleatoria: es una variable cuyo valor es el resultado de un evento
aleatorio.
Variable aleatoria discreta: puede asumir sólo ciertos valores, con frecuencia
números enteros, y resulta del conteo.
Variable aleatoria continua: puede tomar cualquier valor dentro de un rango
dado, resulta de la medición.
Distribución de probabilidad: es una lista de todos los resultados posibles de un
experimento junto con sus respectivas probabilidades.
Ejemplo: Si se lanza una moneda tres veces y se anota el número de caras, se
obtiene la siguiente Distribución Discreta:
Resultado (caras) Probabilidad
0 1/8
1 3/8
2 3/8
3 1/8
∑ 1
Tema 5 página 2
Media y varianza de una distribución discreta
Media o valor esperado de una distribución de probabilidad discreta
Varianza de una distribución de probabilidad discreta
Desviación estándar
Tema 5 página 3
Ejercicio
El número de quejas de los empleados de una empresa de servicios oscila entre 0 a
6 cada día como se muestra en la siguiente tabla. Calcule el valor esperado, la
varianza y la desviación estándar.
Quejas Número de días Quejas Número de días
0 3 4 2
1 4 5 1
2 3 6 4
3 6
Ejercicio - Hoja de cálculo
Tema 5 página 4
Distribución Binomial
Cada ensayo en una distribución binomial termina en sólo uno de dos resultados
mutuamente excluyentes, uno de los cuales se identifica como éxito y el otro
como fracaso. La probabilidad de cada resultado permanece constante de un
ensayo a otro.
Propiedades de una distribución binomial:
1. Sólo debe haber dos posibles resultados. Éxito o fracaso.
2. La probabilidad de un éxito, π, sigue siendo constante de un ensayo al
siguiente, al igual que la probabilidad de fracaso, 1 - π.
3. La probabilidad de un éxito en un ensayo es totalmente independiente de
cualquier otro ensayo.
4. El experimento puede repetirse muchas veces.
Si se conoce la probabilidad de que un ensayo determinado producirá un éxito, es
posible determinar cuántos éxitos habrá en un número dado de ensayos.
La fórmula binomial:
Ejemplo 1: El gerente de crédito de American Expres ha descubierto que 10% de
los usuarios de la tarjeta no paga el monto completo de la deuda durante un mes
dado. Desea determinar la probabilidad de que de 20 cuentas seleccionadas de
manera aleatoria, 5 de las cuentas no sean pagadas.
Ejemplo 2 : De acuerdo con el periódico de educación superior, el 40%
de todos los bachilleres trabajan durante el verano para ganar dinero
para la educación universitaria correspondiente al siguiente período de
otoño. Si 7 bachilleres se seleccionan de manera aleatoria, ¿cuál es la
probabilidad de que a) 5 tengan trabajo en el verano, b) ninguno
trabaje, c) todos trabajen?
Tema 5 página 5
Media y varianza de una distribución binomial
Media de una distribución binomial:
Varianza de una distribución binomial:
Tema 5 página 6
Distribuciones binomiales acumuladas
Del ejercicio de los estudiantes, encontrar la probabilidad de que 3 o menos
estudiantes trabajen.
Calcular la probabilidad de que 5 o más trabajen.
Calcular la probabilidad de que entre 3 y 5 trabajen
Si π > 50 se necesitan dos arreglos ordenados.
Ejemplo:
Se asume que el 80% de los bachilleres tomaron trabajos de verano. Se
desea calcular la probabilidad de que 3 o menos estudiantes trabajen.
Debe construirse un arreglo para π = 0.80 y π = 0.20
Tema 5 página 7
Distribución hipergeométrica
Si la población es pequeña y ocurre el muestreo sin reemplazo, la probabilidad de
un éxito variará, por lo tanto se usa la distribución hipergeométrica.
Fórmula de la distribución hipergeométrica:
N Es el tamaño de la población
r Es el número de éxitos en la población
n Es el tamaño de la muestra
x Es el número de éxitos de la muestra
Ejemplo 1: En un establo de caballos de carreras hay 10 caballos, y 4 de ellos
tienen una enfermedad contagiosa. ¿Cuál es la probabilidad de seleccionar una
muestra de 3 caballos en la cual 2 estén enfermos?
Ejemplo 2: De los 15 altos ejecutivos de un negocio de importaciones, se
seleccionan 12 para enviarlos al Japón para estudiar un nuevo proceso de
producción. Ocho de los ejecutivos ya tienen algo de entrenamiento en el proceso.
¿Cuál es la probabilidad de que 5 de los enviados tengan algo de conocimiento
sobre el proceso antes de partir?
Tema 5 página 8
Distribución de Poisson
Mide la probabilidad de un evento aleatorio sobre un intervalo de tiempo o
espacio.
Supuestos para la aplicación de esta distribución:
1. La probabilidad de ocurrencia del evento es constante para dos intervalos
cualesquiera de tiempo o espacio.
2. La ocurrencia del evento en un intervalo es independiente de la ocurrencia de
otro intervalo cualquiera.
Fórmula para la distribución de Poisson:
x Es el número de veces que ocurre el evento
μ Es el número promedio de ocurrencias por unidad de tiempo o espacio
e 2,7182 la base del logaritmo natural
Ejemplo 1: Calcular la probabilidad de que exactamente 5 clientes lleguen durante
la siguiente hora laboral. La observación simple de las últimas 80 horas ha
demostrado que 800 clientes han entrado al negocio.
Ejemplo 2: Una compañía de pavimentación obtuvo un contrato con el municipio
para hacer mantenimiento a las vías de un gran centro urbano. Las vías
recientemente pavimentadas por esta compañía demostraron un promedio de dos
defectos por milla, después de haber sido utilizadas por un año. Si el municipio
sigue con esta compañía de pavimentación, a)¿cuál es la probabilidad de que se
presenten 3 defectos en cualquier milla de vía después de haber tenido tráfico
durante un año? b) ¿cuál es la probabilidad de tener 3 defectos en 0,5 millas?
Tema 5 página 9
Tema 5 página 10
Plan del capítulo
Tema 4 página 1
Introducción a la Probabilidad
Probabilidad: Es la posibilidad numérica, medida entre 0 y 1, de que ocurra
un evento.
P(evento cierto) = 1
P(evento imposible) = 0
0 ≤ P(Ei) ≤ 1
Experimento: es el proceso que produce un evento. Es toda acción bien
definida que conlleva a un resultado único bien definido.
Espacio muestral: es el conjunto de todos los posibles resultados para un
experimento.
∑P(Ei) = 1
Modelo de frecuencia relativa: utiliza datos que han ocurrido en el pasado
para estimar la probabilidad de que el evento ocurra nuevamente.
Modelo subjetivo: se usa cuando se desea asignar probabilidad a un
evento que nunca ha ocurrido. Calcula la probabilidad de un evento con
base en la mejor evidencia posible.
Modelo clásico: se relaciona con las apuestas y juegos de azar.
Tema 4 página 2
Ejercicios
1. La siguiente tabla muestra el número de computadores
vendidos diariamente por una tienda minorista.
Número de computadores vendidos Número de días
0 12
1 43
2 18
3 20
4 25
Determine la probabilidad de que el número de
computadoras que se vendan hoy sea:
a. 2
b. Menos de 3
c. Más de 1
d. Por lo menos 1
2. Durante el año anterior , las ventas semanales de una tienda
de mascotas han sido bajas durante 16 semanas,
considerables durante 27 semanas, y altas el resto de las
semanas. Cuál es la probabilidad de que las ventas de esta
semana sean:
a. Considerables
b. Bajas
c. Altas
d. Por lo menos considerables.
Tema 4 página 3
Relaciones entre eventos
Intersección entre A y B, (A ∩ B): es el conjunto de todos los
elementos que están tanto en A como en B.
La unión de A o B, (A U B): Es el conjunto de todos los elementos
que están en A o en B o en ambos.
Eventos mutuamente excluyentes: dos eventos son mutuamente
excluyentes, si la ocurrencia de uno prohíbe la ocurrencia del
otro.
Eventos colectivamente exhaustivos: constan de todos los
posibles resultados de un experimento y constituyen su espacio
muestral.
Eventos independientes: son eventos en los que la ocurrencia del
uno no tiene nada que ver con la ocurrencia del otro.
Cuando se saca de un conjunto finito, como por ejemplo una
baraja de cartas, dos eventos son independientes si y solo si se
realiza el reemplazo. Sin embargo, si el primer elemento no se
reemplaza antes de sacar el segundo elemento, los dos eventos
son dependientes.
Eventos complementarios: son los que si un evento no ocurre, el
otro debe ocurrir. El complemento de A se escribe
Tema 4 página 4
Ejercicios
1. Dada una baraja de 52 cartas, el conjunto A consta de los 13
corazones y el conjunto B son los cuatro ases. Identifique
cuáles cartas están incluidas en (A U B) y (A ∩ B).
2. Algunos trabajadores hombres y mujeres de una planta
grande tienen educación secundaria. El conjunto A consta de
los trabajadores hombres, el conjunto B de las trabajadoras
mujeres, el conjunto C es el conjunto con educación
secundaria, y el conjunto D es el de los trabajadores que no
tienen educación secundaria. Identifique y explique (A U C),
(B U D), (A ∩ C). Identifique los eventos que son :
a. Mutuamente excluyentes
b. Colectivamente exhaustivos con respecto al género
c. Si 300 de los 1000 trabajadores son hombres. ¿Cuál es la
probabilidad de que un trabajador sea mujer?
d. ¿Cuál es la diferencia entre P(M) y P( ).
Tema 4 página 5
Tablas de contingencia y de probabilidad
Usted recolectó datos sobre 500 economistas en la academia, la
industria privada, y el gobierno respecto a sus opiniones sobre si
la economía podría ser estable, podría expandirse o podría entrar
en período de contracción en el futuro próximo. Sin embargo,
parte de la información se perdió, resultando la siguiente tabla de
contingencia parcial. Con base en los datos restantes, cree una
tabla de probabilidad.
Economía
Economistas Estable(S) Expansión E Contracción C Total
Academia (A) 125 100
Industria Privada(I) 35 110
Gobierno (G) 25 40 65
Total 200
Economía
Economistas Estable(S) Expansión E Contracción C Total
Academia (A)
Industria Privada(I)
Gobierno (G)
Total
De la tabla de probabilidad halle:
a. P(A)
b. P(G)
c. P(A ∩ S)
d. P(A ∩ E)
e. P(G ∩ C)
Tema 4 página 6
Probabilidad condicional
Es la probabilidad de que el evento A ocurra, dado que o a condición de que el
evento B ya haya ocurrido.
Se denota como P(A|B) y se lee la probabilidad de A dado B.
La fórmula general para calcular esta probabilidad es:
Ejemplo: Hallar la probabilidad de que la carta sacada de una baraja fuese una
jota, dada la información adicional de que es una figura.
Tema 4 página 7
Ejercicios
Economía
1. De la tabla de probabilidad del ejercicio de tablas de contingencia:
a. Halle P(S|A). Economistas Estable(S) Expansión E Contracción C Total
b. Si usted es un economista académico, ¿es más probable que usted Academia (A)
pronostique una economía estable que si trabaja en el gobierno? Industria Privada(I)
c. Dado que usted trabaja en la industria privada, ¿es más probable que Gobierno (G)
usted pronostique una contracción en la economía que un académico?
d. Si usted trabaja para el gobierno, ¿cuál de los tres pronósticos es más Total
probable que usted haga?
Tema 4 página 8
Regla de la multiplicación
El propósito de esta regla es determinar la probabilidad del evento conjunto
P(A ∩ B).
La fórmula para calcular la probabilidad de eventos independientes es:
La fórmula para calcular la probabilidad de eventos dependientes es:
Ejemplo 1: Calcular la probabilidad de sacar un 3 con un dado y una cara con una
moneda.
Solución: Los dos eventos son independientes por tanto,
Ejemplo 2: El gerente de crédito de un banco recolecta datos de 100 de sus
clientes. De los 60 hombres, 40 tienen tarjetas de crédito. De las cuarenta mujeres
30 tienen tarjetas de crédito. Diez de los hombres tienen saldo vencido, mientras
que 15 de las mujeres tienen saldo vencido. El gerente de crédito desea
determinar la probabilidad de que un cliente seleccionado al azar sea:
a. Una mujer con tarjeta de crédito.
b. Una mujer con un saldo vencido.
c. Un hombre sin un saldo vencido.
d. Un hombre con un saldo vencido
Tema 4 página 9
Regla de la adición
Se utiliza para determinar la probabilidad de A o B,
La fórmula para calcular la probabilidad de eventos que no son mutuamente
excluyentes es:
La fórmula para calcular la probabilidad de eventos que son mutuamente
excluyentes es:
Ejemplo 1: La mayoría de las estaciones de servicio venden tres tipos de gasolina:
corriente, super y premium. Con frecuencia, alguna de cada tipo está enriquecida
con etanol. La tabla de contingencia que se muestra a continuación ilustra los
porcentajes de clientes que prefieren cada tipo.
Corriente(C) Super (S) Premium (P) Total
Etanol (E) 0,05 0,10 0,05 0,20
Sin etanol 0,15 0,40 0,25 0,80
Total 0,20 0,50 0,30 1,00
Determinar la probabilidad que el cliente prefiera:
a. Corriente o etanol
b. Super o sin etanol
c. Premium o etanol
d. Premium o sin etanol
e. Corriente o super.
Ejemplo 2: De los 10 chips de un computador, 4 están defectuosos. ¿Cuál es la
probabilidad de seleccionar 3 sin que haya reemplazo, de los cuales sólo uno sea
defectuoso?
Tema 4 página 10
Teorema de Bayes
La fórmula que utiliza el teorema de Bayes es la siguiente:
Ejemplo: Se asume que una fábrica utiliza dos máquinas para producir su
producto. La máquina A produce el 60% de la producción total, y la máquina B
produce el restante 40%. El 2% de las unidades producidas por A son defectuosas,
mientras que B tiene una tasa de defectos del 4%. Suponiendo que una unidad
escogida al azar es defectuosa, se desea saber la probabilidad de que la unidad
provino de la máquina A.
Tema 4 página 11
Técnicas de conteo
Las técnicas de conteo permiten contar el número de subconjuntos que se
pueden obtener de un conjunto.
Factorial de un número:
n! = 1 x 2 x 3 x 4 x…x n
3! = 1 x 2 x 3 = 6
0! = 1
1! = 1
Combinaciones:
No es importante el orden
Ejemplo: Determine cuantos subconjunto de dos elementos se podría obtener del
conjunto
A= {a, b, c}
A= {{a b}, {a, c}, {b, c}}; si el orden no es importante, se obtienen tres subconjuntos.
Permutaciones:
Es importante el orden
Ejemplo: Determine cuantos subconjunto de dos elementos se podría obtener del
conjunto
A= {a, b, c}
A= {{a b}, {a, c}, {b, c}, {b, a},{c, a},{c, b}}; si el orden es importante, se obtienen seis
subconjuntos.
Escogencia múltiple:
Ni las combinaciones, ni las permutaciones permiten que se seleccione un
elemento más de una vez.
La escogencia múltiple si permite la duplicación.
Ejemplo: ¿Cuántos números telefónicos distintos pueden asignarse a una oficina
grande dados los dígitos 0-9?
Tema 4 página 12
grande dados los dígitos 0-9?
a. Si la oficina utiliza solo una extensión seguida por cuatro dígitos, tales como
555-XXXX
b. Si se utiliza una segunda extensión como 556-XXXX
Multiplicación:
Esta técnica se utiliza cuando se debe escoger un elemento de dos o más
conjuntos, entonces, simplemente se multiplica el número de elementos en cada
conjunto.
Ejemplo: Un empresario desea comprar un vehículo para ofrecer tours en la
ciudad. Puede escoger entre tres colores, dos tamaños de motor y cuatro diseños
de interior distintos. ¿Cuántos modos distintos de vehículo están a su disposición?
Colores 3
Tamaños de motor 2
Diseños de interior 4
Tipos de vehículos distintos = 3 x 2 x 4 = 24
Tema 4 página 13
Ejercicios del capítulo
1. Un caso en la corte del condado de Madison, Kentucky, sobre las prácticas de
contratación de una compañía de teléfonos local. La compañía planeó
contratar 3 nuevos empleados. Había 8 candidatos para los cargos, 6 de los
cuales eran hombres. Los 3 que fueron contratados eran hombres. Un cargo
por discriminación de sexo se impuso contra la compañía. ¿Cómo decidiría
usted?
2. Solo el 60% de los estudiantes de la clase de estadística del Profesor Moreta
pasaron la primera prueba. De quienes pasaron , el 80% estudiaron, el 20% de
quienes no pasaron si estudiaron. ¿Debería usted estudiar para las pruebas de
este profesor?
3. Un vendedor vende al 30% de los clientes a quienes llama. Si él hace tres
llamadas hoy, ¿cuál es la probabilidad de que haga exactamente una venta?
Tema 4 página 14
Plan del tema
Tema 3 página 1
Medidas de tendencia central de datos no agrupados
Media aritmética: es la medida de tendencia central que es considerada como el
promedio.
Media poblacional:
Media muestral:
La mediana: es la observación de la mitad después de que se han colocado los
datos en una serie ordenada.
Si el conjunto de datos tiene un número impar de observaciones, la posición de la
mediana es:
Si el conjunto de datos tiene un número par de observaciones, la posición de la
mediana se obtiene con la expresión anterior. El valor de la mediana es el
promedio de la observación anterior y posterior de la posición.
Ejemplo: encontrar la mediana de los siguientes conjuntos de datos:
a. 45, 52, 56, 67, 67
b. 35, 45, 52, 56, 67, 67
La moda: por definición es la observación que más se repite dentro de un conjunto
de datos
La media ponderada: se usa cuando las observaciones tienen distinto peso o
importancia. La fórmula es la siguiente:
La media geométrica: proporciona una medida precisa de un cambio porcentual
promedio en una serie de números. La fórmula es la siguiente:
Tema 3 página 2
Ejercicios
Se asume que se obtuvo un puntaje de 89, 92 y 79 en los exámenes parciales y 94
en el examen final. Estos puntajes y sus respectivas ponderaciones están
reflejados en tabla siguiente:
Nota(x) Peso (W) XW
89 1 89
92 1 92
79 1 79
94 2 188
∑ 5 448
El director ejecutivo de una aerolínea desea determinar la tasa de crecimiento
promedio en los ingresos con base en las cifras dadas en la tabla. Si la tasa de
crecimiento promedio es menor que el promedio industrial del 10%, se asumirá
una nueva campaña publicitaria.
Año Ingreso Porcentaje del año anterior
2011 US$50000 ---
2012 55000 55/50 = 1,1
2013 66000 66/55 = 1,2
2014 60000 60/66 = 0,91
2015 78000 78/60 = 1,3
Restando 1 para convertirlo en un incremento anual promedio da 0,1179 o 11,79%
para el período de cinco años.
Tema 3 página 3
Medidas de dispersión para datos no agrupados
Miden que tanto se dispersan las observaciones alrededor de su
media
El rango: es simplemente la deferencia entre la observación más
alta y la más baja.
Varianza de la población: es el promedio de las observaciones
respecto a su media elevadas al cuadrado.
Desviación estándar de la población: es la raíz cuadrada de la
varianza.
Varianza de la muestra:
Desviación estándar de la muestra:
El número de grados de libertad (n-1) en toda operación
estadística es igual al número de observaciones menos toda
restricción impuesta en tales observaciones.
Ejercicio:
Ejecicio varianza
Tema 3 página 4
Tema 3 página 5
Medidas de tendencia central y dispersión para datos
agrupados
La media:
La mediana:
La clase mediana es la clase cuya frecuencia acumulada es mayor que o
igual a n/2
La moda:
La clase modal es la clase que tenga la frecuencia más alta
Varianza y desviación estándar
Tema 3 página 6
Varianza y desviación estándar
Ejercicio:
Ejercicio
datos agr...
Tema 3 página 7
Otras medidas de dispersión
Las medidas adicionales de dispersión son:
Cuartiles
Deciles
Percentiles
Todo conjunto de datos tiene:
Tres cuartiles
Nueve deciles
Noventa y nueve percentiles
Un percentil y su ubicación en un conjunto ordenado de datos se
identifica mediante los subíndices. Por ejemplo, el decimoquinto
percentil se indica como P15, y su ubicación en la serie ordenada
es L15.
La ubicación de un percentil es:
Lp es el sitio del percentil deseado en una serie ordenada
n es el número de observaciones
P es el percentil deseado
Q1 = P25 D1= P10
Q2 = P50 D2 = P20
Q3 = P75 D3 = P30
Una medida única de dispersión es el RANGO INTERCUARTÍLICO
(RIQ) y es la diferencia entre el tercer cuartil y el primer cuartil.
El RIQ proporciona una medida de dispersión que no está muy
influenciada por unas cuantas observaciones extremas.
Tema 3 página 8
Conceptos relacionados
Teorema de Chebyshev: Establece que para todo conjunto de
datos, por lo menos de las observaciones están dentro
de K desviaciones estándar de la media, en donde K es cualquier
número mayor que 1. |
Por ejemplo si se forma un intervalo de K = 3 desviaciones
estándar por encima y por debajo de la media, entonces por lo
menos de todas las observaciones
estarán dentro de dicho intervalo.
La regla empírica: se basa en la distribución normal, que tiene la
siguiente forma:
La regla empírica especifica que:
Sesgo: algunas distribuciones están sesgadas a la izquierda o a la
derecha, como se observa en la figura.
Por su naturaleza, la media se ve más afectada por las
observaciones extremas.
El sesgo se mide mediante el coeficiente de sesgo de Pearson:
Si P < 0 los datos están sesgados a la izquierda.
Si P > 0 los datos están sesgados a la derecha.
Si P = 0 los datos están distribuidos normalmente.
Ejemplo: Utilizando los datos agrupados de la lista de pasajeros de
una compañía aérea, se calcula
. Dada esta información, el director puede ver claramente
que los datos están sesgados a la derecha. Desea obtener una
medida del grado del sesgo.
Coeficiente de variación (CV): sirve como medida relativa de
Tema 3 página 9
Coeficiente de variación (CV): sirve como medida relativa de
dispersión, determina el grado de dispersión de un conjunto de
datos relativo a su media.
Se usa cuando se considera dos o más distribuciones que tienen
medias significativamente diferentes, o que están medidas en
unidades distintas.
La expresión para calcular el coeficiente de variación es:
.
Ejemplo: Los datos de una compañía aérea reportaron una media
de 78,7 pasajeros por día, con una desviación estándar de 12,14
pasajeros. También recolectaron datos sobre el mismo período
para el número de millas que la aerolínea voló y dicha media y
desviación estándar fueron 1267,5 y 152,7, respectivamente. La
desviación estándar para las millas voladas puede sugerir que
estos datos presentan una variación mucho mayor.
El coeficiente de variación para los pasajeros es:
El coeficiente de variación para las millas es:
Tema 3 página 10
Plan del tema
Tema 2 página 1
Distribución de frecuencias:
Una distribución de frecuencia o tabla de frecuencia, ordenará los datos si estos se
dividen en clases y se registrará el número de observaciones en cada clase.
Cada clase tiene un límite inferior y un límite superior. Los valores exactos de estos
límites son muy importantes. Si los datos son continuos, es necesario permitir
valores fraccionarios.
El número de clases en una tabla de frecuencias es arbitrario. En general, la tabla
debería tener entre 5 y 20 clases. Se sugiere la siguiente regla simple para
aproximar el número de clases a utilizar:
El punto medio de cada clase (MC), se calcula como el promedio de los límites
superior e inferior.
El intervalo de clase es el rango de valores encontrados dentro de una clase. Se
determina restando el límite superior (o inferior) de una clase del límite superior
(o inferior) de la clase siguiente. Es deseable que todos los intervalos de clase sean
de igual tamaño ya que facilita las interpretaciones estadísticas. El intervalo de
clase para una tabla de frecuencia se puede calcular usando la siguiente expresión:
La frecuencia absoluta es el número de observaciones que se encuentra dentro del
intervalo de cada clase.
La frecuencia absoluta acumulada es la suma de las frecuencias absolutas.
La frecuencia relativa es el cociente entre la frecuencia absoluta de cada clase y el
número total de observaciones. Se puede expresar en porcentaje.
La frecuencia relativa acumulada es la suma de las frecuencias relativas.
Tema 2 página 2
Ejercicio de distribución de frecuencias
Los siguientes datos son los ingresos de 60 ejecutivos de
marketing para empresas de Estados Unidos. Los datos están
expresados en miles de dólares.
Ejercicio
Frecuencias
Tema 2 página 3
Tablas de contingencia
Una tabla de contingencia permite examinar o comparar dos
variables al mismo tiempo.
Ejercicio:
De los datos que se presentan a continuación, prepare una tabla de
contingencia para evaluar a 45 empleados respecto a su nivel de
educación expresado en años y el nivel administrativo que poseen
actualmente. Divida la educación en tres grupos: el grupo 1 entre los
10 y los 12 años de educación, el grupo 2 entre los 13 y los 15 años, y
el grupo 3 para 16 años y más. ¿Qué patrones, si los hay, observa y a
qué conclusiones puede llegar?
Ejercicio tabla de contingencia
Tema 2 página 4
Gráficos
Histograma: Coloca las clases de una distribución de frecuencia en el eje horizontal
y las frecuencias en el eje vertical. Ejemplo.
Diagrama de barras: Puede mostrar cantidades o porcentajes para dos o más
valores sobre el eje vertical.
Diagrama circular: es de especial utilidad para mostrar porcentajes relativas de
una variable.
Tema 2 página 5
una variable.
Diagrama de tallo y hoja: creado por John Tukey como una alternativa para el
histograma. Proporciona una impresión visual rápida sobre el número de
observaciones en cada clase.
4.4 4.5 4.9 5.0 5.2 5.3 5.3 5.4
5.4 5.6 5.7 5.7 5.7 5.8 6.1 6.2
6.2 6.3 6.4 6.7 6.8 6.9 7.0 7.1
7.1 7.2 7.3 7.4 7.4 7.5 7.6 7.6
7.8 7.9 8.0 8.1 8.3 8.5
Tema 2 página 6
Ejercicios de gráficos
1. Hacer un diagrama de tallo y hoja con los datos de los ingresos
de los ejecutivos del ejercicio de frecuencias.
Ejercicio
diagrama ...
2. Haga un diagrama circular y un diagrama de barras con los
siguientes datos de los inversores de fondos mutuos (en millones
de dólares): 16.7 en fondos de desarrollo, 12.5 en fondos de
ingreso, 28.2 en fondos internacionales, 15.9 en mercado
monetario, y 13.9 en otros.
Ejercicio
diagra bar...
3. Haga un diagrama de barras que refleje los cambios en los datos
del ejercicio anterior que sufren durante este mes
respectivamente: 2.3, 1.5, -3.6, 4.5 y 2.9.
Tema 2 página 7
Plan del Tema
Tema 1 página 1
Tema 1 página 2
Conceptos Básicos
Tema 1 página 3
Continuación
CUANTITATIVAS: Si las observaciones pueden CUALITATIVAS: Si las observasiones
expresarse numéricamente. pueden expresarse de manera no
numérica.
DISCRETAS: Provienen de contar
CONTINUAS: Provienen de medir
Tema 1 página 4
Importancia del muestreo
Las muestras son necesarias debido a que con frecuencia las
poblaciones son demasiado grandes para ser estudiadas en su
totalidad. Por lo tanto, debe seleccionarse una muestra de la
población, calcular el estadístico de la muestra, y utilizarlo para
estimar el parámetro correspondiente de la población.
ESTADÍSTICA DESCRIPIVA: Es el proceso de recolectar, agrupar, y
presentar los datos de una manera tal que describa fácil y
rápidamente dichos datos.
ESTADÍSTICA INFERENCIAL: Involucra la utilización de una muestra
para sacar alguna inferencia o conclusión sobre la población de la
cual hace parte la muestra.
La exactitud depende en gran parte de la forma como se tomó la
muestra, y del cuidado que se tenga para garantizar que la muestra
proporcione una imagen confiable de la población.
Cuando la muestra no es confiable y no representa a la población,
resultará lo que se denomina ERROR DE MUESTREO.
ERROR DE MUESTREO = PARÁMETRO DESCONOCIDO DE LA POBLACIÓN - ESTADÍSTICO DE
LA MUESTRA
SESGO MUESTRAL: Es la tendencia a favorecer la selección de ciertos elementos de muestra
en lugar de otros
Tema 1 página 5
Escalas de Medida
MEDIDA EN ESCALA NOMINAL: Nombres o calificaciones que se
utilizan en categorías distintas y separadas. Ejemplos: género, estado
civil, marcas de artículos.
MEDIDAS EN ESCALA ORDINAL: Son las que clasifican las
observaciones en categorías con un orden significativo. Muestra un
ordenamiento o secuencia de los datos. Ejemplos: totalmente de
acuerdo, de acuerdo, sin opinión, en desacuerdo, en total
desacuerdo.
MEDIDAS EN ESCALA DE INTERVALO: Las variables se miden de
manera numérica, y llevan un rango u ordenamiento. La diferencia
entre los valores es importante, por lo tanto las operaciones
aritméticas de suma y resta son significativas. El valor de cero se
selecciona arbitrariamente. Ejemplos: la temperatura, el tiempo.
MEDIDAS EN ESCALA DE RAZÓN: Se basa en un sistema numérico en
el cual el cero es significativo. Las operaciones de multiplicación y
división toman una interpretación racional. Ejemplos: Costos,
rentabilidad, inventario, peso, talla.
Tema 1 página 6
Ejercicios
1. ¿Cuál es la diferencia entre una variable cualitativa y una
variable cuantitativa? Dé ejemplos.
2. Defina el error de muestreo y explique qué lo causa
3. ¿En cuál escala de medida puede expresarse cada una de estas
variables? Explique su respuesta.
a. Los estudiantes clasifican a su profesor de estadística sobre una
escala de Terrible, No tan malo, Bueno, Maravilloso, Dios Griego.
b. Los estudiantes en una universidad están clasificados por
profesión, tales como Marketing, Administración, Contaduría.
c. Los estudiantes están clasificados por cursos utilizando los
valores 1, 2, 3, 4, 5.
d. Agrupar mediciones de líquidos en octavo, cuarto y galón.
e. Edades de los clientes.
Tema 1 página 7
Probabilidad y Estadística Actividad 1- Página 1 de 4 06/06/2023
Universidad de las Fuerzas Armadas
Probabilidad y Estadística
Actividad 1
Apellidos:
Nombre:
NRC: Fecha límite de entrega:
Usted debe realizar la Actividad en estas hojas asegurándose de que el archivo electrónico resultante
sea legible. El formato de entrega es PDF, con el nombre del archivo A1.Apellido.Nombre. Si se
incumple estas reglas su trabajo tendrá una calificación de cero.
Se requiere que usted muestre su trabajo y esfuerzo en cada problema de esta actividad. Se aplican las
siguientes reglas:
• Organice su trabajo, de una manera coherente y ordenada.
• Respuestas misteriosas y no sustentadas no recibirán la nota completa. Una respuesta
correcta, que no se encuentre soportada por sus respectivos cálculos, explicación o desarrollo
estadístico y matemático no recibirá una calificación completa; una respuesta incorrecta
soportada por cálculos y explicaciones sustancialmente correctas podría recibir una calificación
parcial.
Ejercicio 1:
Las pérdidas y ganancias, en miles de dólares, de 66 hoteles del ecuador en el último año, se
registran en los siguientes datos:
28 -44 29 30 -24 28
37 32 36 27 26 -28
29 26 -27 22 23 20
-25 25 36 23 31 32
24 27 -33 -16 24 29
36 21 28 26 27 27
32 25 28 24 -40 21
31 32 28 26 30 27
26 24 32 -29 34 -20
25 -19 36 29 30 22
-28 33 39 25 16 23
a. Haga una tabla de frecuencias en donde conste la frecuencia absoluta, frecuencia absoluta
acumulada, frecuencia relativa, frecuencia relativa acumulada, frecuencia relativa
acumulada expresada en porcentaje y marca de clase.
Probabilidad y Estadística Actividad 1- Página 2 de 4 06/06/2023
Dato mayor -44
Dato menor 39
𝑅𝑎𝑛𝑔𝑜 = 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 = 39 − (−44) = 83
𝑁𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 = 2𝑐 ≥ 𝑛 = 27 = 128 > 66
𝑅𝑎𝑛𝑔𝑜 83
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 = = = 11,86 ≈ 12
𝑁𝑜. 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 7
Frecuencia
Frecuencia Frecuencia relativa
Frecuencia Frecuencia Marca
Clases absoluta relativa expresada
absoluta relativa de clase
acumulada acumulada en
porcentaje
LI LS f F f/n F/n f/n (%) MC
-44 -32 3 3 0,0455 0,0455 4,5455 -38
-32 -20 6 9 0,0909 0,1364 9,0909 -26
-20 -8 3 12 0,0455 0,1818 4,5455 -14
-8 4 0 12 0,0000 0,1818 0,0000 -2
4 16 0 12 0,0000 0,1818 0,0000 10
16 28 27 39 0,4091 0,5909 40,9091 22
28 40 27 66 0,4091 1,0000 40,9091 34
66 1
b. Grafique el histograma de los datos
HISTOGAMA
30 27 27
25
No. de Hoteles
20
15
10
6
5 3 3
0 0
0
-38 -26 -14 -2 10 22 34
Pérdidad y ganacias (Miles de Dólares)
Probabilidad y Estadística Actividad 1- Página 3 de 4 06/06/2023
c. Realice el diagrama de tallo y hoja.
TALLO HOJA
-4 4, 0
-3 3
-2 9, 8, 8, 7, 5, 4, 0
-1 9, 6
1 6
2 0, 1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 9
3 0, 0, 0, 1, 1, 2, 2, 2, 2, 2, 3, 4, 6, 6, 6, 6, 7, 9
d. Compare el histograma con el diagrama de tallo y hoja, ¿a qué conclusión llega?
Son gráficos que resumen el conjunto de datos, en el caso del histograma se pierden datos,
en el caso del diagrama de tallo y hoja no se pierden datos.
Ejercicio 2:
En la publicación la “Educación en cifras”, se resumen los datos del personal que labora en una
universidad pública ce Ecuador, según su función.
Nivel
Función Nivelación Pregrado Posgrado
Directivos 2248 11247 7413
Profesores 6591 56696 67226
Prof. Especiales 1953 8426
Administrativos 1620 2146 11226
De Servicio 1741 4930 6449
a. ¿Qué tipo de datos son los presentados?
Cualitativos
b. Realice los gráficos de pastel del personal, según cada uno de los niveles de educación.
De Servicio Funcionarios nivelación
12% Directivos
16%
Administrativos
11%
Profesores
Prof. Especiales 47%
14%
Probabilidad y Estadística Actividad 1- Página 4 de 4 06/06/2023
Funcionarios Pregrado De Servicio
Administrativos
3% 6%
Prof. Especiales
10% Directivos
13%
Profesores
68%
De Servicio Funcionarios Posgrado Directivos
7%
8%
Administrativos
12%
Profesores
73%
c. Realice los gráficos de barras de los datos
Funcionarios de nivelación
7000 6591
6000
Número de funcionarios
5000
4000
3000
2248
1953
2000 1620 1741
1000
0
Directivos Profesores Prof. Especiales Administrativos De Servicio
Función
Probabilidad y Estadística Actividad 1- Página 5 de 4 06/06/2023
Funcionarios pregrado
60000 56696
Número de funcionarios 50000
40000
30000
20000
11247
8426
10000
4930
2146
0
Directivos Profesores Prof. Especiales Administrativos De Servicio
Función
Funcionarios posgrado
80000
70000 67226
Número de funcionarios
60000
50000
40000
30000
20000
11226
10000 7413 6449
0
Directivos Profesores Prof. Especiales Administrativos De Servicio
Función
d. En cada gráfico presente los porcentajes correspondientes a cada una de las funciones.
Los porcentajes están en los gráficos circulares.
Nivel
Función Nivelación Pregrado Posgrado
Directivos 15,88% 13,48% 8,03%
Profesores 46,57% 67,94% 72,82%
Prof. Especiales 13,80% 10,10% 0,00%
Administrativos 11,45% 2,57% 12,16%
De Servicio 12,30% 5,91% 6,99%
Probabilidad y Estadística Actividad 1- Página 6 de 4 06/06/2023
Ejercicio 3:
En los siguientes tipos de valores, designe si las variables son discretas o continuas.
a. Peso del contenido de un paquete de cereal
Continua
b. Diámetro de un cojinete
Continua
c. Número de artículos defectuosos producidos
Discreta
d. Número de individuos en un área geográfica que reciben beneficios de desempleo
Discreta
e. Número promedio de clientes prospectivos contactados por un representante de ventas
durante el mes anterior
Continua
f. Monto de ventas en dólares
Continua
Ejercicio 4:
Un proceso para producción de materiales de construcción está diseñado para generar de tres pesos
diferentes: 10 libras, 11 libras y 12 libras. Un examen de 40 de los contenedores registra sus pesos
reales y sus pesos deseados. Se considera que un contenedor es defectuoso si su peso real difiere en
más de 0,5 libras de su peso deseado. Realice una tabla de contingencia con estos datos en la cual
indique cuántos contenedores, en cada uno de los tres grupos, están dentro de la diferencia permisible.
Registre las observaciones como 1 si es defectuoso y 2 si no es defectuoso. ¿Puede detectar algún
patrón?¿Parece que un grupo de peso tiene una mayor proporción de defectos?
Peso real Peso deseado Peso Real Peso deseado
9,5 10 12,3 11
9,6 10 10,4 12
12,1 11 12,1 10
11,2 12 10,0 11
11,6 11 11,2 10
12,3 12 9,9 12
9,6 10 9,6 11
10,6 12 12,4 10
11,0 11 11,2 12
11,2 10 11,6 11
9,8 11 12,3 10
10,5 10 9,6 12
Probabilidad y Estadística Actividad 1- Página 7 de 4 06/06/2023
11,9 12 10,6 12
11,0 10 11,2 11
9,8 10 10,5 12
11,9 10 12,3 10
10,4 12 12,1 11
10,0 12 11,2 10
9,9 12 9,6 11
11,5 10 9,5 12
Peso Peso
Peso real Peso Real Diferencia Tipo Diferencia Tipo
deseado deseado
9,5 10 12,3 11 -0,5 2 1,3 1
9,6 10 10,4 12 -0,4 2 -1,6 1
12,1 11 12,1 10 1,1 1 2,1 1
11,2 12 10 11 -0,8 1 -1 1
11,6 11 11,2 10 0,6 1 1,2 1
12,3 12 9,9 12 0,3 2 -2,1 1
9,6 10 9,6 11 -0,4 2 -1,4 1
10,6 12 12,4 10 -1,4 1 2,4 1
11 11 11,2 12 0 2 -0,8 1
11,2 10 11,6 11 1,2 1 0,6 1
9,8 11 12,3 10 -1,2 1 2,3 1
10,5 10 9,6 12 0,5 2 -2,4 1
11,9 12 10,6 12 -0,1 2 -1,4 1
11 10 11,2 11 1 1 0,2 2
9,8 10 10,5 12 -0,2 2 -1,5 1
11,9 10 12,3 10 1,9 1 2,3 1
10,4 12 12,1 11 -1,6 1 1,1 1
10 12 11,2 10 -2 1 1,2 1
9,9 12 9,6 11 -2,1 1 -1,4 1
11,5 10 9,5 12 1,5 1 -2,5 1
TABLA DE CONTINGENCIA
Contenedores
Defectuoso No
Peso (lb) Defectuoso Total
(1)
(2)
10 10 5 15
11 9 2 11
12 12 2 14
Total 31 9 40
Existen más contenedores defectuosos (31) que no defectuosos (9).
Los contenedores de 12 libras son los más defectuosos.
Probabilidad y Estadística Actividad 1- Página 8 de 4 06/06/2023
Ejercicio 5:
El gerente administrativo de una gran empresa, controla la aprobación de créditos de los empleados.
Durante los últimos cinco años el crédito más grande fue de US$12000, y el más pequeño fue de
US$1000. Él desea crear una tabla de frecuencia con 7 clases.
a. ¿Cuáles serían los límites de las clases?
b. ¿Cuál sería el intervalo de clase?
b.) Intervalo de clase
𝑅𝑎𝑛𝑔𝑜 12000 − 1000 11000
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 = = = = 1571,43 ≈ 1575
𝑁𝑜. 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 7 7
a.) Clases
L.I. L.S.
1 1000 2575
2 2575 4150
3 4150 5725
4 5725 7300
5 7300 8875
6 8875 10450
7 10450 12025