0% encontró este documento útil (0 votos)
103 vistas56 páginas

Estadistica

Este documento presenta definiciones clave sobre distribuciones de probabilidad, incluyendo variables aleatorias discretas y continuas, y distribuciones de probabilidad. También describe cómo calcular la media, varianza y desviación estándar para distribuciones discretas y binomiales, así como ejemplos de distribuciones binomiales y de Poisson.

Cargado por

KADE SAN
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Temas abordados

  • varianza,
  • frecuencia relativa acumulada,
  • eventos mutuamente excluyentes,
  • modelo de frecuencia relativa,
  • probabilidad condicional,
  • histograma,
  • escala de intervalo,
  • modelo subjetivo,
  • tablas de contingencia,
  • probabilidad de eventos
0% encontró este documento útil (0 votos)
103 vistas56 páginas

Estadistica

Este documento presenta definiciones clave sobre distribuciones de probabilidad, incluyendo variables aleatorias discretas y continuas, y distribuciones de probabilidad. También describe cómo calcular la media, varianza y desviación estándar para distribuciones discretas y binomiales, así como ejemplos de distribuciones binomiales y de Poisson.

Cargado por

KADE SAN
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Temas abordados

  • varianza,
  • frecuencia relativa acumulada,
  • eventos mutuamente excluyentes,
  • modelo de frecuencia relativa,
  • probabilidad condicional,
  • histograma,
  • escala de intervalo,
  • modelo subjetivo,
  • tablas de contingencia,
  • probabilidad de eventos

Distribuciones de Probabilidad

Tema 5 página 1
Definiciones básicas
Variable aleatoria: es una variable cuyo valor es el resultado de un evento
aleatorio.

Variable aleatoria discreta: puede asumir sólo ciertos valores, con frecuencia
números enteros, y resulta del conteo.

Variable aleatoria continua: puede tomar cualquier valor dentro de un rango


dado, resulta de la medición.

Distribución de probabilidad: es una lista de todos los resultados posibles de un


experimento junto con sus respectivas probabilidades.

Ejemplo: Si se lanza una moneda tres veces y se anota el número de caras, se


obtiene la siguiente Distribución Discreta:

Resultado (caras) Probabilidad


0 1/8
1 3/8
2 3/8
3 1/8
∑ 1

Tema 5 página 2
Media y varianza de una distribución discreta

Media o valor esperado de una distribución de probabilidad discreta

Varianza de una distribución de probabilidad discreta

Desviación estándar

Tema 5 página 3
Ejercicio

El número de quejas de los empleados de una empresa de servicios oscila entre 0 a


6 cada día como se muestra en la siguiente tabla. Calcule el valor esperado, la
varianza y la desviación estándar.

Quejas Número de días Quejas Número de días


0 3 4 2
1 4 5 1
2 3 6 4
3 6

Ejercicio - Hoja de cálculo

Tema 5 página 4
Distribución Binomial

Cada ensayo en una distribución binomial termina en sólo uno de dos resultados
mutuamente excluyentes, uno de los cuales se identifica como éxito y el otro
como fracaso. La probabilidad de cada resultado permanece constante de un
ensayo a otro.

Propiedades de una distribución binomial:

1. Sólo debe haber dos posibles resultados. Éxito o fracaso.


2. La probabilidad de un éxito, π, sigue siendo constante de un ensayo al
siguiente, al igual que la probabilidad de fracaso, 1 - π.
3. La probabilidad de un éxito en un ensayo es totalmente independiente de
cualquier otro ensayo.
4. El experimento puede repetirse muchas veces.

Si se conoce la probabilidad de que un ensayo determinado producirá un éxito, es


posible determinar cuántos éxitos habrá en un número dado de ensayos.

La fórmula binomial:

Ejemplo 1: El gerente de crédito de American Expres ha descubierto que 10% de


los usuarios de la tarjeta no paga el monto completo de la deuda durante un mes
dado. Desea determinar la probabilidad de que de 20 cuentas seleccionadas de
manera aleatoria, 5 de las cuentas no sean pagadas.

Ejemplo 2 : De acuerdo con el periódico de educación superior, el 40%


de todos los bachilleres trabajan durante el verano para ganar dinero
para la educación universitaria correspondiente al siguiente período de
otoño. Si 7 bachilleres se seleccionan de manera aleatoria, ¿cuál es la
probabilidad de que a) 5 tengan trabajo en el verano, b) ninguno
trabaje, c) todos trabajen?

Tema 5 página 5
Media y varianza de una distribución binomial

Media de una distribución binomial:

Varianza de una distribución binomial:

Tema 5 página 6
Distribuciones binomiales acumuladas

Del ejercicio de los estudiantes, encontrar la probabilidad de que 3 o menos


estudiantes trabajen.

Calcular la probabilidad de que 5 o más trabajen.

Calcular la probabilidad de que entre 3 y 5 trabajen

Si π > 50 se necesitan dos arreglos ordenados.

Ejemplo:
Se asume que el 80% de los bachilleres tomaron trabajos de verano. Se
desea calcular la probabilidad de que 3 o menos estudiantes trabajen.

Debe construirse un arreglo para π = 0.80 y π = 0.20

Tema 5 página 7
Distribución hipergeométrica
Si la población es pequeña y ocurre el muestreo sin reemplazo, la probabilidad de
un éxito variará, por lo tanto se usa la distribución hipergeométrica.

Fórmula de la distribución hipergeométrica:

N Es el tamaño de la población
r Es el número de éxitos en la población
n Es el tamaño de la muestra
x Es el número de éxitos de la muestra

Ejemplo 1: En un establo de caballos de carreras hay 10 caballos, y 4 de ellos


tienen una enfermedad contagiosa. ¿Cuál es la probabilidad de seleccionar una
muestra de 3 caballos en la cual 2 estén enfermos?

Ejemplo 2: De los 15 altos ejecutivos de un negocio de importaciones, se


seleccionan 12 para enviarlos al Japón para estudiar un nuevo proceso de
producción. Ocho de los ejecutivos ya tienen algo de entrenamiento en el proceso.
¿Cuál es la probabilidad de que 5 de los enviados tengan algo de conocimiento
sobre el proceso antes de partir?

Tema 5 página 8
Distribución de Poisson

Mide la probabilidad de un evento aleatorio sobre un intervalo de tiempo o


espacio.

Supuestos para la aplicación de esta distribución:

1. La probabilidad de ocurrencia del evento es constante para dos intervalos


cualesquiera de tiempo o espacio.
2. La ocurrencia del evento en un intervalo es independiente de la ocurrencia de
otro intervalo cualquiera.

Fórmula para la distribución de Poisson:

x Es el número de veces que ocurre el evento


μ Es el número promedio de ocurrencias por unidad de tiempo o espacio
e 2,7182 la base del logaritmo natural

Ejemplo 1: Calcular la probabilidad de que exactamente 5 clientes lleguen durante


la siguiente hora laboral. La observación simple de las últimas 80 horas ha
demostrado que 800 clientes han entrado al negocio.

Ejemplo 2: Una compañía de pavimentación obtuvo un contrato con el municipio


para hacer mantenimiento a las vías de un gran centro urbano. Las vías
recientemente pavimentadas por esta compañía demostraron un promedio de dos
defectos por milla, después de haber sido utilizadas por un año. Si el municipio
sigue con esta compañía de pavimentación, a)¿cuál es la probabilidad de que se
presenten 3 defectos en cualquier milla de vía después de haber tenido tráfico
durante un año? b) ¿cuál es la probabilidad de tener 3 defectos en 0,5 millas?

Tema 5 página 9
Tema 5 página 10
Plan del capítulo

Tema 4 página 1
Introducción a la Probabilidad

Probabilidad: Es la posibilidad numérica, medida entre 0 y 1, de que ocurra


un evento.

P(evento cierto) = 1
P(evento imposible) = 0
0 ≤ P(Ei) ≤ 1

Experimento: es el proceso que produce un evento. Es toda acción bien


definida que conlleva a un resultado único bien definido.

Espacio muestral: es el conjunto de todos los posibles resultados para un


experimento.

∑P(Ei) = 1

Modelo de frecuencia relativa: utiliza datos que han ocurrido en el pasado


para estimar la probabilidad de que el evento ocurra nuevamente.

Modelo subjetivo: se usa cuando se desea asignar probabilidad a un


evento que nunca ha ocurrido. Calcula la probabilidad de un evento con
base en la mejor evidencia posible.

Modelo clásico: se relaciona con las apuestas y juegos de azar.

Tema 4 página 2
Ejercicios

1. La siguiente tabla muestra el número de computadores


vendidos diariamente por una tienda minorista.
Número de computadores vendidos Número de días
0 12
1 43
2 18
3 20
4 25

Determine la probabilidad de que el número de


computadoras que se vendan hoy sea:
a. 2
b. Menos de 3
c. Más de 1
d. Por lo menos 1

2. Durante el año anterior , las ventas semanales de una tienda


de mascotas han sido bajas durante 16 semanas,
considerables durante 27 semanas, y altas el resto de las
semanas. Cuál es la probabilidad de que las ventas de esta
semana sean:
a. Considerables
b. Bajas
c. Altas
d. Por lo menos considerables.

Tema 4 página 3
Relaciones entre eventos
Intersección entre A y B, (A ∩ B): es el conjunto de todos los
elementos que están tanto en A como en B.

La unión de A o B, (A U B): Es el conjunto de todos los elementos


que están en A o en B o en ambos.

Eventos mutuamente excluyentes: dos eventos son mutuamente


excluyentes, si la ocurrencia de uno prohíbe la ocurrencia del
otro.

Eventos colectivamente exhaustivos: constan de todos los


posibles resultados de un experimento y constituyen su espacio
muestral.

Eventos independientes: son eventos en los que la ocurrencia del


uno no tiene nada que ver con la ocurrencia del otro.

Cuando se saca de un conjunto finito, como por ejemplo una


baraja de cartas, dos eventos son independientes si y solo si se
realiza el reemplazo. Sin embargo, si el primer elemento no se
reemplaza antes de sacar el segundo elemento, los dos eventos
son dependientes.

Eventos complementarios: son los que si un evento no ocurre, el


otro debe ocurrir. El complemento de A se escribe

Tema 4 página 4
Ejercicios
1. Dada una baraja de 52 cartas, el conjunto A consta de los 13
corazones y el conjunto B son los cuatro ases. Identifique
cuáles cartas están incluidas en (A U B) y (A ∩ B).

2. Algunos trabajadores hombres y mujeres de una planta


grande tienen educación secundaria. El conjunto A consta de
los trabajadores hombres, el conjunto B de las trabajadoras
mujeres, el conjunto C es el conjunto con educación
secundaria, y el conjunto D es el de los trabajadores que no
tienen educación secundaria. Identifique y explique (A U C),
(B U D), (A ∩ C). Identifique los eventos que son :
a. Mutuamente excluyentes
b. Colectivamente exhaustivos con respecto al género
c. Si 300 de los 1000 trabajadores son hombres. ¿Cuál es la
probabilidad de que un trabajador sea mujer?
d. ¿Cuál es la diferencia entre P(M) y P( ).

Tema 4 página 5
Tablas de contingencia y de probabilidad

Usted recolectó datos sobre 500 economistas en la academia, la


industria privada, y el gobierno respecto a sus opiniones sobre si
la economía podría ser estable, podría expandirse o podría entrar
en período de contracción en el futuro próximo. Sin embargo,
parte de la información se perdió, resultando la siguiente tabla de
contingencia parcial. Con base en los datos restantes, cree una
tabla de probabilidad.
Economía
Economistas Estable(S) Expansión E Contracción C Total
Academia (A) 125 100
Industria Privada(I) 35 110
Gobierno (G) 25 40 65
Total 200

Economía
Economistas Estable(S) Expansión E Contracción C Total
Academia (A)
Industria Privada(I)
Gobierno (G)
Total

De la tabla de probabilidad halle:


a. P(A)
b. P(G)
c. P(A ∩ S)
d. P(A ∩ E)
e. P(G ∩ C)

Tema 4 página 6
Probabilidad condicional
Es la probabilidad de que el evento A ocurra, dado que o a condición de que el
evento B ya haya ocurrido.

Se denota como P(A|B) y se lee la probabilidad de A dado B.

La fórmula general para calcular esta probabilidad es:

Ejemplo: Hallar la probabilidad de que la carta sacada de una baraja fuese una
jota, dada la información adicional de que es una figura.

Tema 4 página 7
Ejercicios
Economía
1. De la tabla de probabilidad del ejercicio de tablas de contingencia:
a. Halle P(S|A). Economistas Estable(S) Expansión E Contracción C Total
b. Si usted es un economista académico, ¿es más probable que usted Academia (A)
pronostique una economía estable que si trabaja en el gobierno? Industria Privada(I)
c. Dado que usted trabaja en la industria privada, ¿es más probable que Gobierno (G)
usted pronostique una contracción en la economía que un académico?
d. Si usted trabaja para el gobierno, ¿cuál de los tres pronósticos es más Total
probable que usted haga?

Tema 4 página 8
Regla de la multiplicación
El propósito de esta regla es determinar la probabilidad del evento conjunto
P(A ∩ B).

La fórmula para calcular la probabilidad de eventos independientes es:

La fórmula para calcular la probabilidad de eventos dependientes es:

Ejemplo 1: Calcular la probabilidad de sacar un 3 con un dado y una cara con una
moneda.

Solución: Los dos eventos son independientes por tanto,

Ejemplo 2: El gerente de crédito de un banco recolecta datos de 100 de sus


clientes. De los 60 hombres, 40 tienen tarjetas de crédito. De las cuarenta mujeres
30 tienen tarjetas de crédito. Diez de los hombres tienen saldo vencido, mientras
que 15 de las mujeres tienen saldo vencido. El gerente de crédito desea
determinar la probabilidad de que un cliente seleccionado al azar sea:
a. Una mujer con tarjeta de crédito.
b. Una mujer con un saldo vencido.
c. Un hombre sin un saldo vencido.
d. Un hombre con un saldo vencido

Tema 4 página 9
Regla de la adición
Se utiliza para determinar la probabilidad de A o B,

La fórmula para calcular la probabilidad de eventos que no son mutuamente


excluyentes es:

La fórmula para calcular la probabilidad de eventos que son mutuamente


excluyentes es:

Ejemplo 1: La mayoría de las estaciones de servicio venden tres tipos de gasolina:


corriente, super y premium. Con frecuencia, alguna de cada tipo está enriquecida
con etanol. La tabla de contingencia que se muestra a continuación ilustra los
porcentajes de clientes que prefieren cada tipo.
Corriente(C) Super (S) Premium (P) Total
Etanol (E) 0,05 0,10 0,05 0,20
Sin etanol 0,15 0,40 0,25 0,80
Total 0,20 0,50 0,30 1,00
Determinar la probabilidad que el cliente prefiera:
a. Corriente o etanol
b. Super o sin etanol
c. Premium o etanol
d. Premium o sin etanol
e. Corriente o super.

Ejemplo 2: De los 10 chips de un computador, 4 están defectuosos. ¿Cuál es la


probabilidad de seleccionar 3 sin que haya reemplazo, de los cuales sólo uno sea
defectuoso?

Tema 4 página 10
Teorema de Bayes
La fórmula que utiliza el teorema de Bayes es la siguiente:

Ejemplo: Se asume que una fábrica utiliza dos máquinas para producir su
producto. La máquina A produce el 60% de la producción total, y la máquina B
produce el restante 40%. El 2% de las unidades producidas por A son defectuosas,
mientras que B tiene una tasa de defectos del 4%. Suponiendo que una unidad
escogida al azar es defectuosa, se desea saber la probabilidad de que la unidad
provino de la máquina A.

Tema 4 página 11
Técnicas de conteo
Las técnicas de conteo permiten contar el número de subconjuntos que se
pueden obtener de un conjunto.

Factorial de un número:
n! = 1 x 2 x 3 x 4 x…x n
3! = 1 x 2 x 3 = 6
0! = 1
1! = 1

Combinaciones:
No es importante el orden

Ejemplo: Determine cuantos subconjunto de dos elementos se podría obtener del


conjunto
A= {a, b, c}

A= {{a b}, {a, c}, {b, c}}; si el orden no es importante, se obtienen tres subconjuntos.

Permutaciones:
Es importante el orden

Ejemplo: Determine cuantos subconjunto de dos elementos se podría obtener del


conjunto
A= {a, b, c}

A= {{a b}, {a, c}, {b, c}, {b, a},{c, a},{c, b}}; si el orden es importante, se obtienen seis
subconjuntos.

Escogencia múltiple:
Ni las combinaciones, ni las permutaciones permiten que se seleccione un
elemento más de una vez.

La escogencia múltiple si permite la duplicación.

Ejemplo: ¿Cuántos números telefónicos distintos pueden asignarse a una oficina


grande dados los dígitos 0-9?
Tema 4 página 12
grande dados los dígitos 0-9?
a. Si la oficina utiliza solo una extensión seguida por cuatro dígitos, tales como
555-XXXX

b. Si se utiliza una segunda extensión como 556-XXXX

Multiplicación:
Esta técnica se utiliza cuando se debe escoger un elemento de dos o más
conjuntos, entonces, simplemente se multiplica el número de elementos en cada
conjunto.

Ejemplo: Un empresario desea comprar un vehículo para ofrecer tours en la


ciudad. Puede escoger entre tres colores, dos tamaños de motor y cuatro diseños
de interior distintos. ¿Cuántos modos distintos de vehículo están a su disposición?

Colores 3
Tamaños de motor 2
Diseños de interior 4

Tipos de vehículos distintos = 3 x 2 x 4 = 24

Tema 4 página 13
Ejercicios del capítulo
1. Un caso en la corte del condado de Madison, Kentucky, sobre las prácticas de
contratación de una compañía de teléfonos local. La compañía planeó
contratar 3 nuevos empleados. Había 8 candidatos para los cargos, 6 de los
cuales eran hombres. Los 3 que fueron contratados eran hombres. Un cargo
por discriminación de sexo se impuso contra la compañía. ¿Cómo decidiría
usted?

2. Solo el 60% de los estudiantes de la clase de estadística del Profesor Moreta


pasaron la primera prueba. De quienes pasaron , el 80% estudiaron, el 20% de
quienes no pasaron si estudiaron. ¿Debería usted estudiar para las pruebas de
este profesor?

3. Un vendedor vende al 30% de los clientes a quienes llama. Si él hace tres


llamadas hoy, ¿cuál es la probabilidad de que haga exactamente una venta?

Tema 4 página 14
Plan del tema

Tema 3 página 1
Medidas de tendencia central de datos no agrupados
Media aritmética: es la medida de tendencia central que es considerada como el
promedio.
Media poblacional:

Media muestral:

La mediana: es la observación de la mitad después de que se han colocado los


datos en una serie ordenada.

Si el conjunto de datos tiene un número impar de observaciones, la posición de la


mediana es:

Si el conjunto de datos tiene un número par de observaciones, la posición de la


mediana se obtiene con la expresión anterior. El valor de la mediana es el
promedio de la observación anterior y posterior de la posición.

Ejemplo: encontrar la mediana de los siguientes conjuntos de datos:

a. 45, 52, 56, 67, 67

b. 35, 45, 52, 56, 67, 67

La moda: por definición es la observación que más se repite dentro de un conjunto


de datos

La media ponderada: se usa cuando las observaciones tienen distinto peso o


importancia. La fórmula es la siguiente:

La media geométrica: proporciona una medida precisa de un cambio porcentual


promedio en una serie de números. La fórmula es la siguiente:

Tema 3 página 2
Ejercicios

Se asume que se obtuvo un puntaje de 89, 92 y 79 en los exámenes parciales y 94


en el examen final. Estos puntajes y sus respectivas ponderaciones están
reflejados en tabla siguiente:
Nota(x) Peso (W) XW
89 1 89
92 1 92
79 1 79
94 2 188
∑ 5 448

El director ejecutivo de una aerolínea desea determinar la tasa de crecimiento


promedio en los ingresos con base en las cifras dadas en la tabla. Si la tasa de
crecimiento promedio es menor que el promedio industrial del 10%, se asumirá
una nueva campaña publicitaria.
Año Ingreso Porcentaje del año anterior
2011 US$50000 ---
2012 55000 55/50 = 1,1
2013 66000 66/55 = 1,2
2014 60000 60/66 = 0,91
2015 78000 78/60 = 1,3

Restando 1 para convertirlo en un incremento anual promedio da 0,1179 o 11,79%


para el período de cinco años.

Tema 3 página 3
Medidas de dispersión para datos no agrupados
Miden que tanto se dispersan las observaciones alrededor de su
media

El rango: es simplemente la deferencia entre la observación más


alta y la más baja.

Varianza de la población: es el promedio de las observaciones


respecto a su media elevadas al cuadrado.

Desviación estándar de la población: es la raíz cuadrada de la


varianza.

Varianza de la muestra:

Desviación estándar de la muestra:

El número de grados de libertad (n-1) en toda operación


estadística es igual al número de observaciones menos toda
restricción impuesta en tales observaciones.

Ejercicio:

Ejecicio varianza

Tema 3 página 4
Tema 3 página 5
Medidas de tendencia central y dispersión para datos
agrupados

La media:

La mediana:

La clase mediana es la clase cuya frecuencia acumulada es mayor que o


igual a n/2

La moda:

La clase modal es la clase que tenga la frecuencia más alta

Varianza y desviación estándar

Tema 3 página 6
Varianza y desviación estándar

Ejercicio:

Ejercicio
datos agr...

Tema 3 página 7
Otras medidas de dispersión
Las medidas adicionales de dispersión son:
Cuartiles
Deciles
Percentiles

Todo conjunto de datos tiene:


Tres cuartiles
Nueve deciles
Noventa y nueve percentiles

Un percentil y su ubicación en un conjunto ordenado de datos se


identifica mediante los subíndices. Por ejemplo, el decimoquinto
percentil se indica como P15, y su ubicación en la serie ordenada
es L15.

La ubicación de un percentil es:


Lp es el sitio del percentil deseado en una serie ordenada
n es el número de observaciones
P es el percentil deseado

Q1 = P25 D1= P10


Q2 = P50 D2 = P20
Q3 = P75 D3 = P30

Una medida única de dispersión es el RANGO INTERCUARTÍLICO


(RIQ) y es la diferencia entre el tercer cuartil y el primer cuartil.

El RIQ proporciona una medida de dispersión que no está muy


influenciada por unas cuantas observaciones extremas.

Tema 3 página 8
Conceptos relacionados

Teorema de Chebyshev: Establece que para todo conjunto de


datos, por lo menos de las observaciones están dentro
de K desviaciones estándar de la media, en donde K es cualquier
número mayor que 1. |

Por ejemplo si se forma un intervalo de K = 3 desviaciones


estándar por encima y por debajo de la media, entonces por lo
menos de todas las observaciones
estarán dentro de dicho intervalo.

La regla empírica: se basa en la distribución normal, que tiene la


siguiente forma:

La regla empírica especifica que:

Sesgo: algunas distribuciones están sesgadas a la izquierda o a la


derecha, como se observa en la figura.

Por su naturaleza, la media se ve más afectada por las


observaciones extremas.
El sesgo se mide mediante el coeficiente de sesgo de Pearson:

Si P < 0 los datos están sesgados a la izquierda.


Si P > 0 los datos están sesgados a la derecha.
Si P = 0 los datos están distribuidos normalmente.

Ejemplo: Utilizando los datos agrupados de la lista de pasajeros de


una compañía aérea, se calcula
. Dada esta información, el director puede ver claramente
que los datos están sesgados a la derecha. Desea obtener una
medida del grado del sesgo.

Coeficiente de variación (CV): sirve como medida relativa de

Tema 3 página 9
Coeficiente de variación (CV): sirve como medida relativa de
dispersión, determina el grado de dispersión de un conjunto de
datos relativo a su media.
Se usa cuando se considera dos o más distribuciones que tienen
medias significativamente diferentes, o que están medidas en
unidades distintas.
La expresión para calcular el coeficiente de variación es:
.
Ejemplo: Los datos de una compañía aérea reportaron una media
de 78,7 pasajeros por día, con una desviación estándar de 12,14
pasajeros. También recolectaron datos sobre el mismo período
para el número de millas que la aerolínea voló y dicha media y
desviación estándar fueron 1267,5 y 152,7, respectivamente. La
desviación estándar para las millas voladas puede sugerir que
estos datos presentan una variación mucho mayor.

El coeficiente de variación para los pasajeros es:

El coeficiente de variación para las millas es:

Tema 3 página 10
Plan del tema

Tema 2 página 1
Distribución de frecuencias:

Una distribución de frecuencia o tabla de frecuencia, ordenará los datos si estos se


dividen en clases y se registrará el número de observaciones en cada clase.

Cada clase tiene un límite inferior y un límite superior. Los valores exactos de estos
límites son muy importantes. Si los datos son continuos, es necesario permitir
valores fraccionarios.

El número de clases en una tabla de frecuencias es arbitrario. En general, la tabla


debería tener entre 5 y 20 clases. Se sugiere la siguiente regla simple para
aproximar el número de clases a utilizar:

El punto medio de cada clase (MC), se calcula como el promedio de los límites
superior e inferior.

El intervalo de clase es el rango de valores encontrados dentro de una clase. Se


determina restando el límite superior (o inferior) de una clase del límite superior
(o inferior) de la clase siguiente. Es deseable que todos los intervalos de clase sean
de igual tamaño ya que facilita las interpretaciones estadísticas. El intervalo de
clase para una tabla de frecuencia se puede calcular usando la siguiente expresión:

La frecuencia absoluta es el número de observaciones que se encuentra dentro del


intervalo de cada clase.

La frecuencia absoluta acumulada es la suma de las frecuencias absolutas.

La frecuencia relativa es el cociente entre la frecuencia absoluta de cada clase y el


número total de observaciones. Se puede expresar en porcentaje.

La frecuencia relativa acumulada es la suma de las frecuencias relativas.

Tema 2 página 2
Ejercicio de distribución de frecuencias

Los siguientes datos son los ingresos de 60 ejecutivos de


marketing para empresas de Estados Unidos. Los datos están
expresados en miles de dólares.

Ejercicio
Frecuencias

Tema 2 página 3
Tablas de contingencia
Una tabla de contingencia permite examinar o comparar dos
variables al mismo tiempo.

Ejercicio:
De los datos que se presentan a continuación, prepare una tabla de
contingencia para evaluar a 45 empleados respecto a su nivel de
educación expresado en años y el nivel administrativo que poseen
actualmente. Divida la educación en tres grupos: el grupo 1 entre los
10 y los 12 años de educación, el grupo 2 entre los 13 y los 15 años, y
el grupo 3 para 16 años y más. ¿Qué patrones, si los hay, observa y a
qué conclusiones puede llegar?

Ejercicio tabla de contingencia

Tema 2 página 4
Gráficos
Histograma: Coloca las clases de una distribución de frecuencia en el eje horizontal
y las frecuencias en el eje vertical. Ejemplo.

Diagrama de barras: Puede mostrar cantidades o porcentajes para dos o más


valores sobre el eje vertical.

Diagrama circular: es de especial utilidad para mostrar porcentajes relativas de


una variable.

Tema 2 página 5
una variable.

Diagrama de tallo y hoja: creado por John Tukey como una alternativa para el
histograma. Proporciona una impresión visual rápida sobre el número de
observaciones en cada clase.
4.4 4.5 4.9 5.0 5.2 5.3 5.3 5.4
5.4 5.6 5.7 5.7 5.7 5.8 6.1 6.2
6.2 6.3 6.4 6.7 6.8 6.9 7.0 7.1
7.1 7.2 7.3 7.4 7.4 7.5 7.6 7.6
7.8 7.9 8.0 8.1 8.3 8.5

Tema 2 página 6
Ejercicios de gráficos
1. Hacer un diagrama de tallo y hoja con los datos de los ingresos
de los ejecutivos del ejercicio de frecuencias.

Ejercicio
diagrama ...

2. Haga un diagrama circular y un diagrama de barras con los


siguientes datos de los inversores de fondos mutuos (en millones
de dólares): 16.7 en fondos de desarrollo, 12.5 en fondos de
ingreso, 28.2 en fondos internacionales, 15.9 en mercado
monetario, y 13.9 en otros.

Ejercicio
diagra bar...

3. Haga un diagrama de barras que refleje los cambios en los datos


del ejercicio anterior que sufren durante este mes
respectivamente: 2.3, 1.5, -3.6, 4.5 y 2.9.

Tema 2 página 7
Plan del Tema

Tema 1 página 1
Tema 1 página 2
Conceptos Básicos

Tema 1 página 3
Continuación

CUANTITATIVAS: Si las observaciones pueden CUALITATIVAS: Si las observasiones


expresarse numéricamente. pueden expresarse de manera no
numérica.
DISCRETAS: Provienen de contar

CONTINUAS: Provienen de medir

Tema 1 página 4
Importancia del muestreo

Las muestras son necesarias debido a que con frecuencia las


poblaciones son demasiado grandes para ser estudiadas en su
totalidad. Por lo tanto, debe seleccionarse una muestra de la
población, calcular el estadístico de la muestra, y utilizarlo para
estimar el parámetro correspondiente de la población.

ESTADÍSTICA DESCRIPIVA: Es el proceso de recolectar, agrupar, y


presentar los datos de una manera tal que describa fácil y
rápidamente dichos datos.

ESTADÍSTICA INFERENCIAL: Involucra la utilización de una muestra


para sacar alguna inferencia o conclusión sobre la población de la
cual hace parte la muestra.

La exactitud depende en gran parte de la forma como se tomó la


muestra, y del cuidado que se tenga para garantizar que la muestra
proporcione una imagen confiable de la población.

Cuando la muestra no es confiable y no representa a la población,


resultará lo que se denomina ERROR DE MUESTREO.

ERROR DE MUESTREO = PARÁMETRO DESCONOCIDO DE LA POBLACIÓN - ESTADÍSTICO DE


LA MUESTRA

SESGO MUESTRAL: Es la tendencia a favorecer la selección de ciertos elementos de muestra


en lugar de otros

Tema 1 página 5
Escalas de Medida
MEDIDA EN ESCALA NOMINAL: Nombres o calificaciones que se
utilizan en categorías distintas y separadas. Ejemplos: género, estado
civil, marcas de artículos.

MEDIDAS EN ESCALA ORDINAL: Son las que clasifican las


observaciones en categorías con un orden significativo. Muestra un
ordenamiento o secuencia de los datos. Ejemplos: totalmente de
acuerdo, de acuerdo, sin opinión, en desacuerdo, en total
desacuerdo.

MEDIDAS EN ESCALA DE INTERVALO: Las variables se miden de


manera numérica, y llevan un rango u ordenamiento. La diferencia
entre los valores es importante, por lo tanto las operaciones
aritméticas de suma y resta son significativas. El valor de cero se
selecciona arbitrariamente. Ejemplos: la temperatura, el tiempo.

MEDIDAS EN ESCALA DE RAZÓN: Se basa en un sistema numérico en


el cual el cero es significativo. Las operaciones de multiplicación y
división toman una interpretación racional. Ejemplos: Costos,
rentabilidad, inventario, peso, talla.

Tema 1 página 6
Ejercicios

1. ¿Cuál es la diferencia entre una variable cualitativa y una


variable cuantitativa? Dé ejemplos.

2. Defina el error de muestreo y explique qué lo causa

3. ¿En cuál escala de medida puede expresarse cada una de estas


variables? Explique su respuesta.
a. Los estudiantes clasifican a su profesor de estadística sobre una
escala de Terrible, No tan malo, Bueno, Maravilloso, Dios Griego.
b. Los estudiantes en una universidad están clasificados por
profesión, tales como Marketing, Administración, Contaduría.
c. Los estudiantes están clasificados por cursos utilizando los
valores 1, 2, 3, 4, 5.
d. Agrupar mediciones de líquidos en octavo, cuarto y galón.
e. Edades de los clientes.

Tema 1 página 7
Probabilidad y Estadística Actividad 1- Página 1 de 4 06/06/2023

Universidad de las Fuerzas Armadas


Probabilidad y Estadística

Actividad 1

Apellidos:
Nombre:
NRC: Fecha límite de entrega:

Usted debe realizar la Actividad en estas hojas asegurándose de que el archivo electrónico resultante
sea legible. El formato de entrega es PDF, con el nombre del archivo A1.Apellido.Nombre. Si se
incumple estas reglas su trabajo tendrá una calificación de cero.

Se requiere que usted muestre su trabajo y esfuerzo en cada problema de esta actividad. Se aplican las
siguientes reglas:

• Organice su trabajo, de una manera coherente y ordenada.

• Respuestas misteriosas y no sustentadas no recibirán la nota completa. Una respuesta


correcta, que no se encuentre soportada por sus respectivos cálculos, explicación o desarrollo
estadístico y matemático no recibirá una calificación completa; una respuesta incorrecta
soportada por cálculos y explicaciones sustancialmente correctas podría recibir una calificación
parcial.

Ejercicio 1:

Las pérdidas y ganancias, en miles de dólares, de 66 hoteles del ecuador en el último año, se
registran en los siguientes datos:

28 -44 29 30 -24 28
37 32 36 27 26 -28
29 26 -27 22 23 20
-25 25 36 23 31 32
24 27 -33 -16 24 29
36 21 28 26 27 27
32 25 28 24 -40 21
31 32 28 26 30 27
26 24 32 -29 34 -20
25 -19 36 29 30 22
-28 33 39 25 16 23

a. Haga una tabla de frecuencias en donde conste la frecuencia absoluta, frecuencia absoluta
acumulada, frecuencia relativa, frecuencia relativa acumulada, frecuencia relativa
acumulada expresada en porcentaje y marca de clase.
Probabilidad y Estadística Actividad 1- Página 2 de 4 06/06/2023
Dato mayor -44
Dato menor 39

𝑅𝑎𝑛𝑔𝑜 = 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 = 39 − (−44) = 83

𝑁𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 = 2𝑐 ≥ 𝑛 = 27 = 128 > 66

𝑅𝑎𝑛𝑔𝑜 83
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 = = = 11,86 ≈ 12
𝑁𝑜. 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 7

Frecuencia
Frecuencia Frecuencia relativa
Frecuencia Frecuencia Marca
Clases absoluta relativa expresada
absoluta relativa de clase
acumulada acumulada en
porcentaje
LI LS f F f/n F/n f/n (%) MC
-44 -32 3 3 0,0455 0,0455 4,5455 -38
-32 -20 6 9 0,0909 0,1364 9,0909 -26
-20 -8 3 12 0,0455 0,1818 4,5455 -14
-8 4 0 12 0,0000 0,1818 0,0000 -2
4 16 0 12 0,0000 0,1818 0,0000 10
16 28 27 39 0,4091 0,5909 40,9091 22
28 40 27 66 0,4091 1,0000 40,9091 34
66 1

b. Grafique el histograma de los datos

HISTOGAMA
30 27 27

25
No. de Hoteles

20

15

10
6
5 3 3
0 0
0
-38 -26 -14 -2 10 22 34
Pérdidad y ganacias (Miles de Dólares)
Probabilidad y Estadística Actividad 1- Página 3 de 4 06/06/2023
c. Realice el diagrama de tallo y hoja.

TALLO HOJA
-4 4, 0
-3 3
-2 9, 8, 8, 7, 5, 4, 0
-1 9, 6
1 6
2 0, 1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 9
3 0, 0, 0, 1, 1, 2, 2, 2, 2, 2, 3, 4, 6, 6, 6, 6, 7, 9

d. Compare el histograma con el diagrama de tallo y hoja, ¿a qué conclusión llega?

Son gráficos que resumen el conjunto de datos, en el caso del histograma se pierden datos,
en el caso del diagrama de tallo y hoja no se pierden datos.

Ejercicio 2:

En la publicación la “Educación en cifras”, se resumen los datos del personal que labora en una
universidad pública ce Ecuador, según su función.

Nivel
Función Nivelación Pregrado Posgrado
Directivos 2248 11247 7413
Profesores 6591 56696 67226
Prof. Especiales 1953 8426
Administrativos 1620 2146 11226
De Servicio 1741 4930 6449

a. ¿Qué tipo de datos son los presentados?

Cualitativos

b. Realice los gráficos de pastel del personal, según cada uno de los niveles de educación.

De Servicio Funcionarios nivelación


12% Directivos
16%
Administrativos
11%

Profesores
Prof. Especiales 47%
14%
Probabilidad y Estadística Actividad 1- Página 4 de 4 06/06/2023

Funcionarios Pregrado De Servicio


Administrativos
3% 6%

Prof. Especiales
10% Directivos
13%

Profesores
68%

De Servicio Funcionarios Posgrado Directivos


7%
8%

Administrativos
12%

Profesores
73%

c. Realice los gráficos de barras de los datos

Funcionarios de nivelación
7000 6591

6000
Número de funcionarios

5000

4000

3000
2248
1953
2000 1620 1741

1000

0
Directivos Profesores Prof. Especiales Administrativos De Servicio
Función
Probabilidad y Estadística Actividad 1- Página 5 de 4 06/06/2023

Funcionarios pregrado
60000 56696

Número de funcionarios 50000

40000

30000

20000
11247
8426
10000
4930
2146
0
Directivos Profesores Prof. Especiales Administrativos De Servicio
Función

Funcionarios posgrado
80000

70000 67226
Número de funcionarios

60000

50000

40000

30000

20000
11226
10000 7413 6449

0
Directivos Profesores Prof. Especiales Administrativos De Servicio
Función

d. En cada gráfico presente los porcentajes correspondientes a cada una de las funciones.

Los porcentajes están en los gráficos circulares.

Nivel
Función Nivelación Pregrado Posgrado
Directivos 15,88% 13,48% 8,03%
Profesores 46,57% 67,94% 72,82%

Prof. Especiales 13,80% 10,10% 0,00%

Administrativos 11,45% 2,57% 12,16%

De Servicio 12,30% 5,91% 6,99%


Probabilidad y Estadística Actividad 1- Página 6 de 4 06/06/2023

Ejercicio 3:

En los siguientes tipos de valores, designe si las variables son discretas o continuas.

a. Peso del contenido de un paquete de cereal

Continua

b. Diámetro de un cojinete

Continua

c. Número de artículos defectuosos producidos

Discreta

d. Número de individuos en un área geográfica que reciben beneficios de desempleo

Discreta

e. Número promedio de clientes prospectivos contactados por un representante de ventas


durante el mes anterior

Continua

f. Monto de ventas en dólares

Continua

Ejercicio 4:

Un proceso para producción de materiales de construcción está diseñado para generar de tres pesos
diferentes: 10 libras, 11 libras y 12 libras. Un examen de 40 de los contenedores registra sus pesos
reales y sus pesos deseados. Se considera que un contenedor es defectuoso si su peso real difiere en
más de 0,5 libras de su peso deseado. Realice una tabla de contingencia con estos datos en la cual
indique cuántos contenedores, en cada uno de los tres grupos, están dentro de la diferencia permisible.
Registre las observaciones como 1 si es defectuoso y 2 si no es defectuoso. ¿Puede detectar algún
patrón?¿Parece que un grupo de peso tiene una mayor proporción de defectos?

Peso real Peso deseado Peso Real Peso deseado


9,5 10 12,3 11
9,6 10 10,4 12
12,1 11 12,1 10
11,2 12 10,0 11
11,6 11 11,2 10
12,3 12 9,9 12
9,6 10 9,6 11
10,6 12 12,4 10
11,0 11 11,2 12
11,2 10 11,6 11
9,8 11 12,3 10
10,5 10 9,6 12
Probabilidad y Estadística Actividad 1- Página 7 de 4 06/06/2023
11,9 12 10,6 12
11,0 10 11,2 11
9,8 10 10,5 12
11,9 10 12,3 10
10,4 12 12,1 11
10,0 12 11,2 10
9,9 12 9,6 11
11,5 10 9,5 12

Peso Peso
Peso real Peso Real Diferencia Tipo Diferencia Tipo
deseado deseado
9,5 10 12,3 11 -0,5 2 1,3 1
9,6 10 10,4 12 -0,4 2 -1,6 1
12,1 11 12,1 10 1,1 1 2,1 1
11,2 12 10 11 -0,8 1 -1 1
11,6 11 11,2 10 0,6 1 1,2 1
12,3 12 9,9 12 0,3 2 -2,1 1
9,6 10 9,6 11 -0,4 2 -1,4 1
10,6 12 12,4 10 -1,4 1 2,4 1
11 11 11,2 12 0 2 -0,8 1
11,2 10 11,6 11 1,2 1 0,6 1
9,8 11 12,3 10 -1,2 1 2,3 1
10,5 10 9,6 12 0,5 2 -2,4 1
11,9 12 10,6 12 -0,1 2 -1,4 1
11 10 11,2 11 1 1 0,2 2
9,8 10 10,5 12 -0,2 2 -1,5 1
11,9 10 12,3 10 1,9 1 2,3 1
10,4 12 12,1 11 -1,6 1 1,1 1
10 12 11,2 10 -2 1 1,2 1
9,9 12 9,6 11 -2,1 1 -1,4 1
11,5 10 9,5 12 1,5 1 -2,5 1

TABLA DE CONTINGENCIA

Contenedores

Defectuoso No
Peso (lb) Defectuoso Total
(1)
(2)
10 10 5 15
11 9 2 11
12 12 2 14
Total 31 9 40

Existen más contenedores defectuosos (31) que no defectuosos (9).


Los contenedores de 12 libras son los más defectuosos.
Probabilidad y Estadística Actividad 1- Página 8 de 4 06/06/2023

Ejercicio 5:

El gerente administrativo de una gran empresa, controla la aprobación de créditos de los empleados.
Durante los últimos cinco años el crédito más grande fue de US$12000, y el más pequeño fue de
US$1000. Él desea crear una tabla de frecuencia con 7 clases.

a. ¿Cuáles serían los límites de las clases?


b. ¿Cuál sería el intervalo de clase?

b.) Intervalo de clase

𝑅𝑎𝑛𝑔𝑜 12000 − 1000 11000


𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 = = = = 1571,43 ≈ 1575
𝑁𝑜. 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 7 7

a.) Clases
L.I. L.S.
1 1000 2575
2 2575 4150
3 4150 5725
4 5725 7300
5 7300 8875
6 8875 10450
7 10450 12025

Common questions

Con tecnología de IA

Una distribución binomial supone que el muestreo se realiza con reemplazo, donde las probabilidades de éxito y fracaso permanecen constantes en cada ensayo. En cambio, una distribución hipergeométrica se utiliza cuando el muestreo se hace sin reemplazo; por tanto, las probabilidades cambian al sacar cada elemento porque el tamaño de la población disminuye.

El teorema de Chebyshev es aplicable a cualquier conjunto de datos, independientemente de su distribución, a diferencia de la regla empírica que se aplica solo a datos normalmente distribuidos. Este teorema establece que al menos (1 - 1/K^2) de los datos caerán dentro de K desviaciones estándar de la media, para cualquier K mayor que uno, proporcionando una técnica de análisis útil para distribuciones no normales.

El modelo clásico de probabilidad calcula la probabilidad de un evento al dividir el número de resultados favorables entre el número total de resultados posibles. Un ejemplo clásico es lanzar un dado justo, donde la probabilidad de obtener un número par es 3/6, ya que hay tres resultados favorables (2, 4, 6) de un total de seis posibles.

El número esperado, o media, de un experimento con una variable aleatoria discreta se determina multiplicando cada posible resultado por su probabilidad correspondiente y sumando estos productos. Por ejemplo, calcular la media esperada de obtener caras al lanzar una moneda tres veces implicaría sumar 0*(1/8) + 1*(3/8) + 2*(3/8) + 3*(1/8)

El sesgo, especialmente si los datos están sesgados a la izquierda o a la derecha, puede afectar significativamente la media, ya que es sensible a valores extremos. En distribuciones asimétricas, la media puede no representar adecuadamente el centro del conjunto de datos, siendo más apropiada la mediana para describir el centro.

El rango intercuartílico (RIQ) es la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1) de un conjunto de datos. Se utiliza para medir la dispersión de la parte central de los datos, proporcionando una medida robusta que no se ve afectada por valores extremos, a diferencia del rango total.

La desviación estándar es importante para interpretar la varianza porque proporciona una medida de dispersión en las mismas unidades que los datos originales, facilitando así la interpretación y comparación directa. La varianza, al estar cuadrada, magnifica las desviaciones de la media y es menos intuitiva. Por ejemplo, la desviación estándar ayuda a entender cuánto varían las observaciones alrededor de la media en su contexto natural.

Una distribución de Poisson es más adecuada en escenarios donde se mide el número de eventos en un intervalo de tiempo o espacio constante, como contar el número de clientes que llegan a una tienda por hora, especialmente si estos eventos son raros y la probabilidad de su ocurrencia es baja. Esta distribución asume que los eventos ocurren independientemente y a una tasa constante.

Una variable aleatoria discreta solo puede asumir ciertos valores específicos, frecuentemente enteros, y resulta del conteo. Por ejemplo, el número de caras al lanzar una moneda tres veces es discreto. Por otro lado, una variable aleatoria continua puede tomar cualquier valor dentro de un rango, resultando de mediciones.

El coeficiente de variación se emplea para comparar distribuciones con medias significativamente diferentes o medidas en unidades distintas. Proporciona una medida relativa de dispersión al relacionar la desviación estándar con la media.

También podría gustarte