0% encontró este documento útil (0 votos)
111 vistas23 páginas

Distribuciones Discretas en Estadística

Este documento presenta información sobre distribuciones de probabilidad discreta como la binomial y Poisson. Explica que una distribución discreta asigna probabilidades a valores contables de una variable aleatoria. Proporciona ejemplos como el número de quejas de clientes y la probabilidad de que 3 de 4 amigos hayan visto un partido, calculados usando las fórmulas binomiales y de Poisson respectivamente.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
111 vistas23 páginas

Distribuciones Discretas en Estadística

Este documento presenta información sobre distribuciones de probabilidad discreta como la binomial y Poisson. Explica que una distribución discreta asigna probabilidades a valores contables de una variable aleatoria. Proporciona ejemplos como el número de quejas de clientes y la probabilidad de que 3 de 4 amigos hayan visto un partido, calculados usando las fórmulas binomiales y de Poisson respectivamente.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Grupo: Los dicotómicos

Matemáticos:

Giuseppe Giansante cedula 25686656

Nairobi Melero cedula 28411336

Carlos Villalobos 28411400

Funciones de probabilidad estadística discreta


Una distribución discreta describe la probabilidad de ocurrencia de cada valor de una variable
aleatoria discreta. Una variable aleatoria discreta es una variable aleatoria que tiene valores
contables, tales como una lista de enteros no negativos.

Con una distribución de probabilidad discreta, cada valor posible de la variable aleatoria discreta
puede estar asociado con una probabilidad distinta de cero. Por lo tanto, una distribución de
probabilidad discreta suele representarse en forma tabular.

Ejemplo del número de quejas de clientes

Con una distribución discreta, a diferencia de una distribución continua, usted puede calcular la
probabilidad de que X sea exactamente igual a algún valor. Por ejemplo, puede utilizar la
distribución discreta de Poisson para describir el número de quejas de clientes en un día.
Supongamos que el número promedio de quejas por día es 10 y usted desea saber la
probabilidad de recibir 5, 10 y 15 quejas de clientes en un día.

Usted también puede visualizar una distribución discreta en una gráfica de distribución para ver
las probabilidades entre los rangos.

x P (X = x)

5 0.037833

10 0.12511

15 0.034718

Gráfica de distribución del número de quejas de clientes


Las barras sombreadas en este ejemplo representan el número de ocurrencias cuando las quejas
diarias de los clientes son 15 o más. La altura de las barras suma 0.08346; por lo tanto, la
probabilidad de que el número de llamadas por día sea 15 o más es 8.35%.

Entre las funciones discreta tenemos:

• Binomial:

Una distribución binomial es una distribución de probabilidad discreta que describe el número
de éxitos al realizar n experimentos independientes entre sí, acerca de una variable aleatoria.

Existen una gran diversidad de experimentos o sucesos que pueden ser caracterizados bajo
esta distribución de probabilidad. Imaginemos el lanzamiento de una moneda en el que
definimos el suceso “sacar cara” como el éxito. Si lanzamos 5 veces la moneda y contamos los
éxitos (sacar cara) que obtenemos, nuestra distribución de probabilidades se ajustaría a una
distribución binomial.

Por lo tanto, la distribución binomial se entiende como una serie de pruebas o ensayos en la
que solo podemos tener 2 resultados (éxito o fracaso), siendo el éxito nuestra variable
aleatoria.

Propiedades de la distribución binomial

Para que una variable aleatoria se considere que sigue una distribución binomial, tiene que
cumplir las siguientes propiedades:

• En cada ensayo, experimento o prueba solo son posibles dos resultados (éxito o fracaso).
• La probabilidad del éxito ha de ser constante. Esta se representa mediante la letra p. La
probabilidad de que salga cara al lanzar una moneda es 0,5 y esta es constante dado que la
moneda no cambia en cada experimento y las probabilidades de sacar cara son constantes.
• La probabilidad de fracaso ha de ser también constate. Esta se representa mediante la letra q =
1-p. Es importante fijarse que mediante esa ecuación, sabiendo p o sabiendo q, podemos
obtener la que nos falte.
• El resultado obtenido en cada experimento es independiente del anterior. Por lo tanto, lo que
ocurra en cada experimento no afecta a los siguientes.
• Los sucesos son mutuamente excluyentes, es decir, no pueden ocurrir los 2 al mismo tiempo.
No se puede ser hombre y mujer al mismo tiempo o que al lanzar una moneda salga cara y
cruz al mismo tiempo.
• Los sucesos son colectivamente exhaustivos, es decir, al menos uno de los 2 ha de ocurrir. Si
no se es hombre, se es mujer y, si se lanza una moneda, si no sale cara ha de salir cruz.
• La variable aleatoria que sigue una distribución binomial se suele representar como X~(n,p),
donde n representa el número de ensayos o experimentos y p la probabilidad de éxito.
Formula de la distribución binomial

La fórmula para calcular la distribución normal es:

Donde:

n = Número de ensayos/experimentos

x = Número de éxitos

p = Probabilidad de éxito

q = Probabilidad de fracaso (1-p)

Es importante resaltar que la expresión entre corchetes no es una expresión matricial, sino que
es un resultado de una combinatoria sin repetición. Este se obtiene con la siguiente formula:

El signo de exclamación en la expresión anterior representa el símbolo de factorial.

Ejemplo de distribución binomial

Imaginemos que un 80% de personas en el mundo ha visto el partido de la final del último
mundial de fútbol. Tras el evento, 4 amigos se reúnen a conversar, ¿Cuál es la probabilidad de
que 3 de ellos hayan visto el partido?

Definamos las variables del experimento:

n = 4 (es el total de la muestra que tenemos)

x = número de éxitos, que en este caso es igual a 3, dado que buscamos la probabilidad de
que 3 de los 4 amigos lo hayan visto.

p = probabilidad de éxito (0,8)

q = probabilidad de fracaso (0,2). Este resultado se obtiene al restar 1-p.

Tras definir todas nuestras variables, simplemente sustituimos en la formula.


El numerador de la factorial se obtendría de multiplicar 4*3*2*1 = 24 y en el denominador
tendríamos 3*2*1*1 = 6. Por lo tanto, el resultado de la factorial sería 24/6=4.
Fuera del corchete tenemos dos números. El primero sería 0,8^3=0,512 y el segundo 0,2 (dado
que 4-3 = 1 y cualquier número elevado a 1 es el mismo).

Por tanto, nuestro resultado final sería: 4*0,512*0,2 = 0,4096. Si multiplicamos por 100
tenemos que hay una probabilidad del 40,96% de que 3 de los 4 amigos haya visto el partido
de la final del mundial.

• Poisson:

En teoría de probabilidad y estadística, la distribución de Poisson es una distribución de


probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la
probabilidad de que ocurra un determinado número de eventos durante cierto período de
tiempo. Concretamente, se especializa en la probabilidad de ocurrencia de sucesos con
probabilidades muy pequeñas, o sucesos «raros».
Fue propuesta por Siméon-Denis Poisson, que la dio a conocer en 1838 en su
trabajo Recherches sur la probabilité des jugements en matières criminelles et matière
civile (Investigación sobre la probabilidad de los juicios en materias criminales y civiles).

Esta distribución es una de las más importantes distribuciones de variable discreta. Sus
principales aplicaciones hacen referencia a la modelización de situaciones en las que nos
interesa determinar el número de hechos de cierto tipo que se pueden producir en un
intervalo de tiempo o de espacio, bajo presupuestos de aleatoriedad y ciertas circunstancias
restrictivas. Otro de sus usos frecuentes es la consideración límite de procesos dicotómicos
reiterados un gran número de veces si la probabilidad de obtener un éxito es muy pequeña .

Proceso experimental del que se puede hacer derivar

• Esta distribución se puede hacer derivar de un proceso experimental de observación


en el que tengamos las siguientes características.
• Se observa la realización de hechos de cierto tipo durante un cierto periodo de tiempo
o a lo largo de un espacio de observación
• Los hechos a observar tienen naturaleza aleatoria; pueden producirse o no de una
manera no determinística.
• La probabilidad de que se produzcan un número x de éxitos en un intervalo de
amplitud t no depende del origen del intervalo (Aunque, sí de su amplitud)
• La probabilidad de que ocurra un hecho en un intervalo infinitésimo es prácticamente
proporcional a la amplitud del intervalo.
• La probabilidad de que se produzcan 2 o más hechos en un intervalo infinitésimo es un
infinitésimo de orden superior a dos.
• En consecuencia, en un intervalo infinitésimo podrán producirse O ó 1 hecho pero
nunca más de uno
El parámetro de la distribución es, en principio, el factor de proporcionalidad para la
probabilidad de un hecho en un intervalo infinitésimo. Se le suele designar como parámetro de
intensidad, aunque más tarde veremos que se corresponde con el número medio de hechos
que cabe esperar que se produzcan en un intervalo unitario (media de la distribución); y que
también coincide con la varianza de la distribución.

Por otro lado, es evidente que se trata de un modelo discreto y que el campo de variación de
la variable será el conjunto de los número naturales, incluido el

cero:

K = Numero de veces que ocurre un suceso en un intervalo determinado de tiempo longitud o


área.

u = Numero medio de veces que ocurre un suceso en un intervalo determinado de tiempo


longitud o área.

e = es la constante 2.71828, base de los logaritmos naturales, en tanto que los valores de e -λ
pueden obtenerse de tablas.

Ejemplo de poisson:

En un hospital de una importante ciudad se esta estudiando los nacimientos de bebes varones.
Se sabe que en una semana nacen una media de siete varones. Calcular:

1) Probabilidad de que nazcan 3 varones en una semana


2) Probabilidad de que nazcan menos 3 varones en una semana

Es una distribución de poisson porque nos están preguntando la probabilidad de que


ocurra un determinado numero de veces un suceso en un tiempo.

X = Nacimiento de bebe varón (el suceso a estudiar)

u = 7 varones a la semana (la media del suceso)

Seria para el problema 1:

𝑒 −7 ⋅73
𝑃(𝑥 = 3) = = 0.052 = 5.2%
3!
El anterior ejercicio se resuelve de la siguiente manera, la constante e se eleva al negativo
media del ejercicio en este caso -7, seria 2.71828 elevado a la -7 multiplicado por 7 elevado al
3 que daría 0,31278 luego lo dividimos entre 3! Que seria 6, el resultado final es 0.052 si
queremos saber el porcentaje multiplicado 0.052 * 100 y daría 5.2% esa es nuestra
probabilidad de que nazcan 3 varones en una semana

Para el problema 2:

𝑃(𝑥 < 3) = 𝑃(𝑥 = 0) + 𝑃(𝑥 = 1) + 𝑃(𝑥 = 2)


𝑒 −7 ⋅70
𝑃(𝑥 = 0) = = 0.001
0!
𝑒 −7 ⋅71
𝑃(𝑥 = 1) = = 0.006
1!
𝑒 −7 ⋅72
𝑃(𝑥 = 2) = = 0.022 =
2!

𝑃(𝑥 < 0) = 0.001 + 0.006 + 0.022 = 0.029 = 2.9%


El problema se resuelve calculando todas las probabilidades que sea menor de 3, como lo dice
el ejercicio la probabilidad de que nazcan menos de 3 en una semana, en eso tenemos que
calcular la Probabilidad que nazcan 0,1 y 2, el 3 no se toma en cuenta puesto que el enunciado
dice menor de 3, si dijera menor o igual que 3 se calculara 3, luego de haber calculado cada
uno de ellos se suman y esa es la probabilidad, en este caso la probabilidad de que nazcan
menos de 3 en una semana es de 2.9%.

(Todo número elevado a la 0 o 0! Es igual a 1)

• Hipergeométrica:

La distribución hipergeométrica es especialmente útil en todos aquellos casos en los que se


extraigan muestras o se realicen experiencias repetidas sin devolución del elemento extraído o
sin retornar a la situación experimental inicial.
Es una distribución fundamental en el estudio de muestras pequeñas de poblaciones pequeñas
y en el cálculo de probabilidades de juegos de azar. Tiene grandes aplicaciones en el control de
calidad para procesos experimentales en los que no es posible retornar a la situación de
partida.

Tanto la distribución hipergeométrica como la distribución binomial describen el número de


veces que un evento ocurre en un número fijo de ensayos. Para la distribución binomial, la
probabilidad es igual para cada ensayo. Para la distribución hipergeométrica, cada ensayo
cambia la probabilidad de cada ensayo subsiguiente porque no hay reemplazo.
La distribución hipergeométrica se define por 3 parámetros: tamaño de la población, conteo
de eventos en la población y tamaño de la muestra.

La ecuación de hipergeométrica es:

𝑘 𝑁 − 𝑘
( )( )
𝑃(𝑥) = 𝑥 𝑛 − 𝑥
𝑁
( )
𝑛
k = número de éxitos de la población x = número de existo de la muestra

N = numero total de la población n = numero de la muestra

Ejemplo:

En una caja hay 10 celulares de los cuales hay 3 celulares defectuosos, ¿si se saca 5 celulares
de la caja, cual es la probabilidad de sacar un celular defectuoso?

N = 10, k = 3, n= 5, x=1

3 10 − 3 3 7
( )( ) ( ) ( ) (3)(35) 105
𝑃(𝑥 = 1) = 1 5 − 1 = 1 4 = = = 0.4167 = 41,67%
10 10 252 252
( ) ( )
5 5

Recordemos que la manera de resolver lo que encontramos en el paréntesis se resuelve con la


siguiente ecuación

Como resultado da que la probabilidad de sacar 1 celular defectuoso de 5 que se extraigan de


una caja es de 41.67%, de esta manera se desarrolla la ecuación de la Hipergeométrica.

• Multinomial

En teoría de probabilidad, la distribución multinomial o distribución multinómica es una


generalización de la distribución binomial. Esta distribución es muy similar a la distribución
binomial como con la diferencia de que en lugar de dos posibles resultados en cada ensayo, en
esta poder haber múltiples posibles resultados para esta se harán 2 ejemplos para dar a
entender mejor su teoría.
La ecuación de la multinomial es la siguiente:
𝑥 𝑥 𝑥
𝑛! ∗ 𝑃1 1 ∗ 𝑃2 2 ∗ 𝑃3 3…
𝑃(𝑥1 , 𝑥2 , 𝑥3 … ) =
𝑥1 ! ∗ 𝑥2 ! ∗ 𝑥3 ! …
X= variables aleatorias
P = probabilidades aleatorias
N = numero de datos o muestra
Ejemplo 1:
En un curso el 20% de los alumnos son de Armenia, el 30% de Pereira, el 40% de Manizales y el
10% del Valle. En un pequeño grupo se han reunido 4 alumnos. ¿Cuál es la probabilidad de que
2 sean de Armenia y 2 de Manizales?
“En este caso particular nos dan 4 probabilidades, pero solo nos piden dos, de igual manera
usaremos las 4 probabilidades, y ponemos 0 en donde nos tengamos variable”
X1 = 2 de Armenia P1 = 20% N = 4 alumnos
X2 = 0 de Pereira P2 = 30%
X3 = 2 de Manizales P3 = 40%
X4 = 0 del valle P4 = 10%
4! ∗ 0.22 ∗ 0.30 ∗ 0.42 ∗ 0.10 0,1536
𝑃(𝑥=2 , 𝑥=0 , 𝑥=2 , 𝑥=0 ) = = = 0,0384 = 3,84%
2! ∗ 0! ∗ 2! ∗ 0! 4
La probabilidad de que de los 4 alumnos que tomemos de la clase sea 2 de armenia y 2
de Manizales es de 3.84%
Ejemplo 2:
Una empresa desea conocer la opinión que se tiene sobre tres productos A,B,C. Sabiendo que
el producto A es preferido por el 10%, el B por el 30% y el C por el 40%. ¿Cuál es la
probabilidad de que en una muestra aleatoria de 10 personas, dos prefieran A, tres prefieran B
y dos prefieran C?
“En este caso tenemos que la probabilidad que nos dan en total es de 80% de que elijan algun
producto dando a entender que existe un 20% de que no prefiera ninguno de los productos de
la empresa”
X1 = números de personas que prefieran A (2) P1 = 10% n = 10 personas
X2 = números de personas que prefieran B (3) P2 = 30%
X3 = números de personas que prefieran C (2) P3 = 40%
X4 = números de persona que no prefieran ninguno (3) P4 = 20%
10! ∗ 0.12 ∗ 0.33 ∗ 0.42 ∗ 0.23 1,2541
𝑃(𝑥=2 , 𝑥=3 , 𝑥=2 , 𝑥=3 ) = = = 0,0087 = 0,87%
2! ∗ 3! ∗ 2! ∗ 3! 144

El promedio de que 2 prefieran A, 3 prefieran B y 2 prefieran C, seria de un 0,87%.

En la siguiente imagen se puede apreciar la diferencia en lo que serian las 3 principales


funciones discretas:
Funciones de probabilidad estadísticas Continua
Una distribución continua describe las probabilidades de los posibles valores de una variable
aleatoria continua. Una variable aleatoria continua es una variable aleatoria con un conjunto de
valores posibles (conocido como el rango) que es infinito y no se puede contar.

Las probabilidades de las variables aleatorias continuas (X) se definen como el área por debajo
de la curva de su PDF. Por lo tanto, solo los rangos de valores pueden tener una probabilidad
diferente de cero. La probabilidad de que una variable aleatoria continua equivalga a algún valor
siempre es cero.

Ejemplo de la distribución de pesos

La distribución normal continua puede describir la distribución del peso de hombres adultos.
Por ejemplo, usted puede calcular la probabilidad de que un hombre pese entre 160 y 170 libras.
Gráfica de distribución del peso de hombres adultos
El área sombreada debajo de la curva en este ejemplo representa el rango de 160 a 170 libras.
El área de este rango es 0.136; por lo tanto, la probabilidad de que un hombre seleccionado
aleatoriamente pese entre 160 y 170 libras es de 13.6%. Toda el área por debajo de la curva
equivale a 1.0.
Sin embargo, la probabilidad de que X sea exactamente igual a algún valor siempre es cero,
porque el área por debajo de la curva en un punto individual, que no tiene anchura, es cero. Por
ejemplo, la probabilidad de que un hombre pese exactamente 190 libras es cero. Podría calcular
una probabilidad diferente de cero de que un hombre pese más de 190 libras, menos de 190
libras o entre 189.9 y 190.1 libras, pero la probabilidad de que pese exactamente 190 libras es
cero.

Entre las funciones de probabilidad continua nos encontramos con:

• Distribución normal

La distribución normal es una distribución con forma de campana donde las desviaciones
estándar sucesivas con respecto a la media establecen valores de referencia para estimar el
porcentaje de observaciones de los datos. Estos valores de referencia son la base de muchas
pruebas de hipótesis, como las pruebas Z y t.

La importancia de esta distribución radica en que permite modelar numerosos fenómenos


naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de
este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables
que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada
observación se obtiene como la suma de unas pocas causas independientes.
De hecho, la estadística descriptiva solo permite describir un fenómeno, sin explicación alguna.
Para la explicación causal es preciso el diseño experimental, de ahí que al uso de la estadística
en psicología y sociología sea conocido como método correlacional.
Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo de la
normal son:

• caracteres morfológicos de individuos como la estatura;


• caracteres fisiológicos como el efecto de un fármaco;
• caracteres sociológicos como el consumo de cierto producto por un mismo grupo de
individuos;
• caracteres psicológicos como el cociente intelectual;
• nivel de ruido en telecomunicaciones;
• errores cometidos al medir ciertas magnitudes;

Para entender mejor, la distribución normal tiene como función el calcular la probabilidad de
que una muestra se encuentre en un rango, por ejemplo, la probabilidad de que una acción de
una empresa se encuentre entre 18$ y 20$ o que una mujer tenga una estatura entre 1,55mts
y 1,65mts, las características de esta distribución son:

• La moda, media y mediana coinciden


• El área bajo la curva es 1
• El área bajo la curva de cada lado de la media es 50%
• Toma en cuenta u y ó
• Tiene una asíntota y=0

La ecuación de esta distribución:

𝑥−𝑢
𝑍=
𝜎
µ = representa la media.
Ơ = la desviación estándar.
X = el valor dado dentro del problema
Y Ơ =desviacion estandar

ZoX
µ = media

Ejemplo de ejercico:

Una empresa tiene como valor medio de su acción en 37.75$ teniendo una desviación
estándar de 4.05$ que probabilidad existe de que el valor de su acción se encuentre entre
37.75$ y 42.62$?

P(x) = 37.75 ≤ Z ≤ 42.62

µ = 37.75$

Ơ = 4.05$

X = 42.62$

Y Ơ =4.05$

X = 42.62$

ZoX
µ = 37.75$
Para conocer la probabilidad debemos conocer primero el valor de la Z, Si sustituimos los
valores de la ecuación seria así:

42,62−37,75 4,87
𝑍= = 4,05 = 1,20
4,05
Este valor Z los buscaremos en la tabla :
Como podremos notar en la tabla en la fila vemos que está organizado de un numero entero y
uno decimal 1.0 y en la columna de dos decimales, 0.01, como podemos saber cuál buscamos?
Nuestro resultado de z debe ser de dos decimales como lo hicimos en el ejercicio, el cual el
resultado fue 1.20, entonces como lo buscamos? Tomamos el entero y el primer decimal y ese
será nuestra fila, 1.2 y el segundo decimal será nuestra columna en este caso 0, seria 1.20 =
0.3849, la probabilidad seria de 38.49% que el valor de la acción se encuentre entre 37.75$ y
42.62$.

Si el ejercicio fuera entre 35,50$ y 42,62$ tendríamos que calcular primero el rango entre
35.50-37.75 y luego 37.75-42.62 y sumarlos

P(X) = P(x)= (35.50 ≤ Z ≤ 37.75) + P(x)= (42.62 ≤ Z ≤ 37.75)

P(x) = 0.2123 + 0.3849

P(x) = 0.5972 → 59,72%

Esta seria la probabilidad de que el valor de la acción se encuentre entre 35.50$ y 42.62$

• Distribución F de Fisher:

La distribución F es una distribución continua de muestreo de la relación de dos


variables aleatorias independientes con distribuciones de chi-cuadrada, cada una
dividida entre sus grados de libertad. La distribución F es asimétrica hacia la
derecha y es descrita por los grados de libertad de su numerador (ν1) y
denominador (ν2).
La distribución F de Fisher es una distribución que depende de dos parámetros. Es una
distribución que aparece, con frecuencia, como distribución de un estadístico de test, en
muchos contrastes de hipótesis bajo las suposiciones de normalidad.
Esta distribución tiene como función la comparación de dos muestras de población
distintas en el caso de una empresa en la comparación de los datos obtenidos de dos
maquinarias con la misma función con grados diferente de libertad.
Ejemplo:

Sea una población de 20 personas que miden mas de 1.7m, que observamos en 4
muestras de 5 personas cada una, analizando su peso, determinar si existe o no diferencia
significativa entre sus pesos.
Tomando como nivel de significación 0.05.

Muestras
Personas 1 2 3 4
1 64 69 79 62
2 68 65 67 74
3 64 73 77 65
4 80 60 80 75
5 68 61 75 75

Primero debemos plantear una hipótesis:

Hipótesis nula: todas las proporciones de la población son iguales


Hipótesis alternativa: No todas las proporciones de la población son iguales

Ahora debemos calcular los grados de libertad del d1 numerador y d2 denominador :


D1 = k – 1 = 4 -1 = 3
D2 = k(n-1) = 4(5-1) = 4(4) = 16
K= número de muestras

N= número de observaciones(personas)
Ya que tenemos los grados de libertad ahora buscamos en la siguiente tabla donde α =
0.05 y se cruce los grados de libertad

En la tabla α = 0.05, podemos ver que donde se crucen los puntos d1, d2 el valor es 3.239
a este valor lo llamaremos F(tabla) = 3.239
Seguido de esto debemos calcular la media de cada muestra
media = la suma de todas las muestras/ la cantidad de muestras

𝑥̅1 = (64 + 68 + 80 + 64 + 68) / 5 = 344/5 = 68.8


𝑥̅2 = (69 + 65 + 73 + 60 + 61) / 5 = 328/5 = 65.6
𝑥̅3 = (79 + 67 + 77 + 80 + 75) / 5 = 378/5 = 75.6
𝑥̅4 = (62 + 74 + 65 + 75 + 75) / 5 = 351/5 = 70.2
Ahora deberemos calcular la varianza para cada muestra

2
(𝑥1 − 𝑥̅1 )2
𝜎 =
𝑛−1
(N – 1)= 5 - 1 = 4
(𝑥1 − 𝑥̅1 )2 + (𝑥2 − 𝑥̅1 )2 + (𝑥3 − 𝑥̅1 )2 + (𝑥4 − 𝑥̅1 )2 + (𝑥5 − 𝑥̅3 )2
𝜎12 =
𝑛
(64 − 68.8)2 + (68 − 68.8)2 + (80 − 68.8)2 + (64 − 68.8)2 + (68 − 68.8)2
=
4
(−4.8)2 + (−0.8)2 + (11.2)2 + (−4.8)2 + (−0.8)2
=
4
23.4 + 0.64 + 23.4 + 125.44 + 0.64 172.8
= = = 43.2
4 4
(𝑥1 − 𝑥̅2 )2 + (𝑥2 − 𝑥̅2 )2 + (𝑥3 − 𝑥̅ 2 )2 + (𝑥4 − 𝑥̅2 )2 + (𝑥5 − 𝑥̅3 )2
𝜎22 =
𝑛
(69 − 65.6)2 + (65 − 65.6)2 + (73 − 65.6)2 + (60 − 65.6)2 + (61 − 65.6)2
=
4
(3.4)2 + (−0.6)2 + (7.4)2 + (−5.6)2 + (−4.6)2
=
4
11.56 + 0.36 + 54.76 + 31.36 + 21.16 119.2
= = = 29.8
4 4
(𝑥1 − 𝑥̅3 )2 + (𝑥2 − 𝑥̅3 )2 + (𝑥3 − 𝑥̅ 3 )2 + (𝑥4 − 𝑥̅3 )2 + (𝑥5 − 𝑥̅3 )2
𝜎32 =
𝑛
(79 − 75.6)2 + (67 − 75.6)2 + (77 − 75.6)2 + (80 − 75.6)2 + (75 − 75.6)2
=
4
(3.4)2 + (−8.6)2 + (1.4)2 + (−4.4)2 + (−0.6)2
=
4
11.56 + 73.96 + 1.96 + 19.36 + 0.36 107.2
= = = 26.8
4 4
(𝑥1 − 𝑥̅4 )2 + (𝑥2 − 𝑥̅4 )2 + (𝑥3 − 𝑥̅ 4 )2 + (𝑥4 − 𝑥̅4 )2 + (𝑥5 − 𝑥̅4 )2
𝜎42 =
𝑛
(62 − 70.2)2 + (74 − 70.2)2 + (65 − 70.2)2 + (75 − 70.2)2 + (75 − 70.2)2
=
4
(−8.2)2 + (3.8)2 + (−5.2)2 + (−4.8)2 + (−4.8)2
=
4
67.24 + 14.44 + 27.4 + 23.04 + 23.04 154.8
= = = 38.7
4 4
2
𝜎1=43.2
2
𝜎2=29.8
2
𝜎3=26.8
2
𝜎4=38.7
Ahora continuamos calculando la estimación interna de la varianza
2
𝜎𝑖
𝜎𝑤2 =
𝑘−1
Como tenemos 4 muestras con 4 varianzas distintas se suman todas y se
divide entre el numero de muestras
43.2+29.8+26.8+38.7 138.5
𝜎𝑤2 = = = 34.625
4 4
Aun nos falta calcular la media de la media muestrales
68.8 + 65.6 + 75.6 + 70.2
𝑥̅̅ = = 70.05
4
calculamos la varianza de las medias usando

(𝑥̅𝑖 − 𝑥̅̅ )2
𝜎𝑥̅2 =
𝑘−1

𝜎𝑥̅2 =
(68.8−70.05)2 +(68.8−70.05)2 +(68.8−70.05)2 +(68.8−70.05)2 +(68.8−70.05)2 +(68.8−70.05)2
4−1
52.19
= = 17.396666
3

Seguido calculamos la estimación intermediante de la varianza con la siguiente función


𝜎𝑥2 = 𝑛 ∗ 𝜎𝑥̅2

𝜎𝑥2 = 5 ∗ 17.396666
Y por último debemos calcular F(prueba) con la siguiente función la cual es la estimación
intermediante de la varianza entre la estimación interna de la varianza

𝜎𝑥2
𝑓(𝑝𝑟𝑢𝑒𝑏𝑎)= 2
𝜎 𝑤
86.983333
𝑓(𝑝𝑟𝑢𝑒𝑏𝑎)= = 2.51215
34.625

Ya que tenemos ambos valores F(tabla) = 3.2389 y F(prueba) = 2.51215 dependiendo


de su relación podemos decir si se cumple o no nuestra hipótesis al ser menor la
F(prueba) que la F(tabla) la hipótesis “Todas las proporciones de la población son
iguales” es aprobada por lo tanto no existe diferencia significativa en la población.
• Distribución T de student

En probabilidad y estadística, la distribución de Student es una distribución de


probabilidad que surge del problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación de las
diferencias entre dos varianzas muestrales y para la construcción del intervalo de
confianza para la diferencia entre las partes de dos poblaciones cuando se desconoce
la desviación típica de una población y esta debe ser estimada a partir de los datos de una
muestra.
La prueba "t" de Student es un tipo de estadística deductiva. Se utiliza para determinar si hay
una diferencia significativa entre las medias de dos grupos. Con toda la estadística deductiva,
asumimos que las variables dependientes tienen una distribución normal. Especificamos el
nivel de la probabilidad (nivel de la alfa, nivel de la significación, p) que estamos dispuestos a
aceptar antes de que cerco datos (p < .05 es un valor común se utiliza que).
Ejemplo:
Una empresa que fabrica juguetes electrónicos afirma que las baterías que utilizan sus
productos duran un promedio de 30 horas, para mantener este promedio prueban 16 baterías
cada mes, si el valor de “t” calculado caen entre t-.025 y t.025 la empresa queda satisfecha con
su afirmación
¿Qué conclusiones debería sacar la empresa a partir de una muestra que tiene una media de
27?5 horas y una desviación estándar de la muestra de 5 horas?
Media de la poblacion – µ = 30 horas

Media de la muestra – 𝑥̅ = 27.5horas

Tamaño de la muestra --- n = 16

Desviación estándar de la población --- δ = 5horas

α = T0.025

α = 0.025

Lo que sigue es sacar la estadística de prueba con la siguiente formula

𝑥̅ − 𝑢
𝑡𝜀 =
𝛿
( )
√𝑛
27.5−30 −2.5 −2.5
𝑡𝜀 = 5 = 5 = = −2
( ) (4) 1.25
√16

Con la tabla de distribución te student con grados de libertad gl = n -1 = 16-1= 15 y α =


0.025 no podemos ubicar en la tabla en donde estos dos valores cruzan, dando así t2.131
La manera de graficas es la siguiente:
T-2.131 y T2.131 es el rango de confiabilidad de la prueba, si nuestro cálculo de la 𝑡𝜀 a la hora
de graficar queda dentro de ese rango podemos dar la hipótesis de la prueba como correcta ya
que la batería si duran en promedio 30 horas.

Esta distribución se usa mucho en optimización, reducción de costo, de hecho, por esto por
descubierta esta Distribución ya que su padre fundador trabajaba en una cervecería y busco la
optimización de la producción.

• Distribución Chi cuadrado

La prueba chi-cuadrado, también llamada Ji cuadrado (Χ2), se encuentra dentro de las pruebas

pertenecientes a la estadística descriptiva, concretamente la estadística descriptiva aplicada al

estudio de dos variables. Por su parte, la estadística descriptiva se centra en extraer

información sobre la muestra. En cambio, la estadística inferencial extrae información sobre la

población.

El nombre de la prueba es propio de la distribución Chi-cuadrado de la probabilidad en la que

se basa. Esta prueba fue desarrollada en el año 1900 por Karl Pearson.

La prueba chi-cuadrado es una de las más conocidas y utilizadas para analizar variables

nominales o cualitativas, es decir, para determinar la existencia o no de independencia entre

dos variables. Que dos variables sean independientes significa que no tienen relación, y que

por lo tanto una no depende de la otra, ni viceversa.

Así, con el estudio de la independencia, se origina también un método para verificar si las

frecuencias observadas en cada categoría son compatibles con la independencia entre ambas

variables.

Ejemplo:

La siguiente tabla refleja la cantidad de estudiantes según la calificación obtenida en


matemática aplicada con dos profesores diferentes

Deficiente regular bueno total


Profesor Vicente 30 3 1 34
Otro profesor 10 10 18 38
total 40 13 19 72

¿Influye el nivel de exigencia del profesor en la calificación obtenida?

Margen de error: 0.05


Hipótesis nula = No influye el nivel de exigencia

Hipótesis alternativa = El profesor Vicente tiene un nivel de exigencia de ingeniero

Ahora procedemos a calcular la frecuencia teórica de cada uno de los datos seria:
40 ∗ 34 1360
𝐹𝑡(30) = = = 18,888889
72 72
40 ∗ 38 1520
𝐹𝑡(10) = = = 21,111111
72 72
13 ∗ 34 442
𝐹𝑡(3) = = = 6,138889
72 72
13 ∗ 38 494
𝐹𝑡(10) = = = 6,861111
72 72
19 ∗ 34 646
𝐹𝑡(1) = = = 8,972222
72 72
19 ∗ 38 722
𝐹𝑡(18) = = = 10,027778
72 72
Seguido procedemos a calcular el grado de libertad:

𝑔𝑙 = (𝑛𝑓 − 1) ∗ (𝑛𝑐 − 1)

Nf = número de filas

Nc = número de columnas

gl= (2-1) * (3-1)

gl = 1*2

gl= 2

por último calculamos el chi cuadrado de la siguiente manera

(𝑓 − 𝑓𝜀 )2
𝑥2 = ∑
𝑓𝑡

(30−18,89)2 (10−21,11)2 (3−6,14)2 (10−6,86)2 (1−8,97)2 (18−10,03)2


𝑥2 = + + + + +
18,89 21,11 6,14 6,86 8,97 10,03

𝑥 2 = 6,53 + 5,85 + 1,61 + 1,44 + 7,08 + 6,33


𝑥 2 = 28,84
Nos vamos a nuestra tabla de chi cuadrado y buscamos en donde nuestro grado de libertad = 2
coincida con nuestro margen de error de 0.05
2
en la tabla observamos que en donde se interceptan da 𝑥 𝑡𝑎𝑏𝑙𝑎 = 5,9915 se procede a comparar el chi
cuadrado de la tabla y el chi cuadrado calculado, según la teoría si chi calculado es mayor que el chi cuadrado de la
tabla entonces se procede a rechazar la hipótesis nula, al ser contrario que el chi cuadrado sea menor que el chi
cuadrado de la tabla se rechaza la hipótesis alternativa, en nuestro caso del ejemplo se rechaza la hipótesis nula
dando como resultado que si influye el nivel de exigencia del profesor en la evaluación en donde el profesor Vicente
posee un grado de exigencia de nivel ingeniero y es muy poco probable aprobarle la unidad curricular de
matemática aplicada.

También podría gustarte