0% encontró este documento útil (0 votos)
82 vistas25 páginas

Distribuciones Binomial y Poisson Explicadas

La distribución binomial y Poisson son distribuciones de probabilidad discretas. La binomial describe el número de éxitos en n experimentos independientes con probabilidad constante p de éxito. La Poisson modeliza la frecuencia de eventos durante un intervalo de tiempo a partir de la media μ de aparición. Ambas distribuciones cumplen propiedades como independencia y constancia de probabilidades.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
82 vistas25 páginas

Distribuciones Binomial y Poisson Explicadas

La distribución binomial y Poisson son distribuciones de probabilidad discretas. La binomial describe el número de éxitos en n experimentos independientes con probabilidad constante p de éxito. La Poisson modeliza la frecuencia de eventos durante un intervalo de tiempo a partir de la media μ de aparición. Ambas distribuciones cumplen propiedades como independencia y constancia de probabilidades.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

1.

DISTRIBUCIÓN BINOMIAL
Una distribución binomial es una distribución de probabilidad discreta que describe
el número de éxitos al realizar n experimentos independientes entre sí, acerca de
una variable aleatoria.
Para que una variable aleatoria se considere que sigue una distribución binomial,
tiene que cumplir las siguientes propiedades:

 En cada ensayo, experimento o prueba solo son posibles dos resultados


(éxito o fracaso).
 La probabilidad del éxito ha de ser constante. Esta se representa mediante
la letra p. La probabilidad de que salga cara al lanzar una moneda es 0,5 y
esta es constante dado que la moneda no cambia en cada experimento y
las probabilidades de sacar cara son constantes.
 La probabilidad de fracaso ha de ser también constate. Esta se representa
mediante la letra q = 1-p. Es importante fijarse que mediante esa ecuación,
sabiendo p o sabiendo q, podemos obtener la que nos falte.
 El resultado obtenido en cada experimento es independiente del anterior.
Por lo tanto, lo que ocurra en cada experimento no afecta a los siguientes.
 Los sucesos son mutuamente excluyentes, es decir, no pueden ocurrir los 2
al mismo tiempo. No se puede ser hombre y mujer al mismo tiempo o que al
lanzar una moneda salga cara y cruz al mismo tiempo.
 Los sucesos son colectivamente exhaustivos, es decir, al menos uno de los
2 ha de ocurrir. Si no se es hombre, se es mujer y, si se lanza una moneda,
si no sale cara ha de salir cruz.
 La variable aleatoria que sigue una distribución binomial se suele
representar como X~(n,p), donde n representa el número de ensayos o
experimentos y p la probabilidad de éxito.

Formula de la distribución binomial


La fórmula para calcular la distribución normal es:

Donde:

n = Número de ensayos/experimentos

x = Número de éxitos

p = Probabilidad de éxito

q = Probabilidad de fracaso (1-p)


Es importante resaltar que la expresión entre corchetes no es una expresión
matricial, sino que es un resultado de una combinatoria sin repetición. Este se
obtiene con la siguiente formula:

Ejercicios
1.
De todas las flores plantadas por una empresa de jardinería, el 90%
sobrevive. Si se plantan 10 flores ¿cuál es la probabilidad de que 9 o más
sobrevivan?

Solución:
Antes de aplicar la fórmula, verificamos que se trate de un experimento
binomial. Para ello, tiene que cumplir con las 4 condiciones que
mencionamos arriba. Efectivamente, se trata de un experimento binomial.

En este caso, vamos a centrarnos en las flores que sobreviven, por ello
diremos que:

X = número de flores de 10 que sobreviven


Entonces consideramos un éxito si la flor sobrevive. A las que flores que
se mueren, las consideramos como un fracaso.

Aplicaremos la fórmula binomial:

Nos piden calcular la probabilidad de 9 o más sobrevivan.


Este problema tiene trampa, porque dado que se plantaron 10 flores, la
máxima cantidad de flores que pueden sobrevivir es 10, por lo tanto:

– ¿Y no pueden sobrevivir 11 flores?


– No se puede, porque solo se plantaron 10.
– ¿Y si las flores tienen hijitos bonitos?
– Alumno por favor, tome menos azúcar. Concéntrese y sigamos con la
clase.
Ahora colocamos los valores de n, k y p. Recuerda que n es el número de
ensayos, k el número de éxitos y p la probabilidad de éxito. En este caso:

Regresamos con la fórmula de arriba:

Vamos a calcular cada probabilidad por separado, empezando con P(X =


9):

Continuamos con P(X = 10).


Regresamos con esta fórmula:

Y reemplazamos lo calculado:

Ejercicio 2.
La probabilidad de que a un cliente nuevo le guste la matehamburguesa
de Jorge es de 0,8. Si llegan 5 clientes nuevos a la cafetería, ¿cuál es la
probabilidad de que solo a 3 de ellos les guste la matehamburguesa?

Solución:
Antes de aplicar la fórmula, verificamos que se trate de un experimento
binomial. Para ello, tiene que cumplir con las 4 condiciones que
mencionamos arriba. Efectivamente, se trata de un experimento binomial.
En este caso, vamos a centrarnos en los clientes a los que les gusta esta
hamburguesa, por ello diremos que:
X = número de clientes nuevos de 5 a los que les gusta la
matehamburguesa
Entonces consideramos un éxito si al cliente le gusta esta hamburguesa.

Aplicaremos la fórmula binomial:

Ahora colocamos los valores de n, k y p. Recuerda que n es el número de


ensayos, k el número de éxitos y p la probabilidad de éxito.

Reemplazamos estos valores en la fórmula:


La respuesta sería 0,2048.

2. DISTRIBUCIÓN POISSON

La distribución de Poisson es una distribución de probabilidad discreta que


modeliza la frecuencia de eventos determinados durante un intervalo de tiempo
fijado a partir de la frecuencia media de aparición de dichos eventos.
Dada una variable aleatoria discreta X decimos que su frecuencia se puede
aproximar satisfactoriamente a una distribución de Poisson, tal que:

Expresión de la distribución de Poisson


A diferencia de la distribución normal, la distribución de Poisson solo depende
de un parámetro, mu (marcado en amarillo).

Mu informa del número esperado de eventos que ocurrirán en un intervalo de


tiempo fijado. Cuando se habla de algo “esperado” tenemos que redirigirlo a
pensar en la media. Por tanto, mu es la media de la frecuencia de los eventos.

Tanto la media como la varianza de esta distribución son mu, estrictamente


positiva.

Función de densidad de probabilidad (fdp)

Función de densidad
de probabilidad de Poisson
Esta función se entiende como la probabilidad de que la variable aleatoria X tome
un valor concreto x. Es la exponencial de la media negativa multiplicada por la
media elevada a la observación y todo dividido por el factorial de la observación.

Como está indicado, para conocer la probabilidad de cada observación, tendremos


que sustituir en la función todas las observaciones. En otras palabras, x es un
vector de dimensión n que contiene todas las observaciones de la variable
aleatoria X. La media también sería un vector pero de una dimensión, tal que:
Parámetro y realizaciones de la variable aleatoria
Una vez ya tenemos las probabilidades calculadas, junto con las observaciones ya
podemos dibujar la distribución de densidad de probabilidad.

Ejercicio 1
Un estudio sismológico determinó que durante los últimos 100
años, hubo 93 terremotos grandes en todo el mundo, de al menos
6.0 en la escala de Richter –logarítmica-. Supongamos que la
distribución de Poisson es un modelo adecuado en este caso.
Hallar:

a) El promedio de ocurrencia de grandes terremotos al año.

b) Si P(y) es la probabilidad de que ocurran y terremotos durante


un año seleccionado al azar, hallar las siguientes probabilidades:

P(0), P(1), P (2), P (3), P (4), P (5), P (6) y P (7).

c) Los verdaderos resultados del estudio son los siguientes:

– 47 años (0 terremotos)

– 31 años (1 terremotos)

– 13 años (2 terremotos)

– 5 años (3 terremotos)

– 2 años (4 terremotos)

– 0 años (5 terremotos)

– 1 años (6 terremotos)
– 1 años (7 terremotos)

¿Cómo se comparan estos resultados con los obtenidos en el inciso


b? ¿Es la distribución de Poisson una buena elección para modelar
estos eventos?

Solución a)
a) Los terremotos son sucesos cuya probabilidad p es pequeña y
estamos considerando un período restringido de tiempo, de un
año. El promedio de terremotos es:

μ = 93 / 100 terremotos/año = 0.93 terremotos por año.

Solución b)
b) Para calcular las probabilidades solicitadas, se sustituyen
valores en la fórmula dada al comienzo:

y=2

μ = 0.93

e = 2.71828

Es bastante menor que P(2).

Los resultados se listan a continuación:

P (0) = 0.395, P (1) = 0.367, P (2) = 0.171, P (3) = 0.0529, P (4)


= 0.0123, P (5) = 0.00229, P (6) = 0.000355, P (7) = 0.0000471.
Por ejemplo, podríamos decir que hay una probabilidad de 39.5 %
de que no ocurra ningún gran terremoto en un año dado. O que
hay 5,29 % de que ocurran 3 grandes terremotos en dicho año.

Solución c)
c) Se analizan las frecuencias, multiplicando por n=100 años:

39.5; 36.7; 17.1 ; 5.29 ; 1.23 ; 0.229 ; 0.0355 y 0.00471.

Por ejemplo:

– Una frecuencia de 39.5 indica que, en 39.5 de 100 años ocurren


0 terremotos grandes, podríamos decir que está bastante cerca al
resultado real de 47 años sin ningún gran terremoto.

Comparemos otro resultado de Poisson con los resultados reales:

– El valor obtenido de 36.7 significa que en un período 37 años


hay 1 gran terremoto. El resultado real es que en 31 años hubo 1
gran terremoto, una buena coincidencia con el modelo.

– Se esperan 17.1 años con 2 grandes terremotos y se sabe que


en 13 años, que es un valor cercano, hubo en efecto 2 grandes
terremotos.

Por lo tanto el modelo de Poisson es aceptable para este caso.

Ejercicio 2
Una compañía estima que el número de componentes que fallan
antes de cumplir 100 horas de funcionamiento, sigue una
distribución de Poisson. Si el número promedio de fallos es 8 en
ese tiempo, encontrar las siguientes probabilidades:

a) Que un componente falle en 25 horas.

b) Falla de menos de dos componentes, en 50 horas.


c) Que fallen por lo menos tres componentes en 125 horas.

Solución a)
a) Se sabe que el promedio de fallas en 100 horas es 8, por lo
tanto en 25 horas se espera la cuarta parte de fallos, es decir 2
fallos. Este será el parámetro μ.

Se pide la probabilidad de que falle 1 componente, la variable


aleatoria es “componentes que fallan antes de 25 horas” y su valor
es y =1. Al sustituir en la función de probabilidad:

Sin embargo, la pregunta es la probabilidad de que fallen menos


de dos componentes en 50 horas, no que fallen exactamente 2
componentes en 50 horas, por lo tanto hay que sumar las
probabilidades de que:

-Ninguno falle

-Falle solamente 1

P (fallen menos de 2 componentes) = P (0) + P (1)

P (fallen menos de 2 componentes) = 0.0183+0.0732 =0.0915

c) Que fallen por lo menos 3 componentes en 125 horas, significa


que pueden fallar 3, 4, 5 o más en dicho tiempo.

La probabilidad que ocurra al menos uno de entre varios sucesos


es igual a 1, menos la probabilidad que no ocurra ninguno de los
sucesos.

-El suceso que se busca es que fallen 3 o más componentes en


125 horas
-Que no ocurra el suceso significa que fallan menos de 3
componentes, cuya probabilidad es: P(0)+P(1)+P(2)

El parámetro μ de la distribución en este caso es:

μ = 8 + 2 = 10 fallos en 125 horas.

P (fallen 3 o más componentes) = 1- P(0)- P(1)- P(2) =

3. DISTRIBUCIÓN NORMAL Y NORMAL ESTANDAR

4. DISTRIBUCIÓN NORMAL

5. Una variable aleatoria continua, X, sigue una distribución


normal de media μ y desviación típica σ, y se designa porN(μ,
σ), si se cumplen las siguientes condiciones:

6. 1. La variable puede tomar cualquier valor: (-∞, +∞)

7. 2. La función de densidad, es la expresión en términos de


ecuación matemática de la curva de Gauss:

8.

9.

10. Figura 5.1.1 Función de Densidad


11.
12. Curva de la distribución normal

13.

14. Figura 5.1.2 Curva de la distribución normal

15.

16. * El campo de existencia es cualquier valor real, es decir, (-∞, +∞).

17. * Es simétrica respecto a la media µ.

18. * Tiene un máximo en la media µ.

19. * Crece hasta la media µ y decrece a partir de ella.

20. * En los puntos µ − σ y µ + σ presenta puntos de inflexión.

21. * El eje de abscisas es una asíntota de la curva.

22.

23. El área del recinto determinado por la función y el eje de


abscisas es igual a la unidad.

24. Al ser simétrica respecto al eje que pasa por x = µ, deja un área
igual a 0.5 a la izquierda y otra igual a 0.5 a la derecha.

25. La probabilidad equivale al área encerrada bajo la curva.

26.

27. p(μ - σ < X ≤ μ + σ) = 0.6826 = 68.26 %

28. p(μ - 2σ < X ≤ μ + 2σ) = 0.954 = 95.4 %


29. p(μ - 3σ < X ≤ μ + 3σ) = 0.997 = 99.7 %

30.

31. DISTRIBUCIÓN NORMAL ESTÁNDAR

32. La distribución normal estándar, o tipificada o reducida, es


aquella que tiene por media el valor cero, μ =0, y pordesviación
típica la unidad, σ =1.

33. Su función de densidad es:

34.

35. Figura 5.1.3 Distribución Normal Estándar

36. Su gráfica es:

37.

38. La probabilidad de la variable X dependerá del área del recinto


sombreado en la figura. Y para calcularla utilizaremos una tabla.

39. Tipificación de la variable

40. Para poder utilizar la tabla tenemos que transformar la


variable X que sigue una distribución N(μ, σ) en otra variable Z que
siga una distribución N(0, 1).

41.

42.

Ejercicio 1.
En una distribución normal N ( μ ; σ ) sabemos que el intervalo
característico de probabilidad 0,95 es ( 225 ; 375 ). Halla la media y la
desviación típica de esta distribución normal.

Ejercicio 2.
Supongamos que los tiempos de reacción de los conductores
adolescentes se distribuyen normalmente con una media de
0,53 segundos y una desviación estándar de 0,11 segundos.

A. ¿Cuál es la probabilidad de que un conductor adolescente


elegido al azar tenga un tiempo de reacción inferior a 0.65
segundos?

4. DISTRIBUCIÓN EXPONENCIAL
La distribución exponencial suele referirse a la cantidad de tiempo que
transcurre hasta que se produce algún evento específico.

Las distribuciones exponenciales se utilizan habitualmente en


cálculos de fiabilidad de productos, es decir, el tiempo que dura un
producto.

La variable aleatoria de la distribución exponencial es continua y


suele medir el paso del tiempo, aunque puede utilizarse en otras
aplicaciones. Las preguntas típicas pueden ser: "¿cuál es la
probabilidad de que algún evento ocurra en los próximos xx horas
o días, o cuál es la probabilidad de que algún evento ocurra
entre x1x1 horas y x2x2 horas, o cuál es la probabilidad de que el
evento dure más de x1x1 horas para llevarse a cabo" En resumen,
la variable aleatoria X es iguala (a) el tiempo entre eventos o(b)
el paso del tiempo para completar una acción, por ejemplo,
esperar a un cliente. La función de densidad de probabilidad viene
dada por:

e(x)=1μe–1μxe(x)=1μe–1μx
donde μ es el tiempo promedio de espera histórico.

y tiene una media y una desviación típica de 1/μ.

Una forma alternativa de la fórmula de la distribución exponencial


reconoce lo que suele llamarse el factor de decaimiento. El factor
de decaimiento simplemente mide la rapidez con la que la
probabilidad de un evento disminuye a medida que la variable
aleatoria X aumenta. Cuando

Ejercicio 1.

Supongamos que X = la cantidad de tiempo (en minutos) que un


empleado de correos pasa con un cliente. A partir de los datos
históricos, se sabe que el tiempo promedio es de cuatro minutos.

Dado que μ = 4 minutos, es decir, el tiempo promedio que el


dependiente pasa con un cliente es de 4 minutos. Recuerde que
seguimos calculando probabilidad y por tanto nos tienen que decir
los parámetros poblacionales como la media. Para hacer cualquier
cálculo, necesitamos conocer la media de la distribución: el
tiempo histórico de prestación de un servicio, por ejemplo.
Conocer la media histórica permite calcular el parámetro de
decaimiento, m.

m=1μm=1μ. Por lo tanto, m=14=0,25m=14=0,25.

Cuando la notación utiliza el parámetro de decaimiento, m, la


función de densidad de probabilidad se presenta como e(x) = me–
mxe(x) = me–mx, que es simplemente la fórmula original
con m sustituido por 1μ1μ, o e(x)=1μe–1μxe(x)=1μe–1μx.

Para calcular las probabilidades de una función de densidad de


probabilidad exponencial, tenemos que utilizar la función de
densidad acumulada. Como se muestra a continuación, la curva de
la función de densidad acumulada es:

f(x) = 0,25e–0,25x donde x es al menos cero y m = 0,25.

Por ejemplo, f(5) = 0,25e(–0,25)(5) = 0,072. Es decir, la función tiene un


valor de 0,072 cuando x = 5.
El gráfico es el siguiente:

Observe que el gráfico es una curva descendente. Cuando x = 0,

f(x) = 0,25e(−0,25)(0) = (0,25)(1) = 0,25 = m. El valor máximo en el


eje y es siempre m, uno dividido entre la media.

Ejercicio 2.
Hallar la probabilidad de que una persona tarde más de una hora
revisando su correo, si la distribución de probabilidades es
exponencial, con parámetro λ = 0.2.

Solución
Se debe calcular P [x ≥ 60], puesto que 1 hora equivale a 60
minutos y se pide la probabilidad de que la persona tarde 60
minutos o más en revisar el correo. La probabilidad se calcula con
la misma integral presentada al comienzo, solo cambiando los
límites de integración:

El valor obtenido es pequeño, por lo que es muy poco probable


que una persona se demore más de una hora en revisar su correo
electrónico.

5. REGRESIÓN LINEAL
El análisis de la regresión lineal se utiliza para predecir el valor de una variable
según el valor de otra. La variable que desea predecir se denomina variable
dependiente. La variable que está utilizando para predecir el valor de la otra
variable se denomina variable independiente.
Esta forma de análisis estima los coeficientes de la ecuación lineal, involucrando
una o a más variables independientes que mejor predicen el valor de la variable
dependiente. La regresión lineal se ajusta a una línea recta o a una superficie que
minimiza las discrepancias entre los valores de salida previstos y reales. Hay
calculadoras de regresión lineal simple que utilizan el método de “mínimos
cuadrados” para determinar la línea que mejor se ajusta para un conjunto de datos
pareados. A continuación, se calcula el valor de X (variable dependiente) con
respecto a Y (variable independiente).

Ejercicio 1.
Las empresas suelen utilizar la regresión lineal para comprender la relación
entre el gasto en publicidad y los ingresos.

Por ejemplo, podrían ajustarse a un modelo de regresión lineal simple


utilizando el gasto en publicidad como variable de predicción y los ingresos
como variable de respuesta. El modelo de regresión tomaría la siguiente
forma:

ingresos = β 0 +β 1 (gasto publicitario)


El coeficiente β 0 representaría los ingresos totales esperados cuando la
inversión publicitaria es cero.
El coeficiente β 1 representaría el cambio promedio en los ingresos totales
cuando la inversión publicitaria aumenta en una unidad (por ejemplo, un
dólar).
Si β 1 es negativo, significaría que una mayor inversión publicitaria se asocia
con menos ingresos.
Si β 1 está cerca de cero, significaría que la inversión publicitaria tiene poco
efecto sobre los ingresos.
Y si β 1 es positivo, significaría que una mayor inversión publicitaria se asocia
con más ingresos.
Dependiendo del valor de β 1 , una empresa puede decidir disminuir o
aumentar su gasto publicitario.

Ejercicio 2.
Los científicos agrícolas suelen utilizar la regresión lineal para medir el efecto
de los fertilizantes y el agua en el rendimiento de los cultivos.
Por ejemplo, los científicos pueden usar diferentes cantidades de fertilizante
y agua en diferentes campos y ver cómo afecta el rendimiento de los
cultivos. Pueden ajustarse a un modelo de regresión lineal múltiple
utilizando fertilizantes y agua como variables predictoras y el rendimiento
del cultivo como variable de respuesta. El modelo de regresión tomaría la
siguiente forma:

rendimiento del cultivo = β 0 + β 1 (cantidad de fertilizante) +


β 2 (cantidad de agua)
El coeficiente β 0 representaría el rendimiento esperado del cultivo sin
fertilizante ni agua.
El coeficiente β 1 representaría el cambio promedio en el rendimiento del
cultivo cuando el fertilizante se incrementa en una unidad, asumiendo que la
cantidad de agua permanece sin cambios.
El coeficiente β 2 representaría el cambio promedio en el rendimiento del
cultivo cuando el agua se incrementa en una unidad, asumiendo que la
cantidad de fertilizante permanece sin cambios.
Dependiendo de los valores de β 1 y β 2 , los científicos pueden cambiar la
cantidad de fertilizante y agua utilizados para maximizar el rendimiento del
cultivo.

6. COEFICIENTE DE CORRELACIÓN DE PEARSON


El coeficiente de correlación de Pearson es una prueba que mide la relación
estadística entre dos variables continuas. Si la asociación entre los elementos no
es lineal, entonces el coeficiente no se encuentra representado adecuadamente.

El coeficiente de correlación puede tomar un rango de valores de +1 a -1. Un


valor de 0 indica que no hay asociación entre las dos variables. Un valor mayor
que 0 indica una asociación positiva. Es decir, a medida que aumenta el valor de
una variable, también lo hace el valor de la otra. Un valor menor que 0 indica una
asociación negativa; es decir, a medida que aumenta el valor de una variable, el
valor de la otra disminuye.

Para llevar a cabo la correlación de Pearson es necesario cumplir lo siguiente:

 La escala de medida debe ser una escala de intervalo o relación.


 Las variables deben estar distribuida de forma aproximada.
 La asociación debe ser lineal.
 No debe haber valores atípicos en los datos.

Ejercicio 1.

Una persona rellena semanalmente una quiniela y un boleto de lotería primitiva, anotando
el número de aciertos que tiene. Durante las 4 semanas del mes de febrero, los aciertos
fueron :

Semana 1ª 2ª 3ª
Aciertos en la quiniela 6 8 6
Aciertos en la primitiva 1 2 2

Obtener el coeficiente de correlación lineal e interpretarlo. ¿Ofrecerían confianza las


predicciones hechas con las rectas de regresión?

xi yi xi2 yi2 xi · yi
6 1 36 1 6
8 2 64 4 16
6 2 36 4 12
8 1 64 1 8
28 6 200 10 42

Ejercicio 2.
Vamos a ver cómo calcular el coeficiente de correlación lineal mientras
resolvemos el siguiente ejercicio:

Se sabe que el número de clientes diarios de un núcleo de población que


acuden a un centro comercial depende de la distancia entre ambos. Los
datos de seis centros comerciales y sus distancias a un núcleo de población
son los siguientes:

a) Hallar la media de cada variable

b) Hallar el coeficiente de correlación lineal

Apartado a:

Vamos a calcular la media de cada variable:

En primer lugar, colocamos ambos valores en una tabla, donde en la última


fila realizamos la suma total:

La media de x, será igual a la suma de los valores de x, entre el número total


de datos de x:
El número total de datos es igual a 6:

Y la suma de todos los valores x lo obtengo de la última fila de la primera


columna de la tabla. Por tanto, la media de x es:

La media de «y», será igual a la suma de los valores de «y», entre el número
total de datos de «y»:

El número total de datos es igual a 6 y la suma de los valores «y» lo obtengo


de la última fila de la segunda columna de la tabla. La media de «y» es:

Ahora vamos a calcular la des

Apartado b:

Vamos a calcular el coeficiente de correlación lineal y para ello aplicamos su


fórmula correspondiente:
En este caso, los valores se repiten sólo una vez, por lo que f es igual a 1,
tanto en la covarianza como en las desviaciones típicas de cada variable:

Por tanto, la f desaparece de las fórmulas (porque multiplicamos por 1) y me


quedan así:

Para calcular la covarianza tengo que calcular la suma de la multiplicación de


cada valor de x por su valor de «y» correspondiente. Eso lo hago añadiendo
una tercera columna a la tabla, donde en cada fila multiplico x por «y» y en
la última fila sumo el valor de todas las multiplicaciones:
Ese dato, lo sustituyo en la fórmula, junto con el de N, que es 6 y el de la
media de cada variable, que las he calculado en el apartado anterior y opero:

Ahora voy a calcular las desviaciones típicas de x y de «y». Para ello necesito
la suma de todos los valores de x y de «y» elevados al cuadrado y eso lo
calculo añadiendo dos columnas más a la tabla, una donde elevo al
cuadrado cada valor de x de la fila y otro donde elevo al cuadrado cada valor
de «y» de la fila. En la última fila de cada columna sumo todos los valores de
la columna:

La suma de todos los valores de x al cuadrado la obtengo de la última fila de


la cuarta columna. Sustituyo ese valor en la formula, junto con el de N y la
media de x y opero:

La suma de todos los valores de «y» al cuadrado la obtengo de la última fila


de la quinta columna. Sustituyo ese valor en la formula, junto con el de N y
la media de «y» y opero:
Una vez tengo los valores de la covarianza y de ambas desviaciones típicas,
procedo a calcular el coeficiente de correlación lineal:

Vemos que r es muy próximo a -1, lo que quiere decir, que los puntos se
ajustan bastante a una recta con pendiente negativa.

[Link]

[Link]

[Link]
distribucion-exponencial

[Link]

[Link]

También podría gustarte