Variables Aleatorias Teoria - 2023
Variables Aleatorias Teoria - 2023
VARIABLE ALEATORIA
Ejemplo 1:
={varón, mujer},
X(varón)=0; X(mujer)=1
Una variable aleatoria discreta es aquella cuyo conjunto imagen o su espacio muestral
es un conjunto finito o infinito numerable.
Ejemplo 2:
Identificaremos con el valor numérico 0 (cero) al suceso soltera, con el valor numérico 1(uno)
al suceso casada, con el valor numérico 2 (divorciada) y con el 3 (tres) a viuda
Los distintos estados que puede tomar la variable, determina un conjunto denominado
conjunto imagen de X o recorrido de la variable aleatoria X, y se denota X().
X() = { 1,2,3,4,}
Observe que esta variable aleatoria discreta, toma un número finito de resultados posible,
luego la clasificamos como una variable aleatoria discreta finita.
Ejemplo 3:
1
Considere el experimento contar la cantidad de infecciones de oído que un niño adquiere
durante su primer año de vida
Observe que este conjunto tiene un número infinito numerable de resultados posibles. Por lo
que la variable aleatoria la clasificamos en una variable aleatoria discreta infinita numerable.
Ejemplo 4:
Considere la variable aleatoria X: “El peso de una persona adulta (en Kg)”: El recorrido de
esta variable es, X() = [40; 120]
Ejemplo 5:
Con cada resultado posible de la variable aleatoria, xi, asociamos un número que es su
probabilidad de ocurrencia. Teniendo esto en cuenta es posible desarrollar una función
matemática que asigne a cada realización de la variable aleatoria X una determinada
probabilidad. Esta función se denomina función de probabilidad y la representaremos
simbólicamente con f(x).
Anotación:
f(x) = P(X=x), que significa “probabilidad de que la variable aleatoria tome el valor x”
xi f(x)=P(X=x)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
Total 6/6= 1
En el caso de una variable aleatoria discreta, una distribución de probabilidad enlista cada
posible resultado con sus probabilidades correspondiente. Las probabilidades nos dicen que
valores pueden ocurrir con más frecuencia que otros. Debido a que se toman en cuenta
todos los valores posibles de la variable aleatoria, los resultados son exhaustivos, por lo
tanto, la suma de sus probabilidades debe ser 1.
3
Gráfico 3-1 Representación gráfica de la distribución de probabilidad del número obtenido
en la cara superior al lanzar un dado legal
f(x)
Ejemplo 6:
4
Gráfico 3-2. Representación gráfica de la distribución de probabilidad de los grupos
sanguíneos de 50 pacientes que concurrieron a un determinado hospital
1) fX(x) 0 x de R
2) f(xi) = 1
Obsérvese que en el ejemplo anterior, del experimento lanzar un dado y observar el número
obtenido en la cara superior, que se cumple las dos propiedades.
Propiedad 1: Dado que todos los valores de la función de probabilidad son positivos y
menores que uno.
Propiedad 2: Debemos sumar todos los valores de la función de probabilidad f(x) y observar
si su resultado da 1
5
f(xi) = f(1) + f(2) + f(3) + f(4) + f(5) + f(6) = 6/6=1
La suma nos dio como resultado 1, por lo que se cumple también la segunda propiedad,
luego es una función de probabilidad.
Si una función no cumple con las propiedades fundamentales entonces no es una función de
probabilidad.
Ejemplo 7:
x Frecuencia de P(X=x)
ocurrencia de x
0 3 3/50
1 7 7/50
2 23 23/50
3 10 10/50
4 5 5/50
5 2 2/50
6
50 1
Vamos agregar a esta tabla de distribución de probabilidad, una nueva columna a la derecha
con la distribución de probabilidad acumulada F(x) P( X x).
ocurrencia de x
0 3 3/50 3/50
1 7 7/50 10/50
2 23 23/50 33/50
3 10 10/50 43/50
4 5 5/50 48/50
5 2 2/50 50/50
Total 50 1
P(X<3)=P(X=0)+P(X=1)+P(X=2)=33/50=0,66
También se puede calcular sumando las probabilidades de x=4 y x=5 obteniéndose los
mismos resultados.
7
Interpretación: La probabilidad de que un estudiante tenga 4 ó más hermanos es de 0,14.
P(2≤X≤4)= P(X≤4)-P(X≤1)=48/50-10/50=38/50=0,76
Por ejemplo, el período de incubación medio de una enfermedad puede ser 7 días y el de
otra 11 días. Aunque algunos valores individuales sean iguales, las dos distribuciones tienen
distintos puntos centrales y por lo tanto, difieren en esta característica de posición.
En la práctica hay que comentar y comparar constantemente tales mediciones. Por ejemplo
un caso sencillo sería la observación de que las personas que se dedican a una actividad
pierden en promedio 5 días por año a causa de las enfermedades, mientras que los de otra
pierden 10 días. Las dos distribuciones ocupan posiciones distintas y se procura buscar los
motivos de tal diferencia para ver si son remediables.
DISCRETA: Sea X una variable aleatoria discreta, X(Ω) el conjunto de valores que toma
la variable aleatoria X, la esperanza de X se define:
indica que hay que sumar sobre todos los diferentes valores que puede tomar la
variable aleatoria discreta.
8
Ejemplo 8:
x 0 1 2
f(x) 0,1 0,5 0,4
Al hospital le cuesta 10$ cada vez que se utiliza tal cámara. Una situación que puede
interesarnos, es conocer ¿Cuál es el valor esperado, el valor promedio, de uso diario de esa
cámara de oxígeno?. Contestar a dicho interrogante es plantearnos sobre la esperanza
matemática o valor esperado de la variable en estudio, en este caso, la variable aleatoria es:
X: “Número de veces que se utiliza la cámara de oxígeno por día”. E(X)=0 . f(0) + 1 . f(1) + 2 .
f(2) = 0 . 0,1 + 1 . 0,5 + 2 . 0,4 = 1,3
También podemos saber cuál será el costo esperado de uso diario de dicha cámara de
oxígeno: E( C ) =E( 10 000.X)= 10 000. E(X)= 10 000. 1,3 = 13 000 $ por día.
En el caso que la variable sea continua debería sumarse sobre los infinitos valores del
recorrido de la variable aleatoria y esto se realiza mediante la integración. Método que no
veremos en este curso.
Var ( X ) 2 E( X )2 (x i )2 f (x ) i
9
2
A dicha medida se la llama varianza de una variable aleatoria X, se la anota .
E( X 2 ) E( X )
2 2
Var ( X )
X: “Número de veces que se utiliza la cámara de oxígeno por día”. Calcularemos la varianza
E( X 2 ) E( X )
2 2
de la variable partir de la fórmula de cálculo: Var ( X )
Debemos calcular ahora, la esperanza del cuadrado de la variable. E(X2), esta se calcula
E( X 2 ) x2.f (x )
E(X2)=02 . f(0) + 12 . f(1) + 22 . f(2) = 0 . 0,1 + 1 . 0,5 + 4 . 0,4 = 2,1
E(X2) = 2,1
E( X 2 ) E( X )
2 2
Var ( X )
D.E.( X ) Var ( X )
Entonces, una desviación estándar grande comparada con la esperanza muestra que la
distribución de los valores de la variable, se aparta mucho del promedio, mientras que la
desviación estándar pequeña significa que está muy concentrada en torna a su esperanza.
Al establecer una comparación entre una desviación estándar y otra, recuerde que este
criterio de variabilidad se mide en las mismas unidades que las observaciones originales. Si
consideramos la talla media de un grupo de niños en edad escolar puede ser 1,22 m y la
10
desviación estándar de 0,152 m. Si calculamos su peso promedio y su desviación estándar
estará dado en kg. De esto se deduce que comparando las desviaciones estándar de las dos
variables no se puede decir por ejemplo que el peso sea una característica más variable que
la talla, porque las dos variables no se miden en las mismas unidades y la selección de
unidades tiene que influir sobre la comparación.
DISTRIBUCIÓN BINOMIAL
Ejemplos:
Se seleccionan cien escolares a quienes se les hace una reacción de tuberculina, la cual
puede ser positiva o negativa.
Se ensaya una nueva droga en treinta enfermos y los resultados individuales se
clasifican en curación o fracaso.
Se inoculan veinte ratas con una sustancia presumiblemente tóxica y se observa en cada
animal si muere o sobrevive.
11
El ensayo debe repetirse un número fijo de veces, n.
En cada ensayo los posibles resultados son sólo dos, éxito o fracaso. Son mutuamente
excluyentes y se los denota como éxito, E, y fracaso, F.
Una variable aleatoria discreta que cumpla con las condiciones anteriores se llama variable
binomial, su distribución se ajusta a la función de probabilidad:
Ejemplo 9:
Supóngase que el 24 % de cierta población tiene sangre tipo B. A partir de una muestra de
20 individuos extraída de esa población, calcular la probabilidad de:
Interpretación: La probabilidad de encontrar tres o menos de tres personas con sangre tipo
B es, aproximadamente de 0,2569, que en forma porcentual indica el 25,69 %.
Sea X una variable aleatoria con distribución binomial La esperanza de una variable binomial
está dada por:
E(X) = n . p
D.E. (X) = n . p . (1 - p) = n. p. q
Cálculo de Esperanza, varianza y Desviación estándar del ejemplo 10, cuya variable aleatoria
es; X: “cantidad de pacientes que fallecen al padecen cierta enfermedad”
X Binomial ( n = 20 ; p = 0,10 )
E (X) = n . p = 20 . 0,10 = 2
14
DISTRIBUCIÓN DE POISSON
Siendo el número promedio de ocurrencias del evento aleatorio dentro del intervalo. Esta
distribución depende del parámetro , donde es un número positivo.
Esperanza
15
La esperanza de una variable aleatoria X, con distribución de Poisson está dada por:
E(X) =
La varianza de una variable aleatoria X, con distribución de Poisson está dada por:
Var (X) =
La desviación estándar de una variable aleatoria X, con distribución de Poisson, está dada
por:
D.E. (X) =
Ejemplo 10:
Ejemplo 11:
X es una variable aleatoria Binomial, puede comprobar el lector que cumple con los requisitos,
como se observa la probabilidad de morir por la vacuna contra la gripe, p, es un valor
pequeño mucho menor que 0,05 y que el número de la muestra considerado, n, es grande en
este caso mucho mayor que 30 por lo que se puede aproximar esta variable binomial a una
variable con distribución de Poisson con error muy pequeño, por lo tanto en este ejemplo
trabajaremos ésta variable aproximándola a una Poisson.
16
X ~ B( n=100.000, p=0,00002)
P( X 3 ) = F ( 3 ) = 0,8571 85,71%
En la tabla de la distribución de Poisson se ubica el valor = 2 y de allí se busca el valor x = 3,
Interpretación: La probabilidad de morir no más de tres personas. por causa de cierta vacuna
contra la gripe es de 0,8571
Ejemplo 12:
Para un volumen fijo, el número de células sanguíneas rojas es una variable aleatoria con
distribución de Poisson. Si el número promedio para un volumen dado es de 9 células rojas
para personas normales, determinar la probabilidad de que el número de células rojas para
una persona se encuentre dentro de una desviación estándar del valor promedio y a dos
desviaciones estándar del valor promedio. Graficar la distribución de la variable aleatoria
“número de células rojas”.
= = 9 2 = = = 9 = 3
P( + X - ) = P( 6 X 12 ) = P(X 12 ) - P(X 5 ) =
P( + 2 X - 2 ) = P( 3 X 15 ) = P(X 15 ) - P(X 2 ) =
x 0 1 2 3 4 5
f(x) 0,0001 0,0011 0,0050 0,0150 0,0337 0,0607
x 6 7 8 9 10 11
f(x) 0,0911 0,1171 0,1318 0,1318 0,1186 0,0970
x 12 13 14 15 16 17
f(x) 0,0728 0,0504 0,0324 0,0194 0,0109 0,0058
x 18 19 20 21 22 23
f(x) 0,0029 0,0014 0,0006 0,0003 0,0001 0,0000
17
Representaremos a continuación el gráfico de distribución de frecuencias absolutas o gráfico de
bastones para la variable X: “ Cantidad de células rojas por volumen fijo”.
DISTRIBUCIONES CONTINUAS
18
1. Observaciones:
La probabilidad de que la variable aleatoria continua tome valor en un punto es igual a
cero.
P(X=x) =0 x R
Este modelo es tan importante en estadística que una parte considerable de la teoría del
muestreo, de la estimación y las pruebas de hipótesis se basa en sus características.
Para establecer los límites entre lo habitual y lo raro, es necesario conocer la distribución de
la variable en estudio, en individuos normales.
Existe una distribución de frecuencias teórica llamada distribución normal, que puede
considerarse como modelo adecuado para la distribución de un gran número de variables en
el campo biológico.
Esta distribución también es llamada distribución de Gauss, una variable aleatoria continua
tiene distribución normal o de Gauss si su distribución esta dada por la función de densidad:
En este modelo la variable aleatoria puede tomar cualquier valor comprendido entre menos y
más infinito.
Esta distribución depende de dos parámetros que la describen la y la varianza 2, donde
19
- < < + , y 2 > 0; ambos parámetros definen por completo a la curva normal.
El área total debajo de la curva y sobre el eje de las X vale 1. Esta propiedad se
deduce del hecho que la distribución normal es una distribución de probabilidad.
La distribución normal es simétrica respecto de su media . Debido a esta simetría el
50% del área está a la derecha de la perpendicular que se levanta sobre la media y el otro
50% está a la izquierda.
La media se denota por . La desviación estándar, representada por , especifica el
grado de dispersión respecto de la media, junto ambos parámetros y determinan
completamente la distribución normal. En otras palabras, por cada valor diferente de y se
especifica una distribución normal diferente. Los valores diferentes de trasladan la gráfica
de la distribución a lo largo del eje de las X. Los valores diferentes de determinan el grado
de aplanamiento o levantamiento de la curva de la distribución normal.
Una variable aleatoria es normal si la mayoría de sus valores están concentrados
alrededor de un valor medio y los valores de esta variable son cada vez menos frecuentes a
medida que nos alejamos de este valor medio. Las ramas de la curva se extienden
asintóticamente a los ejes, de modo que cualquier valor muy alejado de la media es posible,
aunque poco probable. La curva normal tiene forma de campana.
Tiene un máximo en x = , por lo que la distribución es unimodal.
La mediana, la moda y la media aritmética coinciden.
20
Las curvas tienen la misma varianza pero distintas medias.
Curva NEGRA Y ~ N ( = 0, 2 = 12 )
Curva VERDE Z ~ N ( = 1, 2 = 12 )
Obsérvese que las tres curvas son idénticas sólo están trasladadas en el eje x, esto se debe
que ambas tienen la misma desviación estándar lo que cambian son sus medias. Recuerde
que el área debajo de las curvas se mantienen constantes e iguales a 1.
Todas las curvas tienen la misma media pero distintas varianzas, siendo 2X < 2y < 2z
Curva NEGRA Y ~ N ( = 0, 2 = 12 )
Curva ROJA Z ~ N ( = 0, 2 = 22 )
Es importante notar que muchas son las variables aleatorias continuas de interés que se
distribuyen como una normal algunos ejemplos que podemos citar son:
21
X: “ La presión arterial”, Y: “El nivel de colesterol en la sangre”, Z: “La altura de las
personas”, W: “El peso de las personas”.
La distribución normal puede utilizarse para calcular probabilidades asociadas con estas
variables aleatorias.
La curva normal puede por tanto emplearse para calcular las probabilidades asociadas con
estas variables. Por ejemplo, en una población en la que el nivel de colesterol en la sangre
se encuentre distribuida normalmente con media y desviación estándar , podríamos tratar
de determinar la probabilidad de que un individuo elegido aleatoriamente tenga un nivel de
colesterol en sangre mayor de 250 mg./100 ml. Tal vez este conocimiento nos ayude a
planificar futuros servicios cardiacos. Puesto que el área total debajo de la curva es igual a 1,
podemos calcular la probabilidad en cuestión al determinar la proporción del área bajo la
curva que se localiza a la derecha del punto x=250 ó P(X250). Este cálculo se puede llevar
a cabo con un programa de cómputo o una tabla de áreas calculadas para la curva normal.
22
Resumen de propiedades de la distribución normal
Media
Varianza 2
Desviación Estándar
Coeficiente de sesgo 3=0
Ejemplo 14
Supongamos que frente a una determinación de glucosa en la sangre tengamos que decidir
si el valor obtenido es normal o no.
Aceptamos que la glucosa sanguínea en mg por 100 ml de sangre tiene distribución normal
con promedio 83 y desviación estándar 4. Supongamos que en un paciente se encuentra un
valor superior a 90. Para determinar si es habitual tener un valor de esa magnitud o superior,
estando sano, debemos conocer la probabilidad con que esto ocurre.
Para calcular dicha probabilidad debemos calcular el área bajo la curva normal. Para evitar
este trabajo, se han tabulado estas áreas, pero como es imposible contar con tablas para
todo posible valor de la media y varianza, dado que la variable aleatoria con distribución
23
normal puede tomar infinitos valores, resulta imposible tabular el área asociada con cada
una de las curvas normales, por lo que se ha construido sólo una tabla de áreas para la
distribución normal estándar, es decir para una normal con media 0 y desviación
estándar 1. Otra forma de calcular estas áreas es utilizando algún programa estadístico
como el R.
La distribución de una variable aleatoria normal con media cero y varianza uno se llama
distribución normal estándar
Definición:
Para poder utilizar estas tablas es necesario transformar la variable aleatoria normal X, con
media μ, y varianza 2 en una nueva variable normal Z con media cero y varianza 1.
X -
Z=
La distribución de esta nueva variable aleatoria Z, es una distribución normal estándar con
media 0 y desviación estándar 1, su anotación es, Z ~ N ( = 0 , 2 = 12 ).
Como en toda distribución con variable aleatoria continua el área total debajo la curva es
igual a 1. Cumple con todas las propiedades de la distribución normal.
24
CON DISTRIBUCIÓN NORMAL ESTÁNDAR
Algunas variables muy utilizadas en medicina como la presión arterial, las alturas de las
personas, el peso de las personas entre otras, tienen distribuciones normales y podemos
realizar el análisis descripto para observar si el resultado obtenido de un individuo puede
considerarse normal o no normal.
1. ¿Qué entiende por distribución de probabilidad? Qué formas puede tomar una
distribución de probabilidad?
2. ¿Cuáles son las propiedades que debe cumplir una función de probabilidad?
3. ¿Cuáles son los parámetros de una distribución de probabilidad?
4. ¿Cuáles son las tres propiedades asociadas a la distribución binomial?
5. ¿Cuáles son las tres propiedades asociadas a la distribución de Poisson?
6. ¿Cuándo se aproxima adecuadamente la distribución binomial por la
distribución de Poisson?
7. ¿Cuáles son las propiedades de la distribución normal?
8. ¿Cuáles son los parámetros de la distribución normal?
9. ¿Cuánto valen los parámetros en una distribución normal estándar?
10. Explique la importancia de la distribución normal estándar.
11. ¿Qué transformación utiliza para pasar de una distribución normal a una
distribución normal estándar?
12. ¿En una distribución de variable continua como se mide la probabilidad?
25