TEORÍA DE PROBABILIDADES
CONFERENCIA #3 Variables aleatorias. Clasificación. Funciones que caracterizan VA.
Función de probabilidad y Función de distribución. Características
Numéricas de las Variables Aleatorias. Medidas de tendencia
central y medidas de dispersión.
TEMA II. Variables aleatorias y funciones de distribución
CONTENIDO. Variables aleatorias. Clasificación
Leyes de probabilidad de las VAD. Propiedades. Función de distribución.
Medidas de Tendencia Central y de Dispersión para VAD.
Objetivo
Que los estudiantes sean capaces de identificar, en las diferentes situaciones de la vida,
variables aleatorias, clasificando estas en discretas y continuas. Además, que los estudiantes
logren una familiarización con los conceptos de funciones de probabilidad y de distribución
y sus propiedades. Calcular las características numéricas de las variables aleatorias
discretas.
Introducción
En la conferencia anterior concluimos el estudio del tema I sobre el estudio de los
fenómenos aleatorios.
Lo esencial de todo el tema es el estudio de los eventos, las operaciones entre ellos y él
cálculo de probabilidades aplicando las distintas definiciones (clásica, frecuencial, y el
desarrollo axiomático). Además vimos como una herramienta de apoyo importante el uso
de los diagramas de Venn.
Mas adentrado en el tema estudiamos los conceptos de probabilidad condicional, regla de
multiplicación, formula de probabilidad total, teorema de bayes.
Pregunta de control
1. ¿Cuándo se puede plantear que dos eventos A y B son independientes?
2. ¿Cuándo aplicamos el concepto de probabilidad condicional?
El contenido que se inicia con esta conferencia se caracteriza por la generalidad del enfoque
con que se estudian los fenómenos aleatorios en su comportamiento hasta ahora hemos
aprendido a calcular las probabilidades de eventos en espacios muestrales finitos, utilizando
fundamentalmente las nociones de teoría de conjuntos y de la teoría combinatoria y sus
funciones de distribuciones y leyes de probabilidad. (Mostrar asunto).
Desarrollo
La noción de VA esta asociado al concepto de probabilidad de ocurrencia de un evento, y
es también una correspondencia que se establece entre cada resultado de un fenómeno o
experimento aleatorio y un # real determinado, pero desde otro punto de vista distinto al de
la probabilidad.
Veamos esta correspondencia a través de algunos ejemplos:
Es posible que nos interese, por ejemplo, determinar él # de veces que se obtiene cara, en
cinco lanzamientos de una moneda, él # de piezas defectuosas que aparecen en un lote de n
piezas, el tiempo de vida de un tubo electrónico, etc.
Analicemos un ejemplo mas profundo.
Consideremos una urna que contiene 5 bolas: 3 blancas y dos negras. Si se realiza el
experimento de extraer una muestra de tamaño 2, sin remplazamiento, la cantidad de bolas
blancas que contiene cualquiera de las muestras extraídas, es una variable aleatoria, que se
puede denotar y escribir como:
X: # de bolas blancas en la muestra extraída
Así si tenemos los eventos: (exhaustivos)
A: Ambas bolas sean amarillas
(B, B)
B: Una bola es blanca
(B, N)
C: Las dos bolas sean negras
(N, N)
Entonces se dice que x puede tomar los valores.
X=0,1,2
Notan que P(A)=P(x=0)
Variable aleatoria:
Dado un espacio de probabilidad (S, A, P) una variable aleatoria es una función definida en
dicho espacio, que aplica S en R, de tal manera que la imagen inversa de cada intervalo de
R, es un evento de S.
En símbolos: X: S___R
S___X(s)
En general empleamos la letra mayúscula como notación
Clasificación de las variables aleatorias
Discretas: Toman un conjunto de valores numerales, que puede ser finito o infinito
Ej: # de artículos defectuosos en un lote de 200 artículos.
Cantidad de personas que llegan a una cola en un tiempo t.
Continuas : Toman todos los valores de un cierto intervalo R.
Ej: Estatura de las personas
Peso de un paquete
Esta clasificación es importante desde el punto de vista matemático, pues las técnicas de
calculo de probabilidades dependerán de esta característica.
A continuación abordaremos de distintos tipos de funciones asociadas a las variables
aleatorias, tanto discretas como continuas, que son: la función de probabilidad, la función
de densidad y la función de distribución.
Es bueno aclarar desde ahorra, que el hecho de calcular la probabilidad de un evento o
suceso por diversas formas o utilizando las funciones que estudiaremos, no altera su valor
de probabilidad, porque todas son valores que expresan de un modo u otro la ley de
probabilidad que cumple la V.A empleada.
Función de probabilidad: (p 154 y 155)
Consideramos una V.A discreta X, que toma los valores X1, X2, Xn y sea p1, p2, Pn, la
probabilidad de ocurrencia de estos valores. Con estos elementos se puede definir una
función p, del conjunto R en el intervalo (0,1), subconjunto de R, del segmento modo:
P : R--- (0,1)
x--- p(x)
Donde P1, x=x1
P2, x=x2
. .
P(x)= . .
. .
Pn,x=xn
0, para otros valores de x
Como x1,x2,….,xn son todos los posibles valores de x y además la intersección de dos
cualquiera de ella se vacía se puede afirmar que:
P(x=x1)+P(x=x2)+…..+P(x=xn)=1
Luego:
pi=1, p(x)=1 R -----caracteriza la función de probabilidad (concepto pp. 155)
Ver ejemplos p.156 y 157
Función de distribución.
Hasta ahorra hemos visto la probabilidad de que una variable aleatoria discreta tome un
valor determinado. En determinados problemas, es posible que nos interese conocer la
probabilidad de una v.a tome valores menores o iguales que un cierto valor t.
Ej. : Sea x que tome los valores 0,1,2,3,4,5,6
Se puede definir el evento {x<=2,5) y plantear su probabilidad como:
P(x<=2,5)=P(x=0)+P(x=1)+P(x=2)
Es por tanto, beneficio construir una función que de directamente valores de probabilidad
de los eventos de la forma {xt}. A esta función se denomina Función de distribución.
Se denota como Fx(t)=p(x<=t), R
De la definición se infiere, que a toda variable, tanto discreta como continua, puede
asociarse su función de distribución.
En el caso de variables aleatorias discretas, para calcular F se emplea:
Fx(t)=p(x)
Si F es discreta podemos decir que X es va discreta.
Propiedad 1: la función de distribución F es una función no decreciente.
Fx(t1)<=Fx(t2), si t1<t2
P(xt1)<=P(xt2)
Propiedad 2: lim Fx(t)=0 o Fx(-)=0
t -
El conjunto de los ptos S tales que X(s) sea menor que -; es el evento imposible.
Propiedad 3: lim Fx(t)=1 o Fx(+)=1
t +
Propiedad 4: P(X>t)=1-Fx(t) o P(X>t)=1-P(x<=t)
Propiedad 5: La probabilidad de que una variable aleatoria X tome valores en {a,b}, se
calcula como: P(a<xb)=Fx(b)-Fx(a)
Variables discretas:
En el caso de estas variables la probabilidad en un punto se debe tener en cuenta.
Algunas formulas de cálculo en intervalo son:
P(a<x<=b)=Fx(b)-Fx(a)
P(a<=x<=b)=Fx(b)-Fx(a)+p(a)
P(a<x<b)=Fx(b)-Fx(a)-p(b)
P(a<=x<b)=Fx(b)-Fx(a)+p(a)-p(b)
Las características numéricas fundamentales de las variables aleatorias se agrupan en:
Medidas de tendencia central.
Medidas de dispersión.
Medidas de tendencia central, (también denominados promedios, o estadígrafos de
posición), son valores que se utilizan como indicadores y son por ello representativos de un
conjunto de datos o resultados de un experimento aleatorio. Estos valores tienden a ocupar
el centro en el grupo de datos que se estudian (de su fenómeno).
El valor esperado, valor medio o media
El valor esperado se obtiene a partir de una aplicación del promedio aritmético (al que
llamaremos X) a las variables aleatorias.
Supongamos que: se realiza un experimento en que se mide n veces un parámetro que
denotaremos por: a1, a2, a3, an. El promedio de dichas mediciones se calculara como:
a1+a2+...+an=∑ai =X
n n
Si en esas mediciones algunas se repitieron, por ejemplo:
n1: cantidad de datos con valor x1.
n2: cantidad de datos con valor x2.
.
.
.
nk: cantidad de datos con valor xk.
resultara : n=n1+n2+...+nk y la expresión del promedio quedaran como
n1x1+n2x2+...nkxk=∑n1x1=X
n n
Si recordamos del tema I que la frecuencia relativa de un resultado es el # de veces que
aparece ese resultado entre el # total de pruebas realizadas tendremos entonces que:
fi=ni/n=frecuencia relativa de xi y el promedio calculado anteriormente se podría expresar
como: X=∑fi * xi.
Considerando que sea realizado un número considerable de pruebas la frecuencia relativa es
una medida de la probabilidad de ocurrencia de un evento por tanto sobre la base de este
concepto, podemos sustituir las frecuencias fi por los valores de probabilidad, quedando:
X=∑pi * xi.
Cuando se consideran las probabilidades de ocurrencia de cada valor de la variable, esta
suma es llamada: Valor esperado de la variable, que denotaremos como E(x) y que tendrá
su forma de cálculo en dependencia del tipo de variable aleatoria que se trate, esto es:
Si X es una v.a. discreta con función de probabilidad p(x):
E(x)= ∑X * p(x) (si la serie converge).
Propiedades del Valor esperado
E(c) = c E(5)=5
E(cx)= c*E(x) E(2x)= 2E(x)
E(x+y)= E(x) + E(y)
Generalizando 2 y 3:
E[c1x1 + c2x2 + ... + cnxn] = c1*E(x1) + c2*E(x2) + ... + cn*E(xn)
E(x*y)= E(x) * E(y) (Si x e y son independientes)
Ejemplo:
Si x e y son dos variables aleatorias independientes con:
E(x)= 2 y E(y)= 5
Calcule el valor esperado de:
a) z=x+3y+5 b) w= 2x*y
Solución:
E(z) = E[x+ 3y + 5]= E(x) + 3E(y) + E(5) = 2 + 3*(5) + 5 = 22
E(w) = E(2x*4) = 2 * E(x*y) = 2 E(x) * E(y) = 2 * (2) * (5) = 20
Aunque la información que brinda una medida de tendencia central, en la mayoría de los
casos es suficiente, a veces es necesario determinar hasta qué punto se encuentran próximas
o no al promedio los datos del problema, es decir cuanto es su desviación o dispersión y de
ahí la necesidad de calcular:
Medidas de variación: Permiten medir la dispersión que tienen los valores de la variable
respecto al valor central. Se estudiarán dos medidas de este tipo, la varianza y la desviación
típica.
Varianza:
Es el valor esperado de los cuadrados de las desviaciones de los valores de x respecto al
valor esperado.
Se denota mediante σ2(x) y es, según su definición:
σ2(x) = E[x –E(x)] 2
Según el tipo de variable aleatoria que tratemos, este es:
[Link]: σ2(x) = ∑ [x –E(x)] 2 * P(x)
xєR
∞
Sin embargo, existe un método más simple de cálculo que se obtiene a partir de la
definición (Página 249), de donde queda:
σ2(x) = E(x2) – [ E(x)] 2
Que es la expresión que utilizaremos en lo adelante para el cálculo de la varianza.
Recordando que:
[Link]: = E(x2) = ∑ x 2 * P(x)
xєR
Veamos un gráfico donde se analiza como pueden dispersarse los datos alrededor de su
valor medio.
Grafico aquí
σ2(x1) < σ2(x2)
La varianza por su definición tiene dimensión cuadrática y los valores de la variable
aleatoria tienen dimensión lineal, por lo que se requiere una medida de variación en la
misma dimensión de la variable aleatoria, esta es la desviación típica: σ(x) = + √ σ2(x).
Propiedades de la varianza:
σ2 (c) = 0 σ2 (5) = 0
σ2 (cx) = C2 * σ2 (x) σ2 (4x) = 16 σ2 (x)
Si x e y son variables aleatorias independientes:
σ2 (x + y) = σ2 (x) + σ2 (y)
Generalizando si x1,x2,....,xn son (v.a) independientes:
σ2 (c1x1 + c2x2 + .... + c nxn) = (C1)2 σ2 (x1) + (C2)2 σ 2(x2) + .... +(Cn)2 σ2 (xn)
Aplicando la propiedad anterior podemos plantear que:
σ2 (x - y) = σ2 (x) + (-1)2 σ2 (y)
= σ2 (x) + σ2 (y)
Las propiedades de la varianza no se cumplen para la desviación típica, es decir:
σ (x + y) ≠ σ (x) + σ (y)
σ (x + y) = √ σ2 (x + y)
σ (x + y) = √ σ2 (x) + σ2 (y)
Ejemplo: Si x e y son v.a. independientes con σ2 (x) = 3 y σ2 (y) = 4 calcule:
σ2 (2x + y)
σ2 (2x + y) = σ2 (2x) + σ2 (y) = 4 σ2 (x) + σ2 (y)= 4 (3) + 4 = 16
b) σ (x + 2y) Es posible calcular esto sumando las desviaciones típicas de ambas variables?
No, porque σ (x + 2y) ≠ σ (x) + σ (2y)
Por tanto σ2 (x + 2y) = √ σ2 (x + 2y) = √ σ2 (x) + 4σ2 (y)= √ 3 + 4 (4) = √ 19
Conclusiones
Establecer las conclusiones de clase, enfatizando en la necesidad de reconocer el carácter
de la VA (si es discreta o continua) y las funciones que las caracterizan y cómo calcular sus
características numéricas.
Trabajo Independiente:
Autoexamen pp. 192 a 194 l/t
Ej. Resuelto pp. 175 a 185 l/t
Ej. Propuestos pp. 187 a 192 l/t
Contenido l/t pp. 187 a 194 l/t
Bibliografía:
Probabilidades y Estadística para ingenieros. Walpole, 35-50, Miller, 68-80.