Facultad de Ciencias Económicas Cdra.
Alejandra Schkop
Prof. Lic. Víctor Rodríguez
Unidad 3: “Variable Aleatoria Discreta”
Variables aleatorias – Concepto:
Resulta interesante y algunas veces necesario, asociar a cada uno de los elementos de un suceso una medida
cuantitativa.
Una variable aleatoria es una descripción numérica del resultado de un experimento.
Una variable aleatoria proporciona un medio para describir los resultados experimentales empleando valores
numéricos. En efecto, una variable aleatoria asocia un valor numérico a cada uno de los resultados
experimentales. El valor numérico de la variable aleatoria depende del resultado del experimento.
La variable aleatoria (v.a.) es una función con dominio en S y codominio en lR, es decir, se le asigna a cada
elemento del espacio muestral un número real. Comúnmente se denota por una letra mayúscula como X o Y.
Entonces es X: S lR
- Si los resultados del experimento son numéricos (contamos o medimos) los valores que toma la variable
aleatoria coinciden con los resultados del experimento.
Ejemplo: Observar los sueldos mensuales de los empleados del municipio de todas las categorías.
El espacio muestral puede ser S 0,donde X: “sueldo mensual empleado municipio” y X(i)=i donde i es
cualquier elemento de S.
Ejemplo: En el experimento de lanzar un dado legal y observar la cara hacia arriba, el espacio muestral S es S=
{1, 2, 3, 4, 5, 6} y la variable aleatoria definida X(1)=1; X(2)=2; X(3)=3,…,X(6)=6 Es decir X(i) = i, siendo i = 1,…,
6.
En este experimento “salir 5” o “salir 3” implica como resultado la cara del dado con 5 o 3 puntos, no el número 5
o 3. Pero para los fines de nuestro estudio podemos considerarlos resultados numéricos.
- Si el resultado del experimento es cualitativo y no me induce a ningún ordenamiento específico, hacemos
corresponder a cada resultado un número arbitrariamente. A dichas variables se las denomina “variables
aleatorias categóricas nominales”.
Ejemplo: En el experimento de lanzar una moneda legal y observar la cara hacia arriba, S={c, s}, la variable
aleatoria puede ser X(c) = 1 y X(s) = 0.
- Si el resultado del experimento es cualitativo y me induce a un ordenamiento de sus respuestas, hacemos
corresponder a cada resultado un número respetando el orden que naturalmente imponen. Estas variables
aleatorias reciben el nombre de “variables aleatorias categóricas ordinales”.
Ejemplo: En un experimento en el que se decide estudiar la opinión sobre la atención al público en un comercio,
donde la variable aleatoria es “opinión sobre la atención de los empleados”, el espacio muestral es:
S= {Excelente; Muy Buena, Buena, Regular, Mala} deberemos respetar el orden natural que imponen estas
respuestas y por ejemplo codificar dando valores a la variable aleatoria de la siguiente forma:
X (E)=5; X (MB)=4; X (B)=3; X (R)=2 y X (M)=1
Llamamos a la función variable aleatoria con letras de imprenta mayúsculas (X, Y, Z, etc) y a los valores que
dichas funciones toman con letras imprentas minúsculas (x, y, z, etc)
-1-
Facultad de Ciencias Económicas Cdra. Alejandra Schkop
Prof. Lic. Víctor Rodríguez
La variable aleatoria luego de tener un experimento aleatorio y su espacio muestral, viene a clarificar y
precisar que es lo que decidimos “medir” sobre los resultados del experimento.
A partir de definir una variable aleatoria, cada vez que nos preguntemos por determinada probabilidad,
nos conduciremos siempre con valores numéricos.
Plantearemos entonces probabilidades sobre la variable aleatoria, es decir que:
P({s / s S X(s) = x }) = P(X = x) (*)
Por abuso del lenguaje, utilizamos expresiones como la que aparece en el segundo miembro de (*), en la cual si
somos estrictos matemáticamente son erróneas, ya que estamos comparando una función (variable aleatoria X)
con un número real (x). En definitiva de aquí en más para nosotros la expresión P(X=x) expresa “la probabilidad
del evento, en el cual la variable aleatoria X toma el valor real x”.
Una variable aleatoria que toma un número finito o infinito numerable se denomina variable aleatoria discreto
mientras que una que toma un número infinito no numerable se llama variable aleatoria no discreta o continua
(Ej. medir la duración en minutos de las llamadas telefónicas de los empleados de una empresa).
A una variable aleatoria que asuma ya sea un número finito de valores o una sucesión infinita de valores tales
como 0, 1, 2, . . ., se le llama variable aleatoria discreta.
Distribuciones de probabilidad discretas
Función densidad de probabilidad:
Describe cómo se distribuyen las probabilidades entre los valores de la variable aleatoria. En el caso de una
variable aleatoria discreta x, la distribución de probabilidad está definida por una función de probabilidad,
denotada por fx(x). La función de probabilidad da la probabilidad de cada valor de la variable aleatoria.
Sea X una v.a.d., se llama función de densidad de probabilidad a: fx: lR [0, 1] de forma tal que fx(x)= P(X=x).
Esta última expresión enuncia “la probabilidad del evento, para el cual la variable X toma un valor real x”.
S lR
Gráficamente:
0
s x P(X=x)
-2-
Facultad de Ciencias Económicas Cdra. Alejandra Schkop
Prof. Lic. Víctor Rodríguez
Se puede expresar mediante la función indicadora:
1 si x A
IA(x) fx(x)= aI(x) + bI(x)+… IA: IR {0,1}
0 si x A
Además es normal expresarla mediante un gráfico de barras para obtener una Idea rápida de cómo se distribuye
una variable aleatoria.
En general, f(x) es una función de probabilidad si cumple las siguientes propiedades fundamentales:
1. fx(x) ≥ 0
2. fx(x) = 1
Función de distribución acumulada:
La función de distribución acumulativa de la variable aleatoria X es la probabilidad de que X sea menos o igual a
un valor específico de x.
Sea (S,P) un espacio de probabilidad y X: S IR una variable aleatoria discreta en S, se define la función de
probabilidad acumulada como Fx: IR [0, 1] tal que Fx(x)= P(X x). Donde x es cualquier número real, es decir
- < x < .
Por lo tanto, en el caso discreto, una variable aleatoria X está caracterizada por la función de densidad f x(x) que
representa la probabilidad puntual, y por la función de distribución acumulada Fx(x) la que representa la suma de
las probabilidades puntuales anteriores hasta el valor de x inclusive.
Toda función con dominio en IR y codominio en el intervalo [0, 1] y que cumple las siguientes 3 propiedades es
una función de distribución:
1. Lim Fx(x)= 0 y Lim Fx(x)= 1
x - x +
2. Fx es creciente en sentido amplio: x1 < x2 Fx(x1) Fx(x2)
3. Es una función continua por la derecha en cada punto, es decir, presenta saltos en los puntos x1, x2, x3…
xn de longitud igual a la probabilidad (función de densidad) en cada punto, siendo constante en los intervalos
entre los puntos de salto. En dichos puntos de saltos el valor de la función es igual al límite por derecha:
Lim Fx (x + h)= Fx(x) ; x IR
h 0+
Gráficamente:
1 2 3 x
-3-
Facultad de Ciencias Económicas Cdra. Alejandra Schkop
Prof. Lic. Víctor Rodríguez
Cuantiles de una variable aleatoria discreta
Se denomina de orden p al valor Xp que toma la variable aleatoria discreta X el cual verifica:
P(X< xp) p y P(X xp) p.
Luego Xp es el valor de la población que deja p% de las observaciones acumuladas debajo de él.
Distintas denominaciones:
Si se divide el eje de ordenadas en 100 partes iguales, el valor x p que le corresponde en el eje de abscisas a
casa fracción del eje de ordenadas se lo llama percentil de orden p, siendo p de 1 a 99.
Si se divide el eje de ordenadas en 10 partes iguales, el valor x p que le corresponde en el eje de abscisas a casa
fracción del eje de ordenadas se lo llama decil de orden p, siendo p de 1 a 9.
Si se divide el eje de ordenadas en 4 partes iguales, el valor xp que le corresponde en el eje de abscisas a casa
fracción del eje de ordenadas se lo llama cuartil de orden p, siendo p de 1 a 3.
Por ejemplo la mediana es el segundo cuartil, o lo que es lo igual al quinto decil o cincuenta percentil. Me=x0,5. La
mediana determina el valor de la variable aleatoria que deja por debajo el 50% de la población y el 50% encima
de él.
Características de una variable aleatoria discreta
Esperanza o valor esperado ()
El valor esperado, o media, de una variable aleatoria es una medida de la localización central de la variable
aleatoria. A continuación se da la fórmula para obtener el valor esperado de una variable aleatoria x.
Sea x una variable aleatoria discreta, X(S) el conjunto de los valores de X, la esperanza es igual a:
E(x)= = x.fx(x).
x
es un valor promedio y no es necesariamente un posible resultado del experimento. Cuando los datos son
equiprobables, representa el “promedio”, si no son equiprobables representa el camino central que sigue o
tendencia.
Propiedades de :
1. Sea x una variable aleatoria discreta y P(x=c)= 1; c IR entonces E(x)= E(c)= c
La esperanza de una constante es la misma constante.
2. Sea x una variable aleatoria discreta y a IR entonces E(a.x)= a. E(x)
Lo mismo ocurre si se calcula la esperanza de una constante por una función, donde el producto es la constante
por la esperanza de la función.
E(a.g(x))= a. E(g(x))
3. Sean g y h dos funciones cualquiera definidas en IR, g(x) y h(x) también son variables aleatorias y
E(g(x) + h(x))= E(g(x)) + E(h(x))
-4-
Facultad de Ciencias Económicas Cdra. Alejandra Schkop
Prof. Lic. Víctor Rodríguez
Varianza
Aunque el valor esperado proporciona el valor medio de una variable aleatoria, también suele ser necesaria una
medida de la variabilidad o dispersión. Así como en el capítulo 3 se usó la varianza para resumir la variabilidad
de los datos, ahora se usa la varianza para resumir la variabilidad en los valores de la variable aleatoria.
La esperanza de una variable aleatoria discreta es de especial importancia para estadística, pues describe el
lugar donde se centra la distribución de probabilidad. Por sí misma, sin embargo, no da una descripción
adecuada de la forma de la distribución, por lo q se necesita caracterizar con una medida de variabilidad en la
distribución de una variable aleatoria, es decir, la dispersión de sus observaciones alrededor de la media. A dicha
medida se la llama varianza de una variable aleatoria X, y se denota var(x) o ²x.
La varianza es una medida de la dispersión o variación de los valores de la variable aleatoria alrededor de . Si
los valores tienden a concentrarse alrededor de la media, la varianza es pequeña; en tanto que si los valores
tienden a distribuirse lejos de la media, la varianza es grande.
Varianza pequeña
Varianza grande
Entonces sea x una variable aleatoria discreta con función de probabilidad f x y esperanza . La varianza de x es:
Var(x)= ²x= E[(x-)²]= (x-)² . fx(x)
x
Observaciones:
La cantidad x- se llama “desvío de una observación” respecto de su media.
Como estas desviaciones se elevan al cuadrado y luego de promedian, la var(x) será mucho menor para
un conjunto de valores de x que sean cercanos a que para un conjunto de valores que varíe en forma
considerada de .
Debido a que la unidad de var(x) es el cuadrado de la unidad con que trabaja la variable aleatoria x, para
poder interpretar ese dato comparándolo con se utiliza la raíz cuadrada positiva de la varianza, es
decir , medida que denominamos desviación estándar. Entonces: x= var(x)
Para un cálculo más rápido se utiliza: Var(x)= E(x²) – E(x)²
Propiedades de la varianza:
1. La varianza de una constante es igual a cero. Var(c)= 0
2. La varianza de una constante por una variable es igual al producto de la constante elevada al
cuadrado por la varianza de la variable.
Var(c.x)= c² . var(x)
3. Sea a y b IR entonces var(ax + b)= a² – var(x)
4. La varianza de la suma de variables independientes es igual a la suma de sus varianzas. Es decir, si
X, Y son variables aleatorias independientes:
Var(x +/- y)= var(x) +/- var(y)
-5-
Facultad de Ciencias Económicas Cdra. Alejandra Schkop
Prof. Lic. Víctor Rodríguez
Modelos matemáticos de distribución discreta
A menudo, las variables aleatorias generadas en diferentes experimentos se pueden describir con
la misma distribución de probabilidad y por lo tanto sus funciones de densidad se pueden representar
mediante una sola fórmula. De hecho, se necesita sólo un puñado de distribuciones de probabilidad
importantes para describir muchas de las variables aleatorias discretas que se encuentran en la práctica.
Veremos los modelos más sencillos. Existen muchos más, que derivan de pequeñas variaciones
en la naturaleza del experimento y en el comportamiento de la variable aleatoria.
❶ Modelo Bernoulli
La variable aleatoria X tiene una distribución Bernoulli de parámetro p cuando el experimento consiste
en una única realización del mismo con solo 2 posibles resultados. Este es uno de los experimentos más
simples y se llama al resultado “éxito” o “fracaso” y se denomina variable dicotómica pues solo tiene dos
posibles resultados.
Al experimento que responde a esta descripción se lo indica de la siguiente forma:
X Be(p) y se lee “la variable aleatoria X tiene una distribución Bernoulli de parámetro p, donde p es la
proporción de éxitos”.
En este caso el espacio parametral, es decir, el conjunto de todos los posibles valores que toma el o los
parámetros que caracterizan a la distribución, es = (0, 1) ya que p es el parámetro que caracteriza a la
distribución Bernoulli y es una probabilidad.
= p
fx(x)= p (1-p) ¹ ˉ . I(x)
Su función densidad es: {0, 1} ²= p
var(x)= p(1-p)
❷ Modelo Binomial X Bi(n, p)
La variable aleatoria x tiene una distribución Binomial de parámetros n y p con espacio parametral:
={(n, p) / n Z+ p (0, 1)} si y sólo si posee las siguientes características:
Se repite n veces un experimento Bernoulli. El experimento consiste en una serie de n ensayos idénticos.
La variable es dicotómica. En cada ensayo hay dos resultados posibles. A uno de estos resultados se le
llama éxito y al otro se le llama fracaso.
La probabilidad de éxito de mantiene constante (p= k) en cada ensayo del experimento. La probabilidad
de éxito, que se denota p, no cambia de un ensayo a otro. Por ende, la probabilidad de fracaso, que se
denota 1 – p, tampoco cambia de un ensayo a otro.
Los n ensayos son independientes entre sí
Su función de densidad es:
El número que aparece delante, expresa la combinación posible de los x éxitos en los “n” ensayos, situación que
podemos resumir en el número combinatorio:
Recordar que esta combinación se resuelve como:
En las calculadoras científicas suele aparecer con la simbología nCr.
Aceptamos sin demostración que: = n.p
var(x)= n.p.(1-p)-6-
Facultad de Ciencias Económicas Cdra. Alejandra Schkop
Prof. Lic. Víctor Rodríguez
❸ Modelo Geométrico
Las características del experimento difieren del realizado para obtener valores de una variable binomial,
en este caso el número de veces que se puede realizar el mismo ensayo de tipo Bernoulli, puede ser
hasta infinito, nuevamente existe una variable dicotómica (éxito o fracaso) y hay independencia
estadística. Finalmente la probabilidad, como consecuencia de lo anterior, se mantiene constante en
cada ensayo.
A la variable aleatoria del experimento se la denota X G(p) y se lee: la variable aleatoria X tiene una
distribución geométrica de parámetro p y con espacio parametral = {p / p (0, 1)}
Su función de probabilidad es: fx(x)= p (1-p) . I(x)
{0, 1, 2,…n,…}
Aceptamos sin demostración que: = 1- p
p
var(x)= 1- p
p²
❹ Modelo Poisson
Los experimentos que dan valores numéricos de una variable aleatoria X que representa el número de
eventos independientes que ocurren a una velocidad constante en el tiempo o en el espacio, responden
a un modelo Poisson.
X P() donde es el número promedio de ocurrencias del evento por unidad de tiempo transcurrido y
de espacio parametral = IR+. Sus características son:
Los eventos ocurren a una velocidad constante en tiempo o espacio ()
El número de resultados que ocurren en un intervalo o región específica es independiente del
número que ocurre en cualquier otro intervalo o región del espacio disjunto.
Ofrece una aproximación excelente a la función de probabilidad binomial cuando p es pequeño
(p 0,05) y n grande (n> 20) donde la esperanza de la variable es igual al valor esperado de la
distribución binomial, es decir, = n.p
=
Aceptamos sin demostración que: var(x)=
-7-