UNIVERSIDAD DE CHILE
Facultad de Ciencias Quı́micas y Farmacéuticas
Elementos de Estadı́stica - Otoño 2011
Profesores: Julio Deride S.
Ayudante: Martin Floor P..
GUIA
1 Variables Aleatorias
Sea X una variable aleatoria continua.
a) Determinar el valor de k para que la función
−x/5
ke x>0
f (x) =
0 para otro valor
sea la función de densidad de probabilidad de X.
b) Calcular P (0 ≤ X ≤ 8). En cuánto difiere de P (0 < X < 8)?
c) Determinar F (x) la distribución acumulada de X.
d) Calcule la esperanza y varianza de X.
e) Cuánto vale la esperanza y varianza de la variable aleatoria 3X y 3 + X?
2 Vectores Aleatorios
Considere un vector aleatorio (X, Y ), cuya función de densidad conjunta viene dada
por
(
3x−y
5
x ∈ [1, 2], y ∈ [1, 3]
f (x, y) =
0 en caso contrario
a. Calcule las funciones de densidad marginal fX y fY , especificando claramente
el valor de cada una para x, y ∈ R.
b. Calcule las esperanzas de cada variable E(X) y E(Y ).
c. Calcule E[XY ] y Cov(X, Y ). Concluya sobre la independencia de ambas vari-
ables.
d. Se define el coeficiente de correlación como
Cov(X, Y )
ρ= p p .
V ar(X) V ar(Y )
Calcule ρ. Comente sobre la relación que existe entre este coeficiente y el R de
una regresión lineal.
3 Test de Diagnóstico y Curvas ROC (40%)
Se estudia el comportamiento de una nueva enfermedad que afecta al sistema nervioso.
Para el diagnóstico de esta enfermedad se considera el siguiente examen:
• T : se mide el tiempo de reacción de una persona frente a un estı́mulo (X). Si
éste es mayor o igual a 3.5 [s], el diagnóstico es positivo.
Se sabe que en personas aquejadas de la enfermedad el tiempo de reacción X se
distribuye con la siguiente función de densidad de probabilidad:
(
a · (x − 3)(x − 6) si x ∈ [3, 6]
f+ (x) =
0 si no
Si la persona está sana, entonces
(
b · x(x − 4) si x ∈ [0, 4]
f− (x) = .
0 si no
a, b < 0.
a. (1 pto.) Grafique las funciones. Calcule las constantes a y b tal que f− y f+
sean funciones de densidad de probabilidad.
b. (1 pto.) Defina claramente el test de diagnóstico. Esto es, especifique la variable
aleatoria en estudio, nivel de corte y clasificación.
b. (2 pts.) Calcule la Sensibilidad y Especificidad del test. Señale cada uno en el
gráfico de densidades.
c. (2 pts.) Si la probabilidad de tener la enfermedad es de 10%, calcule los valores
predictivos del test. Si una persona resulta con T + , calcule la probabilidad de
estar enferma.
4 Regresión Lineal.
Se desea estudiar qué variable es mejor para el detectar la Diabetes. Para ello, se
realizan mediciones sobre sujetos de prueba, donde se miden las variables glucosa del
plasma en ayunas (GA) y glucosa del plasma casual (tomada a cualquier hora del
dı́a) (GC). Las mediciones para ambos test de diagnóstico se resumen en los cuadros
(1) y (2).
Para determinar la forma de las curvas ROC, se sugiere estudiar el modelo
Sensibilidad = K · (1 − Especif icidad)α
para cada una de las variables.
a. Dibuje un Diagrama de dispersión para los puntos 1−Especif icidad y Sensibilidad
para ambas variables.
2
Nivel de Corte 1 − Esp Sens Nivel de Corte 1 − Esp Sens
120 0.14 0.72 196 0.01 0.50
123 0.26 0.83 199 0.31 0.81
126 0.55 0.91 201 0.48 0.86
129 0.77 0.95 204 0.62 0.93
131 0.96 0.97 207 0.88 0.95
Table 1: Glucosa del Plasma en ayunas Table 2: Glucosa del plasma casual
b. Aplique logaritmo a los modelos y estime los coeficientes K̂i y α̂i para i = 1, 2.
c. Calcule el coeficiente de determinación y comente la bondad de los modelos.
¿Qué porcentaje de variabilidad es explicado?
d. Calcule el ı́ndice de separación de poblaciones a partir del modelo anterior.
¿Con cuál variable se queda?