Bioestadstica
Cul es la probabilidad de aprobar Bioestadstica?
Cul es la probabilidad de no encontrarme un atasco cuando voy a clase? Todos los das nos hacemos preguntas sobre probabilidad e incluso los que hayis visto poco de la materia en cursos anteriores, tenis una idea intuitiva lo suficientemente correcta para lo que necesitamos de ella en este curso.
Nociones de probabilidad
Frecuentista (objetiva): Probabilidad de un suceso es la frecuencia relativa (%) de veces que ocurrira el suceso al realizar un experimento repetidas veces.
CLASIFICACION OMS Frecuencia NORMAL 469 OSTEOPENIA 467 OSTEOPOROSIS 64 Total 1000 Porcentaje 46,9% 46,7% 6,4% 100,0
NORMAL OSTEOPENIA OSTEOPOROSIS 0 10 20 30 40 50
CLASIFICACION OMS
Vlidos
Porcentaje
Subjetiva (bayesiana): Grado de certeza que se posee sobre un suceso. Es personal.
En ambos tipos de definiciones aparece el concepto de suceso. Vamos a ver qu son y algunas operaciones que se pueden realizar con sucesos.
3
Sucesos
E espacio muestral
Cuando se realiza un experimento aleatorio diversos resultados son posibles. El conjunto de todos los resultados posibles se llama espacio muestral (E). Se llama suceso a un subconjunto de dichos resultados. Se llama suceso contrario (complementario) de un suceso A, A, al formado por los elementos que no estn en A
E espacio muestral
Se llama suceso unin de A y B, AUB, al formado por los resultados experimentales que estn en A o en B (incluyendo los que estn en ambos.
Se llama suceso interseccin de A y B, AB o simplemente AB, al formado por los elementos que estn en A y B
A
A
E espacio muestral E espacio muestral UNIN A B E espacio muestral INTERS. A B
4
A
B
Definicin de probabilidad
Se llama probabilidad a cualquier funcin, P, que asigna a cada suceso A un valor numrico P(A), verificando las siguientes reglas (axiomas)
E espacio muestral
P(E)=1
100%
E espacio muestral
0P(A) 1 P(AUB)=P(A)+P(B) si AB= es el conjunto vaco.
Podis imaginar la probabilidad de un subconjunto como el tamao relativo con respecto al total (suceso seguro)
5
EJEMPLOS
E espacio muestral A B
P(A)=3/9=1/3 P(A)=? P(B)=? P(B)=5/9 P(AUB)=6/9=2/3 P(AUB)=? P(AB)=? P(AB)=2/9 P(A)=? P(A)=6/9=2/3 P(B)=4/9 P(B)=?
E espacio muestral A B
E espacio muestral A
P(A)=3/9=1/3 P(A)=? P(B)=2/9 P(B)=? P(AUB)=5/9 P(AUB)=? P(AB)=0 P(AB)=? P(A)=6/9=2/3 P(A)=? P(B)=7/9 P(B)=?
P(A)=3/9=1/3 P(A)=? P(B)=? P(B)=2/9 P(AUB)=3/9=1/3 P(AUB)=? P(AB)=2/9 P(AB)=? P(A)=? P(A)=6/9=2/3 P(B)=7/9 P(B)=?
Probabilidad condicionada
Se llama probabilidad de A condicionada a B, o probabilidad de A sabiendo que pasa B:
E espacio muestral
P ( A B) P( A | B ) = P( B )
A B
Error frecuentiiiiiisimo:
No confundis probabilidad condicionada con interseccin. En ambos medimos efectivamente la interseccin, pero
En P(AB) con respecto a P(E)=1 En P(A|B) con respecto a P(B)
7
EJEMPLOS
P(A)=3/9=1/3 E espacio muestral P(B)=5/9 P(AUB)=6/9=2/3 A P(AB)=2/9 B P(A)=6/9=2/3 P(B)=4/9 P(B|A)=? P(A|B)=? P(B|A)=2/3 P(A|B)=2/5 P(A)=3/9=1/3 P(B)=2/9 A P(AUB)=5/9 B P(AB)=0 P(A)=6/9=2/3 P(B)=7/9 P(A|B)=? P(B|A)=0 P(B|A)=? P(A|B)=0
E espacio muestral
P(A)=3/9=1/3 E espacio muestral P(B)=2/9 A P(AUB)=3/9=1/3 P(AB)=2/9 B P(A)=6/9=2/3 P(B)=7/9 P(A|B)=? P(B|A)=2/3 P(B|A)=? P(A|B)=1
Intuir la probabilidad condicionada
A A
P(A) = 0,25 P(B) = 0,10 P(AB) = 0,10
P(A) = 0,25 P(B) = 0,10 P(AB) = 0,08
Probabilidad de A sabiendo que ha pasado B?
P(A|B)=1
P(A|B)=0,8
9
Intuir la probabilidad condicionada
A A
B B
P(A) = 0,25 P(B) = 0,10 P(AB) = 0,005
P(A) = 0,25 P(B) = 0,10 P(AB) = 0
Probabilidad de A sabiendo que ha pasado B?
P(A|B)=0,05
P(A|B)=0
10
Algunas reglas de clculo prcticas
Cualquier problema de probabilidad puede resolverse en teora mediante aplicacin de los axiomas. Sin embargo, es ms cmodo conocer algunas reglas de clculo:
P(A) = 1 - P(A) P(AUB) = P(A) + P(B) - P(AB) P(AB) = P(A) P(B|A) = P(B) P(A|B)
Prob. de que pasen A y B es la prob. de A y que tambin pase B sabiendo que pas A.
11
Recuento
Ejemplo (I)
CLASIFICACION OMS Total NORMAL OSTEOPENIA OSTEOPOROSIS
MENOPAUSIA NO SI 189 280 108 359 6 58 303 697
Total 469 467 64 1000
Se ha repetido en 1000 ocasiones el experimento de elegir a una mujer de una poblacin muy grande. El resultado est en la tabla.
Cul
es la probabilidad de que una mujer tenga osteoporosis?
P(Osteoporosis)=64/1000=0,064=6,4%
Nocin frecuentista de probabilidad
Cul
es la probabilidad de que una mujer no tenga osteoporosis?
P(No Osteoporosis)=1-P(Osteoporsis)=1-64/1000=0,936=93,6%
12
Recuento
Ejemplo (II)
CLASIFICACION OMS Total NORMAL OSTEOPENIA OSTEOPOROSIS
MENOPAUSIA NO SI 189 280 108 359 6 58 303 697
Total 469 467 64 1000
Probabilidad de tener osteopenia u osteoporosis? P(OsteopeniaUOsteoporosis)=P(Osteopenia)+P(Osteoporosis)P(OsteopeniaOsteoporosis)=467/1000+64/1000=0,531
Son sucesos disjuntos Osteopenia Osteoporosis=
Probabilidad de tener osteoporosis o menopausia? P(OsteoporosisUMenopausia)=P(Osteoporosis)+P(Menopausia)P(Osteoporosis Menopausia)=64/1000+697/1000-58/1000=0,703
No son sucesos disjuntos
Probabilidad de una mujer normal? P(Normal)=469/1000=0,469 P(Normal)=1-P(Normal)=1-P(OsteopeniaUOsteoporosis) =1-0,531=0,469
13
Recuento
Ejemplo (III)
CLASIFICACION OMS Total NORMAL OSTEOPENIA OSTEOPOROSIS
MENOPAUSIA NO SI 189 280 108 359 6 58 303 697
Total 469 467 64 1000
Si es menopusica probabilidad de osteoporosis?
P(Osteoporosis|Menopausia)=58/697=0,098
Probabilidad de menopausia y osteoporosis?
P(Menop Osteoporosis) = 58/1000=0,058
Otra forma:
P ( Menop Osteoporosis) P ( Menop) P (Osteoporosis | Menop) 697 58 58 / 1000 0,058 1000 697
14
Recuento
Ejemplo (III)
CLASIFICACION OMS Total NORMAL OSTEOPENIA OSTEOPOROSIS
MENOPAUSIA NO SI 189 280 108 359 6 58 303 697
Total 469 467 64 1000
Si tiene osteoporosis probabilidad de menopausia?
P(Menopausia|Osteoporosis)=58/64=0,906
Probabilidad de menopausia y no osteoporosis?
P(Menop No Osteoporosis) = 639/1000=0,639
Si tiene no tiene osteoporosis probabilidad de no menopausia?
P(No Menopausia|NoOsteoporosis)=297/936=0,317
15
Independencia de sucesos
Dos sucesos son independientes si el que ocurra uno, no aade informacin sobre el otro.
A es independiente de B
P(A|B) = P(A)
P(AB) = P(A) P(B)
16
Recuento
Ejemplo (IV)
CLASIFICACION OMS Total NORMAL OSTEOPENIA OSTEOPOROSIS
MENOPAUSIA NO SI 189 280 108 359 6 58 303 697
Total 469 467 64 1000
Son independientes menopausia y osteoporosis?
Una forma de hacerlo
P(Osteoporosis)=64/1000=0,064 P(Osteoporosis|Menopausia)=58/697=0,098
La probabilidad de tener osteoporosis es mayor si ha pasado la menopausia. Aade informacin extra. No son independientes!
Otra forma?
P(Menop Osteoporosis) = 58/1000 = 0,058 P(Menop) P(Osteoporosis)= (697/1000) x (64/1000) = 0,045
La probabilidad de la interseccin no es el producto de probabilidades. No son independientes.
17
Sistema exhaustivo y excluyente de sucesos
Son una coleccin de sucesos A1
A2
A1, A2, A3, A4 Tales que la unin de todos ellos forman el espacio muestral, y sus intersecciones son disjuntas.
Recordis cmo formar intervalos en tablas de frecuencias? A1
A3 A4 Suceso seguro A2 A3 A4
18
Divide y vencers
Todo suceso B, puede ser descompuesto en componentes de dicho sistema. A1
A2
B = (BA1) U (BA2 ) U ( BA3 ) U ( BA4 )
B A1 A3 A4 B B B
Suceso seguro
A2
A3 A4
B
19
Nos permite descomponer el problema B en subproblemas ms simples. Creedme . Funciona.
Teorema de la probabilidad total
A1
A2 Si conocemos la probabilidad de B en cada uno de los componentes de un sistema exhaustivo y excluyente de sucesos, entonces podemos calcular la probabilidad de B. B P(B|A1) P(A1) Suceso seguro P(A2) P(A3) A1 P(B|A2) A2 A3 A4 A3 A4 B B B B
P(B|A3)
P(B|A4)
P(A4) P(B) = P(BA1) + P(BA2 ) + P( BA3 ) + P( BA4 ) =P(A1) P(B|A1) + P(A2) P(B|A2)+
20
Ejemplo (I): En este aula el 70% de los alumnos son mujeres. De ellas el 10% son fumadoras. De los hombres, son fumadores el 20%.
T. Prob. Total. Hombres y mujeres forman un sist. Exh. Excl. de sucesos 0,1 Mujer 0,9 No fuma Fuma
Qu porcentaje de fumadores hay?
P(F) = P(MF) + P(HF) = P(M)P(F|M) + P(H)P(F|H)
0,7 Estudiante
=0,7 x 0,1 + 0,3 x 0,2 = 0,13 =13%
0,3 Hombre 0,2 Fuma
Los caminos a travs de nodos representan intersecciones.
Las bifurcaciones representan uniones disjuntas.
0,8
No fuma
21
Ejemplo (II): En un centro hay dos quirfanos. El 1 se usa el 75% de veces para operar. En el 1 la frec. de infeccin es del 5% y en el 2 del 10%.
0,05 Infec
Qu probabilidad de infeccin hay?
P(I) = P(Q1I) + P(Q2I) = P(Q1)P(I|Q1) + P(Q2)P(I|Q2)
Paciente
Q1
0,75
0,95 No infec
=0,75 x 0,05 + 0,25 x 0,1 = 0,0625
0,25 Q2 0,1 Infec
T. Prob. Total. Los dos quirfanos forman un sist. Exh. Excl. de sucesos
0,9
No infec
22
Ejemplo (III): El 20% del tiempo que se est en una casa
transcurre en la cocina, el 10% en el bao y el resto entre el saln y el dormitorio. Por otro lado la probabilidad de tener un accidente domstico estando en la cocina es de 0,30 de tenerlo estando en el bao es de 0,20 y de tenerlo fuera de ambos de 0,10. Cul es la probabilidad de tener un accidente domstico?
0,30 Acc No Acc
0,20
Cocina
P(A) = P(AC) + P(AB) + P(AR) =
P(C)P(A|C) + P(B)P(A|B) + P(R)P(A|R)
0,70
Acc 0,20
Casa
0,10 Bao 0,80 No Acc
=0,2 x 0,3 + 0,1 x 0,2 + 0,7 x 0,1 = 0,15 =
15%
0,70 Resto
0,10
Acc
0,90
No Acc
Teorema de Bayes
A1
A2
Si conocemos la probabilidad de B en cada uno de los componentes de un sistema exhaustivo y excluyente de sucesos, entonces si ocurre B, podemos calcular la probabilidad (a posteriori) de ocurrencia de cada Ai.
A3
A4
P(B Ai) P(Ai | B) P(B)
donde P(B) se puede calcular usando el teorema de la probabilidad total:
P(B)=P(BA1) + P(BA2 ) + P( BA3 ) + ( BA4 )
=P(B|A1) P(A1) + P(B|A2) P(A2) +
24
Ejemplo (IV): En este aula el 70% de los alumnos son mujeres. De ellas el 10% son fumadoras. De los varones, son fumadores el 20%.
Qu porcentaje de fumadores hay? P(F) = =0,7 x 0,1 + 0,3 x 0,2 = 0,13
(Resuelto antes)
0,1
Fuma
Se elije a un individuo al azar y es fumador 0,7 Probabilidad de que sea un hombre?
Estudiante
Mujer
0,9 No fuma
P( H F ) P( H ) P( F | H ) P( H | F ) P( F ) P( F ) 0,3 0,2 0,46 0,13
0,3 Hombre
0,2
Fuma
0,8 No fuma
25
Ejemplo (V): En un centro hay dos quirfanos. El 1 se usa el 75% de veces para operar. En el 1 la frec. de infeccin es del 5% y en el 2 del 10%. Qu probabilidad de infeccin hay? P(I) = 0,0625 Se ha producido una infeccin. 0,05 Qu probabilidad hay de que sea en el Q1?
Q1 0,75 Paciente 0,95
Infec
No infec
P(Q1 I ) P(Q1) P( I | Q1) P(Q1 | I ) P( I ) P( I ) 0,75 0,05 0,6 0,0625
0,25 Q2
0,1
Infec
0,9
No infec
26
Ejemplo (VI): El 20% del tiempo que se est en una casa
transcurre en la cocina, el 10% en el bao y el resto entre el saln y el dormitorio. Por otro lado la probabilidad de tener un accidente domstico estando en la cocina es de 0,30 de tenerlo estando en el bao es de 0,20 y de tenerlo fuera de ambos de 0,10. Se ha producido un accidente, cul es la probabilidad de que haya sido en la cocina?
P(A) = 0,15 (ya calculado)
0,30 Acc
0,20
Cocina
No Acc
0,70
Acc 0,20
Casa
0,10
Bao 0,80 No Acc
P(C A) P(C ) P( A | C ) P(C | A) P( A) P( A) 0,20 0,30 0,4 0,15
0,70 Resto
0,10
Acc
0,90
No Acc
Ejemplo de prueba diagnsticas: Diabetes
Los carbohidratos ingeridos terminan como glucosa en la sangre. El exceso se transforma en glucgeno y se almacena en hgado y msculos. Este se transforma entre comidas de nuevo en glucosa segn necesidades. La principal hormona que regula su concentracin es la insulina. La diabetes provoca su deficiencia o bien la insensibilidad del organismo a su presencia. Es una enfermedad muy comn que afecta al 2% de la poblacin (prevalencia) Una prueba comn para diagnosticar la diabetes, consiste en medir el nivel de glucosa. En individuos sanos suele variar entre 64 y 110mg/dL.
El cambio de color de un indicador al contacto con la orina suele usarse como indicador (resultado del test positivo)
Valores por encima de 110 mg/dL se asocian con un posible estado prediabtico.
Pero no es seguro. Otras causas podran ser: hipertiroidismo, cancer de pncreas, pancreatitis, atracn reciente de comida
Supongamos que los enfermos de diabetes, tienen un valor medio de 126mg/dL.
28
Funcionamiento de la prueba diagnstica de glucemia
Valor lmite: 110mg/dL Superior: test positivo. Inferior: test negativo.
Probabilidad de acierto: Para enfermos
Verdadero positivo (sensibilidad)
Para sanos
Verdadero negativo (especificidad)
Probabilidad de error Para enfermos
Falso Falso +
29
Para sanos
Cmo definir el punto de corte de la prueba diagnstica?
No es simple. No es posible aumentar sensibilidad y especificidad al mismo tiempo. Hay que elegir una solucin de compromiso: Aceptable sensibilidad y especificidad.
30
Una prueba diagnstica ayuda a mejorar una estimacin de la probabilidad de que un individuo presente una enfermedad.
En pricipio tenemos una idea subjetiva de P(Enfermo). Nos ayudamos de
Incidencia: Porcentaje de nuevos casos de la enfermedad en la poblacin. Prevalencia: Porcentaje de la poblacin que presenta una enfermedad.
Para confirmar la sospecha, usamos una prueba diagnstica. Ha sido evaluada con anterioridad sobre dos grupos de individuos: sanos y enfermos. As de modo frecuentista se ha estimado:
P(+ | Enfermo)= Sensibilidad (verdaderos +)= Tasa de acierto sobre enfermos. P(- | Sano) = Especificidad (verdaderos -)= Tasa de acierto sobre sanos.
A partir de lo anterior y usando el teorema de Bayes, podemos calcular las probabilidades a posteriori (en funcin de los resultados del test): ndices predictivos
P(Enfermo | +) = ndice predictivo positivo P(Sano | -) = ndice predictivo negativo
31
Pruebas diagnsticas: aplicacin T. Bayes.
Sensibilidad, verdaderos + P. a priori de enfermedad: incid., preval., intuicin, Enfermo Falsos Individuo T-
T+
Falsos +
T+ Sano
Especificidad, Verdaderos -
T-
32
Ejemplo: ndices predictivos
Individuo
La diabetes afecta al 2% de los individuos.
La presencia de glucosuria se usa como indicador de diabetes. Su sensibilidad es de 0,945. La especificidad de 0,977. Calcular los ndices predictivos.
0,977
0,98
0,02
0,023
0,055
0,945
TP( Enf | T )
T+
T-
T+
P( Sano T ) P( Sano) P(T | Sano) P(T ) P( Sano) P(T | Sano) P( Enf ) P(T | Enf ) 0,98 0,977 0,999 0,98 0,977 0,02 0,055 P( Sano | T )
P( Enf T ) P( Enf ) P(T | Enf ) P(T ) P( Sano) P(T | Sano) P( Enf ) P(T | Enf ) 0,02 0,945 0,456 0,02 0,945 0,98 0,023
33
Observaciones
-Qu probabilidad tengo de estar enfermo?
En el ejemplo anterior, al llegar un individuo a la consulta tenemos una idea a priori sobre la probabilidad de que tenga una enfermedad. A continuacin se le pasa una prueba diagnstica que nos aportar nueva informacin: Presenta glucosuria o no. En funcin del resultado tenemos una nueva idea (a posteriori) sobre la probabilidad de que est enfermo. Nuestra opinin a priori ha sido modificada por el resultado de un experimento.
- En principio un 2%. Le haremos unas pruebas.
- Presenta glucosuria. La probabilidad ahora es del 45,6%.
34
Qu hemos visto?
lgebra de sucesos
Unin, interseccin, complemento Nociones
Probabilidad
Frecuentista Subjetiva o Bayesiana
Axiomas Probabilidad condicionada Reglas de clculo
Complementario, Unin, Interseccin
Independencia de sucesos Sistema exhaustivo y excluyente de sucesos
Teorema probabilidad total. Teorema de Bayes
Pruebas diagnsticas A priori: Incidencia, prevalencia. Eficacia de la prueba: Sensibilidad, especificidad. A posteriori: ndices predictivos.
35