100% encontró este documento útil (1 voto)

1K vistas526 páginas

Introducción a la Bioestadística

Este documento presenta un programa de bioestadística dividido en 6 partes que cubren temas como estadística descriptiva, probabilidad, validación estadística, análisis de varianza y control de calidad. La primera parte introduce conceptos básicos de estadística descriptiva como recopilación y presentación de datos, y estadígrafos como medias y desviaciones estándar. Las partes siguientes cubren temas de probabilidad, teoría de muestras, inferencia estadística y análisis de varianza. La últ

Cargado por

Jorge Fupuy

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

100% encontró este documento útil (1 voto)

1K vistas526 páginas

Introducción a la Bioestadística

Cargado por

Jorge Fupuy

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

PROGRAMA DE BIOESTADSTICA

Parte 1 : Estadstica Descriptiva

Tema 1. Introduccin: Definiciones primarias. Historia breve. Magnitudes y variables. Estadgrafos. Precisin y exactitud. Cuestiones clnicas. Ejemplos. Tema 2. Recopilacin de datos: Etapas de la recopilacin. Formas de la
recopilacin. Mediciones de laboratorio. Recopilacin en investigaciones clnicas. Mediciones industriales. Cuantificacin de errores de medicin. Ejemplos.

Tema 3. Presentacin de datos: Informes de laboratorio. Informes estadsticos.

Mtodos: textual, tabular, grfico y mixtos. Grficos: circular, de barras, Pictogramas, cronolgicos, diagrama de saldos. Histogramas. Polgono de frecuencias acumuladas. Pirmides de poblacin. Ejemplos.

Tema 4. Estadgrafos:

Clasificacin de estadgrafos. Clasificacin de enfermedades por diagnosis. ndices clnicos. ndices de calidad diagnstica: Sensibilidad, Especificidad e ndice de Youden. Eficiencia diagnstica. Relatividad de los tests clnicos. Valores Predictivos y Likelihood ratios. Influencia de los puntos de corte. Otros ndices diagnsticos. ndices de riesgo o dao: Odds ratio y riesgo relativo. Concordancia de una prueba clnica. Estadgrafos de posicin: Medias, Mediana, Fractiles, Moda. Estadgrafos de dispersin: Rango, Desvo estndar y Varianza, Coeficiente de variacin. Ejemplos.

Parte 2 : Probabilidad
Tema 5. Probabilidad: Introduccin. Concepto de particin. Modelo axiomtico.
Propiedades derivadas y aplicaciones. ndices clnicos como probabilidades. Odds. Ejemplos. Anexos: Teora de conjuntos y clculo combinatorio. Introduccin. Independencia. Condicionalidad. Simulacin para un test clnico. Teoremas de Probabilidad Total y de Bayes. Diagnstico y el teorema de Bayes: Odds a posteriori. Simplificacin de Bayes. Estudio de la independencia en las tablas de riesgo. Probabilidad hipergeomtrica. Ejemplos.

Tema

Probabilidad

condicional:

Tema 7. Pruebas repetidas: Procesos Bernoulli. Probabilidad Binomial. Contagio y repulsin. Probabilidad Pascal. Probabilidad Binomial Negativa. Probabilidad Geomtrica. Probabilidad Multinomial. Procesos de tipo Poisson. Aplicaciones del modelo Poisson. Aproximacin de la Binomial a la Poisson y a la Hipergeomtrica. Ejemplos. Tema 8. Funciones de probabilidad: Fenmenos aleatorios en Bioqumica y Farmacia. Funcin de distribucin. Distribuciones discretas y continuas unidimensionales. Distribuciones conjuntas e independencia. Valor esperado y aplicaciones: riesgo en los test clnicos y en epidemiologa. Momentos de orden k.

Variables aleatorias tipificadas. Aplicaciones: ndice de agregacin y muestreo de aceptacin. Teorema Central del Lmite. Ejemplos.

Parte 3 : Validacin Estadstica

Tema 9. La normalidad: Qu es lo normal? Criterios de normalidad. Valores de referencia o normales. La funcin de Gauss. Propiedades. Clculo de probabilidades con Gauss. Aproximaciones con la funcin de Gauss. Correcciones por continuidad. Ejemplos. Tema 10. Teora de muestras: Introduccin. Muestras aleatorias y no aleatorias.
Aplicaciones en Medicina. Distribuciones de probabilidad en el muestreo: medias, proporciones, diferencia de dos medias y de dos proporciones. Ejemplos de aplicacin.

Tema 11. Teora de la inferencia estadstica: Introduccin. Estimas por puntos y por intervalos. Intervalos de medias, de proporciones, del desvo estndar y de la varianza. Propiedades de un estimador. Intervalos para dos muestras. Intervalos para el cociente de dos proporciones. Ejemplos. Tema 12. Teora de la decisin estadstica: Hiptesis estadsticas. Validaciones estadsticas: uso del test de hiptesis. Modelo de Gauss para una muestra aplicado a: medias, varianzas y proporciones. Comparaciones de dos muestras: comparaciones de medias y proporciones. Intervalos de confianza versus tests de hiptesis. Ejemplos.

Parte 4 : Pequeas muestras

Tema 13. Teora de pequeas muestras: Modelo de Student para una muestra: aplicacin para medias muestrales y proporciones. Student para dos muestras independientes: comparaciones de medias y proporciones. Test de equivalencia biolgica. Comparacin de dos muestras apareadas. Modelo de la Chi-cuadrado. Modelo de Fisher. Significacin clnica versus estadstica. Ejemplos. Tema 14. Estadstica no paramtrica: Conceptos bsicos. Aplicacin en una
muestra: Modelo de la Binomial y la prueba de Rachas. Usos en muestras apareadas: Modelo del Signo y la prueba de rangos de Wilcoxon. Usos en dos muestras independientes: Modelo de la U de Mann-Whitney. Modelo de Cochran para n muestras apareadas. Modelo de Cohen-Kappa. Usos y aplicaciones prcticas.

Tema 15. Anlisis de frecuencias: Conceptos bsicos. La prueba de la Chicuadrado. La prueba de G (G-test). Tablas de contingencia. Tablas de 2x2: Modelo I, II y III. Aplicaciones en Farmacia y Bioqumica: Riego Relativo y Odds Ratio. Modelos en Epidemiologa. Anlisis de factores ocultos. Factores encajados o jerrquicos. Reproducibilidad: Modelo de Guttman. Ejemplos. Tema 16. Bondad de ajuste: El mtodo clsico de Pearson con Chi cuadrado. El mtodo moderno con G-test. La prueba de Kolgomorov-Smirnov para una y para dos

muestras. Tests de bondad de ajuste con repeticin. Anlisis de concordancia: Modelos de McNemar, Cochran, G-test de McNemar, Log-Odds Ratio, Cohen-Kappa, Phi o Yules. El mtodo de visin dual. Paradojas de Feinstein. Aplicaciones prcticas.

Parte 5 : Anlisis de Varianza

Tema 17. Anlisis de Varianza (ANOVA): ANOVA de un factor: Modelo
terico. Formas cortas de clculo. Aplicacin en Control de Calidad: control de exactitud, de precisin y del factor humano. Modelos de Eisenhart: Modelo I y Modelo II de ANOVA. Supuestos bsicos. Modelo no paramtrico equivalente de KruskalWallis. Comparaciones de varias proporciones. Ejemplos.

Tema 18. Comparaciones Mltiples: Modelo II: Componente aadida de

varianza. Modelo I: Comparaciones mltiples a priori modelo del SS-STP. Comparaciones a posterior: Modelos de Tukey para tamaos muestrales iguales y de Gabriel para tamaos desiguales. Diseo bsico de experimentos con ANOVA. Comparaciones no paramtricas equivalentes. Bioequivalencia.

Tema 19. Anlisis de ANOVA encajado: Ventajas respecto al modelo simple. Modelos encajados puros y mixtos. Formas cortas de clculo para dos niveles. Modelo encajado de tres niveles. Formas cortas de clculo. Ejemplos de aplicacin. Tema 20. ANOVA para ms de un factor: Modelo de ANOVA para dos factores con repeticin: Supuestos bsicos y modelos tericos. Caso sin repeticin. Modelo de bloques aleatorizados Modelo no paramtrico de Friedman. Sensibilidad de los modelos de Anova. Ejemplos.

Parte 6: Regresin, Correlacin y Control de calidad

Tema 21. Modelos para ms de una variable: Conceptos bsicos. Anlisis de
regresin. Diseos experimentales en regresin. Clculos bsicos. Clculos cortos. Ensayos de hiptesis en regresin. Regresin por el origen: Recta de calibracin. Caso de ms de un valor de Y por cada valor de X. Curvas de regresin. Transformaciones en regresin. Aplicaciones prcticas.

Tema 22. Anlisis de Correlacin: Conceptos bsicos. Frmula del producto momento del coeficiente de correlacin. Clculo del coeficiente de regresin. Ensayos de hiptesis en correlacin. Comparacin entre dos o ms coeficientes de correlacin. Modelo de Kendall. Ejemplos de aplicacin. Tema 23. Control de Calidad Instrumental: Conceptos bsicos. Propagacin de errores. Calibraciones de instrumentos: Calibracin de balanzas, pipetas, capilares y micro pipetas. Calibracin de urodensmetros, espectrofotmetros y equipos automatizados. Calibraciones microbiolgicas. Otras calibraciones. Aplicaciones y usos.

Tema 24. Control de Calidad Metodolgico: Conceptos bsicos. Sueros

controles y patrones. Protocolo de las tcnicas de laboratorio en la fases analtica del mtodo. Controles del mtodo de rutina Control de calidad en Microbiologa y en exmenes bioqumicos. Usos y aplicaciones.

Tema 25. Control de Calidad Estadstico: Conceptos bsicos. Cartas de

Control de Levey-Jennings. Cartas de Control de Westgard. Cartas corregidas. Especificaciones internacionales del error en mediciones clnicas. El error en sistemas no estables. Requisitos de la CLIA.

1
Introduccin
En este captulo se definen los conceptos bsicos necesarios para poder captar mejor los temas a desarrollar en esta asignatura. La idea es facilitar la comprensin del texto empleando una terminologa comn. Se establecen una serie de trminos - a manera de convencin - para coordinar la nomenclatura a utilizar en adelante. El problema consiste en la diversidad de trminos usados para nombrar los mismos conceptos. Esto es debido a la gran variedad de autores, disciplinas, modas y tendencias que existen en la bibliografa actual. Cada uno, aportando su cuota de originalidad, pero complicando la simplicidad. Otro problema que se trata de resolver, es el uso de palabras con un claro significado en el leguaje diario, pero usadas de manera diferente en la Estadstica. Por lo tanto conviene empezar con las definiciones generales.

1.1 Definiciones primarias

La palabra Biometra proviene del griego, con dos races bsicas: Bios (vida) y Metron (medida). Se trata entonces, de una materia que se dedica a la teora de las mediciones en las Ciencias Biolgicas. Y en un sentido ms amplio, a la aplicacin de los mtodos estadsticos para resolver problemas biolgicos, por lo cual la Biometra es llamada tambin: Bioestadstica. Para redondear estos conceptos, conviene definir: Estadstica es un conjunto de mtodos cientficos para la recopilacin, representacin condensacin y anlisis de los datos extrados de un sistema en estudio. Con el objeto de poder hacer estimaciones y sacar conclusiones, necesarias para tomar decisiones. La Estadstica no es una ciencia en s misma. Se trata de un grupo de mtodos con base cientfica. Los mtodos son modelos que optimizan matemticamente los objetivos buscados. De hecho, la Estadstica Terica es una rama de las Matemticas. Recopilar datos significa obtenerlos efectuando mediciones, muestreos, encuestas, censos, etc. La representacin de datos implica mostrarlos con grficos, con tablas, en forma de texto, o cualquier combinacin de stas. La condensacin de los datos implica reducir su nmero a dos o tres valores representativos de todo el grupo, denominados estadsticas, estadgrafos o nmeros ndices, tales como la media, la sensibilidad, la varianza, el costo de vida, etc. El anlisis se hace con las herramientas estadsticas, empleando la informacin obtenida de los datos, para realizar estimaciones o inferencias, testear hiptesis de trabajo y as, poder tomar las decisiones ms adecuadas en cada caso particular, basadas en la evidencia cientfica suministrada por estos anlisis. De la definicin anterior, surge que la Estadstica puede ser usada en cualquier sistema en estudio. En la prctica, esto significa una gran cantidad de posibilidades, pues, donde pueda definirse un sistema, all se podr emplear la Estadstica.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] Sistema: es un conjunto de elementos que se aslan para su estudio en funcin de sus interrelaciones. Tienen tres caractersticas que permiten identificarlos de entre todos los conjuntos: - Objetivos: Saber lo que se quiere del sistema, o lo que se espera que ste haga. - Comportamiento: Lo que realmente hace el sistema, cmo se comporta. - Estructura: La manera en que se interrelacionan los elementos.

1-2

Por ejemplo, el sistema educativo est compuesto por una serie de elementos: escuelas, docentes, alumnos, administrativos, programas de estudio, textos y otros. Su claro objetivo es educar a sus integrantes. Se comporta dando resultados que estn a la vista y pueden mensurarse. Y tiene una estructura formada por un conjunto de leyes, programas de estudio, reglamentos, etc. Tambin son ejemplos de sistema: el aparato circulatorio, el respiratorio, una empresa comercial, el planetario, una persona, etc. De la comparacin entre los objetivos buscados y el comportamiento obtenido, surge el concepto de control. Por ejemplo el caso de una heladera, tiene un grupo de elementos componentes como el gabinete, la puerta, los estantes, el motor y otros que no estn dispuestos de cualquier forma sino que siguen un plano dado (una estructura). El objetivo, es mantener en su interior una cierta temperatura por debajo de la ambiental. Cuando el motor trabaja, comienza a enfriar el interior del gabinete, bajando la temperatura hasta un valor lmite que hace funcionar un relee, el cual corta la corriente elctrica, y el motor se detiene. Dicho relee, hace las veces de control, pues en todo momento compara la temperatura real con la temperatura deseada; detiene o arranca al motor segn convenga. Como puede verse a travs de estos ejemplos, sistema es un concepto muy amplio, y as es el campo de aplicacin de la Estadstica. Es importante destacar que el sistema completo bajo estudio estadstico se constituye en la poblacin o marco de referencia. Toda la informacin obtenida adquiere sentido si se sabe respecto de qu o de quines, es vlida. Por ejemplo, el dato numrico 3,2 solo significa un nmero real al no tener ninguna referencia concreta. Si se le aade una unidad fsica como 3,2 kg se agrega una informacin extra: se trata de una masa. Finalmente, si se dice que es el peso promedio de los recin nacidos de un hospital en el da de ayer, entonces se tiene una idea ms concreta que el mero significado numrico inicial, pues ahora se tiene un marco de referencia concreto, que son los nacimientos en el lugar fsico donde se ubica el hospital, y el momento especfico del estudio realizado. Anlogamente, en Sicologa se habla del marco de referencia del individuo, formado por el conjunto de conocimientos, creencias, experiencias vividas, principios ticos y morales del mismo, etc. Todo esto hace que un mismo hecho, pueda ser interpretado de varias maneras por distintas personas, pues cada una, tiene su propio marco de referencia. Ver un desnudo no provoca la misma reaccin en un artista plstico que en un censor de cine; el azcar considerado como un dulce por la mayora, puede ser visto como un veneno por un diabtico. As tambin, todo trabajo en Biometra deber tener su propio sistema referencial: la poblacin. Poblacin Biolgica: es la formada por todos los individuos de una misma especie en un estado dado de su vida histrica o sexual, que habitan un rea geogrfica definida y en una poca determinada. Poblacin estadstica: es el conjunto de todas las muestras posibles, que pueden obtenerse del sistema en estudio de acuerdo al mtodo de seleccin empleado.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-3

El marco de referencia de un estudio biomtrico, es la poblacin biolgica de la cual se obtuvieron los datos. Este marco se necesita, para que adquieran sentido los nmeros que se manejan. Por ejemplo, si se hace un estudio midiendo el hematocrito de un grupo de pacientes, varones adultos y sanos, entonces la poblacin estar compuesta por todos los seres vivos de la especie Homo-Sapiens, que habitan el planeta Tierra, de sexo masculino y con una edad mayor de 18 aos, en el momento del estudio. El tamao de la poblacin se saca contando el nmero de elementos componentes. A veces es un conteo simple, pero otras veces se trata de conteos ordenados y se debe recurrir a las tcnicas del Anlisis Combinatorio para calcular el tamao de la poblacin. Si se aplican dos tcnicas clnicas diferentes a un mismo paciente para detectar una infeccin, los resultados posibles no son dos, sino cuatro: (+ +), (- +), (+ -) y (- -). Para aclarar mejor esto, se puede imaginar un experimento en el cual se lanza un dado y se observa el nmero que sale. Los casos posibles son las seis caras del dado y ese es el tamao de la poblacin. Sin embargo, si se lanza dos veces ese dado, ahora los casos son (1,1) (1,2) (1,3) ... (6,5) (6,6), o sea, 36 casos posibles en total, y esa cantidad pasa a ser el tamao de la nueva poblacin, donde cada elemento est formado por un par de nmeros. Muestra: es un conjunto de datos obtenidos de una poblacin cualquiera, con el mtodo de recopilacin elegido. Se la puede imaginar como un subconjunto del conjunto poblacin. Se toman muestras, cuando no se puede o no conviene, tomar la poblacin entera. Si se tiene una poblacin de tamao infinito, no se podr nunca tomar todas las muestras posibles, como por ejemplo, las mediciones repetidas de una misma magnitud, que se pueden repetir indefinidamente mientras el ensayo no sea destructivo (repetidas pesadas en una balanza, medir la temperatura de un cuerpo, etc.). Hay ocasiones, donde si bien la poblacin es finita, es tan grande que no resulta prctico tomar todos los casos como por ejemplo, cuando la poblacin es la especie humana. Otras veces, las determinaciones que se deben realizar en las muestras son tan caras que resulta mucho ms barato tomar muestras. Pueden haber razones de tiempo que impidan analizar a toda la poblacin. Si el mtodo de ensayo es destructivo, como ver si los fsforos funcionan, o abrir ampollas de medicamento para verificar su contenido, entonces no hay ms remedio que tomar muestras. En cambio, si se revisan diamantes para determinar si son falsos, all se tomar a cada uno de los elementos componentes de la poblacin, y nunca una muestra de los mismos. La idea bsica es tomar muestras representativas de la poblacin desconocida, y hacer deducciones acerca de esa poblacin a travs del estudio de las muestras. La clientela que concurre a una farmacia o a un laboratorio de anlisis clnicos proviene de una poblacin relacionada con la cercana a su ubicacin geogrfica. Conocerla en sus preferencias, es algo fundamental para toda campaa publicitaria destinada a incrementar las ventas, y con encuestas se puede saber los gustos de la clientela. Hay dos partes en esta asignatura: Estadstica Descriptiva: Es la parte de la Estadstica que se ocupa de recopilar, representar y condensar los datos obtenidos del sistema en estudio. Estadstica Inferencial: Es la parte de la Estadstica dedicada a la formulacin de supuestos y estimaciones, para hacer predicciones y poder sacar conclusiones de los datos obtenidos con el estudio de las muestras. Y as, poder tomar decisiones con base cientfica. La Estadstica se emplea en el estudio de los fenmenos naturales, tanto los generados en los laboratorios por los cientficos como aquellos ms all del control humano. En una gran va-

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-4

riedad de disciplinas como economa, sociologa, poltica, ciencias de la salud, en estudios de mercado, urbanismo, etc. Es una herramienta de uso tan amplio y general que hoy da es difcil imaginar un lugar donde no pueda emplearse. Ms an, en algunas disciplinas es la herramienta bsica de medicin, como por ejemplo en parapsicologa para la determinacin de PES (percepciones extra-sensoriales).

1.2 Historia breve de la Estadstica

Desde los albores de la civilizacin, el hombre ha tratado de evaluar de alguna manera los fenmenos que lo rodean cuantificando lo que puede observar. Se cree que en las cavernas prehistricas sus habitantes contabilizaban sus pertenencias, haciendo muescas en las paredes. A medida que los pueblos evolucionaban en cantidad y conocimientos, se requera cada vez ms el uso de recopilaciones de datos, con fines administrativos, religiosos, etc. En el antiguo Egipto exista una administracin centralizada destinada a la toma de datos y a la contabilizacin de todos los bienes del faran. La diosa de los libros y las cuentas fue Safhkit y puede decirse que sus adoradores eran los estadsticos de la poca. En Asiria se encontraron tablas de la biblioteca de Asurbanipal conteniendo informacin como las producciones de cada provincia del Imperio. En la Biblia hay un Libro llamado de los Nmeros donde se relata el censo que hizo Moiss con los israelitas antes de cruzar el desierto. En el Libro de los Reyes se habla de un censo hecho por David. Adems de otros recuentos como los del Libro de Esdras y Nehemas. En Confucio hay referencias a un rey llamado Yao (3000 AC), quien orden un censo comercial y agrcola de toda la China. Slo un buen manejo de la informacin estadstica explica el desarrollo de los fenicios en el comercio y la navegacin pica, como el Periplo cuya traduccin griega todava se conserva. All se cuenta sobre un tal Henn, que borde la costa de frica al mando de sesenta naves, desde Gibraltar hasta Liberia. As como tantas otras epopeyas que implican la necesidad de contabilizaciones y recuentos para la administracin de hombres, armas y suministros. En la Biblia es famosa la sentencia Con la medida que midis, as seris medidos. Aristteles, en su libro La Repblica, comienza a asimilar Estadstica con el concepto de manejo del Estado. La particular relacin que lo una con Alejandro Magno, quien puso a su disposicin grandes sumas para financiar el Liceo, donde los primeros destellos de la ciencia organizada fueron enseados a sus alumnos, en particular el manejo de la cosa pblica. El relato del nacimiento de Cristo presenta el concepto de empadronamiento. En la Roma antigua, se llevaban registros sistemticos de datos y an censos, con fines tributarios. En Amrica, los incas usaban nudos en las cuerdas (quipus) para efectuar recuentos en el manejo de sus almacenes comunitarios. Las majestuosas construcciones de aztecas, mayas e incas, as como otros pueblos constructores, implica un alto grado de sofisticacin en el manejo de datos. Durante la Edad Media se multiplican los ejemplos de censos, relevamientos de propiedades, registros demogrficos (nacimientos y defunciones), recoleccin de impuestos, etc. En el Concilio de Trento se establece la obligatoriedad de inscribir matrimonios, nacimientos y muertes. en todas las Iglesias. Todo esto muestra como en la historia, paulatinamente, van apareciendo intentos de usar la Estadstica como una herramienta, para el manejo de asuntos civiles, comerciales, religiosos, estatales, etc. Es en Alemania donde aparece la llamada escuela Universitaria o alemana de Estadstica; en 1660 se crea la primera ctedra universitaria en la Universidad de Heldsmat, don-

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-5

de Herman Cnning dicta un curso en el que se pasaba revista a los hechos ms notables del Estado y a la sistematizacin de datos y conocimientos. O sea, un enfoque eminentemente administrativo de la cosa estatal. Su discpulo, Godofredo de Achewall, la separa de la Sociologa y la llama por primera vez Estadstica. En Inglaterra, se desarrollaba paralelamente la escuela Demogrfica, llamada tambin la de los aritmticos polticos. Pues sus integrantes trataban de obtener leyes empricas para la cuantificacin de los fenmenos polticos y sociales. Se destacan W. Petty, E. Halley y J. Gaunt (1620/74) quien en una memoria a la Royal Society de Londres, destaca la influencia de las estaciones del ao sobre la mortalidad, las migraciones de pobladores del campo a la ciudad, la proporcin constante de los sexos, y otros conceptos bsicos de la moderna Demografa. Por su parte en Francia, se desarrollaba la escuela Probabilstica, concentrando sus estudios en los juegos de azar, tanto de cartas como de dados. En 1657, Christian Huyghens, reputado fsico de la poca, escribi un tratado sobre las probabilidades de xito y fracaso en juegos de cartas. Si bien esto tena lugar en Holanda, la idea sobre chances de ganar en los juegos de azar es tan vieja como el hombre. En la India, en el Rig-Veda, se menciona un juego de dados como intento de medir la probabilidad, se trata de un poema literario escrito unos 1000 aos antes de Cristo. Sfocles atribuye a un tal Palamedes la invencin del juego de dados durante el sitio de Troya. Cuanto ms sofisticados se volvan los juegos, mayor era el deseo de estudiarlos para saber cmo ganar. Tal vez esa bsqueda de una martingala haya sido el mejor incentivo para mantener vivo el inters en las probabilidades, a lo largo del tiempo. La primera solucin a un juego de dados, el pasadiez (se gana si al lanzar dos dados se sacan ms de diez puntos) se debe a Galileo. La ancdota histrica ms famosa se encuentra en una carta escrita en 1654 por Blas Pascal a Pierre Fermat. En ella, Pascal menciona al Caballero de Mer como poseedor de un fino espritu y una gran habilidad en el juego, a pesar de no ser un gemetra... El Caballero estaba indignado con la aritmtica porque segn su experiencia de jugador, si uno acepta sacar un 6 en cuatro jugadas tiene una ventaja de acertar mayor, que si acepta sacar dos 6 (hacer "sones"), usando dos dados. Lo que le escandalizaba, era que la probabilidad de ganar no se mantuviese constante, y eso a sus ojos era una contradiccin. Lo notable del caso, es que not en forma totalmente emprica, una diferencia de apenas el 4% en la probabilidad de ganar, que muestra la correcta resolucin terica del problema. En 1714 aparece Ars Conjectandi, obra pstuma de Juan Jacobo Bernoulli, publicada siete aos despus de su muerte. En este trabajo se relaciona por primera vez la teora con los experimentos, se define la probabilidad clsica, y se plantea la posibilidad de introducir lo probable en lo social. Esto es, que el Clculo de Probabilidades tena otros usos adems de los juegos de azar. Su sobrino Nicols, quien fue el encargado de la publicacin post-mortem, luego publica una coleccin de problemas resueltos que se vuelve muy popular para su poca. Por ejemplo, la solucin del problema de Montmort, que consista en calcular la probabilidad de que un jugador gane si al sacar una carta de un grupo de trece, el nmero de extraccin sea igual al nmero de la carta. La frmula propuesta por Montmort fue generalizada al caso de n cartas por uno de sus lectores; quien encontr que la probabilidad tenda a una constante si el nmero de cartas tenda a infinito (p=0,6321). El lector se llamaba Euler, y as se descubri al nmero e (2,718...). El incremento que toman los estudios acerca de las probabilidades creci vertiginosamente. El francs De Moivre halla la curva matemtica de la probabilidad integral, y a principios del siglo XIX, [Link] recopila todo lo publicado hasta entonces acerca del tema, ms otros descubrimientos de su propia cosecha, en particular la primera versin del teorema fundamental de la Estadstica:

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-6

el Teorema Central del Lmite. Sin embargo, este tema sera popularizado por un fsico de su misma poca: Gauss. Al estudiar los errores de medicin cometidos en los experimentos, Gauss descubri que mediciones repetidas, bajo condiciones anlogas, arrojan diferentes resultados, si los instrumentos son lo suficientemente sensibles. A falta de una mejor explicacin para el fenmeno, atribuy estas variaciones a la casualidad, y obtuvo en su estudio de errores una curva terica en forma de campana que lleva su nombre. La aplicacin de la teora de errores en mediciones experimentales, les dio un carcter de tipo cientfico, diferencindolas de las investigaciones biolgicas de ese entonces, que se limitaban a describir y clasificar especies, sin entrar a controlar la repeticin de fenmenos en laboratorios. Un discpulo de Laplace, estableci en 1837 el desarrollo matemtico de la Ley de los Grandes Nmeros, a partir de la cual comienza la Inferencia Estadstica. Adems, estudiando la probabilidad binomial para los sucesos raros, encuentra una funcin que lleva su nombre: Poisson. Esa funcin es usada por dos colegas de la Universidad de Pars, para explicar en forma terica un nuevo fenmeno que haban encontrado. Y es as, que el matrimonio Curie da forma a su Ley de la Radiactividad Natural, semilla primitiva de la Fsica Estadstica y ms adelante de la Fsica Cuntica. La contribucin de la escuela rusa, se hizo en el campo de la teora. Autores como Chebishev, Markoff, Kintchine y otros, completaron la base matemtica de la Estadstica y es en Rusia, a fines del siglo XIX, donde se publica por vez primera la versin completa del Teorema Central del Lmite, luego de casi un siglo de bsqueda. Tal vez, el primero en aplicar estos conocimientos a la Biologa y Medicina en el campo de lo social, fue el belga Adolfo Quetelet. Su idea del hombre promedio sirvi para estudiar la relacin entre las dimensiones humanas. Su obra Sur LHomme, origin la Antropometra y adems se ocup de obtener datos acerca del nmero de suicidios, delitos, etc. Sin embargo, el llamado Padre de la Bioestadstica fue un ingls: Sir Francis Galton (1822-1911). Era primo de Ch. Darwin y estimulado por la publicacin del Origen de las Especies intent hallar teoras de tipo gentico para resolver los problemas de herencia en los humanos. Si bien no pudo hallar las respuestas a esas cuestiones, introdujo un mtodo matemtico para el ajuste de curvas a puntos experimentales: el de los mnimos cuadrados. Este mtodo lo us en sus estudios de la herencia de padres a hijos. La propuesta era que hijos de padres ms altos que el promedio de la poblacin eran ms bajos que sus padres; viceversa, hijos de padres bajos, crecan ms que sus progenitores. O sea, la poblacin humana, tiende al promedio de alturas en generaciones sucesivas. Por eso al mtodo se lo llama: Regresin. Hoy se ha verificado esto y se sabe que el promedio de altura de los humanos va en aumento con los siglos, debido principalmente, a una mejor calidad y cantidad de alimentacin. El heredero de la ctedra de Galton y seguidor de sus trabajos: K.R. Pearson, descubre la distribucin 2 y funda la primer revista cientfica del tema: Biometrika Donde los investigadores de la poca publicaban sus descubrimientos, como W. Gosset que usaba el seudnimo de Student, y tal vez la figura ms grande del siglo en el tema: Ronald A. Fisher (1890-1962) creador del 50% de la Bioestadstica actual. Su mtodo de Anlisis de Varianza es la herramienta bsica para las investigaciones biolgicas. Desarroll la frmula matemtica de la funcin imaginada por Gosset, a la que llam distribucin t de Student, que reemplaz en la prctica al centenario mtodo gaussiano. Fue el creador de muchas cosas ms: el mtodo estadstico para Disear Experimentos, el mtodo de mxima verosimilitud para los estimadores, y lo buscado por Galton: la Gentica de Poblaciones. Contribuciones posteriores como las del norteamericano Snedecor con su distribucin F (por Fisher) completaron esta rama de la Estadstica a principios de siglo. Luego de los treinta, en la Universidad de Duke (USA), O. Rhine aplica el

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-7

mtodo estadstico con singular xito, en sus estudios de fenmenos paranormales, cuantificando as tales fenmenos. Sus xitos desataron imitaciones en todo el mundo. Durante la guerra, grupos multidisciplinarios dedicados a resolver problemas de logstica, desarrollan nuevas aplicaciones: la Investigacin Operativa. Se van imponiendo los nuevos modelos no-paramtricos para estudios en Psicologa, Sociologa y tantos otros campos. Se desarrolla la Econometra para los planificadores. Y hoy da siguen apareciendo novedades y mejoras de todo tipo, junto al inestimable aporte de las computadoras, en simulaciones y dems clculos cuya complejidad, los tornaban inalcanzables para la mayora hasta hace pocos aos.

1.3 Magnitudes y variables

Es frecuente el uso de estas dos palabras como sinnimos. Si bien a veces esto es correcto, conviene puntualizar la diferencia conceptual entre ambas: La magnitud no depende del sistema de referencia, mientras que la variable s. Por ejemplo, la masa de un cuerpo es igual en todo el Sistema Solar, pero su peso vara segn el planeta donde est ubicada. Un hombre pesa en la Luna casi un sexto de lo que pesa en la Tierra, pero su masa sigue siendo la misma. Entonces la magnitud es la masa, y la variable el peso. Una caracterstica del hombre, como la de tener sangre caliente es una magnitud. Tomando como poblacin a toda la especie Homo-sapiens, es una constante para todos los seres humanos, por lo tanto no es una variable, sino un parmetro. Pero si se toma como poblacin a todos los habitantes del planeta, al comparar con los peces se detecta una diferencia con el hombre, deja de ser un parmetro y esa misma magnitud es ahora una variable. El orden cordiano es un parmetro para la familia mirtceas (variable para esa poblacin). A su vez, si se considera a esa familia como la poblacin en estudio, ahora pasa a ser un parmetro y la especie Eucalyptus una variable dentro de la misma. Cualquier caracterstica de un elemento de la poblacin que pueda observarse puede ser medida, ya sea con instrumentos como la glucosa, el colesterol, peso, talla, etc.; ya sea con los sentidos como color, olor, sabor, nivel de ruido y textura; o bien, se puede clasificarla en clases (o categoras) para hacer recuentos como sano-enfermo, positivo-negativo, etc. En sntesis: Magnitud: Es toda caracterstica, o cualidad, de un elemento integrante de la poblacin, susceptible de ser observada. Variable: Es toda magnitud que permite diferenciar entre s a los componentes de una misma poblacin. Matemticamente se expresa como una funcin. Parmetro: Es toda magnitud que tiene el mismo valor dentro de una poblacin. O sea, no permite diferenciar entre s a sus elementos componentes. Medir: Es comparar una magnitud con otra de su misma especie, considerada como referencia o patrn. Ya sea usando instrumentos, o bien, por medio de los sentidos. Valor o Dato: Es el resultado al medir una magnitud en un elemento de la poblacin.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-8

De las definiciones anteriores surge que una muestra puede ser interpretada como un conjunto de valores que puede adoptar una magnitud. Y cuando tal conjunto, est formado por todos los valores posibles de la magnitud, entonces se trata de la poblacin. Mientras que si se tiene un nico valor constante para toda la poblacin, se puede tomar como un parmetro o como una muestra de un nico elemento. En la poblacin masculina, el sexo es un parmetro, o sea, una magnitud constante; mientras que si la poblacin es la especie humana, el sexo es una magnitud variable. Generalmente, una variable se expresa usando letras maysculas como X, Y, Z etc. Mientras que para los datos se usan las minsculas con subndice, como xi , yj , zk . Al igual que en Matemtica, la nomenclatura tcnica para un conjunto de valores se expresa con: X (x1, x2, x3, ..., xn). Si el peso de un individuo es de 73 kg, entonces ese es un dato, o un valor que adopta la variable al ser medida. Por ejemplo, si ese resultado se tuvo con la pesada undcima de la muestra de individuos escogida, esto se expresa con x11= 73 kg. Cada rama dentro de la Biologa presenta un grupo especfico de magnitudes propias, como concentraciones de fluidos o de productos qumicos en Clnica, medidas morfolgicas en Antropometra, frecuencias de factores hereditarios en Gentica, las estadsticas vitales en Demografa, y muchas otras ms. Es el investigador quien decide cul magnitud usar en sus estudios y la forma en que usar la herramienta estadstica, para analizar los datos obtenidos. La Bioestadstica no contribuye al descubrimiento de nuevas magnitudes, sino al tratamiento de la informacin que hace posible tal descubrimiento. Por ejemplo, un anlisis estadstico puede demostrar que el ajuste de los datos de la magnitud elegida, a una curva terica planteada, no es digna de confianza. Para reemplazarla, el investigador deber buscar alguna curva nueva usando los conocimientos de su profesin, su intuicin, pero nunca podr usar a la Estadstica, para buscar una funcin que se ajuste mejor a los datos obtenidos, presentndola como si fuese una nueva teora, pues tan solo es una aproximacin emprica. Las magnitudes pueden ser clasificadas como sigue:

Continuas Cuantitativas Discretas Magnitudes Ordinales Cualitativas Atributos Politmicas Dicotmicas (binarias)

La diferencia entre magnitudes cuantitativas y cualitativas est en la relacin que tienen con el patrn o estndar, contra el cual son comparadas al ser medidas. Si esta relacin puede ser expresada con nmeros, debido a una proporcionalidad, entonces la magnitud es cuantitativa. Por ejemplo, si la altura de un paciente es de 1,7 m, eso significa que es 1,7 veces ms largo que el metro patrn depositado en Pars, o sea una proporcin numrica real, y por eso la magnitud altura es cuantitativa. En general, todas las magnitudes fsicas basadas en el Sistema Internacional de Unidades (metro, kilo, segundo, etc.) son ejemplos clsicos de magnitudes de este tipo. En

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-9

cambio, una magnitud es cualitativa cuando su relacin con el patrn no es una proporcin numrica. El sexo, el color, el olor, etc. son ejemplos de este tipo de variables. Se pueden codificar con nmeros a los resultados, cuando se miden esas magnitudes, pero eso no quiere decir que la relacin sea numrica. Por ejemplo, si se conviene en codificar con un 2 al sexo masculino y con un 1 al femenino, eso no quiere decir que un hombre valga por dos mujeres. Las magnitudes cuantitativas se clasifican en continuas o discretas. Se diferencian entre s, porque en la primera la relacin numrica con el patrn puede ser cualquiera, mientras que en la segunda hay algunos valores prohibidos. Entonces una magnitud continua se expresa mediante nmeros reales. Las mediciones fsicas clsicas son el mejor ejemplo de este tipo de magnitudes: peso, talla, densidad, temperatura, presin, etc. En una magnitud continua hay infinitos puntos posibles dentro de un intervalo cualquiera de la misma - en del dominio de los nmeros reales. En cambio, cuando la magnitud tiene algunos valores que son posibles y otros que no, entonces se trata de una discreta (se expresan por lo general con los nmeros enteros positivos). Por ejemplo, las de recuento o enumeracin: como el nmero de hijos, de pacientes, la cantidad de dientes y otras. All se usan valores enteros para contar los resultados; no tendra sentido decir hay 12,75 alumnos presentes. Este tipo de magnitudes tambin se las llama: discontinuas o mersticas. Las magnitudes cualitativas se clasifican en atributos u ordinales. Se diferencian entre s en que los atributos son las cualidades del objeto de la medicin, observables sin emplear instrumentos. Como las organolpticas (color, sabor, olor, textura y nivel de ruido) donde se usan los sentidos para medir. En cambio, las ordinales implican medir el orden de los resultados obtenidos, para luego clasificarlos. Como el resultado de una carrera de autos, un concurso de belleza, un sorteo de lotera, etc. Debe destacarse que una magnitud de tipo continua, puede usarse como magnitud ordinal y an de atributos. Depende de la convencin utilizada para expresar los resultados. Por ejemplo, en un antibiograma se trata de hallar el mejor antibitico para combatir una infeccin, el mtodo consiste en extraer del paciente una muestra de la zona infectada y colocarla en un agar gel apropiado, dentro de una caja de Petri; luego de obtener desarrollo microbiano se coloca una arandela conteniendo muestras de los antibiticos a probar, y transcurrido cierto tiempo, la accin antibitica deja una aureola al atacar al agente infeccioso. Lo que se mide es el dimetro de las diferentes aureolas (cuantitativa), se compara con la tabla de resultados provista por el fabricante, y los resultados se expresan en tres categoras: sensible, muy sensible o resistente al antibitico (ordinal). La magnitud continua fue agrupada en tres clases, ordenadas de acuerdo con la resistencia al antibitico. A este procedimiento se lo llama agrupar los datos en categoras. Al precisar la talla de una persona, se est midiendo una magnitud de tipo continua, pero si esos datos se usan para clasificarlo en muy alto, alto, normal, bajo o enano, entonces se transforma la variable en una ordinal al categorizar los resultados, expresndolos de una manera cualitativa. Es conveniente tener en cuenta, desde el punto de vista de la cantidad de informacin, que la riqueza contenida en la magnitud continua se va perdiendo al volverla cualitativa, mediante algn tipo de convencin. Una binaria es la que contiene menor cantidad de informacin. Las magnitudes de atributos se clasifican en dicotmicas o politmicas. La diferencia se basa en si el atributo puede adoptar dos o ms valores diferentes. Dicotmicas o binarias son aquellas que pueden tener slo dos valores posibles, como: el sexo, el factor sanguneo Rh, la ausencia o presencia de la enfermedad, todas las reacciones de tipo (+) o (-), levgiro o dextrgiro, xito o fracaso, etc. Por su parte, las Politmicas son aquellas magnitudes que pueden tener ms de dos resultados posibles, como: el grupo sanguneo, la raza, el fenotipo, anlisis de sangre

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-10

en heces, marcas de autos en plaza, tipos de bocas de expendio de mercaderas al pblico y otras. Nuevamente, conviene resaltar que toda magnitud cualitativa puede ser dicotomizada como las continuas. Simplemente se toma un resultado y se lo ubica en una de dos categoras, segn si verifica o no un atributo dado. Por ejemplo, para clasificar a un varn recin nacido como robusto verificamos que pese ms de 4 kg al nacer; todo aquel que pes menos ser clasificado en la otra categora como no robusto. Naturalmente, que al dicotomizar una variable se pierde informacin y eso atenta contra la calidad de las estadsticas obtenidas con esos datos. El hecho de saber que un recin nacido es robusto no indica cul fue su peso al nacer, lo nico que se sabe es que pes ms de 4 kg. A un paciente con una CPK (creatino-fosfo kinasa) menor que 20 UI se lo puede suponer como exento de un infarto de miocardio, como (-), y si el valor es superior a 120 UI como (+). En el medio quedan los casos dudosos y as resultan tres categoras, se tiene una magnitud clnica tricotmica. Una magnitud compuesta es aquella que relaciona dos o ms magnitudes simples. As, dos magnitudes como: el peso de glucosa y de un cierto volumen de agua, al mezclarlas se transforman en una compuesta: la concentracin de glucosa en agua. Por regla general, las determinaciones de qumica clnica son ejemplos de este tipo. Por su parte, en farmacia se usan para casos como: ventas mensuales, ganancia diaria, etc. Tambin se puede tener magnitudes compuestas, relacionando magnitudes cualitativas. Por ejemplo, si se est determinando en una poblacin la cantidad de individuos que sufrieron enfermedades infantiles tpicas, esta medicin tendr datos del tipo: contrajo varicela, no contrajo paperas, y otros valores del cuestionario, entonces el cruzamiento de esos datos genera varias variables. A la idea de magnitudes multi-compuestas se la asocia con mediciones multidimensionales, y para estudiar sus resultados se suele emplear el anlisis estadstico multivariado. A veces se mezclan dos tipos de magnitudes diferentes, como el recuento de rojos, blancos o plaquetas, donde se tiene una magnitud discreta en el numerador y una continua en el denominador. En estos casos, se suele considerar a la resultante como si fuese una magnitud de tipo continuo. Todo depende de la convencin adoptada por el profesional.

1.4 Estadgrafos
Se llaman estadsticas o estadgrafos a los valores que cuantifican caractersticas de un grupo de datos, tales como la dispersin de los mismos, la tendencia a concentrarse alrededor de un cierto punto, etc. Estos ndices muestran las caractersticas ms salientes del conjunto de datos con un solo nmero. Y es a estos nmeros, a los que tradicionalmente se los llama estadsticas. Aqu se prefiere el uso de la palabra estadgrafo por dos razones: una, para no confundir este concepto con el de toda la materia en estudio; otra, porque en realidad es un valor que ilustra (grafica) una caracterstica saliente del grupo de datos. Por lo general, la informacin que se extrae del sistema aislado para su estudio es muy voluminosa. A menos de contar con computadoras para su procesamiento en forma electrnica, el manejo de grandes cantidades de nmeros se torna difcil, engorroso y con grandes posibilidades de cometer equivocaciones. Por estos motivos, desde sus comienzos, el problema general de la Estadstica fue buscar la manera ms conveniente de condensar el volumen de datos a unos pocos nmeros (medidas), que fueran indicativos de la conformacin de todo el conjunto.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-11

Condensando la nube de datos, en unas pocas gotas, ricas en informacin, se puede facilitar enormemente el manejo de las cantidades ingentes de datos. Y adems, la transmisin de los resultados obtenidos a otros investigadores, se facilita y resume. Si se piensa en como publicar el resultado de un experimento, del cual se extrajeron cientos de mediciones, la forma ms engorrosa sera hacerlo literalmente. Esto es, escribir cada nmero y transmitir en forma cruda toda esa informacin. Una manera ms prctica sera con una tabla donde los valores fueran agrupados en pocas columnas empleando sus frecuencias de aparicin o sus totales. Un grfico ilustrara mucho mejor, pues de un solo vistazo se abarcara el grupo en su totalidad, a costa de perder precisin. El problema hasta ahora sigue siendo el de siempre: se da toda la informacin en detalle, o se agiliza el trmite, resumindola a unos pocos indicadores: los estadgrafos. Este tipo de indicadores se puede agrupar en tres clases principales:

De tendencia central Estadgrafos (estadsticas o ndices) De dispersin Especficos

Los estadgrafos de tendencia central indican alrededor de cul valor se agrupan los datos obtenidos. La media, la mediana, la moda son los ms comunes y conocidos indicadores de este tipo. Si se graficaran todos los valores, esa especie de nube de puntos se distribuira alrededor de una zona central, donde se ubican estos ndices. La media o promedio suele ser la mejor medida para cuantificar esta zona, una especie de centro de gravedad de esos datos. De hecho, en Fsica, el centro de masa se define usando el promedio de las masas ponderado con la distancia. Dentro de este grupo entran los percentiles, por ejemplo la mediana que es el percentil 50, o bien el segundo cuartil, o bien el quinto decil, quiere decir que la mitad de los valores hallados son mayores que la mediana, y la otra mitad menor. Los estadgrafos de dispersin indican qu tan esparcidos estn los datos obtenidos. El rango, el desvo estndar y la varianza, son los ndices ms conocidos de este grupo. Se debe definir la dispersin de los datos respecto de algo. Conviene hacerlo respecto de la media aritmtica (como lo hace el desvo estndar) porque minimiza los cuadrados de los desvos, tal como se ver ms adelante. Otro estadgrafo asociado a estos dos tipos mencionados es el coeficiente de variacin, que es el cociente entre el desvo estndar y la media. En Fsica, este mismo concepto es el error relativo de una medicin, y en Bioqumica se lo asocia con la calidad del test clnico: cuanto menor es el coeficiente de variacin, mejor es el test. Los estadgrafos especficos son propios de cada especialidad. El ndice del costo de vida, el de la construccin y el de la inflacin, son los ms conocidos en Economa. Para Bioqumica y Medicina se emplean ndices como Sensibilidad, Especificidad, Prevalencia, Rendimiento, etc. Ayudan en la toma de decisiones. En Bioqumica por ejemplo, se los emplea como criterios, para decidir cul anlisis clnico conviene ms en la deteccin de una cierta enfermedad. Hasta la dcada del setenta, era costumbre seleccionar las tcnicas de anlisis de acuerdo a los criterios clsicos de precisin y exactitud, tomados como sinnimos de calidad. Desde entonces, en muchos casos se han impuesto los criterios de sensibilidad y especificidad, pues interesa ms la capacidad

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-12

para diagnosticar del mtodo, que su precisin y exactitud. An hoy, se usan las denominadas cartas de control de calidad, donde lo que se controla es si el mtodo clnico se mantiene estable dentro de lmites aceptables. Aqu al concepto de estabilidad se lo confunde con calidad, como ocurre en la Industria de donde se extrajeron estas ideas. En particular, son muy tiles cuando se miden magnitudes cualitativas donde es imposible usar los criterios clsicos de precisin y exactitud. En Sanitarismo se emplean ndices demogrficos como las tasas de Natalidad, Mortalidad, Morbilidad, etc. Tambin se usan ndices hospitalarios como: camas ocupadas, tiempo de permanencia, cantidad de prestaciones, etc. En Farmacia se usan mucho los ndices de tipo econmico y los de tipo industrial, como porcentaje de fallas, rotacin de stock, etc. En el tema cuatro se vern estos ndices con ms detalle.

1.5 Precisin y exactitud

En el lenguaje comn se suele usar la palabra precisin como sinnimo de exactitud. Sin embargo, en estadstica son conceptos bien diferentes. Si se mide una magnitud patrn n veces, con un instrumento adecuado, se obtienen n valores que difieren entre s. La dispersin de estos valores tiene diferentes causas y cuanto menor sea, mayor ser la precisin del instrumento de medicin. Por su parte, cuanto ms cercano est el promedio de los valores al valor del patrn, mayor exactitud tendr el instrumento. Para ilustrar estas ideas, nada mejor que usar un smil, como el del tiro al blanco. En l se supone que: el centro del blanco es el valor patrn, cada impacto es una medicin realizada, y la pistola es el sistema de medicin. Se puede apreciar en la Figura 1.1 tres ejemplos de una serie de disparos sobre el blanco. En el caso A, se puede ver que los impactos estn muy cercanos entre s pero muy lejos del centro, y por eso se dice que hay mucha precisin, pero poca exactitud. En el caso B, se ve que los impactos estn muy dispersos pero rodeando sistemticamente al centro, o sea que su promedio resultar muy cercano al mismo. A este caso se lo califica como de poca precisin y mucha exactitud. Y en el caso C, el ideal, se tiene un grupo muy compacto de disparos en el centro del blanco, hay mucha exactitud y mucha precisin. Haciendo la analoga entre la serie de disparos y una serie de mediciones, se pueden captar mejor las ideas de precisin y exactitud. Cuanto ms cercanos entre s estn los datos, mayor ser la precisin. Cuanto ms cerca est el promedio del centro, o valor verdadero de la magnitud (suero control), mejor ser la exactitud. Figura 1.1 Smil de tiro al blanco, para ilustrar los conceptos de precisin y exactitud

Caso A
(muy preciso y poco exacto)

Caso B
(poco preciso y muy exacto)

Caso C
( muy preciso y muy exacto)

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-13

Para cuantificar estos conceptos en clnica, hay varios mtodos. El ms comn es tomar un suero patrn -un estndar calibrado- y fraccionarlo en n alcuotas. Luego se mide cada alcuota y se tienen n valores, se calcula el promedio y el desvo estndar de esos datos. La diferencia entre el valor medio y el suero patrn da una idea de la exactitud del mtodo y permite cuantificarlo con el llamado error sistemtico. Lo mismo se puede hacer para controlar instrumentos; por ejemplo, usando pesas patrn se pueden testear balanzas, comparando el promedio de una serie de pesadas repetidas del patrn con el valor del mismo, se determina si est calibrada. Cuanto menor salga esta diferencia, tanto mejor ser la exactitud de la balanza. Usando sueros controles en forma anloga se puede controlar la exactitud de cualquier sistema de medicin clnico. A su vez, la precisin se cuantifica usando como base el desvo estndar del mtodo. En Clnica para saber si la dispersin de un mtodo es razonable, se lo compara con un valor lmite descrito en la bibliografa - ver Tema 25, o empleando algn criterio antiguo como el de Thonks o el de Aspen. As, comparando el desvo estndar del mtodo con un valor aceptable - desde el punto de vista clnico - se puede juzgar la precisin del mismo. Otra forma ms elaborada, es diluir el suero control para obtener un grupo de concentraciones diferentes, y luego, repetir para cada una, el mtodo anterior. De esa forma, se tiene un panorama del comportamiento del sistema de medicin en un rango de valores, similar al que se tiene en la prctica diaria de la profesin. Ms adelante se detallarn mejor estos procedimientos. En la industria, se han diseado controles mecnicos de precisin. Como en la fabricacin de los cojinetes para rulemanes. Estas esferas de acero, no pueden ser ni ms grandes, ni ms chicas que la diferencia entre los radios de las arandelas que las contienen; caso contrario, no se podr armar el rulemn. A la salida de la mquina productora de los cojinetes de acero se los hace circular por una zaranda con agujeros calibrados con el lmite mayor. Las que no pasan por estos huecos se descartan, las otras, caen a otra zaranda ubicada debajo, con agujeros calibrados para el lmite inferior. Las que quedan dentro de esta zaranda son las buenas y las que pasan por los huecos son desechadas, por ser demasiado pequeas. De esa manera, se controla en forma permanente, a medida que se fabrican, la precisin de la mquina industrial. Con el mismo criterio, en los laboratorios de anlisis clnicos se implementan las Cartas de Control de Calidad para tener un control diario de la estabilidad del test clnico. En la industria farmacutica se hace un control de calidad mucho ms exhaustivo que en otras industrias. Lo principal es controlar las dosificaciones de los medicamentos producidos. Para ello se seleccionan al azar, cierta cantidad de unidades de todo el lote de produccin. El nmero de unidades elegidas - la muestra - se decide sobre la base del tamao del lote para poder trabajar con una confianza aceptable. Luego se analiza el contenido de cada uno de sus componentes activos, dentro de ciertos lmites de tolerancia. Si el porcentaje de fallados es muy alto, no queda ms remedio que rechazar todo el lote, para impedir que salga al mercado un producto poco satisfactorio, que podra daar por lo menos la imagen de la empresa. El punto dbil del uso de estos conceptos, en la prctica, es su inaplicabilidad en el caso de tener que trabajar con variables de tipo cualitativo. En estos casos no hay ni valor promedio, ni desvo estndar. La solucin es trabajar con porcentajes. En efecto, si la ausencia de cierto atributo se puede clasificar como falla, entonces el porcentaje de fallados pasa a ser una variable de tipo continuo y se subsana el inconveniente. La idea es controlar que el porcentaje de fallados no exceda ciertas normas de calidad definidas por el fabricante, las cuales deben estar en

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-14

un todos de acuerdo con las normas establecidas por la autoridad sanitaria, para que los mismos puedan ser vendidos al pblico. Esto implica una serie de estudios muy complejos en poblaciones humanas, realizados de acuerdo a estrictas normas internacionales. Adems durante el ao 2002 se legisl sobre el concepto de Bioequivalencia en el Ministerio de Salud Pblica para ver si se permite la venta al pblico de un medicamento o de un equipamiento mdico.

1.6 Cuestiones clnicas

Uno de los principales objetivos tanto de Bioqumica como de Farmacia, es prestar ayuda al mdico en el tratamiento de sus pacientes. Entonces parece prudente explicitar los cuatro tipos fundamentales de investigacin clnica (tomadas del JAMA- Guyatt, G-2002): - Terapia: Determinar el efecto de diferentes tratamientos para mejorar el estado del paciente, o para evitar los efectos adversos involucrados. - Daos: Discernir los efectos de potenciales agentes dainos (incluyendo las terapias varias que estn interesados en examinar de acuerdo al punto anterior) en el estado del paciente, morbilidad y mortalidad. - Diagnstico: Establecer la capacidad de diagnosticar de un mtodo clnico para poder diferenciar entre aquellos individuos con, o sin, la condicin buscada o enfermedad. - Pronsticos: (prognosis) Estimar el curso futuro de la enfermedad del paciente. Para contestar la primera cuestin acerca del tema teraputico se usan estudios denominados Ensayos aleatorios controlados (Randomized Controlled Trials: RCT). Esta investigacin se disea de la siguiente manera: los participantes se dividen en dos grupos, y para ello se los escoge en forma aleatoria. A uno de los grupos se le aplicar un tratamiento experimental para estudiar el efecto del mismo (tratados), mientras que al otro grupo se le aplica el tratamiento estndar o usual (controles o placebos). Luego se sigue la evolucin de cada individuo en el tiempo, para observar si aparece el efecto buscado o bien no aparece. Por ejemplo, si se le aplica una nueva vacuna contra la gripe al grupo tratado, y el tratamiento usual al grupo control. Este tipo de estudios para analizar las terapias se puede esquematizar as: Tratados Participantes Seleccin aleatoria Controles Efecto (Si / No) Efecto (Si / No)

Idealmente, se podra hacer el mismo tipo de estudios para analizar el dao que puede infligir la exposicin a un cierto factor de riesgo. Esto es, en lugar de aplicarle a cada individuo un tratamiento preventivo, se le inocula un agente infeccioso o daino, para ver que le pasa. Pero la tica impide desarrollar este tipo de estudios, por lo que se encara de otra manera. Por ejemplo, para ver el efecto de fumar con relacin a enfermedades pulmonares, no es prctico disear un estudio donde se obligue a los individuos a fumar durante los prximos 10 aos para ver si desarrollan un cncer u otro tipo de complicaciones pulmonares. En cambio se pueden elegir individuos que han fumado regularmente durante los ltimos 10 aos para ver si hubo daos.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-15

Estos estudios observacionales dan una informacin ms pobre que los RCT y se pueden esquematizar como sigue: Enfermedad presente Expuestos Enfermedad ausente Pacientes elegibles Ocurrencia o circunstancia Enfermedad presente No expuestos Enfermedad ausente Para poder contestar la tercera cuestin sobre los diagnsticos, se trata de establecer que tan bien trabaja un mtodo para diagnosticar, o bien un test clnico. Aqu se necesita otro tipo de estudios basados en el estudio de sus propiedades, o caractersticas operacionales. Estos estudios se disean para saber que tan buena es la calidad del test clnico: Estudios de calidad: En estos casos, el investigador tiene que identificar a un grupo de individuos que pueden tener una cierta enfermedad o condicin de inters, de los otros que no la tienen (por ejemplo: tuberculosis, Chagas, sfilis, etc.). Esta es la condicin buscada, o bien los positivos. Entonces se comienza juntado un grupo de personas que el investigador sospecha que podran tener esta condicin. Luego a cada uno se le efecta un test clnico y a la vez otro test considerado el golden standard o mtodo de referencia (el cual de acuerdo a los conocimientos actuales es el mejor para detectar esa enfermedad). Con todos esos datos el investigador compara los resultados hallados con el test comn contra los de referencia, para poder evaluar la capacidad, o calidad del test clnico investigado. De esta forma se forman cuatro conjuntos independientes de resultados: los positivos confirmados por el test de referencia considerados como los verdaderos positivos, y los no confirmados considerados como falsos positivos, y anlogamente con los negativos que pueden ser verdaderos o falsos. Se agrupan estos datos en una tabla llamada Tabla Diagnstica, del tipo doble dicotmica como se muestra en el esquema siguiente: Tabla 1.1. Tabla diagnstica Resultados verificados Resultados del test Enfermos Sanos Positivo vp fp (+) verdadero positivo falso positivo Negativo fn vn (-) falso negativo verdadero negativo Total TE TS

Total TP TN N

Donde N es el nmero de sujetos investigados y TP = vp + fp : Total de sujetos diagnosticados positivos TN = vn + fn : Total de sujetos diagnosticados negativos TE = vp + fn : Total de sujetos enfermos, o que poseen la condicin buscada TS = fp + vn : Total de sujetos no enfermos (sanos), o que no poseen la condicin buscada

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] Este tipo de estudios de calidad se puede esquematizar de la manera siguiente: Pacientes bajo sospecha de tener la condicin buscada

1-16

Test clnico

Test de referencia

Tabla diagnstica

El caso anterior es el ms sencillo de todos porque se trata de estudios donde los resultados del diagnstico se dicotomizan en positivos y negativos, pero pueden ocurrir otro tipo de situaciones donde los resultados no son binarios como por ejemplo: positivo, dudoso y negativo. Una manera de salvar esta situacin es sencillamente descartar los casos dudosos y trabajar nicamente con los casos de diagnstico claro para el clnico. O bien esperar el paso del tiempo para confirmar. Finalmente, para tratar la cuarta cuestin de la prognosis se desarrollan estudios observacionales para poder identificar factores que puedan modificar ese pronstico. La investigacin se basa en identificar pacientes que pertenecen a determinado grupo, tal como: embarazadas, pacientes que sern sometidos a ciruga, o pacientes con cncer, etc.; con o sin factores que puedan modificar su prognosis (tal como: edad, profilaxis, etc.). El factor de exposicin aqu es el tiempo, y el investigador sigue observando a los pacientes para ver la aparicin de signos de la condicin buscada, tal como: problemas en el recin nacido al trmino del embarazo, infartos de miocardio luego de la ciruga, o supervivencia al cncer. Pacientes con riesgo de tener la condicin buscada Aparece el problema Factor de prognosis Tiempo No aparece

En general, los resultados obtenidos en las cuestiones de terapia, daos y prognosis se pueden agrupar en una Tabla de riesgo como se muestra a continuacin: Tabla 1.2. Tabla de riesgo Factor de riesgo / Tratamiento Presente Ausente Total Condicin esperada Si No a c TS b d TN

Total TP TA N

Donde N es el nmero de sujetos investigados y TP = a + b : Total de sujetos expuestos al factor de riesgo, inmunizados, o protegidos. TA = c + d : Total de sujetos no expuestos, o bien sin inmunizar o sin proteger. TS = a + c : Total de sujetos enfermos, o que poseen la condicin buscada TN = b + d : Total de sujetos no enfermos (sanos), o que no poseen la condicin buscada

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-17

En el caso de terapias, un sujeto tratado significa que ha recibido el tratamiento que se est estudiando, mientras que un individuo no tratado es uno del grupo control. A su vez, un individuo clasificado como enfermo es uno en el cual se ha observado la presencia del efecto buscado, y sano es uno donde no se ha verificado dicha presencia. En el caso de daos, un sujeto expuesto es uno que por diversas circunstancias se expuso en su pasado al factor de riesgo investigado (como fumar, radiacin, etc.). Y anlogamente al anterior, cuando se observa la aparicin del efecto buscado se lo clasifica como enfermo. En el caso de prognosis, cuando la condicin o estado del individuo es el que se quiere analizar se lo califica como expuesto o tratado (embarazada, operado, etc.). Luego de cierto tiempo se observa si aparece o no, el efecto buscado (problema en el recin nacido, infarto, etc.). Cuando se desean comparar dos tests clnicos para saber cual de ambos es el mejor, la manera adecuada de hacerlo es realizar un estudio de calidad diagnstica para cada uno, y luego comparar los resultados para poder optar por el de mayor calidad, de acuerdo a la enfermedad involucrada. A este procedimiento para comparar dos mtodos clnicos se lo denomina: comparaciones independientes para diferenciarlo de otro ms econmico, donde a cada paciente se le efectan dos mediciones, una con cada mtodo, y no se necesita de sueros controles ni de mtodos de referencia que son ms caros que un procedimiento estndar. Se llaman comparaciones apareadas, a los estudios realizados aplicando dos tests clnicos a un mismo paciente. Se debe tener muy en cuenta que el objetivo de este tipo de estudios no es determinar cual mtodo es el mejor, sino tan solo ver si uno de ellos (el mtodo viejo) puede ser reemplazado por el otro (el nuevo). En el caso de medir magnitudes continuas la idea central es ver si ambos mtodos tienen la misma exactitud, usada aqu como sinnimo de calidad. Esto es, ver si los pares de mediciones individuales son iguales, o bien si la diferencia entre ambos es cercana a cero. Para poder validar los resultados se emplean modelos estadsticos especiales para muestras apareadas, como se ver ms adelante. Para comparar la precisin en muestras apareadas, la nica manera es contrastar los resultados de cada mtodo por separado, contra un valor de tablas para ver si pueden ser aceptables. Para ello, se adopta un valor llamado: la dispersin mxima admisible (tabulada al final del captulo 25). Pero lo que no se puede hacer, es comparar ambos valores de precisin entre s porque las muestras no son independientes. En cambio en exactitud se hace un truco, porque lo que se estudia es la diferencia de las dos mediciones y as queda un nico valor por cada paciente, los cuales s son independientes. En el caso de medir otro tipo de magnitudes, que no sean continuas, la idea es transformarlas en un caso dicotmico o binario, adoptando un punto de corte adecuado. Ahora bien, como cualquier magnitud puede ser dicotomizada, el estudio de los casos binarios es el ms general de todos, porque abarca todas las mediciones clnicas. Por ejemplo, no se puede determinar la exactitud o precisin en magnitudes cualitativas, mientras que s se puede hacerlo en continuas; pero as como se puede transformar una magnitud cualitativa en binaria, lo mismo ocurre con las continuas. Por ejemplo, si se est midiendo el colesterol de un paciente se pueden agrupar los resultados hallados en dos grupos: colesterol alto o bajo, si se mide el peso se pueden clasificar en flacos y gordos adoptando un valor de corte apropiado (menos de 70 kg: flacos y 70 kilos o ms: gordos, para varones entre 18 y 22 aos). Si se mide un antibiograma los resultados se pueden clasificar en microorganismo sensible o resistente al antibitico. En el resultado de una determinacin de sangre en heces se puede adoptar la clasificacin: con y sin rastros de sangre. Los casos binarios son muy comunes en microbiologa, bacteriologa, micologa, etc. En toda deci-

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-18

sin clnica a ser adoptada despus de aplicar un mtodo de diagnstico, el resultado es binario como por ejemplo: se interna al paciente o no, se lo medica o no, se lo enva a ciruga o no, etc. Como regla conviene recordar que toda magnitud puede ser transformada en binaria. El objetivo central de disear el estudio clnico en forma apareada para magnitudes binarias, es decidir si se pueden intercambiar dos mtodos estudiando la concordancia entre ambos. La forma usual de presentar los resultados en estos casos se muestra en la tabla siguiente: Tabla 1.3. Tabla de concordancia Mtodo 1 Mtodo 2 (+) (-) Total (+) a c a+c (-) b d b+d Total a+b c+d N

Donde el nmero total de concordancias est dado por la cantidad (a + d) y el nmero total de discordancias por la cantidad (b + c). Siendo N el nmero total de casos analizados. Adems, a : es el nmero de individuos que resultaron positivos con ambos mtodos. d : es el nmero de individuos que resultaron negativos con ambos mtodos. c : es el nmero de individuos que resultaron positivos con el mtodo 1 y negativo con el otro. b : es el nmero de individuos que resultaron positivos con el mtodo 2 y negativo con el otro. Las Tablas 1.1, 1.2 y 1.3 esquematizan en forma general los diferentes tipos de estudios clnicos. Ms adelante se ver en ms detalle como estudiar a cada una de ellas.

1.7 Problemas propuestos

V 1) La estadstica es una ciencia para el tratamiento de los datos obtenidos. V 2) El significado de Bioestadstica es el mismo que el de Biometra. V 3) El objeto de la Estadstica es tomar decisiones con base cientfica. 4) Un sistema en estudio es un conjunto de elementos interrelacionados sin restricciones. V V 5) La poblacin de la familia rosceos es la clase angiospermas. V 6) En una poblacin de enfermos de HIV el sexo es un parmetro de la misma. 7) Las mujeres con sndrome de Turner, no son un parmetro en la poblacin femenina. V V 8) Los 5000 casos de gripe analizados, conforman la poblacin en estudio. 9) Los 20000 enfermos seleccionados constituyen una muestra de la poblacin argentina. V V 10) Todo estudio biomtrico debe tener un marco de referencia. V 11) Analizando las muestras se pueden inferir los parmetros poblacionales. V 12) Magnitud y variable difieren en que la primera depende de la poblacin. V 13) Medir es comparar una magnitud con otra de su misma especie. V 14) Un elemento de la poblacin que ha sido medido es un dato. F F F F F F F F F F F F F F

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

15) La diferencia entre las cuantitativas y cualitativas es su relacin con el patrn. 16) Una magnitud cualitativa no puede ser expresada con nmeros. 17) Las magnitudes discretas se expresan con los nmeros enteros positivos. 18) El peso no es una magnitud continua porque no puede ser negativo. 19) Dar 10 ejemplos de cada tipo de magnitud. 20) La cantidad de grageas de un frasco es una magnitud continua. 21) El estado civil de una persona es una magnitud dicotmica. 22) La fragancia de una planta medicinal es una magnitud organolptica. 23) La concentracin de un jarabe es una magnitud compuesta. 24) El resultado de una maratn es una magnitud ordinal. 25) La bondad de una persona no es una magnitud porque no puede medirse. 26) Los estadgrafos son valores que cuantifican ciertas caractersticas de los datos. 27) La exactitud de un sistema de medicin no puede ser controlada. 28) No se conocen las causas de la dispersin de las mediciones. 29) Los ndices clnicos forman parte de los estadgrafos de dispersin. 30) El nmero esperado de clientes en una farmacia no es un estadgrafo. 31) La dispersin de los datos se relaciona con la exactitud de los mismos. 32) Cuanto ms se acerque el promedio medido al valor patrn, mejor es la exactitud. 33) Lo ideal para diagnosticar es tener mucha precisin y exactitud. 34) Un sistema de medicin es bueno cuando su desvo es pequeo respecto a la media. 35) Completar el crucigrama siguiente:
1) 2) 3) 4) 6) 7) 8) 9) 10) 11) 12) 13) 14) B I O E S T A D I S T I C A

1-19

V V V V V V V V V V V V V V V V V V V

F F F F F F F F F F F F F F F F F F F

1) Conjunto de todas las muestras posibles, que pueden obtenerse del sistema en estudio. 2) Toda magnitud, que permite diferenciar entre s, a los componentes de una misma poblacin. 3) Valores que cuantifican caractersticas de un grupo determinado. 4) Los estadgrafos que indican que tan espaciados estn los datos obtenidos. 5) Conjunto de mtodos cientficos para la recopilacin, representacin, condensacin y anlisis de los datos extrados de un sistema en estudio, con el objeto de poder hacer estimaciones y sacar conclusiones, necesarias para tomar decisiones. 6) Conjunto de elementos que se aslan para su estudio en funcin de sus interrelaciones. 7) Conjuntos de datos obtenidos de una poblacin cualquiera.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

1-20

8) Comparar una magnitud con otra de su misma especie, considerada como referencia o patrn. 9) Parte de la estadstica dedicada a la formulacin de supuestos y estimaciones, hace predicciones y sacan conclusiones, de los datos obtenidos con el estudio de las muestras. 10) Nombre del llamado Padre de la Bioestadstica, ingls, primo de Ch. Darwin. 11) Toda magnitud, que tiene el mismo valor dentro de una misma poblacin. O sea, no permite diferenciar entre s, a sus elementos componentes. 12) Las magnitudes cuantitativas, en donde la relacin numrica con el patrn puede ser cualquiera. 13) Magnitud que se relaciona con ms de dos magnitudes simples. 14) Resultado al medir una magnitud, en un elemento de la poblacin. 36) Clasifique las magnitudes siguientes: - Nmero de libros en biblioteca. - Cantidad de dientes. - Stock de mercaderas - Concentracin de substancias - Drogueras proveedoras de una farmacia - Laboratorios proveedores de reactivos clnicos - Raza, religin, color de ojos, color de cabello - Reaccin en bacterias Gram. + - Resultados en: Carrera de autos, olimpadas, torneo de esgrima, concurso de belleza - Factor sanguneo: Rh - Grupo sanguneo - Ventas en pesos Ventas en unidades 37) Completar las conceptos siguientes: Las magnitudes cualitativas se clasifican en ... El error casual se relaciona con los estadgrafos de ... Las magnitudes cuantitativas se clasifican en ... Las variables dicotmicas tienen solo ... valores posibles. Las variables politmicas tienen .......... valor posible. Los .............. sirven para condensar una nube de datos. Las tres caractersticas de un sistema son : .... Estadstica es un .... de mtodos cientficos para la recopilacin, ......... , condensacin y anlisis de los datos extrados de un ............ en estudio. Los estadgrafos de posicin son: .... Los estadgrafos de dispersin son: .... Los ndices clnicos ms comunes son: .... Biometra es la ............ aplicada en Ciencias Biolgicas. El sistema en estudio se convierte en la ............. o ...... de referencia. El ............. de la poblacin se saca contando el nmero de componentes que tiene. La ............. es un subconjunto de la poblacin.

38) Definir las cuatro cuestiones clnicas bsicas que necesita atender un mdico en su prctica diaria. 39) Cmo se disean las investigaciones clnicas para poder estudiar la respuesta a cada una de las cuestiones del punto anterior ? 40) Explicar como se obtiene una Tabla de la verdad a partir de una investigacin clnica, sobre la calidad de un test clnico, o bien un mtodo de diagnstico.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

41) Unir con flechas los conceptos que se correspondan entre s: Medir

1-21

Es un conjunto de elementos que se aslan para su estudio en funcin de sus interrelaciones

Magnitud cuantitativa

Es comparar un valor con otro de su misma especie considerado como Referencia o patrn. Ya sea usando instrumentos, o bien por medio de los sentidos. Se pueden clasificar en continuas o discretas. Son los valores que cuantifican caractersticas de una serie de datos. Es el conjunto de todas las muestras posibles que pueden obtenerse del sistema en estudio, de acuerdo con el mtodo de seleccin usado Es toda magnitud cuyo valor es constante en toda la poblacin. Es el resultado de hacer una medicin. Est relacionada con el error sistemtico de las mediciones. Es lo que se estudia en este primer tema. Es toda magnitud que permite diferenciar entre s a los componentes de una misma poblacin. Matemticamente, se expresa como una funcin. Es todo resultado de un test que da positivo.

Poblacin Sistema Exactitud

Estadgrafos Estadstica Descriptiva Variable Parmetro Dato

Verdadero positivo

Positivo

El todo resultado de un test verificado como positivo

42) Cmo se clasifica a un individuo que dio positivo con el test clnico y sin embargo esto no resulta confirmado con el test de referencia o golden estndar? 43) Anlogamente, para los otros tres casos posibles. 44) Cuando no se dispone de mtodo de referencia para confirmar el resultado del test clnico, las maneras de verificar el resultado para armar una Tabla de la verdad podran ser: (contestar por s o no) - Efectuar anlisis complementarios y adicionales. - Consultar al especialista. - Hacerle una autopsia al paciente que ha fallecido. - Esperar el paso del tiempo para verificar el pronstico hecho con el test. - Realizar biopsias porque estas nunca fallan. - Hacer biopsias aunque estas pueden fallar. - Conseguir los datos de s estaba enfermo o sano primero, y despus analizar en forma retrospectiva el resultado del test clnico que se le haba realizado al paciente. - Lanzar una moneda al aire. - Usar tcnicas ms refinadas. - Estudiar la historia clnica y consultar con otros colegas.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

45) Existe un test clnico perfecto que no arroje ningn resultado falso ? 46) Tratar de definir la calidad de una prueba clnica o de un mtodo de diagnstico. 47) Explicar la concordancia entre dos mtodos de diagnstico. 48) En una Tabla de riesgo en cual de las cuatro celdas ubicara los casos siguientes: Un fumador que contrajo cncer de pulmn. Un individuo vacunado que no contrajo la enfermedad. Un no fumador con problemas pulmonares. Un enfermo que no fue inmunizado. Una infeccin bacteriana luego de someterse a ciruga. Un paciente que no fue sometido a tratamiento preventivo antes de la ciruga y no se infect. Un paciente de SIDA muy liberal en sus costumbres sexuales. Un recin nacido muerto de madre drogadicta. Un muerto de infarto de miocardio con un carcter apacible. Una persona sana a pesar de vivir en una zona epidmica. Un recin nacido sano luego de nacer por cesrea.

1-22

49) Explique como determinar el dao que puede provocar un factor de riesgo en forma tica. 50) De las razones por las cuales puede fallar una prognosis de contraer enfermedades venreas, si no se usan protectores adecuados en las relaciones sexuales. 51) En los estudios del efecto de un tratamiento, como se hace para separar los controles de los dems casos y explique la forma en que Ud. lo hara de manera prctica. 52) Pueden alguna vez coincidir una Tabla de la verdad con una de riesgo ? Dar ejemplos. 53) Pueden alguna vez coincidir una Tabla de la verdad con una de concordancia ? Dar ejemplos. 54) Explicar la diferencia entre muestras apareadas e independientes. 55) Explicar la diferencia entre una Tabla diagnstica, de riesgo y de concordancia. 56) Cul es el objetivo principal en un estudio de concordancia ? 57) Cul es el objetivo principal en un estudio de calidad diagnstica ? 58) Cul es el objetivo principal en un estudio de riesgo ? 59) Cul es el objetivo principal en un estudio del tipo RCT ? 60) Explicar la diferencia entre un estudio de tipo observacional y otro de tipo experimental. 61) Explicar la diferencia entre un estudio prospectivo y uno retrospectivo. 62) Explicar uno de los objetivos bsicos de Bioqumica y de Farmacia.

2
Recopilacin de datos
En este captulo se describen las diferentes tcnicas de recopilacin de datos, y se da un procedimiento para disear las diferentes etapas del proceso de obtencin de datos. Se hace hincapi en los mtodos de medicin. O sea, en la recopilacin de datos por medio de instrumentos, como es la prctica diaria en un laboratorio de anlisis clnicos y en las dosificaciones de medicamentos en la industria farmacutica. Otras formas de recopilar como encuestas, censos, etc. se tocan muy someramente pues se espera que el lector interesado use los textos especficos para profundizar estos conceptos.

2.1 Etapas de la recopilacin

Haciendo abstraccin de la manera de recopilar, se puede generalizar todo el proceso de obtencin de datos usando un diagrama de flujo como es habitual en programacin de sistemas. El objeto de este diagrama es ilustrar las diferentes etapas lgicas a seguir en el proceso de recopilacin, y a la vez mostrar cmo se puede disear el diagrama lgico de cualquier otra tarea. La Figura 2.1 muestra el ejemplo adoptado para este caso particular. Etapa 1 - Objetivos de la Recopilacin: esta primera etapa consiste en determinar con claridad qu es lo que se quiere lograr con la recopilacin. No siempre es fcil saber lo que se quiere y menos determinarlo en detalle. Por eso, se deben definir primero los objetivos generales del trabajo estadstico. Y a partir de ellos se conocern las variables a medir y as saber cules elementos se necesitarn. Con esto se tiene una primera idea de los alcances y limitaciones de la tarea a realizar, segn sea el tipo de informacin a obtener de la poblacin en estudio. Los objetivos deben redactarse como si fueran un telegrama, esto es, concisos, breves y claros. Una buena delimitacin temprana de la tarea ahorra tiempo, dinero y trabajo, que se desperdiciara en futuras revisiones, correcciones, ampliaciones, etc. Otra cosa a determinar con claridad en esta etapa es la poblacin en estudio y las hiptesis necesarias para simplificar el trabajo, desde el punto de vista prctico. Normalmente, la persona a cargo de la investigacin es la responsable de esta etapa pues tiene una visin ms completa y actualizada del tema en estudio. Este paso y el siguiente estn ntimamente relacionados. La doble flecha en el diagrama indica esta situacin. Lo prctico es ajustar lo que se quiere, en funcin de lo que se tiene o se puede conseguir, para no caer en utopas. Por ejemplo, si se necesita la distribucin de la poblacin por edades y sexo, no es lo mismo disponer de la informacin del ltimo censo realizado que hacerlo uno mismo.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

2-2

Figura 2.1 - Etapas de la Recopilacin de Datos.

OBJETIVOS

RELEVAMIENTOS

CREACION DE ALTERNATIVAS

Altern. 1

Altern. 2

Altern. 3

. .

Altern. n

SELECCION DE ALTERNATIVAS

PRUEBA PILOTO

PUESTA EN MARCHA

OBTENCION DE LOS DATOS

TRATAMIENTO DE LOS DATOS

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

2-3

Etapa 2 - Relevamientos: esta etapa consiste en determinar lo que se tiene para alcanzar
los objetivos definidos en la etapa anterior. Se trata de listar los bienes necesarios para poder hacer el trabajo, y el listado de los disponibles. Conviene tener en cuenta la siguiente clasificacin de los bienes:

Bienes tangibles

Materiales Equipamiento Dinero Infraestructura Personal

Organizacin Bienes intangibles Conocimientos Los materiales incluyen los de vidrio, de limpieza, drogas, reactivos, analitos, etc. Por equipamiento se entiende no slo los aparatos de medicin, sino los accesorios como muebles y tiles de laboratorio y para oficina. El dinero o los recursos monetarios deben ser determinados con mucho detalle para afrontar gastos e inversiones durante la investigacin. Adems, hay que determinar los fondos disponibles y las posibles fuentes financieras adonde poder recurrir. La infraestructura incluye a los edificios, laboratorios, electricidad, agua, etc. El personal es todo el necesario en sus diferentes niveles, como ser: profesionales, tcnicos, ayudantes, consultores externos, de servicio, etc. Este relevamiento de los bienes tangibles disponibles y de los necesarios para la recopilacin condiciona de alguna manera los objetivos. Puede ser que se disponga de bienes sobrados para alcanzar los objetivos, por lo que se pueden plantear metas ms ambiciosas. Por otra parte, puede ocurrir que los bienes disponibles estn lejos de cubrir los necesarios, y por lo tanto se debern resignar los objetivos planteados por otros ms modestos. Por su parte, los bienes intangibles son dos: la organizacin de los bienes tangibles, de manera tal de alcanzar los objetivos, y los conocimientos para saber cmo usarlos. Esto es el know how de cada profesin. Y tambin lo es la bsqueda bibliogrfica de trabajos similares en revistas especializadas, textos y otras fuentes de informacin. Una vez terminada esta etapa, que seguramente habr ayudado a depurar la anterior, se debe comenzar a pensar en las diferentes maneras de hacerlo.

Etapa 3 - Creacin de alternativas: esta etapa consiste en saber cmo hacerlo. O sea,
generar distintas alternativas de sistemas de recopilacin de datos, de acuerdo con los objetivos adoptados y los bienes disponibles. Se debe hacer un listado con todas las formas posibles de efectuar la recopilacin a fin de tener un panorama completo. Esto se ilustra en el diagrama de flujo con el planteo de n alternativas. Bsicamente, hay dos tipos de alternativas: una es lograr los datos a travs de publicaciones existentes llamadas fuentes; la otra forma es con mediciones propias. A su vez, dentro de cada tipo, se pueden plantear varias alternativas, por ejemplo: si las determinaciones se harn en laboratorio propio o por encargo a terceros, si se controlar la calidad de los instrumentos a usar, etc. En sntesis, se habla de fuente propia cuando se decide extraer los datos mediante mediciones. Fuente Primaria es cuando se toman los datos de otros investigadores que publican los resultados de sus propias mediciones. Fuente Secundaria es cuando los datos se extraen de publicaciones que usan como referencia a fuentes primarias. Y as sucesi-

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

2-4

vamente. Siempre que sea posible se aconseja el empleo de fuente propia en razn de la confiabilidad de los datos a manejar. Cuando esto no sea posible, entonces conviene usar una fuente primaria para evitar errores de imprenta, de trascripcin, etc. En Argentina existe el Instituto Nacional de Estadsticas y Censos que es la fuente primaria por excelencia de los investigadores. El INDEC, como se lo conoce popularmente, publica boletines peridicos con informacin obtenida de fuentes propias. O en forma directa, a travs de los Censos Nacionales de Poblacin y Vivienda, encuestas etc. Ya sea, a travs de los organismos provinciales similares con los que est asociado en esta tarea.

Etapa 4 - Seleccin de alternativas: esta cuarta etapa consiste en determinar cul es la

mejor entre las n alternativas planteadas en la etapa anterior. Se necesita de un mtodo para la adopcin de un criterio de seleccin. El mtodo ms comn es el grading que se muestra en el Cuadro 2.1 siguiente: CUADRO 2.1 Mtodo de grading para seleccionar alternativas Se tienen cuatro alternativas para realizar una determinacin de los valores de referencia de glucosa, en una poblacin dada. Estas son las Alternativas A, B, C y D. Procedimiento: 1. Se establece una lista de criterios a tener en cuenta en la seleccin:
(1) Mnimo costo. (4) Mnimo tiempo. (2) Mxima cantidad de datos. (5) Mnimo trabajo. (3) Mxima confiabilidad.

2. A cada criterio se le asigna un puntaje de 0 a 100 de acuerdo con la importancia que se le asigne a cada uno: Costo: 90 N de datos: 50 Confiabilidad: 80 Tiempo: 40 Trabajo: 30 3. Dentro de cada criterio se hace un ranking de las alternativas disponibles de peor a mejor y se le asigna un puntaje, de acuerdo con ese orden. Cuando hay empate se promedia el puntaje. Luego se multiplica por el grado de importancia definido en el paso anterior. Criterios
Orden 1 2 3 4 Trabajo A= 1x30= 30 D= 2x30= 60 B= 3x30= 90 C= 4x30=120 Confiabilidad D=1,5x80=120 C=1,5x80=120 A=3,5x80=280 B=3,5x80=280 N de pruebas C=1x50= 50 B=2x50=100 D=3x50=150 A=4x50=200 Tiempo D=1 x 40= 40 A=2,5x40=60 B=2,5x40=60 C=4x40= 160 Costo B=1x90= 90 C=2x90=180 D=3x90=270 A=4x90=360

En caso de empate se promedia y se asigna el orden promedio (Tiempo: hubo empate entre A y B, o sea entre el 2 y 3 puesto, se asigna 2,5 puntos a cada uno). En Trabajo, N y Costo no hay empates, en Confiabilidad hay empate entre el puesto 1 y 2 (1,5 puntos), y entre el 3 y el 4 (3,5 puntos).

4. Ahora se suma el total de puntos para cada alternativa:

A = 30+280+200+60+360 = 930 B = 90+280+100+60+90 = 620 C = 120+120+50+160+180 = 630 D = 60+120+150+40+270 = 640

5. Finalmente, se escoge como mejor alternativa aquella que obtuvo el puntaje mayor. En este caso se escoge la Alternativa A, y como segunda opcin la Alternativa D.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

2-5

La nica forma de sumar peras con manzanas es transformando cada una a pesos. El grading hace algo similar porque se trata de valorizar criterios totalmente subjetivos para poder sumar los puntajes y as decidir. En el ejemplo, se debe efectuar una determinacin clnica de glucosa en una poblacin dada para obtener sus valores de referencia. Se determinaron cuatro formas de hacer este trabajo y son las Alternativas A, B, C y D. El problema es decidirse por alguna de ellas. Los criterios a tener en cuenta para esta seleccin son: 1) menores costos; 2) obtener la mayor cantidad de datos posibles porque se trata de los valores de referencia; 3) optimizar la calidad del sistema de medicin para tener confiabilidad en los datos a obtener; 4) no demorar mucho con todo el trabajo; y 5) hacerlo en la forma ms sencilla posible. Una vez determinados los criterios a usar, se debe valorizarlos. Para ello, se le asigna un puntaje a cada uno, en forma subjetiva, comparndolos entre s. En el ejemplo, el tema del costo es muy importante y recibe 90 puntos sobre 100. Si hubiese sido decisivo, entonces tendra los 100 puntos. La cantidad de datos es ms o menos importante y por eso se le otorgan 50 puntos. La confiabilidad est a medio camino entre los dos anteriores y recibe 80 puntos. El tiempo que se tarde en hacer todo el trabajo no es crtico, pero s conveniente, y por ello se le dan 40 puntos. La laboriosidad de cada mtodo incide poco en la decisin a tomar y por lo tanto se le dan 30 puntos. Con esto ya se tienen valorizados los criterios entre s, y lo que falta es aplicarlos en cada una de las cuatro alternativas dadas. Para simplificar la tarea, se emplea dentro de cada criterio un ranking de las alternativas. La escala se puede hacer de mejor a peor. Como hay cuatro alternativas, habr cuatro puestos en el ranking. A la alternativa ms conveniente se le asigna el mayor valor posible, esto es 4. A la peor el menor valor posible: 1. Luego, entre las dos restantes se elige la mejor de ambas para ponerle un 3 y a la remanente un 2. Por ejemplo, en el criterio del costo, se sabe que la alternativa ms cara es la B y as le toca el ltimo puesto con un punto, mientras que la ms barata es la A y le tocan 4 puntos. En el medio quedan las alternativas C y D, pero como la C es un poco ms cara tiene 2 y la D queda con 3. Anlogamente, para los dems criterios. Debe notarse que en caso de empate se deben promediar los puntos. Por ejemplo, en el criterio del tiempo, lo nico que se sabe es que la alternativa D es la peor (por eso sale con un punto) y la C es la mejor (4 puntos). Pero, de las otras dos lo nico que se sabe es que demandaran un tiempo similar, una especie de empate entre ellas. Por lo tanto, quedan empatados los puestos 2 y 3, el puntaje promedio resulta 2,5 y es el que se le asigna a las alternativas A y B. Ahora se pueden volcar todos estos puntajes a una tabla, como la que se muestra en el Paso 3 del Cuadro 2.1. En cada casilla se multiplica el puntaje obtenido en el ranking por los puntos obtenidos en el grading de cada criterio (Paso 2). As, cada combinacin posible de criterio y alternativa, resulta valorizada en una de las casillas de esa tabla. Se tiene una ponderacin de los valores subjetivos presentados. El ltimo paso es sumar el total de puntos logrado por cada alternativa para saber cul gana. En el ejemplo, la alternativa A resulta seleccionada por tener el valor mximo de 930 puntos. Y queda como segunda opcin la alternativa D que le sigue con 640 puntos. Puede verse que la alternativa ganadora obtuvo el 80% del puntaje mximo posible [4 (90+50+80+40+30) = 1.160]; esto es, se trata de una buena seleccin. Si la alternativa seleccionada es el empleo de fuente propia, entonces hay que continuar con las etapas siguientes de la Figura 2.1. En cambio, si se decide usar otras fuentes, de publicaciones de otros investigadores, entonces hay que pasar al Tratamiento de los datos como se ver en el prximo captulo.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

2-6

En el Cuadro 2.2 se muestra otro ejemplo de aplicacin prctica. El problema ahora es seleccionar una de tres farmacias para firmar un convenio de prestaciones con una Obra Social. El responsable de tomar tal decisin toma en cuenta cinco factores y visita a cada una para poder definir el ranking entre ellas. CUADRO 2.2 Aplicacin del grading El gerente de una Obra Social quiere elegir la mejor farmacia de Posadas para firmar un convenio con ella para la atencin de sus afiliados. Los criterios que emplea son: reparto a domicilio, al cual le da una importancia del 90%. Buen surtido de medicamentos con 80%. Atencin personalizada 50%. Muchas bocas de expendio repartidas en la ciudad 60% y buen trato a los clientes 40%. Las candidatas son tres: las farmacias A, B y C. Realizando un ranking entre ellas para cada criterio resulta : Criterios FARMACIA A Reparto a domicilio 90 x 3 = 270 Surtido de medicamentos 80 x 1 = 80 Atencin personalizada 50 x 3 = 150 Bocas de expendio 60 x2,5 = 150 Buen trato 40 x 3 = 120 TOTALES 770 FARMACIA B 90 x 2 = 180 80 x 2 = 160 50 x 1 = 50 60 x 2,5 = 150 40 x 1,5 = 60 600 FARMACIA C 90 x 1 = 90 80 x 3 = 240 50 x 2 = 100 60 x 1 = 60 40 x 1,5 = 60 550

No hay empates y en conclusin, se decide negociar en primer trmino con la Farmacia A.

Este tipo de anlisis puede emplearse en todos los casos donde resulte difcil tomar una decisin, porque los factores a tener en cuenta son muy diversos. Desde un estudio biomtrico hasta una decisin de tipo personal.

Etapa 5 - Prueba piloto: existe una diferencia entre el diseo en los papeles y la realidad.
Es por eso que siempre es aconsejable hacer una prueba piloto antes de la puesta en marcha para poder juzgar cmo trabaja el sistema de recopilacin de datos. Se sacan unos pocos datos y se analizan las dificultades no previstas, junto con los resultados. Comparando los valores obtenidos con los que se esperaba tener, se hace una especie de control previo del sistema.

Etapa 6 - Ajustes: sera demasiado optimista esperar que todo salga bien al primer intento y
que no sea necesario efectuar correcciones. Lo normal es tener que hacer pequeos ajustes que permitan optimizar al sistema. De las diferencias detectadas en el control de la etapa anterior se sacan indicios. Estos muestran qu tpicos retocar y surgen nuevas ideas de cmo hacer mejor las cosas. Bsicamente, usando el sentido comn se corrigen los principales defectos, como ser: mejorar el entrenamiento y conocimientos del personal, redisear formularios, calibrar equipos de medicin, estimacin de la magnitud del error de medicin, etc. Pero tambin hay tcnicas de optimizacin especiales como son los distintos modelos de la Investigacin Operativa. Esta es una disciplina muy emparentada con estadstica y sus modelos ms conocidos son: Teora de Lneas de Espera, Programacin por Camino Crtico (PERT), Programacin Dinmica y Lineal, Reemplazos, Simulaciones, etc. Una vez hechos los ajustes, se vuelve a la etapa anterior y se

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

2-7

efecta una nueva prueba piloto. Este ensayo permite decidir si se contina adelante, o si son necesarios ms ajustes. Hay que continuar hasta que todo sea satisfactorio y recin entonces pasar a la etapa siguiente. Pero puede ocurrir que la prueba piloto demuestre que la alternativa escogida no sea satisfactoria para los objetivos previstos. Entonces, hay que escoger una nueva alternativa y recomenzar con los ensayos. En el Cuadro 2.1, esto implicara desechar la alternativa A y optar por la D para hacerle una nueva prueba piloto. Y as sucesivamente hasta lograr una alternativa aceptable. Si ocurre que ninguna de las alternativas planteadas es satisfactoria, entonces hay que generar ms alternativas para que sean probadas. Si todava esto no alcanza, lo que queda es volver atrs hasta definir nuevos objetivos y empezar todo de nuevo.

Etapa 7 - Puesta en marcha: una vez optimizado y ajustado el mtodo de obtencin de

datos solo resta ponerlo en marcha. De esa manera, se logra la cantidad de datos necesarios para alcanzar los objetivos previstos. El resultado final es la obtencin de un volumen grande de informacin que debe ser presentada en forma ms resumida y comprensible usando tablas, grficos y otras formas, como se ver ms adelante.

2.2 Formas de recopilacin

Existen varias maneras de recopilar datos. En trminos generales pueden ser agrupadas de diferentes formas. Una, es la que se vio en la Etapa 3 del punto anterior; otra es: Obtencin propia Formas de recopilar Obtencin de terceros Fuente primaria Fuente secundaria Fuente terciaria

Esta primera clasificacin se basa en la fuente de donde se toman los datos. La idea es que siempre conviene la fuente propia por razones de seguridad y confiabilidad. Mientras que si es de terceros, entonces conviene ms la fuente primaria que las otras por la posibilidad de errores en la trascripcin, publicacin, etc. Pero hay otros factores a tener en cuenta como las definiciones de los trminos y de los conceptos usados en el trabajo, las unidades usadas, etc. Cuando es una fuente propia se conocen todas las definiciones. Pero cuando se trata de una fuente primaria no siempre estn escritas en la publicacin, y en el caso de una fuente secundaria no se acostumbra ponerlas. El hecho de no tener muy claras las definiciones de trminos implica no tener claro el mbito de aplicacin del trabajo. Por ejemplo, si se toman datos de un estudio de las familias de Misiones, conviene saber qu cosa entiende el autor del trabajo por familia. Una cosa es la familia censal constituida por la cabeza de familia, su esposa y los hijos solteros que habitan bajo el mismo techo. Otra cosa es la familia biolgica formada por el padre, la madre y todos los hijos de ambos (definida as en el Diccionario Demogrfico de Naciones Unidas). Otra cosa es la familia como se entiende vulgarmente, constituida por padres, hijos y parientes. Por lo tanto, si no se tiene claro a qu tipo de familia se refiere el autor del trabajo, no se puede saber a qu poblacin aplicar las conclusiones. Ni tampoco si tales datos pueden ser tomados como fuente para un nuevo trabajo.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

2-8

Cuando no se conocen muy bien las unidades que se usaron para medir los datos, estos son directamente intiles. Por ejemplo, si se poseen datos de la produccin maderera de Misiones expresados en m3. Una cosa es el m3 estreo usado en la cubicacin de los rollos de madera en planchada de camin, otra el m3 Alto Paran usado para cubicar madera en el monte, y otra muy diferente el m3 lineal del Sistema Internacional de Unidades (1 m3 = 18,25 m3 Alto Paran ). nica vez Formas de recopilar Sistemtica Otra forma de clasificar, es tomar en cuenta la cantidad de veces que se har el mismo trabajo de recopilacin para una investigacin determinada. Hay veces en que se repite la tarea en perodos fijos de tiempo, caso tpico los Censos Nacionales de Poblacin y Vivienda que se realizan cada diez aos. Tambin se pueden efectuar Censos sobre otras actividades, como por ejemplo: Censo Industrial, Censo de Establecimientos Educacionales, Censo Agropecuario etc. Por su parte existen Encuestas o trabajos similares de recopilacin hechas en forma sistemtica. Un ejemplo, son las mediciones necesarias para calcular los ndices Econmicos mensuales que publica el INDEC (ndice de Costo de vida, de la Construccin, de Precios, etc.). En Misiones se realiza la Encuesta Permanente de Hogares, para controlar la situacin socioeconmica de sus habitantes y ver su evolucin en el tiempo. Estratificadas Formas de recopilar No Estratificadas Se puede clasificar la forma de recopilar de acuerdo con la manera en que se tomaron las muestras. Muchas veces la poblacin se divide en subconjuntos llamados estratos para lograr mayor calidad en las estimaciones que si se toma toda la poblacin en su conjunto. En Clnica, la estratificacin ms comn es la clasificacin de la poblacin por Edad y Sexo. Pero es usual el empleo de otros estratos como: Nivel de Educacin o de Ingresos, Raza, Religin, etc. Para un Laboratorio de Anlisis Clnicos, la manera diaria de recopilacin de datos es medir, y su problema principal es la variabilidad (error) que afecta toda determinacin clnica. En una Farmacia, el movimiento diario generado por las ventas afecta el stock. La manera de medir es haciendo el recuento de mercadera una equivocacin en el recuento no debe ser considerado como error.

2.3 Mediciones de laboratorio

La variabilidad en las mediciones no slo se debe al azar. Adems, hay una serie de factores, en el complejo proceso de una determinacin clnica, que producen variaciones. La contribucin de cada una de estas causas al total de la variabilidad, depende de los cuidados y controles que se tengan. Pueden ser acotadas, disminuidas en algo, pero nunca pueden eliminarse del todo. Los orgenes de estas fluctuaciones, se detallan en un trabajo de Statland y Winkel (1985) y se pueden abreviar con: Preparacin del paciente. Etapa Obtencin de la muestra. Pre-instrumental Procesamiento del analito. Almacenamiento hasta la medicin.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] Dilucin de la muestra tomada. Fraccionamiento en alcuotas. Mezcla de la muestra y los reactivos. Fluctuaciones de los instrumentos.

2-9

Etapa Instrumental

Las variaciones debidas a la preparacin del paciente, no solo incluyen a los factores biolgicos que operan antes de la recogida de la muestra, sino tambin a los factores analticos y psicolgicos que actan durante la toma. Dentro de todos ellos, los que tienen un efecto ms acentuado son: el ejercicio, la dieta y la ingestin de frmacos. El ejercicio genera una actividad muscular que tiene efectos transitorios, a veces prolongados, sobre diversas cantidades clnicas. Las variaciones transitorias de los constituyentes del plasma inducidas por ejercicio incluyen una disminucin de cidos grasos libres, un aumento fuerte (del 180%) en la concentracin del aminocido alanina, y uno mayor (300%) en la de lactato. Esto se observa durante la primera hora despus del ejercicio por razones de tipo metablico, y vuelven a sus niveles anteriores en las horas siguientes. Los efectos duraderos del ejercicio se notan en el aumento de la actividad de las enzimas musculares medidas en suero como fosfatasa-alcalina (AP), creatino-fosfo-cinasa (CPK), lactato-deshidrogenasa (LDH), etc. Por ejemplo, se midieron variaciones de AP del 120%, once horas despus de realizar el ejercicio. Las variaciones debidas a la dieta son muy conocidas. Aunque se recomienda que antes de someterse a la extraccin el paciente est en ayunas, un ayuno prolongado (de 24 horas) puede conducir a resultados inesperados. La bilirrubina se incrementa en 240% despus de ayunar 48 horas. As tambin se detectaron incrementos en la concentracin plasmtica de leucina, valina e isoleucina, como disminuciones de concentraciones de glucosa y protenas. El tipo de ingesta influye tambin en las determinaciones. Una dieta rica en protenas produce un incremento en la concentracin srica de urea, amonaco y urato. La ingesta de alta proporcin de cidos grasos no saturados disminuye el colesterol. Las bebidas con cafena, matena o tena, pueden llegar a triplicar la concentracin de cidos grasos. La supresin de hidratos de carbono aumenta la excrecin de acetona en orina. La ingestin de etanol induce incrementos en la concentracin de lactatos, uratos, triglicridos y metabolitos del etanol, como disminuciones de la CPK y de la AP. Las variaciones producidas por los efectos fisiolgicos de los frmacos son muy grandes. Sobre todo, por la gran disponibilidad de los mismos usadas en el tratamiento de los pacientes. Existen dos categoras bsicas: los efectos fisiolgicos in vivo del frmaco o de alguno de sus metabolitos, sobre la variable clnica a determinar, y los efectos in vitro debido a propiedades fsico-qumicas del frmaco que interfieren con el material de ensayo. Young (1975), compil un archivo de ms de 2.000 referencias con 15.000 interacciones de frmacos, donde puede verse la gran cantidad de posibilidades existentes. Pudo observar que la respuesta farmacolgica de un paciente difiere mucho de la de un individuo sano y que la respuesta in vivo depende de una serie de factores como: dosis, estado fsico y otras medicaciones suministradas en conjunto. En la obtencin de la muestra, la postura del paciente es la que produce las variaciones ms grandes. Tambin inciden otros factores como la aplicacin del torniquete y el ejercicio del puo. Por ejemplo, para la determinacin del lactato no se debe aplicar un torniquete, mientras que si se prolonga por mucho tiempo la aplicacin de este antes de la extraccin en s, se producen variaciones en protenas, colesterol, hierro y bilirrubina. Statland (1974), encontr diferencias por variaciones en la postura de los pacientes antes de la venipuncin. Determin 17 compo-

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

2-10

nentes de suero en individuos sanos que estuvieron de pie hasta un minuto antes de la extraccin, y de los mismos individuos luego de estar media hora acostados. Aparecieron variaciones de ms del 10% en Fosfatasa alcalina, Albmina y ALT; ms del 5% en Protenas totales, Hierro, Lpidos totales, Colesterol, AST y Fosfatasa cida.; ms del 3% en Fosfato Potasio y Calcio; mientras que el cido rico disminuy en casi un 4%. La seleccin de sangre capilar frente a sangre venosa no suele ser de mucha importancia, excepto en las pruebas de tolerancia de glucosa donde la capilar tiene concentraciones mayores del 10% al 30% respecto de la venosa. En la recogida de especimenes de orina de 24 horas, se deben seguir cuidadosamente las instrucciones sobre el mtodo a seguir; caso contrario se produce mucha confusin en los resultados. En el procesamiento del analito se pueden producir variaciones por contaminacin de la muestra si los residuos de detergentes en los tubos empleados no se lavan correctamente. El tapn de corcho, al igual que algunos de vidrio, pueden liberar calcio al ser expuestos a la sangre; entonces la concentracin srica de calcio se incrementa falsamente. La recogida de orina para anlisis de metales exige lavar el recipiente con cidos sin contaminantes. Otro problema comn, es la hemlisis que puede producirse tanto in vivo como in vitro. Cuando se colocan las muestras de sangre en tubos cerrados al vaco, la fuerte expansin de la sangre en el tubo provoca la lisis de las clulas. Lo mismo usando un anticoagulante de oxalato. Durante los pasos de centrifugacin y de separacin, se produce una fuga de clulas adicional de dos formas: una es la liberacin de los constituyentes del eritrocito, y la otra es la interferencia directa de la hemoglobina con diferentes ensayos, como albmina, bilirrubina, etc. Por su lado, la lisis de plaquetas puede aumentar la concentracin srica de Potasio y Magnesio, tanto como la actividad srica de aldolasa y Fosfatasa cida. El oxalato de potasio provoca una dilucin del plasma porque el agua de las clulas se escapa. El EDTA o heparina pueden producir disminucin en Calcio cuando se lo determina con un mtodo de colorante, aunque no afecta en el mtodo de absorcin atmica. La turbiedad en suero originada por altas concentraciones de triglicridos, provocar resultados altos para todos los ensayos basados en absorbancia a las mismas longitudes de onda. Las partculas de lpido tambin absorben luz y falsean el resultado. Los pasos de centrifugacin y decantacin pueden producir variaciones si no son efectuados correctamente. La transferencia de contaminantes, equivocaciones en el marcado de los tubos, fuga del potasio, suelen ocurrir en estos pasos si no se tiene cuidado. La congelacin y descongelacin pueden producir la desnaturalizacin de las protenas falseando los resultados obtenidos. En el almacenamiento antes de medir, pueden ocurrir variaciones por evaporacin del agua que contiene el suero y por la inestabilidad de los constituyentes qumicos. Una elevada temperatura ambiente, fuerte correntadas de aire en el laboratorio, mucho tiempo de exposicin al entorno, pueden producir evaporacin. Inversamente, si hay mucha humedad relativa ambiente. Esta evaporacin puede verse ayudada por la forma y el tamao de los recipientes usados. Todo lo cual produce lecturas con mayor concentracin de las substancias a medir en el suero, que la correcta. Muchos constituyentes qumicos de la sangre no son estables durante el almacenamiento, lo que ocasiona falsas lecturas. Por ejemplo, una prdida de la actividad enzimtica, prdida de dixido de carbono en almacenamientos abiertos, gluclisis en sangre por esperar demasiado tiempo entre la toma de sangre y la separacin del suero de la misma, la prdida de potasio si se conserva la sangre en una heladera, etc. Durante la Etapa Instrumental, es decir, mientras se estn midiendo las muestras, pueden ocurrir variaciones debidas al manejo. Una cosa comn es hacer las diluciones con pipetas en

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

2-11

lugar de usar balanzas de precisin. Aunque se trate de pipetas calibradas, las determinaciones volumtricas son de menor calidad que las efectuadas en balanzas analticas. Estas pueden detectar variaciones de hasta 10-4 g para cantidades de hasta 200 g, precisin que no logra una pipeta. Anlogamente, cuando se fracciona la muestra total en alcuotas, el trasvasamiento y la determinacin volumtrica pueden dar lugar a variaciones por falta de precisin instrumental. La mezcla de las alcuotas con los reactivos para efectuar las determinaciones, es otro paso de combinacin de volmenes susceptible de lo expresado antes. Pero no slo pueden producirse variaciones por emplear pipetas manualmente, sino que pueden ocurrir contaminaciones tanto en los materiales empleados como en los reactivos. Por ejemplo, una contaminacin bacteriana conduce a diferencias detectables en una Carta de Control de Calidad. Finalmente, las fluctuaciones de los instrumentos son una de las causas clsicas del llamado error de medicin. El sentido comn indica que si se efectan mediciones repetidas del mismo material bajo condiciones estables y con el mismo instrumento, los resultados obtenidos deberan ser los mismos. Sin embargo, todo investigador que haya operado con instrumentos sensibles sabe que esto no es as. Hay variaciones debidas a causas desconocidas y a esa ignorancia se le puso un nombre: error, y una causa: el azar. Error: Es la indeterminacin que afecta a toda medicin con instrumentos. En un conteo la medicin es exacta si hay algn error, entonces se trata de una equivocacin al contar mal. Cuando al efectuar una serie de mediciones se obtienen valores iguales, se piensa que el instrumento no es lo suficientemente sensible como para detectar el error. Nunca se puede creer que son iguales porque siempre hay errores y las sutiles variaciones ocasionadas por el azar no son detectadas en el instrumento. Ejemplos: detectar en un reloj comn una variacin del orden de unas centsimas de segundo, o el peso de un grano de arena en una balanza de almacn, etc. Si bien los errores no pueden ser evitados, por lo menos pueden ser cuantificados. Como se mostrar en el punto 2.6.

2.4. Recopilacin en investigaciones clnicas

Tanto en Medicina, como en Bioqumica y Farmacia las investigaciones ms comunes sobre poblaciones se centran en los estudios del riesgo. O sea, del dao potencial que pueden ocasionar en los pacientes, ciertos factores que se sospecha son causa de enfermedades, o bien el tratamiento aplicado. La disciplina que abarca estos estudios es la Epidemiologa. Se pueden clasificar los diseos de este tipo de estudios en tres fundamentales: Cohortes Caso-control RCT (tambin llamados Clinical trials)

Diseo de estudios clnicos

En un estudio por cohortes el punto de partida es el estado de la exposicin sufrida con el factor de riesgo (a veces de inmunizacin). El investigador identifica y clasifica a los que intervendrn en el estudio en dos grupos (o cohortes): Expuestos y no expuestos. Entonces se sigue en el tiempo a los sujetos, para detectar si aparece la enfermedad o signo esperado y se mide la can-

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

2-12

tidad de casos en que aparece el estado buscado (enfermos) y los casos de ausencia del mismo (sanos). Con estos datos se puede armar una Tabla de riesgo como la vista en el captulo anterior. Este caso es de un estudio prospectivo, aunque tambin se podra hacer uno de tipo retrospectivo donde se busca en la historia del paciente si alguna vez estuvo expuesto al factor de riesgo. Uno de los problemas de este tipo de diseo es la gran cantidad de datos requerida cuando la enfermedad es poco frecuente, por ejemplo si una hemorragia gastrointestinal en personas que usan cierto medicamento aparece 1,5 veces cada mil personas, en comparacin con aquellos que no usan el medicamento en los cuales aparece 1 cada mil, el tamao muestral requerido (NNT) es de 75.000 sujetos para cada grupo. El otro problema de los estudios observacionales es la aparicin de ciertos factores de confusin, que enmascaran otras causas que provocan la enfermedad. Por ejemplo, si en el caso de las hemorragias el medicamento se prescribe para pacientes de avanzada edad, y se sabe que los pacientes viejos tienen ms tendencia a sangrar que los jvenes; entonces el factor edad puede incrementar el riesgo de hemorragias que se presume debido al medicamento. Por todo esto, los investigadores deben documentar muy cuidadosamente las caractersticas de los sujetos investigados, tanto expuestos como no expuestos, ya sea para demostrar su compatibilidad o para corregir las diferencias usando tcnicas estadsticas. Se supone que ambos grupos deberan tener caractersticas similares para poder ser comparados como por ejemplo tener aproximadamente la misma edad, sexo, condiciones socio-econmicas etc. Cuando los investigadores no consigan un buen balance en edad entre ambos grupos, se debern usar mtodos estadsticos para ajustar el desbalance de los grupos. Pero aunque se tomen todas las precauciones posibles al respecto como: la comparacin entre los factores de confusin potenciales, la documentacin cuidados para evitar un desbalance, grandes tamaos muestrales, etc.; ni an as, pueden estar seguros que factores importantes para el diagnstico no se hayan tenido en cuenta, porque sencillamente los desconocen, o no los han medido y por lo tanto no saben si ocasionan un desbalance entre los grupos. Todo esto muestra que las inferencias obtenidas con los estudios por cohortes nunca ser tan confiables como las que se pueden obtener con un riguroso estudio del tipo RCT donde el investigador controla mejor los factores involucrados. En un estudio diseado como caso-control los pacientes que han desarrollado la enfermedad, o el sntoma buscado, se clasifican como casos, y luego se eligen como controles a individuos que son razonablemente similares a los casos, con relacin a aspectos relevantes como pueden ser sexo, edad, condiciones mdicas concurrentes, etc., pero que no han desarrollado la enfermedad. Este tipo de estudios es ms conveniente que el anterior cuando las enfermedades son raras, o cuando un estudio por cohortes toma demasiado tiempo para que sea factible. Usando un diseo del tipo caso-control los investigadores pueden determinar la frecuencia relativa de exposicin al agente que se cree origina la enfermedad, ajustando los resultados con las otras variables conocidas en el pronstico. Este diseo permite tambin el estudio simultneo de mltiples factores de exposicin que podran tener una asociacin con la enfermedad resultante. Por ejemplo, los investigadores podran hacer un estudio del tipo caso-control para demostrar la relacin entre la ingesta de dietilstibestrol (DST) en mujeres embarazadas y el desarrollo de adenocarcinoma vaginal en sus hijas muchos aos ms tarde. Un estudio del tipo RCT o por cohorte requeriran ms de 20 aos para poder ser completados. Peor an, dado que no es muy frecuente esta enfermedad la cantidad de casos requerida sera de cientos de miles. Por el contrario, usando un diseo del tipo caso-control los investigadores escandinavos separaron dos grupos: en el primero colocaron a las jvenes que haban desarrollado la enfermedad como casos (8 en total) y luego buscaron como controles jvenes con similares caractersticas que no la haban desarrollado como controles (32 en total). Luego retrocediendo en el tiempo determinaron si existi la in-

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

2-13

gesta de DST durante el embarazo de sus madres. Se encontr una fuerte asociacin (p < 0,00001) entre la ingesta de DST y el desarrollo del adenocarcinoma vaginal, sin tener que esperar 20 aos y con tan solo 40 mujeres en lugar de cientos de miles. En los estudios diseados como RCT se pueden estudiar la exposicin a agentes dainos tanto como a agentes beneficiosos para el paciente como inmunizaciones, proteccin antibitica previo a una ciruga, etc. Como la aleatoriedad de la muestra es la mejor manera de balancear los grupos de expuestos y no expuestos, las estimaciones resultarn menos sesgadas que con los otros tipos de estudios. Se ha encontrado que los resultados inesperados que a veces aparecen en estos estudios, tienen gran potencial en la determinacin del dao potencia de un factor en estudio (por ejemplo, drogas que los investigadores suponen beneficiosas a veces aparecen asociadas con un incremento de la mortalidad). Cuadro 2.3. Cuadro comparativo de los tipos de estudios clnicos Diseo Comienza en Se estudia el Ventajas Desventajas Susceptible a sesgo y validez limitada.

Cohortes Estado de la exposicin. Casocontrol RCT Estado de la enfermedad Estado de la Exposicin.

Resultado de Posible cuando no se puede la enfermedad. hacer aleatoria la seleccin de lo individuos expuestos. Resultado de la exposicin

No insumen largos perodos Susceptible a sesgo y de tiempo, y se pueden usar validez limitada muestras pequeas Resultado de Baja susceptibilidad al sesgo Posibilidad limitada, casos adversos generalizaciones

Hay otro tipo de estudios tales como las series de casos (descripcin de una serie de pacientes) y el informe de un caso (descripciones de pacientes individuales). Estos dos tipos de estudios no suministran comparaciones entre grupos, ni requieren que los grupos tratados y de control tengan similar prognosis. Sin embargo, ocasionalmente se encuentran dramticos hallazgos que demandan un inmediato cambio en el trabajo de los mdicos, como por ejemplo el caso del uso de la talidomina en embarazadas y sus consecuencias en el recin nacido. O bien, la serie de casos que se fueron reportando hasta que se identific al Sida como una nueva enfermedad. Pero tambin pueden haber consecuencias indeseables cuando se toman acciones en respuesta a cierta evidencia de enfermedad, por ejemplo el caso de la droga Bendectin usada como antiemtico en el embarazo, donde el fabricante tuvo que sacarla de inmediato del mercado, como resultado de informes de series de casos que sugeran que era peligrosa. Aunque estudios posteriores demostraron que la droga era relativamente segura, la mala fama adquirida no pudo ser erradicada, como tampoco la posibilidad de juicios en contra del fabricante al reintroducir la droga. En consecuencia, las posibilidades benficas de esa droga se perdieron por esos motivos. Por eso los mdicos no deben dejarse llevar tanto por los informes de casos, donde aparecen ciertas relaciones del tipo causa-efecto, sino ms bien reconocer que esos resultados pueden conducir a las investigaciones pertinentes por los entes reguladores, o por parte de los investigadores clnicos. La aparicin del llamado mal de la vaca loca fue informada al pblico mucho ms tarde de haber sido descubierta, ocasionando prdidas econmicas severas. Durante el 2003 la aparicin del SARS en China y su rpida propagacin, sigue generando serias preocupaciones en muchos pases.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

2-14

2.5. Mediciones industriales en Farmacia

En este caso, las mediciones habituales se orientan hacia el control de produccin. Se usan instrumentos en cada etapa del proceso productivo, generalmente de lectura continua, como es el caso de una termocupla insertada en un horno para controlar temperatura. A la que puede adosarse una graficadora de pluma, que registra sobre un papel continuo el valor de temperatura en forma permanente (al estilo de un electrocardiograma). De esa forma se pueden controlar las variaciones indeseadas y saber el momento en que ocurrieron. Todava, para automatizar este proceso, se puede incorporar un timbre de alarma que suene cuando la temperatura sobrepase ciertos lmites prefijados; o bien, accionar el encendido y apagado del horno como un relee. Las mediciones tpicas de Laboratorio forman parte del control de calidad en la industria. Se debe controlar tanto la materia prima ingresante como el producto final terminado. En la industria farmacutica, alimenticia y de cosmtica, los procesos son similares. La materia prima se inspecciona en el laboratorio para determinar la concentracin del reactivo comprado, de los solventes y otros integrantes de la frmula del producto a fabricar. Es decir, su grado de pureza. Pero tambin deben controlarse los dems insumos como envases, envolturas, frascos, ampollas, etc. Aqu, el objetivo es asegurarse que cumplan los requisitos pedidos, como por ejemplo los colores e impresin de los envases de cartn, de las etiquetas a pegar, el estampado en los tapones, etc. Luego, al final del proceso productivo se deben hacer ms controles de calidad. En este caso, el objeto es asegurarse que el producto terminado cumpla las normas de calidad adoptadas por la empresa. Estas normas van desde la forma de empaquetamiento hasta el grado de pureza de los principios activos del medicamento. La presentacin del producto final hace a la imagen empresaria entre los consumidores. En un perfume, por ejemplo, la esttica del envase a veces es ms importante que el contenido. En un medicamento es al revs, por lo tanto el mayor cuidado en esos casos se centra en el contenido. (Las acotaciones hechas en el punto anterior, en trminos generales, son aplicables al laboratorio de control en la industria. Pero las mediciones efectuadas a lo largo del proceso productivo son otra cosa). El problema general en la industria qumica es la mezcla en una o ms fases del proceso de varios componentes dentro de aparatos adecuados, ya sea en forma continua o en forma de batch (lotes de produccin). Cada componente puede ser considerado transferible a otras fases posteriores, teniendo en cuenta los cambios producidos por las reacciones qumicas, con liberacin o absorcin de calor, reacciones catalticas, oxidaciones, humidificaciones, etc. Dadas las condiciones iniciales necesarias para que comiencen las reacciones o para poner al sistema en cierto punto, luego de cierto tiempo de contacto comienza el proceso que debe ser controlado en todas las etapas subsiguientes, en cada punto o momento donde se produzcan los efectos buscados. En trminos generales, se debe prestar atencin a los puntos siguientes: Balance de materiales: la masa de la entrada, menos la de salida, debe ser igual a la acumulada durante el proceso. Esto permite tener un balance diferencial para cada componente y se puede disponer de relaciones estequiomtricas disponibles para el control. Primera Ley de la Termodinmica: tomando la etapa como un todo, se puede aplicar la manera diferencial de la primera ley para tener una ecuacin de control. Esto se reduce a un balance de entalpa si no hay flujo de calor desde el contorno hacia dentro o fuera, ni trabajo hecho por el sistema.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] -

2-15

Equilibrios: en los lmites de las regiones interfaciales entre las etapas, se producen condiciones de equilibrios que prevalecen en cada fase, y que se pueden considerar como partes del equilibrio final alcanzado por el proceso como un todo. Ecuaciones porcentuales: se aplican a la transferencia de calor a travs de todas las interfaces entre las etapas del proceso, a la transferencia de masa de cada componente individual y de las reacciones qumicas ocurridas.

2.6 Cuantificacin de errores de medicin

En el punto anterior se detallaron las muchas causas que pueden producir variaciones en las mediciones del Laboratorio de Anlisis Clnicos. La variacin total que afecta una medicin de laboratorio debe ser considerada como la suma de muchas variaciones muy pequeas, que agregan su efecto de manera tal que puede ser detectada por instrumentos. Esto se expresa as: el error total en una medicin de una magnitud cuantitativa es ocasionado por un gran nmero de causas, conocidas y desconocidas, que pueden producir efectos infinitesimales individualmente, pero que en conjunto, pueden ser cuantificados y clasificados como sigue: De apreciacin Errores Sistemticos Casuales La clasificacin anterior no es estricta. La aparicin de un tipo de error no excluye la existencia simultnea de los dems. Si no se los detecta es porque el sistema de medicin no es lo suficientemente sensible para ello. En la literatura sobre este tema es habitual encontrar a los dos ltimos tipos solamente. Aqu se agreg el primero por su utilidad en el diseo previo de las mediciones y como criterio en la seleccin de instrumentos. Sirve para cuantificar el error cuando se efecta una sola medicin. Los otros dos tipos necesitan ms de una medicin. Error de apreciacin: es aquel originado en la indeterminacin de la escala del instrumento de lectura utilizado. Bsicamente, hay tres tipos de escala que usan los instrumentos: lectura directa, digital y de alineacin. Estos casos se esquematizan en el Grfico 2.1. Los instrumentos de lectura directa son todos aquellos cuya escala es continua. Donde a simple vista se puede ver hasta la menor unidad de la escala. El ejemplo clsico es una regla milimetrada o un termmetro de mercurio, como el caso (b) del Grfico 2.1. Para efectuar una medicin de temperatura en un lquido, se sumerge el bulbo del termmetro en el mismo y se compara la altura de la columna de mercurio con la regla grabada en el vidrio del mismo. Si el termmetro est graduado en grados centgrados, significa que la distancia entre dos marcas sucesivas en el vidrio tiene ese valor. Si se puede ver que el menisco de mercurio est entre la marca de 56C y la de 57C, entonces, el resultado x de esta medicin se debe expresar: x (56; 57)C o lo que es lo mismo: x (56,5 + 0,5)C

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] Grfico 2.1: diferentes tipos de escalas en instrumentos de medicin

2-16

(a) Sin escala

(b) Escala de tipo continua

(c) Escala de tipo discreta

La segunda manera de expresar el resultado de la medicin significa tomar el valor ms probable dado por el promedio, y aceptar una incertidumbre de medio grado llamada error de apreciacin. Cuando la lectura es directa, se cuantifica a ese error con un valor del 50% de la menor unidad de la escala. Por ejemplo, en una regla milimetrada el error de apreciacin sera de 0,5 mm; en un reloj de agujas con segundero sera de medio segundo. La indeterminacin, en estos casos, est dada por la capacidad del ojo humano para discernir entre las dos marcas de la regla. No sera razonable decir que el ojo puede ver las centsimas de milmetro en una regla comn. Los instrumentos de lectura indirecta pueden ser de dos tipos: los de escala discreta y los de comparacin. Cuando el instrumento es digital se tiene una escala discreta, pues los valores van de uno en uno y es imposible apreciar la mitad de la menor magnitud de la escala. En el Grfico 2.1 puede verse en el caso (c) un reloj digital que informa hasta el segundo. Indica una lectura de 12 hs. 23' y 41''. La siguiente indicacin podr verse como [Link]. O sea, el error de apreciacin en estos casos se cuantifica con la menor magnitud de la escala. As, una lectura cualquiera se expresar como: x ( x + x) El valor x obtenido hace pensar que el valor verdadero de la magnitud medida pertenece a un intervalo definido por: el valor ms probable ms o menos el error de apreciacin x. Para el ejemplo anterior, si se mide un intervalo que empieza a las [Link] y termina a las [Link], el tiempo transcurrido se expresa como: x (23 + 1) segundos. Los instrumentos con una escala de comparacin son algo ms complicados. En el caso (a) del Grfico 2.1 se muestra el esquema de una balanza de platillos. Aqu se tiene una aguja, llamada el fiel, que oscila alrededor de la posicin central de equilibrio. Cuando se coloca la masa a pesar en un plato de la balanza esta se desequilibra. Se van agregando pesas hasta volver a lograr el equilibrio. Sumando el valor de las pesas se obtiene la medicin. En este caso no hay una escala en el sentido clsico del trmino. Por lo tanto, para cuantificar el error de apreciacin se procede como sigue: se toma la menor pesa disponible y se la coloca con mucho cuidado en el plato; si la aguja no se mueve, entonces se toma la pesa inmediata superior. Y as sucesivamente

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

2-17

hasta poner una que altere el equilibrio, lo ms chica posible. El valor de tal pesa ser el mdulo del error de apreciacin para esa lectura. Todo lo anterior muestra que siempre habr una manera de poder cuantificar la indeterminacin que afecta a toda lectura en un instrumento. Cualquiera sea el tipo de escala del instrumento, cualquiera sea el instrumento, toda medicin puede y debe ser expresada usando el concepto de error. Es mucho ms prudente estimar el valor desconocido de la magnitud, con un intervalo, en vez de un nico valor. Como ejemplo, se puede pensar en un paciente que concurre a un bioqumico a medirse la glucosa y este le informa (90 + 15) mg/l, luego para confirmar el valor va a otro laboratorio a repetirse la medicin y en ste ltimo le informan (103 + 7) mg/l. Al comparar ambos informes no ve incongruencias. Muy distinto hubiera sido el caso si ambos laboratorios le hubiesen informado con un nico valor 90 vs. 103. Cuando se estila medir una sola vez al paciente, entonces conviene conocer el error porcentual del sistema de medicin. Por ejemplo, si se sabe que para medir glucosa en nuestro laboratorio se comete un error porcentual del 8%, entonces cuando un paciente arroja un resultado de 93 mg/l se debera aadir (+ 8%) Cuando se mide ms de una vez a la misma magnitud, entonces cambia todo el procedimiento para determinar la incertidumbre de las medidas. Ahora se pueden obtener: Error sistemtico: es aquel que se caracteriza por tener siempre el mismo signo y aproximadamente el mismo mdulo, en una serie de mediciones. Un reloj que atrasa, una regla dilatada, un espectrofotmetro sin el ajuste del cero, son los ejemplos tpicos de esta clase de errores. Son los ms difciles y costosos de detectar. Para poder corregirlos, generalmente se deben calibrar los instrumentos con personal especializado. Cuando se los acota, se pueden corregir los resultados finales en alguna medida, pero nunca se los puede eliminar totalmente. Hay una serie de causas que los originan debidas al: . Observador: tendencia personal a ubicarse a un costado de la aguja indicadora (paralaje). Mal lavado de los materiales a utilizar. Falta de control en los procedimientos. Mala aplicacin de los cubreobjetos. Mezclas deficientes, etc. . Instrumento: lentes o filtros sucios. Electrodos viejos. Agujas indicadoras dobladas. Cubetas de caras no paralelas en el espectrofotmetro. Mala calibracin del aparato, etc. . Materiales: contaminacin de los reactivos por falta de precauciones. Drogas vencidas. Kits mal refrigerados. Mala extraccin de la muestra al paciente. Conservacin deficiente de las muestras, etc. . Mtodo: tiempo de centrifugacin excesivo o escaso. Eleccin inadecuada del diluyente. No emplear EDTA o similar en recuentos en sangre. Variaciones bruscas de temperatura o energa elctrica sin tener previsto su control, etc. La responsabilidad por este tipo de causas recae en el profesional, pues si toma las adecuadas precauciones podra evitar la mayora de ellas. Este es uno de los motivos por los cuales toda tcnica de laboratorio tiene un protocolo a respetar estrictamente. Adems, todo laboratorio debera tener procedimientos de control de calidad para sus prcticas, junto con los planes de mantenimiento preventivo para los aparatos, materiales y drogas. Sin embargo, como el factor humano es el principal responsable de la prevencin, lo mejor es mantener a todo el personal motivado y entrenado en esta problemtica. Las tcnicas estadsticas slo informan de la aparicin

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

2-18

de estos errores despus que han ocurrido, cuando lo ideal sera evitar que ocurran. Si todo el personal conoce el tema de errores en mediciones a fondo y si ponen su empeo en evitarlos, casi todo el trabajo est hecho. No debe perderse de vista la tendencia humana a evitarse problemas. Cada vez que se detectan desvos, eso implica una serie de trabajos extras fuera de la rutina habitual del laboratorio y lo ms difcil: descubrir las causas desconocidas que los provocan. El ser humano reacciona instintivamente ante lo desconocido con temor. El abandono de una estereotipia de conducta cmoda y habitual, le genera ansiedad. Le es difcil aceptar el hecho de que tiene fallas ante s mismo y ms an ante los dems. As, lo natural es la resistencia al cambio. Por eso, la parte ms difcil en la implementacin de un programa de control de calidad no es su diseo ni su implementacin, sino lograr que el personal lo adopte de buen grado en su fuero ntimo. Un cambio de actitud. Lo ms difcil. Error casual: es aquel provocado por una gran serie de causas desconocidas y variables llamadas casualidad, en una serie de mediciones. Su mdulo no es constante y tampoco, tiene el mismo signo. Toda vez que se efectan varias mediciones y los resultados obtenidos son diferentes, se puede tener una medida del mismo. Para poder cuantificarlo se usa la teora estadstica de los errores casuales, que se ver ms adelante. Por ahora, basta decir que se los usa en tcnicas de calibracin para poder cuantificar la precisin y exactitud de las tcnicas de laboratorio. Ambos criterios se usan tambin para seleccionar prcticas entre s. Cuando hay varios mtodos posibles para hacer la misma determinacin clnica conviene elegir el de mejor calidad, y hasta hace poco eso significaba el de mejor precisin y exactitud. Actualmente se emplean otros criterios de seleccin. Sobre todo en las magnitudes cualitativas donde precisin y exactitud no tienen sentido. En sntesis, todo resultado de una prctica clnica debe ser informado a los usuarios usando un intervalo formado por un valor ms probable y una estimacin del error de medicin. Este error acota y cuantifica la variabilidad de las mediciones de laboratorio y tiene que ser informado al mdico necesariamente. Se supone que el mtodo empleado ha sido testeado, calibrado, y est controlado para seguir manteniendo una indeterminacin aceptable (lo que en Medicina significa: un 95% de confiabilidad en los resultados).

2.7 Problemas propuestos

1) Ordenar las siguientes etapas de una recopilacin de datos: ( ) Puesta a punto; ( ) Relevamientos; ( ) Creacin de alternativas; ( ) Objetivos; ( ) Seleccin de alternativas; ( ) Puesta en marcha. 2) Empleando el mtodo de grading determinar la puntuacin de 3 alternativas: A, B y C donde al Costo se lo valoriza en 90 puntos, siendo A la mejor y C la peor. El Tiempo con 50 puntos es el mismo para las tres. En Confiabilidad con 80 puntos la mejor es B, luego C y A: A( ) B( ) C( ) V F 3) La mejor forma de hacer una recopilacin es usando fuente primaria. V F 4) En la etapa instrumental de las mediciones se hace el procesamiento del analito. V F 5) El error de apreciacin de un reloj comn digital es 0,5 seg. V F 6) El error sistemtico puede ser corregido por el bioqumico. V F 7) El error casual no puede ser corregido por el profesional. 8) Nombrar los bienes tangibles e intangibles en la etapa de relevamiento....................................

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

V 9) Un censo es una forma de recopilar por nica vez. V 10) Una encuesta puede ser estratificada para tener mayor riqueza de informacin. V 11) La variabilidad en las mediciones slo es producto del azar. V 12) Para evitar variaciones por la dieta se debe preparar al paciente con un ayuno. V 13) El ejercicio no influye en la medicin de los parmetros clnicos. V 14) La postura del paciente produce variaciones en la obtencin de la muestra. 15) Nombrar los cuatros puntos a tener en cuenta en la etapa pre-instrumental. 16) dem anterior, pero para la etapa instrumental. 17) Nombrar los tres tipos de errores de medicin. V 18) El error de apreciacin de un termmetro comn es 0,1C. V 19) El error casual se puede cuantificar slo si se hacen varias mediciones. 20) El error sistemtico de una balanza puede ser producido por una mala puesta a cero. V V 21) En un reloj digital un intervalo de 45 seg. se informa como (45,0 + 0,5) seg. V 22) Los instrumentos de lectura indirecta son de comparacin nicamente. V 23) El error sistemtico puede ser de distinto signo. V 24) Una serie de causas desconocidas producen el error casual. V 25) Toda medicin est afectada por una cierta indeterminacin, llamada error. 26) Conviene informar los valores medidos con un intervalo, antes que con un punto. V

2-19

F F F F

F F

F F F F F F F F
F

27) Usando el mtodo del grading encontrar la mejor de las alternativas propuestas: En cuatro laboratorios de la ciudad se prestan especialidades relacionadas con hormonas y radioinmuno ensayo. Un sanatorio se apresta a firmar un convenio con uno de ellos y debe decidir con cul. Para esto toma en cuenta los criterios siguientes: a) Cercana al sanatorio (los laboratorios A y C estn a pocas cuadras y los otros dos muy lejos, siendo el B ms cercano que el D). b) Control de calidad (los laboratorios C y D llevan un programa de control y los otros no). c) Rapidez en la entrega de resultados (A es el ms veloz, luego D, C y por ltimo B). d) Comisiones (B da la mxima, C una intermedia y A y B la mnima). e) Experiencia (D es el ms antiguo, A el ms novato y los otros dos parecidos entre s). Se le asigna 40 puntos al primer criterio, 80 puntos al segundo, 60 al tercero, 100 puntos al cuarto y 50 puntos a la experiencia. Por qu se decide finalmente por el laboratorio B? 28) Completar los siguientes conceptos: - La recopilacin de datos a travs de formularios se hace en una ..... - La primera etapa de la recopilacin de datos es definir claramente los .................. del mismo. - Para seleccionar alternativas se puede usar cualquier mtodo, pero el ms recomendable es el llamado .................. - El relevamiento .................. se hace usando libros, informes, revistas cientficas, etc. - Conviene hacer una prueba ............. antes de la puesta en marcha. - Cuando se sacan los datos del informe de otro investigador, se usa una fuente ........ - Cuando se miden los datos a usar, se est usando una fuente .......... - Cuando los datos se obtienen de terceros, se usan fuentes .........., .......... o terciarias. - Se pueden recopilar datos por nica vez, o en forma ............

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

2-20

- Si la poblacin se divide en ..............., la forma de recopilar se llama ........... - Las variaciones de las mediciones en un laboratorio se deben al azar y a una serie de factores como ser: ...... - Hay dos etapas bsicas en las mediciones: la .......................... y la ........................ - La mezcla de la muestra del paciente con los reactivos se hace en la etapa ......................... - Las variaciones producidas por los efectos fisiolgicos de los frmacos son muy ............... Hay dos tipos de efectos los in vivo y los in ........ - La dieta que deben hacer los pacientes para una toma de muestra de sangre es un ........... de 12 horas, porque un ayuno de 24 horas no es ................ - Para que no ocurran evaporaciones antes de medir la muestra, conviene que ............... - Hay que prestar atencin en las mediciones industriales a los siguientes puntos: .......... - Los errores de apreciacin se emplean cuando se hace una sola ............ - Los errores de apreciacin se originan en la indeterminacin de la ............. del instrumento. - El error sistemtico es la diferencia entre ........................ - El error casual est relacionado con una serie de causas ............................... - El error ......................... siempre es del mismo signo y de magnitud ............. en una serie de mediciones de laboratorio. En cambio el error ................. , puede tener diferente ........... y diferente ................ - La precisin se relaciona con el ...................... y la exactitud con el .......................... 29) Definir los siguientes conceptos: - Recopilacin de datos - Fuente propia - Fuente primaria - Bienes tangibles e intangibles - Formas de recopilacin 30) Clasificar los pasos a seguir en las etapas pre-instrumental e instrumental. 31) Definir y clasificar los tipos de errores de medicin. 32) Diferencias entre mediciones de laboratorio e industriales. 33) Formas de cuantificar los tres tipos de errores de medicin. 34) Explicar los tipos de diseos de estudios clnicos ms comunes. 35) Ventajas y desventajas entre los diferentes diseos clnicos. 36) Explicar las ventajas y desventajas de los informes de serie de casos. 37) Que tipo de diseo se debe usar cuando se quiere investigar: - la exposicin a un cierto factor de riesgo - el desarrollo de la enfermedad. - la inmunizacin o proteccin aplicada - una enfermedad muy rara - el efecto de un factor daino al paciente.

3
Presentacin de datos
En este captulo se describen las diferentes tcnicas de presentacin de datos, y se dan varios procedimientos para efectuarlas. Primero, se muestra una manera de proceder en el Laboratorio de Anlisis Clnicos cuando este debe informar sus resultados al usuario. Luego, se muestran las diversas tcnicas para armar tablas y grficos cuando se tienen muchos datos. Se repasan los grficos ms usuales y se hace hincapi, en los de uso ms frecuente o importante, como los histogramas y las pirmides de poblacin.

3.1 Informes de laboratorio

Diariamente, el laboratorio de anlisis clnicos prepara una serie de informes escritos. El ms usual es el reporte al mdico solicitante (Grfico 3.1) de los resultados obtenidos en el paciente analizado. Cada laboratorio puede confeccionar un formulario preimpreso con copias para que una de ellas quede en su poder como archivo de todo lo actuado. En este formulario basta volcar los datos medidos, colocar las observaciones si las hubiera y firmar para tener el informe listo. Estos formularios normalmente contienen la siguiente informacin: . Datos de identificacin: en el borde superior del formulario se coloca el logotipo del laboratorio (si lo tiene), el nombre, la direccin, el horario de atencin y los telfonos. . Ttulo: en forma breve y concisa se explica el tipo de informe. . Paciente: los datos principales del paciente son: nombre y apellido, nmero de afiliado y la obra social (o anlogo) a la que pertenece, porque con esos datos se puede facturar. Adems el sexo y la edad son dos cosas necesarias para el mdico. . Solicitante: es para especificar el nombre del mdico que envi al paciente. . Cuerpo: el cuerpo es el informe propiamente dicho en una columna se codifican las prestaciones realizadas; en la columna de al lado la denominacin tcnica de la prestacin; y en la siguiente se coloca cada uno de los resultados. A veces se agrega, y conviene hacerlo, otra columna con los valores del intervalo, dentro del cual se estima est el valor verdadero de la medicin. Otras veces, en esa ltima columna se colocan los valores de referencia para poblaciones humanas, de la edad y sexo del paciente. Esto ltimo le facilita al mdico saber si su paciente tiene los valores normales, o bien, algn exceso o defecto que le ayudan en el diagnstico y tratamiento. Finalmente, algunos profesionales dejan en blanco esa ltima columna para poder agregar algo si lo consideran oportuno.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-2

. Notas: al final del informe se dejan dos o tres renglones libres para observaciones. . Firma: todo informe debe ser rubricado por el profesional responsable con aclaracin del nombre y apellido, ttulo profesional y matrcula pblica con la que est habilitado oficialmente. En el Grfico 3.1 se muestra un ejemplo de este tipo de formularios, usando datos imaginarios. Lo que se presenta es la copia que debera guardar el profesional para su archivo personal, donde se colocan todos los datos relevantes del trabajo realizado. El original que se enva al mdico no tiene porqu tener toda esa informacin; por ejemplo, los cdigos de prestaciones pueden ser obviados. El resguardo de la copia es importante para prevenir cualquier inconveniente que pudiese surgir en el futuro, tal como un litigio, un reclamo por una cobranza mal liquidada, etc. Grfico 3.1: Ejemplo de formulario para informar resultados

LABORATORIO DE ANLISIS CLNICOS de la Clnica La Dulce Espera INFORME DE RESULTADOS

Flix de Azara 3789 - Posadas (3300)

Paciente: Ana S. de Fernndez N Afiliado: 56788948412-9 Obra Social: Madereros Edad : 25 aos

Solicitante: FECHA: 12 08 01 Dr. Claborde Clnica el Sol -Caingus Horario: Lunes a Viernes 8 a 20 hs Sbados de 8 a 14 hs.

Cdigo

Prctica

Valor medido

Valores de referencia

174 876 192 902

Colesterol Total Triglicridos Creatinina Uremia

170 mg/dl ( + 20) 102 mg/dl ( + 25) 9 mg/l 0,2 g/l ( + 2) ( + 0,05)

hasta 220 mg/dl hasta 170 mg/dl entre 8 y 14 mg/l hasta 0,4 g/l

Observaciones:
............................................ Juan Sebastin Mastropierro BIOQUIMICO M. P. N 4567

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-3

A veces se acostumbra usar separatas, o sea, una especie de volantes preimpresos para los informes especiales como ser: Hemograma completo, Proteinograma, Inmunoglobulinas y algunos otros. Estas hojas separadas se completan con los datos medidos y se abrochan a la hoja del informe principal, vista ms arriba. En el Grfico 3.2 se muestra un ejemplo. Conviene destacar que en toda separata se vuelven a colocar fecha, paciente y firma, aunque parezca redundante. Esto conviene hacerlo pues, si las hojas se desglosan, el mdico puede saber de quin se trata y cundo se hizo el informe. Adems, toda hoja de un informe debe estar firmada, para darle visos de seriedad. Se recomienda el uso de sobres para poner los informes que se entregan a los pacientes aunque estos no sean cerrados. Sin embargo, si la informacin es confidencial, es mejor cerrar el sobre de manera tal que nadie lea el informe, salvo el mdico solicitante. Es usual el uso de sobres con membrete de tamao oficio, para estos menesteres.

Grfico 3.2: Ejemplo de informes profesionales usando separatas.

LABORATORIO DE ANLISIS CLNICOS de la Clnica La Dulce Espera PROTEINOGRAMA

Flix de Azara 3789 - Posadas (3300)

PRCTICA

Unidad

Valor Medido 7,66 (+ 0,5) 4,46 (+ 0,6) 3,20 (+ 0,3) 0,23 (+ 0,1) 0,75 (+ 0,1) 0,85 (+ 0,1) 1,15 (+ 0,1) 1,39

Valores de referencia

Protenas totales......... Albmina.................... Globulinas.................. 1 globulinas............. 2 globulinas............. globulinas............. globulinas............ Relacin A/G............. FECHA
12 08 01

g/dl g/dl g/dl g/dl g/dl g/dl g/dl

6,1 a 7,9 4,0 a 5,2 1,9 a 2,7 0,2 a 0,4 0,4 a 0,7 0,7 a 0,9 0,7 a 1,4 1,5 a 2,7

Paciente:
Juan Sebastin Mastropierro

Ana S. de Fernndez

BIOQUIMICO M. P. N 4567

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-4

La otra presentacin de datos importante de los laboratorios, es el listado de todas las prcticas realizadas en el mes (o quincenal) que se presenta a modo de factura para cobrar. En lugar de presentar una factura a cada una de las Obras Sociales con las cuales se trabaj durante el mes, es mucho ms prctico elevar una sola, completa, al Crculo o al Colegio de Bioqumicos, como es el caso de la provincia de Misiones. Entonces, la entidad que los agrupa se encarga de cobrarle a cada Obra Social, y la suma total la deposita en la cuenta bancaria del profesional, con los descuentos de prctica. Este servicio lo prestan a cada uno de sus afiliados, cobrando una comisin a descontar de los depsitos. A veces, adems se le hace la liquidacin de impuestos correspondientes a esas operaciones. Naturalmente, el profesional debe contar con Facturas reglamentarias para poder cobrar a los pacientes particulares. Guardar una copia de todo trabajo realizado y firmado es tan importante como lo es en cualquier negocio el guardar una copia de toda factura emitida. No solo para cumplir ante la DGI, sino para resguardar su firma profesional ante cualquier requerimiento legal que pudiera enfrentar.

3.2 Informes estadsticos

Los mtodos para la presentacin de datos en Estadstica son de tres tipos. Casi siempre se los combina con el objeto de lograr una mayor claridad y transparencia en la informacin que se transmite al lector. Sera muy engorroso leer un informe donde se detallan uno por uno los cientos de valores obtenidos en la recopilacin. Por eso, toda esta nube de datos, como se la llama en la jerga estadstica, debe ser presentada de manera simple y en lo posible amena. El director del trabajo es el responsable de esta parte y le conviene aprovechar las caractersticas ms salientes de cada mtodo. Textual Mtodos de presentacin de datos Tabular Grfico Cualquiera sea el mtodo de presentacin adoptado, es obligatorio hacer mencin especfica de la fuente desde donde se obtuvieron los datos. Se aclara fuente propia cuando el autor es quien hizo las mediciones. Cuando se trata de una fuente secundaria, terciaria o alguna otra, entonces se deben aclarar los datos de la misma, de manera tal, que el lector pueda hallarla, en caso de ser necesario. Para esto, hay una costumbre casi universal de detallar los datos identificatorios de la fuente, ya sea un libro, ya sea un artculo de una revista cientfica. Como se muestra a continuacin: 1) Libros: Azzimonti Renzo, J.C., Bioestadstica aplicada para Bioqumica y Farmacia, Editorial Universitaria de la UNaM, 2 Edition, Posadas, 2003 Primero se coloca el apellido del autor principal y separadas con una coma, sus iniciales. Luego en letra cursiva se pone el ttulo entre dos punto y coma. A continuacin la editorial que lo public, el nmero de la edicin y el ao. A veces se coloca la ciudad donde se edit.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] 2) Artculos:

3-5

Azzimonti Renzo JC, Failures of Common Measures of Agreement in Medicine and the Need for a Better Tool: Feinstein's Paradoxes and the Dual Vision Method, Scand J Clin Lab Invest 2003, 63: 207-216 En este caso, se colocan los apellidos y las iniciales de los autores, luego el ttulo del artculo en letra comn. El nombre de la revista se coloca en letra cursiva, pero con la abreviatura oficial aprobada de la misma. En el ejemplo es la Scandinavian Journal of Clinical and Laboratory Investigation. En negrita se coloca el nmero de tomo: 63, luego las pginas de inicio y fin del artculo, ms el ao de publicacin. En los textos, se acostumbra colocar una llamada usando un nmero escrito entre corchetes ( superndice), correspondiente a la bibliografa detallada al final del libro o del captulo. As, el lector puede profundizar un tema especfico de su inters sabiendo con certeza a qu fuente recurrir en cada tema.

3.3. Mtodo textual

Este mtodo de presentacin de la informacin consiste en el empleo de palabras y cifras combinadas en un texto, para informar los datos obtenidos. En el Cuadro 3.1 se puede ver un ejemplo. Hay un pequeo prrafo que explica el origen de los datos, junto con 400 nmeros desordenados, para que el lector los analice y trate de sacar sus propias conclusiones. CUADRO 3.1: Datos obtenidos de un Servicio de Unidad Coronaria.
De los archivos del Servicio se tomaron todas las fichas de pacientes ingresantes con diagnstico presunto de Infarto de Miocardio. Estas fichas se separaron en dos grupos: en uno se ubicaron los que no tuvieron infarto como se verific despus, y en el otro aquellos con diagnstico confirmado. Se desecharon los casos dudosos. De cada grupo se escogieron al azar 200 casos y se tom el valor de CPK expresado en unidades enzimticas. Los valores obtenidos fueron: SIN INFARTO: 10 - 33 - 20 - 2 - 76 - 38 - 8 - 63 - 76 - 80 - 15 - 18 - 37 - 23 - 22 - 7 - 3 - 2 - 30 35 - 39 - 6 - 11 - 17 - 20 - 23 - 19 - 18 - 26 - 28 - 21 - 77 - 1 - 14 - 4 - 6 - 33 - 30 - 39 - 40 - 8 - 22 2 - 18 - 13 - 12 - 23 - 33 - 16 - 18 - 67 - 70 - 34 - 19 - 98 - 38 - 11 - 5 - 9 - 30 - 23 - 28 - 8 - 12 - 13 24- 13 - 14 - 19 - 22 - 32 - 12 - 79 - 25 - 63 - 5 - 19 - 16 - 3 - 7 - 9 - 10 - 13 - 17 - 2 - 4 - 5 - 6 - 6 - 6 -18 - 91 - 3 - 11 - 10 - 88 - 15 - 19 - 20 - 11 - 12 - 18 - 2 - 6 - 7 - 8 - 9- 11 - 10- 10 - 17 - 3 - 99 - 5 2 - 8 - 1 - 40 - 115 - 9 - 11 - 12 - 32 - 72 - 14 - 24 - 23 - 18 - 19 - 3 - 5 - 22 - 29 - 53 - 55 - 1 - 12 13 - 105 - 10 - 3 - 5 - 41 - 55 - 56 - 44 - 7 - 79 - 9 - 6 - 59 - 1 - 66 - 43 - 2 - 65 - 48 - 44 - 5 - 70 - 77 - 9 - 7 - 5 - 59 - 6 - 12 - 11 - 13 - 14 - 21 - 66 - 23 - 61 - 80 - 55 - 45 - 42 - 60 - 58 - 47 - 43 - 56 - 59 - 54 - 49 - 48 - 45 - 44 - 56 - 45 - 49 - 81 - 88 - 100 - 110 - 97 - 120 - 92 - 90. CON INFARTO: 23 - 44 - 55 - 81 - 100 - 88 - 93 - 99 - 40 - 34 - 57 - 21 - 35 - 122 - 56 - 37 - 154 45 - 39 - 56 - 41 - 60 - 49 - 43 - 56 - 51 - 52 - 141 - 56 - 57 - 59 - 150 - 29 - 61 - 128 - 80 - 85 - 87 90 - 91 - 97 - 66 - 65 - 150 - 144 - 61 - 69 - 81 - 100 - 88 - 93 - 99 - 77 - 76 - 155 - 74 - 79 - 68 - 80 - 62 - 64 - 73 - 75 - 132 - 66 - 77 - 68 - 132 - 70 - 71 - 73 - 77 - 61 - 63 - 72 - 71 - 74 - 76 - 61 - 167 - 66 - 180 - 179 - 69 - 121 - 140 - 123 - 122 - 130 - 134 - 138 - 140 - 124 - 85 - 87 - 90 - 91 - 97 127 - 129 - 132 - 131 - 139 - 135 - 134 - 123 - 133 - 139 - 101 - 120 - 102 - 100 - 85 - 87 - 90 - 91 97 - 111 - 113 - 115 - 103 - 104 - 106 - 108 - 110 - 118 - 116 - 81 - 100 - 88 - 93 - 99 - 114 - 112 110 - 105 - 103 - 107 - 106 - 109 - 107 - 112 - 115 - 119 - 120 - 102 - 104 - 103 - 105 - 81 - 100 88 - 93 - 99 - 109 - 107 - 105 - 85 - 87 - 90 - 91 - 97 - 103 - 104 - 106 - 107 - 112 - 115 - 118 - 111 - 102 - 111 - 113 - 115 - 103 - 104 - 106 - 108 - 110 - 118 - 116 - 114 - 112 - 110 - 105 - 103 - 107 106 - 109 - 102 - 81 - 100 - 88 - 93 - 99 - 115 - 103 - 104 - 106 - 108-

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-6

Desde el punto de vista del lector, este mtodo es el ms engorroso de los tres para poder captar el significado de los valores obtenidos y sacar alguna conclusin. En el ejemplo del Cuadro 3.1 se aprecia que los que no tuvieron infarto, en general tienen un valor menor de CPK que los infartados. Pero como hay muchos valores coincidentes en ambos casos, se hace confuso el uso de esta tcnica clnica para diagnosticar un infarto. Sin embargo, un anlisis ms cuidadoso permitira ver que las cosas no son as. En forma textual se informara: ... el primer valor obtenido con los infartados fue 10, el segundo 33, el tercero 20..., y as sucesivamente. Desde el punto de vista del redactor, el mtodo textual tiene una ventaja importante con respecto a los otros: se puede influenciar al lector. El autor puede resaltar ciertas cifras de su inters, puede remarcar conceptos apropiados para sus fines y hacer pasar desapercibidos a los otros. Se puede focalizar la atencin del lector, de tal manera que pase por alto ciertos datos evitando que saque sus propias conclusiones. Todo lector prevenido debe desconfiar cuando encuentra juicios de valores en un trabajo cientfico. Se ha preparado un pequeo ejemplo ilustrativo de estos conceptos en el Cuadro 3.2. Para entenderlo mejor, es conveniente seguir los pasos indicados: primero se debe leer el texto de la Parte A. Luego, en un papel, el lector escribe las cifras que recuerde y las conclusiones que saca. Por ltimo, lee la Parte B y la compara con sus propias conclusiones: CUADRO 3.2: Ejemplo de un mtodo textual.
Paso 1) Leer una sola vez el prrafo identificado como Parte A. Parte A: La actual comisin directiva de nuestro club de canotaje, que hoy finaliza su tarea, tiene el gusto de presentar a vuestra consideracin los exitosos logros alcanzados durante su gestin, tales como el incremento de un 400% en la cantidad de remos extras, y todava un bote tipo doble ms. Se mejor la seguridad y vigilancia de los bienes de nuestro club de dos aos de vida, en un 200%. Con gran previsin de futuro y preocupacin por el equilibrio ecolgico, se increment en un 500% el capital arbreo. Los ingresos por cuota societaria aumentaron en un 50%, acrecentando a su vez el nmero de socios. Con esta exitosa gestin financiera de este perodo, se construy un nuevo vestuario para mayor comodidad de nuestros asociados mejorando substancialmente el aspecto sanitario... Paso 2) Escribir en un papel lo que se recuerda de la primer lectura y opinar sobre la gestin realizada por la comisin directiva saliente. Paso 3) Leer el Parte B, comparar con la anterior comisin directiva para ver si se mantiene la opinin escrita en el Paso 2. Parte B: ...Del Resumen y Balance de los dos primeros perodos del club se han extrado las siguientes cifras: 1 Gestin 2 Gestin - Cantidad de Botes 20 21 - Cantidad de Remos 42 50 - rboles plantados 5 25 - Nmero de serenos 1 3 - Cuota mensual del socio 30$ 40$ - Nmero de socios 110 112 - Superficie construida 600 m2 606 m2 (los 6 m2 se destinaron a vestuario)

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-7

Puede notarse del Cuadro 3.2, que mientras las primeras autoridades del club pudieron comprar 20 botes, la segunda solo uno, pero al comprar 8 remos de ms, incrementaron en un 400% la cantidad de remos sobrantes. Colocaron 20 plantines de rboles en el terreno y con eso dicen que incrementaron un 500% el capital arbreo. El alza de un 50% en los ingresos del club no fue aumentando el nmero de socios, sino subiendo la cuota. Contrataron 2 serenos, cuando antes con uno alcanzaba. Construyeron 6 m2, cuando los anteriores lograron centuplicar ese valor. Sin embargo, todas estas cosas no surgen del texto del discurso de la comisin saliente, sino de una tabla comparativa que presenta slo cifras. Esto ilustra la conveniencia de adjuntar a los textos las tablas correspondientes, para hacer ms transparentes los conceptos que se puedan verter. Una tabla no puede influir al lector tanto como lo puede hacer un texto.

3.4. Mtodo tabular

Este mtodo de presentacin de la informacin consiste en presentar los datos por medio de una tabla o cuadro. En esta, se debe colocar al principio un ttulo identificatorio que en forma clara, breve y completa, explique el contenido de la tabla. Luego viene el cuerpo y al final se debe colocar la fuente de donde se tomaron los valores mostrados. Una tabla simple consta de un cuerpo dividido en columnas, cada una con su encabezado y una aclaracin de las unidades que se estn usando. Una tabla de doble entrada consta de un cuerpo dividido en filas y columnas, con sus respectivos encabezados, como la del Cuadro 3.3. Si se diera el caso de usar las mismas unidades en toda la tabla, entonces conviene especificar las mismas en el ttulo, para simplificar. El cuerpo de la tabla propiamente dicho muestra los datos numricos. Conviene emplear recuadros para facilitar la lectura y ubicacin de los valores. CUADRO 3.3: Ejemplo del mtodo tabular. Valores de CPK extrados de fichas de pacientes de una Unidad Coronaria (medidos en UI.) Diagnsticos Confirmados Sin Infarto Con infarto 104 36 28 18 10 4 0 0 0 0 8 16 32 46 66 23 6 3

Valores de CPK medidos 1 21 41 61 81 101 121 141 161 a a a a a a a

20 40 60 80 100 120 140 160 180

FUENTE: Cuadro 3.1 anterior.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-8

Para armar la tabla del Cuadro 3.3, se usaron los valores del Cuadro 3.1, agrupndolos en clases de igual tamao como se ve en la columna matriz o principal donde van los encabezados de las filas. En este caso, el encabezado de la cuarta fila es: 61 a 80. Para cada fila (intervalo), se cuenta el nmero de veces (frecuencia) que un valor cae dentro del mismo, tanto para el caso de infartados como no-infartados. Por ejemplo, el valor 23 de la sptima fila y tercera columna significa que se han encontrado 23 casos de pacientes infartados, cuya CPK est comprendida entre los valores 121 y 140 UI y ningn caso entre los no infartados por lo que su valor es 0. Una tabla es el mtodo ms imparcial para presentar la informacin, muestra los datos crudos, dejando al lector la tarea de interpretarlos sin hacer ni sugerencias ni comentarios. Al contrario de un grfico, no se puede captar la idea general de un simple vistazo salvo a trazos gruesos. Como por ejemplo decir usando el cuadro anterior, que cuanto mayor sea la CPK mayor la posibilidad de tener un infarto.

3.5. Mtodo grfico

Este mtodo de presentacin de la informacin es el ms simple para el lector porque puede captar el panorama general, o la tendencia de los datos, de un solo vistazo. Es mucho ms fcil de comprender que una tabla o un texto. La sencillez de lneas, una atractiva manera de presentacin, la posibilidad de usar las tres dimensiones (3D), junto con colores, hacen de los grficos una de las herramientas ms poderosas para transmitir ideas en forma rpida y simple al lector. Su desventaja ms notoria es la prdida de precisin y exactitud, si se lo compara con una tabla. Pero siempre se puede sacrificar algo en aras de la sencillez. Por estas razones, la mayora de los autores usan las tres formas vistas (mtodos mixtos) para la redaccin de sus obras. La idea es aprovechar las ventajas de cada uno de ellos. Cada grfico es un original, quedando a criterio de su autor sus dimensiones y formas, pero sometidas a las reglas del buen arte. Esta libertad de creacin provoca un gran nmero de posibilidades. Aqu, slo se muestran los tipos ms usuales en clnica, usando una clasificacin muy general. Para quien necesite crear sus propios grficos, conviene repasar algunos consejos de expertos en el tema: - antes de efectuar el grfico definitivo, conviene hacer varios modelos diferentes en borrador para poder elegir entre ellos al ms adecuado; - la disposicin del grfico debe hacerse de izquierda a derecha; - debe colocarse siempre el cero de la escala cuando alguna es usada en el mismo; - para las comparaciones conviene emplear una sola dimensin, antes que dos o tres; - en los grficos de porcentaje acumulativo adems del nivel cero se debe colocar el 100%; - la lnea ms gruesa de todas debe ser la del grfico o curva que se muestre, para subordinar las dems a la principal - la lnea de ayuda visual en el grfico debe ser la ms fina de todas; - debe tener un ttulo claro, conciso y completo; - debe indicar la fuente de donde se extrajo la informacin; - deben colocarse siempre la escala empleada y las unidades de las magnitudes mostradas; - la escala de un grfico debe adaptarse para que entre toda la informacin en el mismo; - las normas IRAM de dibujo tcnico deben emplearse en la medida de lo posible; - no se debe usar un grfico para mostrar la informacin en modo tendencioso; - si un grfico no resulta claro para el autor, mucho menos lo ser para el lector.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-9

3.5.1 Grfico circular

A este tipo de grfico se lo conoce con su nombre ms popular como el diagrama de la torta (pie-chart) o reparto de la torta. Consiste en repartir el rea del crculo en trozos proporcionales a las cantidades que se estn representando. En el Grfico 3.3 se muestra un ejemplo, usando estos valores inventados. Se muestra el diagrama en dos y tres dimensiones; para una mejor ilustracin se le pueden agregar colores. Grfico 3.3: Pacientes por tipo de Obra Social atendidos en el L.A.C. durante julio de 1999

Ninguna 20% Ninguna 20% Estatal 50% Privada 30% Estatal 50%

Privada 30%

2D
Ninguna 20%

Ninguna 20%

Estatal 50%

Privada 30%

2D anillo

2D anillo separado

Ninguna

Estatal Privada Privada

Estatal

3 D separado Fuente: Propia.

3 D anillo

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-10

Por ejemplo, si se deben presentar tres tipos diferentes cuyos porcentajes del total sean respectivamente: 50%, 30% y 20%, entonces se divide el crculo en tres sectores de superficie proporcional. El sector circular de la primera deber tener un ngulo que sea el 50% de los 360 del ngulo total, o sea, abarcar la mitad del crculo con un ngulo de 180. El segundo ocupar el 30% del total con un sector de ngulo de 108. Y el tercero tendr un ngulo de 72. En el ejemplo anterior se presentan seis formas de ilustrar la misma informacin. En la primera se ha trazado un grfico en 3D al modo tradicional. El semicrculo ms grande corresponde a los pacientes que llegan al laboratorio con una orden de prestacin autorizada en una Obra Social de tipo estatal, en este caso la mitad de los pacientes totales. El sector ms chico corresponde al 20% de los pacientes atendidos durante el mes de julio de 1999 y son todos aquellos que no estn cubiertos por una Obra Social, o sea, los pacientes particulares. El restante sector, de un 30%, corresponde a los que provienen de Obras Sociales de tipo privada. Todo esto se capta ms rpido dando una ojeada al grfico que leyendo todo el prrafo anterior, e ilustra sobre las ventajas de este mtodo con respecto al textual. Se presentan tambin otros tres crculos usando el modo tridimensional, pero con tcnicas diferentes, para ilustrar al lector sobre algunas de las posibilidades disponibles para poder elegir entre ellas.

3.5.2 Grfico de barras

Este tipo de grfico comparativo es uno de los ms usados en clnica por la sencillez de su construccin. Consiste en representar las cantidades con rectngulos de igual base, y de altura proporcional a los valores respectivos. Los intervalos libres entre barras tambin deben ser del mismo tamao, aunque a veces algunos autores las muestran pegadas. Grfico 3.4: Grfico de barras en 2D y en 3D. Pacientes por tipo de Obra Social atendidos en el L.A.C. durante julio de 1999:

50% 40% 30% 20% 10% 0% 0% Estatal Privada Pacientes Ninguna Estatal Privada Ninguna Pacientes 60% 40% 20%
Estatal Ninguna Privada

3 D apilado

En el Grfico 3.4 se muestra un ejemplo clsico del diagrama de barras en dos dimensiones, usando los mismos datos del punto anterior. La lnea punteada ayuda a ver mejor los datos numricos, y un ligero sombreado destaca mejor las barras. Al grfico tridimensional se lo gira en cierto ngulo para obtener una mejor apreciacin por parte del lector. Adems, se han engrosado las escalas para obtener una mejor sensacin de profundidad. Por ltimo, se muestra un grfico tridimensional apilando las barras una encima de otra. Todo esto se puede hacer pues solo se representan tres categoras; cuando estas son muchas ms no conviene apilar ni recargar tanto de

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-11

informacin al eje de abcisas. Las grandes ventajas del grfico de barras son: sencillez de construccin y facilidad de captacin por parte del lector. Esto ltimo se debe a que visualmente se compara una sola dimensin: la altura, pues como las bases son todas iguales no se les presta atencin. Muy distinto sera si hay que comparar ms dimensiones, por ejemplo, si en lugar de comparar barras se comparasen crculos (ver Grfico 3.5), cuadrados o rombos. En estos casos, es imposible hacer abstraccin mental de una de las dos. En tales casos, las diferencias de tamao son sutiles y muy engaosas. Grfico 3.5: Grficos comparativos de crculos versus de barras. Cantidad de pacientes por sucursales:
800

Posadas

Apstoles

Ober

Posadas

Apstoles

Ober

NOTA: las cantidades representadas son Posadas: 800, Apstoles: 584 y Ober: 496

Se pueden superponer dos o tres diagramas de barras para hacer comparaciones, tal como se estila en las series temporales donde el foco de atencin se concentra en las variaciones anuales o semestrales. En el Grfico 3.6 siguiente se ilustra esta situacin. Grfico 3.6: Grfico de barras comparativas en 2D y en 3D. (1995-1996).

Demanda Mensual de Prcticas

1995 - 1996
600 500 Cantidad 400 300 200
200 400 600

100 0 1 2 3 4 5 6 7 Mes 8 9 10 11 12
0

Un mal uso de las reglas puede inducir al lector a una mala interpretacin. Por ejemplo, si no se indica el nivel de cero, se pueden magnificar diferencias muy pequeas para que el lector de un vistazo crea que son mucho ms grandes. En el Grfico 3.7 se presentan dos situaciones: en el caso (a) se muestran dos barras, la sombreada representa una venta para el producto X de mil unidades, la otra barra en blanco representa al producto Y con 980 unidades. O sea, la situacin es que X se vende nada ms que un 2% ms que Y. Si se mira el caso (b) se ve una gran diferencia entre ambas barras, y da la impresin que X se vende mucho ms que Y. Este engao es posible pues en el caso (b) no se muestra el nivel cero. Es como obligar al lector a ver las dife-

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-12

rencias con una lupa ( el crculo punteado) y eso no es correcto. Algunas veces se quiebra el dibujo mostrando la parte de arriba como el caso (b), pero agregando la parte de abajo con el nivel cero, y una escala cortadas. Esto engaa mejor al lector - caso (c).

Grfico 3.7: Cmo influenciar al lector con un grfico de barras.

1000

X caso (c) : incorrecto

caso (a) : correcto

caso (b) : incorrecto

3.5.3 Pictogramas
Son grficas comparativas de imgenes donde se usan smbolos para representar las magnitudes que se estn usando. Por ejemplo, si el tema tratando es el nmero de nacimientos, se hace un esquema de un beb. De esa forma, el lector puede captar ms rpido la idea. Para formar los pictogramas deben tenerse en cuenta los puntos siguientes: . Una vez adoptado el smbolo a usar, se le asigna un tamao fijo y una cantidad de unidades. . Para representar una cantidad dos veces mayor no se aumenta el tamao del smbolo al doble, se deben usar dos smbolos y anlogamente para mltiplos enteros. . Para representar fracciones de unidades pictogrficas se puede dividir al smbolo hasta su cuarta parte. O sea, se deben aproximar las fracciones hasta el 25% de la unidad definida. . Para cantidades mucho mayores conviene combinar el pictograma con otro diagrama. . El smbolo adoptado como pictograma debe explicarse por s mismo. Si bien el pictograma es el grfico ms llamativo a su vez es el ms engaoso, por la propensin que se tiene a comparar reas y volmenes, antes que lneas. En el Grfico 3.8 se ilustran

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-13

estos puntos. Se muestran una serie de smbolos y en cada uno se coloca la escala correspondiente. Por ejemplo, para mostrar 50 insectos se debe dibujar la mitad del pictograma, pero no es correcto reducirlo a la mitad. Para graficar 100 tractores se ponen dos figuras completas y no uno solo, de doble tamao.

Grfico 3.8: Pictogramas 1. Ejemplos de pictogramas con los valores que representan

100 Insectos

30 camiones

90 juzgados

200 mdicos 50 casamientos

400 telescopios

500 conejos

50 tractores 30 atletas

200 granjas

500 obreros

250 discos

10 disquetes

40 diplomas

20 escuelas

2. Ejemplos de usos de los pictogramas para mostrar cifras

Para representar 50 Insectos

Para representar 100 tractores

Forma correcta

Forma incorrecta

Forma correcta

Forma incorrecta

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-14

3.5.4 Grficos cronolgicos

Se denomina as a todo grfico de dos o ms variables, una de las cuales es el tiempo. Los ms difundidos son los de dos variables, con el tiempo en el eje de abcisas. Se usan para mostrar la evolucin en el tiempo de una magnitud cualquiera. Se clasifican en dos tipos: . Simples: se usan para representar una sola serie de datos homogneos. . Compuestos: son utilizados para comparar dos o ms series de datos cronolgicos. En el Grfico 3.9 se pueden ver los mismos datos del Grfico 3.6, pero ahora mostrados como dos series cronolgicas anuales. Utilizando diferentes escalas se puede resaltar una tendencia sobre la otra, tanto en un sentido como en el otro. Si se busca hacer ms notorio el hecho de que 1996 fue un mejor ao que 1995 para el laboratorio del ejemplo, entonces se agrandan las ordenadas y se comprimen las abcisas. O viceversa, si se busca el efecto contrario. Grfico 3.9: Comparacin de dos series cronolgicas.
Demanda Mensual de Prcticas
600 500 Cantidad 400 300 200 100 1 3 5 Mes 7 9 11 1996 1995

Grfico 3.10: Dos formas incorrectas de presentar la misma informacin

600 500 Cantidad 400 300 200 100 Cantidad 1 3 5 7 9 11 Mes

600 500 400 300 200 100

6 7 Mes

9 10 11 12

Para resaltar al ao 1996 sobre 1995

Para atenuar las diferencias entre las series

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-15

3.5.5 Diagrama de saldos

Es una variante de las series cronolgicas donde lo que interesa es mostrar las fluctuaciones de la magnitud, respecto de un nivel de referencia. El ejemplo clsico es el diagrama que muestra las variaciones de las ganancias en el tiempo, como se aprecia en el Grfico 3.11. Por regla general se sombrean las reas ubicadas entre la curva y el nivel de referencia, como ayuda visual al lector. De esa manera se destacan los saldos positivos, ubicados por encima del nivel, de los negativos. Grfico 3.11: Ingresos ($) de un laboratorio en un ao, con gastos fijos de $ 3.500/mes.

3.6 Histogramas
Este es un mtodo especial de presentar los datos de mediciones de un laboratorio. Es el ms utilizado cuando se tienen muchos datos obtenidos al medir una magnitud clnica, algunos de los cuales pueden repetirse varias veces. Para armarlo, se deben colocar en el eje de abcisas los valores que adopta la magnitud, y en ordenadas se muestra el nmero de veces que se repite el dato, o sea, su frecuencia. El procedimiento es simple. Primero se buscan el valor mximo y el mnimo de todo el grupo de datos. Luego se ordenan los valores en forma creciente y se hace el recuento, anotando el nmero de veces que se repite cada uno. La forma ms sencilla para hacer el recuento es colocar un palote al lado de cada nmero en forma vertical, y cruzarlos con el quinto ( //// ). Aunque algunos prefieren usar el smbolo del cuadrado cruzado: Cuando se grafica cada valor individual, con su frecuencia correspondiente, se tiene el llamado: Diagrama de bastones. En los histogramas, en cambio, se agrupan los datos en clases para evitar un nmero muy grande de valores en las abcisas, que dificultara su representacin. Adems, esto simplifica el recuento. Cuando la cantidad de datos supera el medio millar, se acostumbra usar entre 10 y 20 clases. Cuando son menos, se usan de 5 a 10 clases, segn convenga,

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-16

por esttica y por practicidad. Para determinar la cantidad de clases conviene definir primero el ancho de clase (a). Por ejemplo, tomando los datos del Cuadro 3.1 para los pacientes sin infarto, se puede determinar que el valor mnimo de la CPK fue de 1 UI/l, mientras que el mximo fue 120 UI/l, luego el rango ser 119 UI/l. Se define al rango, como la diferencia entre el valor mximo y el mnimo del grupo de datos. Con ese valor se puede usar una frmula emprica para determinar el ancho de clase: rango > a > rango 10 20 (ms de 500 datos) o rango > a > rango (para menos de 500) 5 10

En el ejemplo, como son 200 datos, se usa la frmula de la derecha, y se obtiene un ancho de clase comprendido entre: 23,8 > a > 11,9 por comodidad conviene usar un nmero entero y redondo, como ser a = 20. Una vez adoptado el ancho de clase, se arman las clases empezando del menor valor. Esto se hizo en el Cuadro 3.3 utilizando los datos mostrados en el Cuadro 3.1. El resultado se muestra en el Grfico 3.12 donde se presentan los dos histogramas. Grfico 3.12: Histograma de los datos del Cuadro 3.1, agrupados en el Cuadro 3.3
No Infartados
120 100 70 60 50 40 30 20 10 0 20 40 60 80 100 120 140 160 180 20 40 60 80 100 120 140 160 180

Infartados

frecuencia

80 60 40 20 0

frecuencia

CPK (UI/l)

Lmites de Clase (LC): son los dos valores extremos del intervalo de cada clase. Por ejemplo, el lmite de clase inferior de la primera clase es 1, mientras que 20 es el superior. Lmites Reales de Clase (LRC): son los valores obtenidos al sumarle la mitad de la menor unidad de la escala empleada al lmite de clase superior, y restarle al inferior. En el ejemplo anterior seran: 0,5 y 20,5. Estos se usan para evitar discontinuidades en el grfico cuando la magnitud clnica es continua. As, el lmite real superior de una clase siempre debe ser igual al lmite real inferior de la clase siguiente, y as sucesivamente. Marcas de clase: es el punto medio del intervalo de clase. Se obtiene como la semisuma de los dos lmites reales de clase. En el ejemplo sera: (0,5 + 20,5) /2 = 10,5. Ancho de clase: es la diferencia entre los dos lmites reales de una clase cualquiera. Por ejemplo, en la primer clase ser: a = 20,5 0,5 = 20 y anlogamente en las dems.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-17

Frecuencia: es la cantidad de datos que contiene cada clase. En la primera clase de los no infartados la frecuencia es de 104, eso significa que hay 104 datos cuyos valores son menores que el lmite real superior de esa clase. Frecuencia relativa: es la frecuencia de cada clase dividido el nmero total de datos. Frecuencia acumulada: de una clase cualquiera, es la suma de la frecuencia de esa clase ms la sumatoria de las frecuencias de todas las clases anteriores. Al agrupar en clases se pierde informacin. Ya no se sabe la frecuencia de cada dato individual, sino la de todo el grupo incluido en esa clase. Pero por otra parte, se simplifican los recuentos y los grficos. Se pierde precisin en aras de la simpleza.

3.7 Polgono de frecuencias acumuladas

Otra manera de presentar los histogramas, es con el polgono de frecuencias acumuladas, que se muestra en el Grfico 3.13. Para trazarlo, se coloca la magnitud clnica en el eje de abcisas, subdividida en clases. En el eje de ordenadas se pone la frecuencia acumulada de cada clase as resulta que cada barra se forma superponindola con la de su izquierda (lnea punteada gruesa del grfico). El polgono se traza comenzando en el origen y trazando una recta que lo une con el extremo superior derecho de la primera barra. Desde ese punto, se traza otra recta que lo una con el mismo extremo de la segunda barra y as sucesivamente. Grfico 3.13: Polgono de frecuencias acumuladas (datos del Grfico 3.12). Sin infarto f ac
200

Con infarto f ac

150

100

80 100 120 140 160 180

CPK

El uso prctico del polgono de frecuencias acumuladas, es para determinar en forma grfica y rpida el porcentaje de observaciones que quedan por debajo de cierto valor, o viceversa. Por ejemplo, si se deseara saber qu valor deja el 50% de los valores por debajo de l -la mediana- se toma la frecuencia acumulada 100 y se traza una paralela al eje de abcisas hasta tocar la curva, de all se baja una vertical, y el valor que se lee de la CPK es la mediana. En el Grfico 3.10, para el caso de los infartados, el valor estimado de la mediana es 115 UI/l.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-18

3.8 Pirmides de poblacin

Este es un caso especial de histograma. Se usan dos histogramas, uno para hombres y otro para mujeres, que se ubican en forma vertical y enfrentados uno con otro como se puede ver en el Grfico 3.14 siguiente. Las edades se agrupan en intervalos de 5 aos de edad; el primero de 0 a 4 aos, el segundo de 5 a 9 aos y as sucesivamente (eje de ordenadas). Mientras que en el eje horizontal se representa el porcentaje de ese grupo de edades en la poblacin total. Este diagrama, llamado tambin pirmide de edades, se emplea mucho en Demografa. En Anlisis Clnicos se usan sus datos para preparar los valores de referencia poblacionales de las magnitudes clnicas (como se ver ms adelante), los cuales se vuelcan en una tabla del tipo Peso-talla. En Farmacia se lo emplea para tener una idea de la composicin de la poblacin circundante, a los efectos de disear tcnicas de mercadeo. Grfico 3.14: Pirmide de poblacin

Edades 70 y + 65 a 69 60 a 64 55 a 59 50 a 54 45 a 49 40 a 44 35 a 39 30 a 34 25 a 29 20 a 24 15 a 19 10 a 14 5a9 0a4 8%

Hombres

Mujeres

Es interesante destacar la forma de la pirmide. Cuando adopta la forma de un pino se tiene una poblacin del tipo rural. En cambio, si la poblacin es urbana toma la forma de un atad, angosta en su base (pocos nacimientos), ancha en su parte media (muchos jvenes en edad de trabajar) y truncada en su punta (mayor promedio de edades). Es la forma tpica de las grandes ciudades como Buenos Aires, New York, Tokio, Los ngeles, y otras. De sus datos se pueden sacar conclusiones de la tasa de mortalidad, tasa de fecundidad, movimientos de la masa laboral y hasta de la historia de una poblacin.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-19

3.9 Recetas en Farmacia

El tema de presentacin de datos en Farmacia, a diferencia de Bioqumica, tiene dos fases. En la primera se trata de verificar toda la informacin requerida en una receta para poder efectuar la venta de medicamentos. En la segunda se trata de presentar toda la informacin a cada Obra Social para poder recuperar los descuentos realizados a sus afiliados. La diferencia principal con Bioqumica es que, mientras en esta hay que elaborar el informe de las prcticas realizadas a cada paciente, en Farmacia hay que revisar lo recetado por el mdico para ver si se ajusta a los requisitos vigentes. En ambas, estas tareas se realizan diariamente, y mensualmente se presentan las facturas de sus servicios a cada Obra Social. Conviene, entonces, repasar el trabajo diario del farmacutico con las recetas como puede verse a continuacin. Bsicamente se vern los requisitos para obtener los descuentos establecidos con las Obras Sociales y todos los pasos a seguir para ello. Se debe recordar que los edulcorantes, los productos dietticos, los sueros o medicamentos sin troquel y todo los medicamentos de venta libre, no son reconocidos por las Obras Sociales. Estas, solo reconocen aquellos medicamentos incluidos en el Manual Farmacutico, con descuentos que oscilan entre un 30% y un 100% de su costo. Datos requeridos en la receta 1. Las recetas deben estar escritas de puo y letra del mdico actuante y con la misma tinta. 2. Nombre y apellido del paciente. 3. Tipo y nmero de Documento de Identidad. 4. Nombre de la Obra Social (que a veces viene preimpreso en la receta). 5. Nmero de afiliado. 6. Lista de medicamentos recetados, cantidad de envases y contenido de los mismos. 7. Firma y sello del profesional con su nmero de matrcula. 8. Completar los casilleros de la receta preimpresa y anular los no utilizados para los medicamentos. En caso de tachaduras, salvar en el anverso con la firma respectiva. 9. Fecha de emisin de la prescripcin (por la validez de 15 a 30 das a partir de ella). 10. Firma y aclaracin del comprador, su nmero de documento y su domicilio. 11. La aclaracin cuando se trate de Tratamiento Prolongado. Datos a completar en la receta por la Farmacia 1. Las recetas deben tener adheridos los troqueles de los medicamentos vendidos, cubiertos por la Obra Social respectiva. 2. El precio unitario de cada medicamento vendido, la cantidad y su precio total. 3. El precio total a cobrar al afiliado. 4. El precio total a cobrar a la Obra Social por los medicamentos cubiertos por la misma. 5. El total de la receta cumplimentada. 6. La fecha de la venta, con el sello de la farmacia y firma del profesional habilitado. 7. Por conveniencia, se suelen registrar en el anverso de la receta los datos de la persona que retira el producto. Documentacin que debe aportar el paciente

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-20

Cada paciente deber presentarse en la Farmacia, ya sea en persona o a travs de un tercero. Deber exhibir la credencial que lo identifica como afiliado a la Obra Social y su documento de identidad. Para casos como el PAMI, donde no hay credencial, deber exhibir el ltimo recibo de sueldo y su documento. Requisitos a verificar dentro de la prescripcin mdica 1. Hasta 4 envases por receta. 2. Hasta 3 especialidades por receta. 3. Hasta 1 unidad por rengln. 4. Hasta 2 unidades por especialidad del tamao menor, intermedio o nico. 5. Hasta 1 unidad por especialidad del tamao mayor. 6. Hasta 5 unidades de antibiticos inyectables monodosis. 7. Hasta 2 unidades de antibiticos inyectables multidosis. 8. Cuando la farmacia no disponga del tamao grande del medicamento y el afiliado estuviese de acuerdo, se podrn entregar dos (2) envases chicos en su reemplazo. Pero siempre que la cantidad no supere la indicada en la receta. 9. Cuando por carencia en plaza del medicamento recetado no fuera posible entregar este y en la receta vengan indicados medicamentos alternativos o substitutos, entonces se expender el de menor precio disponible. 10. Cuando en la receta no venga especificada la cantidad de medicamentos, se deber expender el de menor cantidad. 11. Cuando en la receta venga aclarado el tratamiento prolongado se puede vender el tamao mayor del medicamento. Caso contrario, se debe vender el de menor tamao. Caso de psicofrmacos (receta archivada) Para la provisin de estos productos, adems de lo anterior, se deber exigir el duplicado de la receta expedida por el profesional. El cual quedar en poder de la Farmacia y archivado de manera tal de poder exhibirlo en el caso de inspecciones. Caso de falta de existencias Cuando un medicamento prescripto faltase, la Farmacia est autorizada a emitir un comprobante donde se compromete a obtenerlo dentro de las 48 horas hbiles, para completar su servicio. Pero si la falta en plaza de dicho medicamento fuese notoria, la Farmacia queda eximida de esta obligacin y devolver el dinero, si el medicamento ya fue pago. Cobro de facturas a las Obras Sociales Para poder cobrar los descuentos realizados a los clientes por Obra Social, la Farmacia deber presentar el ltimo da hbil del mes lo siguiente: 1) Cada una de las recetas cumplimentadas en el mes. Estas debern tener adheridos los troqueles de cada uno de los medicamentos vendidos que estn dentro del Manual Farmacutico, y el sello de la Farmacia, con la firma del profesional responsable.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] 2) Un resumen de las ventas donde debe figurar: - Nombre y apellido de afiliado. - Nmero de afiliado. - Medicamentos vendidos con sus cantidades y precios de venta. - Fecha de venta.

3-21

3) Total facturado. Esta factura se debe confeccionar para cada Obra Social todos los meses. De acuerdo con convenio anual renovable, firmado por ambas partes. Las diferencias que pudiesen aparecer se transforman en Notas de Dbito o de Crdito, segn corresponda.

3.10 Problemas propuestos

1. Mencionar los principales datos que se deben presentar en un informe de laboratorio. 2. dem anterior para una separata como por ejemplo un Proteinograma. 3. El mejor mtodo para presentar los datos es aquel que emplea: . . . . . . . . . . . . . . . . . . . . . . . . . . 4. Dibujar algunos grficos para estos datos: ( A = 200Kg B = 400Kg C = 200Kg). 5. Cuntas magnitudes se pueden representar en un histograma ( ) y en uno circular ( )?

6. Mencionar las ventajas y desventajas de los mtodos de presentacin de datos.

7. El mejor mtodo para influenciar al lector es el mtodo tabular. 8. En el mtodo grfico se pierde precisin en aras de la sencillez. 9. Se debe siempre indicar la fuente de donde se tomaron los datos. 10. Para las comparaciones conviene usar muchas dimensiones. 11. Cuando se usa escala en un grfico, siempre debe colocarse el cero de la escala. 12. Las lneas con las cuales se trazan los grficos deben tener todas el mismo grosor. 13. Los grficos circulares y de barras se pueden presentar en dos y tres dimensiones. 14. No se debe cortar la lnea de la escala en un diagrama comparativo de barras. 15. En un pictograma hay que usar un icono de tamao doble, para mostrar una cantidad doble. 16. El smbolo adoptado por el pictograma debe explicarse por s mismo. 17. Un grfico cronolgico slo puede presentar una serie de datos homogneos. 18. Una pirmide de poblacin muestra cmo se distribuye por edad y sexo. V V V V V V V V V V V V F F F F F F F F F F F F

19. Dibujar el histograma de los datos agrupados siguientes: Frecuencia 10 20 30 15 8 Valor 2 4 6 8 10 20. Dibujar el polgono de frecuencias acumuladas del punto anterior. 21. Calcular frecuencias de clases para los siguientes datos:

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

3-22

100 - 330 - 120 -342 - 176 - 238 - 98 - 163 - 176 - 280 - 115 - 189 - 237 - 230 - 220 - 170 - 83 - 102 300 - 350 - 339 - 168 - 111 - 173 - 209 - 253 - 190 - 181 - 261 - 228 - 121 - 177 - 105 - 214 -304 - 156 330 - 302 - 239 - 240 - 188 - 222 - 125 - 218 - 139 - 212 - 123 - 133 - 116 - 148 - 267 - 170 - 234 - 190 88 - 115 - 220 - 129 -153- 126 - 138 - 124- 132 - 214 - 225 - 163 - 156 - 192 - 216 - 143 - 149 - 202 - 133 250 - 239 - 138 - 117 - 202 - 165 - 148 - 159 - 132 - 128 - 123 - 146 - 147 - 129 -153- 126 - 138 - 124

22) Obtener las frecuencias acumuladas de los datos anteriores. 23) Con los mismos datos trazar el histograma y polgono de frecuencias acumuladas. 24) Listar los principales datos que debe contener un Informe de Laboratorio Bioqumico. 25) Listar los datos requeridos en una receta, que debe verificar el farmacutico. 26) Listar los datos que debe completar el farmacutico en una receta. 27) Listar los requisitos a verificar dentro de una prescripcin mdica. 28) Cules datos se pueden obviar en una separata de un informe de laboratorio? 29) Completar los siguientes conceptos: - Los tipos de informes estadsticos son: ................... - Las ventajas de usar el mtodo textual son: .................... - Las desventajas de usar el mtodo textual son: ................ - Las ventajas y desventajas de una tabla son: ................... - La mejor ventaja de un grfico es su .................. - Los diagramas comparativos son: ................ - Cuando se usan smbolos para representar magnitudes se trata de un ................. - Para mostrar las variaciones de ingresos y egresos de dinero en un negocio se usa el ........... - Para representar a una poblacin humana por edad y sexo se usa el .................. - En ........ informe de laboratorio se necesita la firma del Bioqumico responsable. - En ........ receta presentada en una Farmacia se necesita la firma del mdico responsable. - Para graficar la variacin de los ingresos en el tiempo se usa un ......................... - El mtodo .............. es mejor que una tabla para captar de un vistazo los datos. - Una tabla es mucho ms ............ que un grfico. - La forma correcta de presentar un grfico de barras es siempre colocando el .......... en el mismo. 30) Explicar como se denotan las fuentes o referencias en los textos 31) Que otros grficos son usuales en Medicina ?

4
ndices clnicos y estadgrafos
En este captulo se describen diferentes ndices clnicos que se usan para juzgar el comportamiento de un mtodo de diagnstico en Medicina y los estadgrafos clsicos. Un diagnstico es una prediccin acerca del estado del paciente. Al mismo, se puede llegar a travs de una serie de anlisis tales como: estudio de los sntomas, tests clnicos, radiografas, electrocardiogramas, etc. El resultado final de todo este proceso es binario (sano /enfermo), al igual que la decisin final del mdico como: se lo interna al paciente o no, con o sin medicacin, ciruga, quimioterapia, etc. Si el resultado es dudoso, esto significa que sern necesarios ms estudios y la decisin final solo se pospone para un futuro cercano; pero esta es siempre dicotmica o binaria. En los comienzos, el concepto de calidad se asociaba estrechamente a las ideas de precisin y exactitud. La idea clsica era: cuanto ms exacto y preciso sea un mtodo, mejor es la calidad del mismo. El problema es que estas ideas solo pueden aplicarse a magnitudes de tipo continuo, donde pueden determinarse los errores de tipo sistemtico y casuales asociados a estos conceptos. Por lo que hubo que buscar una nueva manera de entender la calidad en los anlisis clnicos y para abarcar a todo tipo de magnitud que se pueda presentar. Lo que conduce al caso dicotmico, pues toda magnitud se puede transformar en una binaria, adoptando un punto de corte apropiado en la magnitud que se est analizando. Por ejemplo, la temperatura es una magnitud continua, si se adopta un punto de corte como 37 C para separar un caso normal de un caso de fiebre, entonces se la ha transformado en binaria: con o sin fiebre. La solucin a este problema fue propuesta por Galen y Gambino en 1975, en su obra Beyond Normality, y desde entonces se ha ido refinando esta forma de encarar la cuestin, tal como se ver a continuacin. Bsicamente las objeciones son dos: (a) Los anlisis clnicos se usan mayormente para detectar enfermedades. Se necesita que ayuden a efectuar un buen diagnstico. De nada sirve que una tcnica, sea muy precisa y exacta si diagnostica mal. (b) Cuando las magnitudes son cualitativas, el criterio de calidad tradicional de precisin y exactitud es inaplicable.

4.1. Clasificacin de estadgrafos.

Los estadgrafos se clasifican como se muestra a continuacin: Especficos (clnicos, demogrficos, sanitarios, etc.) Estadgrafos De posicin (medias, mediana, percentiles, moda, etc.) De dispersin (desvo estndar, varianza, rango, etc.)

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-2

Los estadgrafos de posicin y dispersin estn estrechamente vinculados con los conceptos de precisin y exactitud. Si se mide muchas veces, en forma repetida, un valor patrn cualquiera de una magnitud como un suero control de concentracin conocida o estndar, se tiene un conjunto de datos para juzgar el comportamiento de la tcnica clnica de medicin. Una manera de saber la exactitud de la misma es tomar un valor ndice de tendencia central, como el promedio, y compararlo con el valor de referencia. Si el estndar est muy alejado del valor promedio, entonces se puede pensar que la tcnica no es muy exacta. Caso contrario, se piensa que la tcnica est calibrada en exactitud. Para juzgar si la diferencia observada entre ambos valores es por causalidad, o bien se trata de un error de tipo sistemtico, no se puede usar un criterio cualitativo sino las tcnicas estadsticas apropiadas, que se vern ms adelante, para poder tener un criterio cuantitativo. Esto significa no juzgar las diferencias con criterio humano, subjetivo, sino con un criterio matemtico de tipo estadstico: es el adoptado en la ciencia como un criterio objetivo. Anlogamente, en el caso de la precisin, si la tcnica clnica tiene un ndice de dispersin muy pequeo respecto de los valores aceptables de referencia en la bibliografa, se puede pensar que es bastante precisa. Nuevamente, slo un mtodo estadstico permite juzgar imparcialmente si la diferencia entre el ndice hallado y el valor de referencia se debe al azar. Se debe resaltar: Toda medicin cientfica, de magnitudes continuas, debe ir siempre acompaada con el error de medicin, que cuantifica y engloba ambos conceptos. Un informe presentado sin la aclaracin de error de mtodo empleado, no es serio. Cuando se trata de un recuento de unidades enteras, no hay error sino equivocaciones. En cambio, en las magnitudes cualitativas, al no ser numricas, no tienen sentido los conceptos de precisin y exactitud usados tradicionalmente para hablar de calidad. Es costumbre en los laboratorios de fsica, qumica y relacionados, decir que si un mtodo tiene buena precisin y exactitud, entonces es de buena calidad. Esa costumbre se extendi a los laboratorios de anlisis clnicos, donde para optar entre dos tcnicas se empleaba ese criterio. Sin embargo, a mediados de la dcada del cuarenta algunas crticas empezaron a aparecer en la bibliografa. El primer trabajo precursor fue el de Yerushalmi y otros en 1947, junto con los de Galen y Gambino en 1975. Bsicamente las objeciones son dos: 1. Los anlisis clnicos se usan mayormente para detectar enfermedades. Se necesita que ayuden a efectuar un buen diagnstico. De nada sirve que una tcnica, sea muy precisa y exacta si diagnostica mal. 2. Cuando las magnitudes son cualitativas, el criterio de calidad tradicional es inaplicable. La respuesta para ambas crticas, fueron los llamados ndices clnicos.

4.1.1. Clasificacin de enfermedades por diagnosis

Debe tenerse muy en cuenta el tipo de enfermedad que se est analizando y el grado de avance de la misma en el paciente, porque de acuerdo a ello se deber puntualizar en ciertos aspectos, ms que en otros, como se explicar ms adelante. Por ahora, basta con efectuar una primera clasificacin de las enfermedades en tres tipos bsicos de acuerdo al siguiente esquema: Tipo I : Son todas aquellas enfermedades donde la peor equivocacin que se puede cometer en el diagnstico es un falso negativo.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-3

Tipo II : Son todas aquellas enfermedades donde la peor equivocacin que se puede cometer en el diagnstico es un falso positivo. Tipo III : Son las restantes, donde no se puede clasificar claramente como una de las anteriores. Las enfermedades que se pueden clasificar como Tipo I son: - Una enfermedad que es curable si se detecta a tiempo. - Una enfermedad que es grave y no puede dejarse pasar inadvertida. - Los falsos positivos no trauman ni psicolgicamente, ni econmicamente al paciente, pero los diagnsticos falsos negativos s lo hacen. Ejemplos: infarto de miocardio, enfermedades venreas y otras enfermedades infecciosas curables, la fenilcetonuria, el feocromocitoma (curable en el 100% de los casos s es detectado a tiempo), cncer de mama o de tero, etc. En cambio, una enfermedad donde para el paciente, un diagnstico falso positivo es ms peligroso que un falso negativo, se considera como del Tipo II, como ser: - La enfermedad es grave, pero difcilmente curable o sin remisin. - Es muy importante para el paciente o para la poblacin l saberse un verdadero negativo. - Los falsos positivos trauman seriamente al paciente, en cambio los falsos negativos no. - El tratamiento de los falsos positivos ocasiona serios perjuicios al paciente. Ejemplos: estado terminal o sin remisin de la enfermedad, cncer oculto, esclerosis en placas, tratamientos como radioterapia, quimioterapia, lobectoma, ciruga innecesaria, estado IV de la sfilis cuando ya no tiene remedio, etc. Cuando la enfermedad no puede ser encasillada en ninguno de los dos casos anteriores, entonces se la considera como del Tipo III, como por ejemplo: lupus eritomatoso, ciertas formas de leucemia o linfoma, diabetes, etc. En el caso del SIDA un falso positivo puede ser muy daino para el paciente, pero un falso negativo sera muy peligroso para la sociedad y como ambos peligros son graves, lo mejor es clasificarla como del Tipo III desde un punto de vista tico. Notar que una misma enfermedad puede ser clasificada de maneras diferentes, de acuerdo al estado de avance que tiene en el paciente. Un cncer que pueda ser curado si se detecta a tiempo es un claro caso de Tipo I, pero una vez que se produjo una metstasis en el paciente pasa a ser del Tipo II. Lo mismo ocurre con los diferentes estados de la Sfilis, que se puede curar si es detectada a tiempo, pero se torna incurable cuando est muy avanzada.

4.2. ndices clnicos

El objetivo principal de una tcnica clnica es que sirva para diagnosticar bien. Si para efectuar el mismo trabajo hay muchas tcnicas disponibles, entonces se debe optar por aquella que mejor sirva a ese propsito, y si adems es precisa y exacta, mejor. Al realizar un diagnstico se est dicotomizando a la magnitud clnica medida, no importa del tipo que sea. Se pude postular que siempre habr dos resultados posibles: Sano o Enfermo. En principio, se pueden descartar a los casos intermedios, donde no est muy claro el estado real del paciente, para simplificar

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-4

el problema. La prctica clnica ideal sera una que discrimine perfectamente a los sanos de los enfermos, una que no cometa equivocaciones, una utopa. La realidad actual es bastante diferente; para poder diagnosticar bien se necesita, adems de la revisin personal, varias determinaciones de laboratorio que confirmen la diagnosis. An as, todava habr un cierto grado de incertidumbre, mayor cuanto menos avanzada est la enfermedad. Y entonces, se puede sospechar que la calidad del mtodo, estar relacionada con la distribucin en la poblacin del grado de avance de la enfermedad, con la forma de seleccionar las muestras, adems de la calidad intrnseca de la tcnica clnica. Por otra parte, de acuerdo a los objetivos del estudio clnico los ndices clnicos derivados se pueden clasificar con: Bsicos Parmetros Derivados De calidad diagnstica Variables de acuerdo a la poblacin ndices clnicos De riesgo o dao Epidemiolgicos En el diagnstico

De concordancia (para dos o ms mtodos)

Los ndices clnicos para un solo mtodo se dividen en dos partes, los relacionados con el mtodo de diagnstico (la calidad del diagnstico hecho y el riesgo que implica hacer un diagnstico) y los relacionados con el riesgo o dao potencial de un factor, que se cree relacionado con la causa de la enfermedad que se est estudiando. Pero cuando se trata de comparar dos o ms mtodos entre s, se pueden comparar los ndices anteriores si las muestras son independientes, o bien se puede analizar la concordancia entre ellos cuando las muestras son apareadas. Los tipos de investigaciones clnicas se detallaron en el captulo 1, donde se mostraron las tres maneras ms sencillas de presentar los datos en tablas de 2 x 2 (Tabla 1.1, 1.2 y 1.3). Ahora, se mostrar como calcular los ndices relacionados a cada una de ellas:

4.3. ndices de calidad diagnstica.

En su forma ms simplificada el problema de hacer una prediccin o diagnstico se puede esquematizar con la Tabla de diagnstico tal como la vista en el primer captulo Tabla 1.1. Esta forma de organizar los datos se llama tablas doble dicotmicas, donde los cuatro casos posibles de la tabla son: dos verdaderos (vp y vn) y dos falsos (fp y fn) en diagnsticos donde se verifica la presencia de la enfermedad o sntoma buscado (positivo) o la ausencia del mismo (negativo). Los totales marginales de la tabla son: TE = vp + fn : Total de Enfermos = verdaderos positivos + falsos negativos TS = vn + fp : Total de Sanos = verdaderos negativos + falsos positivos TP = vp + fp : Total de positivos = verdaderos positivos + falsos positivos TN = vn + fn : Total de negativos = verdaderos negativos + falsos negativos

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] Resultados verificados Resultados del test Enfermos Sanos Positivo vp fp (+) verdadero positivo falso positivo Negativo fn vn (-) falso negativo verdadero negativo Total TE TS

4-5

Total TP TN N

La tcnica clnica ideal sera aquella que no cometa equivocaciones en sus pronsticos, o sea una con fn = fp = 0. Las consecuencias de las equivocaciones no son igualmente graves para el paciente, todo depende del tipo de enfermedad de que se trate. Y por ese motivo se realiz la clasificacin de las enfermedades en el punto anterior, teniendo en cuenta el tipo de equivocacin cometida en el diagnstico. Una manera de analizar la calidad de un mtodo de diagnstico es tener en cuenta siempre los dos tipos de equivocaciones, o sea se trata de un problema de tipo dual. Y cuantificar su calidad de acuerdo a la capacidad intrnseca del mismo en equivocarse.

4.3.1 Sensibilidad, Especificidad e ndice de Youden.

El comportamiento de un mtodo de diagnstico al pronosticar, puede ser analizado en forma dual de la manera siguiente: Sensibilidad: Es la capacidad del mtodo para diagnosticar como positivo a un enfermo. Especificidad: Es la capacidad del mtodo para diagnosticar como negativo a un sano.

Por ejemplo, si el mtodo es capaz de detectar a tres casos de positivos cada cuatro enfermos que analiza, entonces su capacidad para identificar correctamente a los que pronostica como positivo es del 75%. Aqu se dice que su sensibilidad S = 0,75. Por otro lado, si el mtodo es capaz de detectar a ocho casos negativos, cada diez individuos sanos, entonces su capacidad para identificar correctamente como negativo es del 80%. Se dice aqu que su especificidad E = 0,8. Aplicando estos conceptos al caso general presentado en la Tabla de diagnstico, se pueden deducir las frmulas que siguen: Sensibilidad: S = vp / TE = (verdaderos positivos) / (total de enfermos) Especificidad: E = vn / TS = (verdaderos negativos) / (total de sanos) Ambos valores estn acotados entre cero y uno. Cuando la sensibilidad es mxima S = 1, quiere decir que no hay falsos negativos, ya que TE = vp + fn, y esa sera la cualidad buscada para una enfermedad del Tipo I. En cambio, para una enfermedad del Tipo II, lo deseable es que fp = 0 y para ello deber ser mxima la especificidad: E = 1, pues TS = vn + fp. La calidad puede ser expresada con los criterios de sensibilidad y especificidad, por lo tanto una prueba clnica es ideal cuando tiene una capacidad para diagnosticar S = E = 1, o sea cuando no comete equivocaciones en sus pronsticos.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-6

A las tcnicas clnicas de laboratorio, o bien a los mtodos de diagnstico que se parecen mucho a este ideal se los denomina: mtodos de referencia (o golden standard). La realidad es bastante diferente a esta utopa, son muy raros los casos donde ambos ndices se acercan al mximo a la vez, an en una biopsia se pueden cometer equivocaciones. Entonces el problema se reduce a elegir aquella prueba que tenga mxima sensibilidad cuando hay disponibles varias tcnicas para las enfermedades del Tipo I, y mxima especificidad para las del Tipo II. Para el caso de las enfermedades del Tipo III, se necesita otro ndice de calidad que mezcle ambos conceptos. Este ndice clnico fue propuesto por Youden para analizar la capacidad del mtodo de diagnstico, usando un nico valor en reemplazo de la forma dual de hacerlo. La idea es mezclar los dos ndices anteriores para hacer el estudio de calidad. Se define como: ndice de Youden: Y = S + E - 1 = (sensibilidad) (especificidad) - 1 En el caso ideal, este ndice vale 1 ya que S = E = 1. En el caso de lanzar una moneda al aire para efectuar el diagnstico, es decir puro azar, ser S = E = 0,5 y por lo tanto este ndice es nulo. La condicin evidente para tener una calidad aceptable es que no sea negativo. La idea para seleccionar un mtodo de diagnstico en las enfermedades del Tipo III, es elegir aquel que tenga el mximo valor de este ndice, pues eso equivale a tener un mnimo de resultados falsos, prorrateados entre el total de los casos analizados. Estos tres ndices dan un valor que cuantifica los conceptos bsicos de calidad diagnstica, de acuerdo al tipo de enfermedad analizada. Sin embargo, puede verse que el ltimo es una consecuencia de los dos primeros, a los que se considera los ndices bsicos o parmetros de calidad, de los cuales se derivan todos los dems.

4.3.2 Eficiencia diagnstica (diagnostic accuracy)

La otra manera de ver la misma idea es usando otro ndice, sugerido por muchos autores como la manera de evaluar el poder discriminatorio del mtodo clnico. Una especie de ndice general de la calidad, porque lo que se analiza aqu es el porcentaje de xitos logrados por el mtodo en sus pronsticos. Es como el clsico concepto del rendimiento, ver que tan bien trabaja el mtodo de diagnstico o test clnico. Por ejemplo, si se imagina al mtodo como una mquina de hacer predicciones, el rendimiento del mismo se puede expresar con: Eficiencia: A = (vp + vn) / N = (verdaderos positivos + verdaderos negativos) / (total de casos) La idea de eficiencia es simplemente la del porcentaje de xitos obtenidos al diagnosticar, se puede descomponer en dos tipos de xitos: el trmino (vp / N) es el porcentaje de xitos en positivos y el trmino (vn / N) es el porcentaje de xitos en negativos. Cuanto mayor sea la eficiencia de una prueba clnica, mejor ser su poder discriminatorio. La prueba clnica ideal tendr una eficiencia mxima (100%) A = 1, mientras que cuando A = 0 significa que no tuvo ningn acierto de sus pronsticos. Notar que si se lanza una moneda al aire para hacer pronsticos, la eficiencia sera del 50%, o sea A = 0,[Link] se puede usar para seleccionar el mejor mtodo en el caso de las enfermedades del Tipo III. De hecho, es el recomendado en la bibliografa. Sin embargo, hay una diferencia conceptual importante entre estos dos ndices, y es que el ndice de Youden no depende de la poblacin en donde se aplica el mtodo, sino que es una caracterstica intrnseca propia del mtodo, en cambio la eficiencia depende del lugar donde se est usando el

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-7

mtodo, o bien del momento en que se lo aplica. Esto es, la eficiencia depende de la prevalencia de la poblacin mientras que el ndice de Youden no, como se puede ver a continuacin: Prevalencia: p = TE / N = (total de enfermos) / (total de individuos de la poblacin estudiada) Teniendo en cuenta que la eficiencia se puede expresar como: A = (vp / N) + (vn / N) = [(S . TE) / N] + [(E . TS) / N)] Reemplazando los valores verdaderos con los ndices sensibilidad y especificidad respectivamente, y luego haciendo las simplificaciones necesarias resulta: A = S . p + E (1 p) = (sensibilidad x prevalencia) + [especificidad x (1- prevalencia)] Por ejemplo, en una poblacin donde la enfermedad es muy rara o casi inexistente, la prevalencia sera prcticamente nula (p = 0) y entonces la eficiencia resulta igual a la especificidad. En cambio en un caso extremo de epidemia, donde casi toda la poblacin est enferma, la prevalencia es prcticamente del 100% (p = 1) y entonces la eficiencia resulta igual a la sensibilidad. Notar que, con el transcurso del tiempo una enfermedad puede propagarse y empezar a aumentar la prevalencia de la misma, lo que originara un cambio en la eficiencia. Pero esto no ocurre con el ndice de Youden, porque este no depende de la prevalencia. En forma matemtica esto sera A = f (p) mientras que Y f (p). Otro punto importante a tener en cuenta es que, en una misma poblacin geogrfica, se pueden tener distintos valores de prevalencia. Por ejemplo, el nmero de pacientes con problemas cardacos que concurren a hacerse atender en un centro asistencial de la zona rural de Posadas, es mucho menor que los que concurren al hospital, los que a su vez son menores que los concurrentes a la unidad coronaria del mismo, derivados de otros centros asistenciales. Por lo tanto, el mismo mtodo de diagnstico aplicado en estos tres puntos tendr un valor diferente de eficiencia (A) a pesar de que todos estn en una misma zona geogrfica. Debe remarcarse aqu, que la poblacin de referencia para una investigacin clnica, no es la de la zona geogrfica circundante, sino de aquellos pacientes que concurren a hacerse atender en el centro asistencial. Para explicar mejor esta diferencia entre parmetros y variables de la calidad del mtodo de diagnstico, se puede usar un smil de la Fsica. Calor y fro son dos conceptos opuestos que aparecen como una dualidad. Sin embargo se trata de la misma magnitud fsica: la temperatura, o sea de la misma cosa. En un extremo de la escala cuando la temperatura es baja se asocia con uno de los extremos, una sensacin: el fro. En el otro extremo de la escala, cuando la temperatura es alta se la asocia con la sensacin opuesta: el calor. Aparecen como cosas contrarias, cuando en el fondo se trata de lo mismo. Anlogamente en Medicina, la eficiencia de una prueba diagnstica es la magnitud clnica variable, en un extremo de la escala cuando la prevalencia es muy baja se la asocia con el concepto de especificidad. Mientras que en el otro extremo de la escala, cuando la prevalencia es muy alta se la asocia con el concepto de sensibilidad. Es decir, que sensibilidad y especificidad no son otra cosa que la eficiencia de una prueba clnica, pero expresada en sus dos casos extremos. Para entender estas ideas se puede usar la nocin de relatividad tal como se estudia en Fsica. Por ejemplo: la diferencia conceptual entre masa y peso, es que la primera es una cualidad intrnseca del cuerpo que no depende del sistema de referencia en el cual se halla. En cambio el peso vara con la influencia de la atraccin de la gravedad del planeta en donde se encuentre el

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-8

cuerpo. Se dice por ese motivo que el peso es una cualidad extrnseca del cuerpo. Expresado en otros trminos, a la magnitud masa le corresponde una variable llamada peso. Este es un parmetro en el planeta Tierra porque todo individuo est afectado por la misma fuerza de gravedad, pero es una variable dentro del sistema solar. Anlogamente, si se supone que la capacidad de un mtodo clnico es constante en toda la poblacin humana, entonces la sensibilidad y especificidad se mantendrn fijas para todos los individuos, por lo que pueden ser considerados como cualidades intrnsecas del mtodo. Y lo mismo ocurre con el ndice de Youden. En cambio la eficiencia vara (cualidad extrnseca) segn el sistema de referencia o poblacin en donde se usa el mtodo, de acuerdo a la prevalencia de la enfermedad existente en la poblacin. Es decir, sensibilidad y especificidad son los principales parmetros de un mtodo clnico mientras que la eficiencia es una variable. Si se considera a un mtodo de diagnstico, o bien a un test clnico, como si fuese una mquina para hacer predicciones, entonces se puede explicar este concepto con otro smil: Un Ferrari es un excelente auto para correr en un premio de Frmula I, pero a pesar de su alta calidad puede que no sea la mejor opcin para correr en Indianpolis, como tambin puede llegar a ser un desastre para competir en las arenas del desierto en el Rally de Dakar.

4.4 Relatividad de los tests clnicos.

Todo esto muestra que la eficiencia debe ser informada al lector con una curva, en lugar de usar un solo valor, como se acostumbra hacer en la prctica actual. Para obtener estas curvas fcilmente se puede usar un algoritmo desarrollado para computadoras en Excel, disponible en la pgina web de la ctedra. Pero tambin se lo puede obtener con un procedimiento que se muestra a continuacin: Ejemplo: Sea un test clnico que tiene una calidad cuantificada por S = 0,9 y E = 0,75. Se desea averiguar el efecto de la relatividad en la eficiencia. Como S y E son los parmetros del mtodo, se puede obtener el otro parmetro con IY = 0,65. Y para ver como afecta la prevalencia de la enfermedad a la eficiencia, se pueden simular diferentes valores de la misma tomando varios valores de p, como ser p = 0,1; 0,2; 0,3; ... ; 0,9 y un tamao muestral cualquiera como por ejemplo N = 1000. Paso 1: Para la primera simulacin se adopta el valor p = 0,1, es decir 1 enfermo cada 10 casos, y se calcula el nmero de verdaderos positivos y negativos: Como S = vp / TE resulta vp = S . TE = S . N . p = 0,9 . 1000 . 0,1 = 90 Como E = vn / TN resulta vn = E . TN = E (N TE) = E (1 p) N = 0,75 (1 0,1) 1000 = 675 Paso 2: Se calculan ahora los valores de falsos negativos y positivos con: TE = N . p = 100 = vp + fn ; o sea fn = 100 vp = 100 90 = 10 TS = N (1 p) = 900 = vn + fp; o sea fp = 900 vn = 900 675 = 225

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-9

Paso 3: Con los cuatro valores obtenidos en las dos etapas anteriores se puede armar la Tabla de diagnstico para el caso de una prevalencia del 10% y as calcular el total de positivos y negativos como se muestra a continuacin: Resultado verificado Test (+) (-) Total Enfermo 90 10 TE = 100 Sano 225 675 TS = 900 Total TP = 315 TN = 685 1000

Paso 4: Se calcula la eficiencia para estos valores de la Tabla completa: A = (vp + vn) / N = (90 + 675) / 1000 = 0,765 Y se tiene estimado el primer valor de la eficiencia para una prevalencia del 10%. Anlogamente, se toman diferentes valores de la prevalencia y se repiten los 4 pasos anteriores para obtener los respectivos valores de la eficiencia, resultando la curva siguiente: Grfico 4.1: Variabilidad de la eficiencia con la prevalencia (S = 0,9 y E = 0,75).
100 80 Prevalencia. 60 40 20 0 0,70

0,75

0,80 A

0,85

0,90

0,95

En el Grfico 4.1 se muestra un mtodo de diagnstico con los parmetros S = 0,9 y E = 0,75. En una poblacin donde la enfermedad es muy rara, la prevalencia ser muy baja tal como es el caso de la meningitis, y la eficiencia ser muy parecida al valor de la especificidad (si p ! 0 entonces A ! E). En cambio, para otra poblacin donde la enfermedad es muy frecuente, como puede ser una epidemia, la eficiencia del mismo mtodo clnico cambia bastante y se acerca a la sensibilidad (si p ! 1 entonces A ! S). Esto ejemplo muestra que si se mide la capacidad de un mtodo de diagnstico, con el ndice de la eficiencia (A), este valor ser diferente en poblaciones diferentes. Y por lo tanto, no es aconsejable seguir ese criterio para informar la calidad o poder discriminatorio del mtodo como se recomienda usualmente en alguna bibliografa. O por lo menos, no usar un nico valor para presentar el dato, sino que se debe mostrar la curva para que el lector sepa como trabajar ese mtodo en su propia poblacin de referencia. Notar que esta curva no depende del tamao de la muestra (N) usada para determinarla.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-10

4.5 Valores Predictivos.

Otra manera de analizar la capacidad de un mtodo es analizando el porcentaje de xitos logrados sobre la base de sus pronsticos. La idea es estudiar que tan bien predice el mtodo. Otra vez se trata de una dualidad, porque hay que ver los dos aspectos principales: como trabaja en los casos positivos y como lo hace en los casos negativos. Se puede definir entonces: Valor Predictivo de Positivos: Es la capacidad del mtodo para identificar correctamente a un caso positivo, de entre todos los resultados positivos obtenidos. Valor Predictivo de Negativos: Es la capacidad del mtodo para identificar correctamente a un caso negativo, de entre todos los resultados negativos obtenidos.

Por ejemplo, si el mtodo es capaz de detectar a cuatro casos verdaderos de positivos cada cinco resultados positivos encontrados, entonces su capacidad para identificar correctamente a los que pronostica como positivo es del 80%. Aqu se dice que su Valor Predictivo de Positivos es de VPP = 0,8. Por otro lado, si el mtodo es capaz de detectar a nueve casos verdaderos de negativos, cada diez casos que resultaron negativos, entonces su capacidad para identificar correctamente como negativo es del 90%. Se dice aqu que su Valor Predictivo de Negativos resulta: VPN = 0,9. Aplicando estos conceptos al caso general presentado en la Tabla de diagnstico, se pueden deducir las frmulas que siguen: Valor Predictivo de Positivos: VPP = vp / TP = (verdaderos positivos) / (total de positivos) Valor Predictivo de Negativos: VPN = vn / TN = (verdaderos negativos) / (total de negativos) La relacin matemtica entre estos ndices relativos, con los dos ndices bsicos S y E se expresa con el Teorema de Bayes, que se explicar ms adelante. Por ahora, se puede visualizar esta idea con el grfico siguiente, obtenido de la misma manera que la explicada para la eficiencia, pero ahora se calculan adems los valores predictivos: Grfico 4.2: Variabilidad de los valores predictivos con la prevalencia (S = 0,9 y E = 0,75)
100 80 Prevalencia. Prevalencia. 60 40 20 0 0,00 100 80 60 40 20 0 0,00

0,20

0,40

0,60

0,80

1,00

0,20

0,40 VPN

0,60

0,80

1,00

VPP

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-11

En este ejemplo se analiza la variabilidad de los valores predictivos con la prevalencia, para un mtodo clnico de parmetros S = 0,9 y E = 0,75. Por ejemplo, para una prevalencia del 10% resultan: VPP = vp / TP = 90 / 315 = 0,286 y VPN = vn / TN = 675 / 685 = 0,985 Mientras los VPP varan desde cero a uno, a medida que aumenta la prevalencia, los VPN lo hacen de forma inversa. Si la prevalencia aumenta, aumentan los valores predictivos de positivos y bajan los negativos. Cuando el VPP = 1, significa que vp = TP, es decir no hay falsos positivos, la condicin ideal para una enfermedad del Tipo II. En cambio, si VPP = 0, esto implica que no hay aciertos en positivos y todos los pronsticos de esa ndole tienden a ser falsos. Notar que esto ocurre cuando la enfermedad es rara y su prevalencia muy baja. Por otra parte, cuando VPN = 1, significa que vn = TN, o sea que no hay falsos negativos, la condicin buscada para las enfermedades del Tipo I. Viendo la grfica anterior, se puede observar que cuando la prevalencia de la enfermedad sea muy alta (epidemias, unidades coronarias, etc.), el VPN = 0 y que casi no van a existir aciertos en negativos. En cambio, si la enfermedad es muy rara, casi todos los resultados negativos sern falsos. Ejemplo 1: Se ha realizado un estudio para ver la capacidad de un test clnico que se usa habitualmente en el laboratorio. Las historias clnicas de los pacientes se separan en dos grupos. En el primero se agrupan los casos verificados de enfermedad a posteriori, es decir se hace un tipo de estudio retrospectivo una vez que se est seguro del estado real del paciente. As se obtiene el nmero de casos identificados correctamente como positivos (vp) y las falsas predicciones (fp). En el segundo conjunto se agrupan los casos verificados de ausencia de la enfermedad, y con el estudio retrospectivo se obtienen los nmeros de casos verdaderos negativos y falsos negativos (vn y fn). Los casos dudosos se descartan para eliminar variabilidad indeseada. Se seleccionaron al azar 400 casos de enfermedad y otros tantos de no-enfermedad. Los resultados obtenidos se muestran en la tabla. Se desean conocer los ndices clnicos correspondientes a este test.

Resultado verificado Test (+) (-) Total Enfermo 370 30 400 Sano 70 330 400 Total 440 360 800

Lo primero es calcular los parmetros principales del mtodo: S = 370 / 400 = 0,925 y E = 330 / 400 = 0,825 Con estos valores se obtiene Y = 0,925 + 0,825 1 = 0,75 Y para informar la eficiencia y los valores predictivos se muestran las curvas calculadas con el mtodo que se vio en el ejemplo anterior. La eficiencia (A) vara como s grafica a continuacin:

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-12

100 80
Prevalencia

60 40 20 0 0,80

0,85 A

0,90

0,95

Los valores predictivos varan con la prevalencia como se ve ms abajo:

100 80 Prevalencia. 60 40 20 0 0,00 Prevalencia. 0,20 0,40 0,60 0,80 1,00 100 80 60 40 20 0 0,00

0,20

0,40

0,60

0,80

1,00

PPV

NPV

Ejemplo 2: De la sumatoria total de casos encontrados por los investigadores del ejemplo anterior se determina que la prevalencia de la enfermedad para ese laboratorio es p = 0,4 (solo se usan los casos totales verificados). Se pide calcular como son los valores relativos para ese laboratorio en particular, de acuerdo a su poblacin de referencia. De las curvas anteriores se obtiene: A = 0,865; VPP = 0,779 y VPN = 0,943. Esto significa que el porcentaje de xitos de ese test, en esa poblacin, ser del 86,5%. Adems predecir correctamente a los positivos en un 77,9% de los casos, y a los negativos en el 94,3% de los casos.

4.6 Likelihood Ratios.

Habitualmente, estos ndices suelen informarse en los trabajos de investigacin junto a los parmetros bsicos. Se trata de un par de valores que no varan con la prevalencia de la poblacin, sino que son caractersticas propias del mtodo clnico. Su uso se relaciona con las probabilidades a posteriori del test como se explicar ms adelante. Por ahora, basta saber como se los define: - Likelihood Ratio de Positivos: LR+ = S / (1 E)

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] - Likelihood Ratio de Negativos: LR- = (1- S) / E Por ejemplo, para el caso visto ms arriba donde S = 0,925 y E = 0,825 se pueden obtener: LR+ = 5,286 y LR- = 0,091

4-13

A mediados de la dcada del ochenta, se los comienza a emplear para facilitar el clculo de la compleja frmula de Bayes en los trabajos de Medicina. Un ejemplo desarrollado por Simel y publicado por The Lancet en 1985 muestra como determinar si una prueba es o no necesaria para mejorar el diagnstico. Los LR no son una probabilidad, ni dependen de la prevalencia, es decir son magnitudes o valores intrnsecos de la prueba clnica. Sin embargo, se calculan como un cociente de probabilidades. El LR+ es el cociente entre la probabilidad de predecir correctamente la enfermedad y la probabilidad de predecir incorrectamente a dicha enfermedad. Da una indicacin de cuanto puede aumentar o bajar la probabilidad del resultado del mtodo de diagnstico, antes de efectuarlo (probabilidad pre-test). Cuando el LR+ = 1 indica que si se le realiza el test al paciente, no se obtendr informacin adicional y por lo tanto lo mejor es no someter al paciente a gastos intiles. En cambio cuando LR+ > 1 indica que es conveniente efectuar el test porque se obtendr informacin adicional. Pero si LR+ < 1 entonces el test no incrementa la probabilidad de asesorar bien al clnico, sino que disminuye. Para profundizar estos conceptos hay que tener una nocin de probabilidades, cosa que se har ms adelante.

4.7 Influencia de los puntos de corte.

Hasta ahora se vio el caso de resultados dicotmicos del mtodo de diagnstico que es el caso ms general. Sin embargo, muchas mediciones clnicas se hacen con otro tipo de magnitudes como las continuas. La solucin para estos casos es transformar una magnitud cualquiera en una binaria adoptando un punto de corte adecuado. Por ejemplo, el peso es una magnitud continua y si se toma el valor 70 kg para diferenciar a gordos de flacos, entonces cuando un individuo pesa hasta 70 kg se lo considera flaco y en caso contrario gordo. Este valor de 70 kg es el punto de corte adoptado para separar dos zonas bien definidas en la variable continua. El problema es que no existe en los casos reales, un valor que permita discriminar claramente a los sanos de los enfermos en magnitudes continuas. Se encuentran tres zonas: una para los sanos, una intermedia donde los casos son dudosos y la tercera donde los resultados indican claramente la presencia de la enfermedad. Para ilustrar estos conceptos se analizar el caso de infartos de miocardio del captulo anterior, en los Cuadros 3.1 y su resumen en el Cuadro 3.3. Pero antes de proseguir hay que hacer notar una diferencia conceptual importante: Sensibilidad, especificidad y sus ndices derivados no varan con la prevalencia, pero s lo hacen con el punto de corte que se adopta en magnitudes continuas. Los otros ndices variables como los valores predictivos y la eficiencia, pueden variar por ambas cosas. Por ejemplo, tomando el caso de los pacientes con supuesto infarto de miocardio visto en el Cuadro 3.3, y definiendo como punto de corte un valor de CPK de 20 UI/l, entonces cuando un paciente tenga un valor menor o igual de CPK se lo supondr sano (-), o sea una falsa alarma. En cambio, si el valor medido es mayor se lo internar de inmediato en la unidad coronaria, pues se lo supondr infartado, es decir como enfermo (+). As, de los infinitos valores posibles que puede

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-14

arrojar la medicin de una variable continua, al adoptar un punto de corte, este delimitar dos zonas, dicotomizando la variable en cuestin. Analizando los histogramas del Grfico 3.12, se puede ver que muchos puntos de corte arrojarn falsos diagnsticos. Puede verse esta superposicin entre 20 y 120 UI/l, creando una zona de incertidumbre muy amplia. Adoptando como punto de corte 20 no habr ningn caso (-) que sea falso. Viceversa, si se adopta 120 como punto de corte entonces no habr ningn falso (+). En cambio, una tcnica clnica ideal, separara ambas zonas sin problemas y as no se cometeran equivocaciones. Pero, en la actualidad es muy raro el disponer de una prueba que de certidumbre total. An una biopsia puede fallar. El desafo es encontrar una prueba lo ms cercana posible a la ideal, llamada el golden standard. Los investigadores estn probando combinaciones de dos o ms pruebas usando diferentes modelos en serie o paralelo, el Anlisis Multivariado, etc. El problema es encontrar un criterio, basado en la tica, que le permita al clnico elegir el mejor punto de corte posible. Luego de adoptarlo, la variable continua se transforma en una binaria y se le puede aplicar todo lo visto en los puntos anteriores. Para definir un criterio conviene analizar la variabilidad de los ndices de acuerdo al punto de corte adoptado en la magnitud clnica. En el Grfico 3.12 se observa que, tomando a 120 UI/l como punto de corte, no habr falsos positivos. En cambio, tomando a 20 UI/l como valor referente, entonces fn = 0. Adoptando diferentes puntos de corte se puede deducir que si se aumentan los fp, bajan los fn y viceversa. La pregunta ms difcil de contestar es: Cul ser el valor ptimo a elegir para poder discriminar entre sanos y enfermos ? Hay varias respuestas. Si se trata de una enfermedad mortal, en caso de no ser atendida a tiempo, salta a la vista que lo ms importante es tener fn = 0, como los infartos, ciertos tipos de tumores, etc. En cambio, si se trata de una enfermedad terminal, sin cura posible, puede resultar muy grave informarle al paciente que la padece cuando en realidad est sano. Aqu se requiere de fp = 0, como el caso un cncer terminal, metstasis de ciertos tumores, etc. Por otro lado, hay muchos casos donde esta decisin no es tan sencilla como por ejemplo en el caso del SIDA: desde el punto de vista del paciente lo peor es un fp por los temores y angustias que le producir creerse enfermo cuando en realidad est sano, pero desde el punto de vista de la sociedad lo peor es un fn porque al no tomar las prevenciones del caso la enfermedad se propagar en ms personas. Como antes, para decidir no hay que perder de vista el tipo de enfermedad que se est analizando. En el caso visto de mediciones de CPK se tienen los archivos de pacientes que llegan a una unidad coronaria con un diagnstico presunto de infarto, el cual fue confirmado o rechazado a posteriori. Es decir, de todas las historias clnicas de esa unidad se descartan los casos dudosos y solo se usan aquellos confirmados en dos clases: los que tuvieron un infarto y los que no lo tuvieron pues fue una falsa alarma. De entre todos los casos disponibles se eligen al azar una cierta cantidad N lo ms grande posible (por lo menos 50 casos), clasificadas un 50% para los de enfermedad confirmada y el otro 50% para los sanos. En el ejemplo visto se tomaron 400 pacientes, 200 con infarto confirmado y 200 sin infarto. Para poder estudiar la influencia del punto de corte, que se adopte para la medicin de la CPK se emplearn los datos del Cuadro 3.1 y las frecuencias del Cuadro 3.3. Como se puede clasificar a los infartos como una enfermedad del Tipo I, se deduce que el principal criterio a tener en cuenta va a ser la sensibilidad. La estrategia ser adoptar un punto de corte que maximice dicho ndice, para evitar la mayor cantidad de falsos negativos posibles. Sin embargo, si se tratase de otra enfermedad habra que maximizar la especificidad para las enfermedades del Tipo II, o el ndice de Youden para las del Tipo III. Para este ejemplo, en la Tabla 4.1 siguiente, se toman a los lmites superiores de cada intervalo de clase como puntos de corte y as se pueden efectuar los clculos como se muestra a continuacin:

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] Tabla 4.1: Obtencin de los diagnsticos posibles con datos del Cuadro 3.1 y 3.3
Clases
(1)

4-15

Sin Infarto Con Infarto Puntos Fr. Fr. ac. Fr. Fr. ac. de Corte
(2) (3) (4) (5) (6)

TN
(7)

TP
(8)

vn
(9)

fn
(10)

vp
(11)

fp
(12)

0-20 21-40 41-60 61-80 81-100 101-120 121-140 141-160 161-180

104 36 28 18 10 4 0 0 0

104 140 168 186 196 200 200 200 200

0 8 16 32 46 66 23 6 3

0 8 24 56 102 168 191 197 200

20 40 60 80 100 120 140 160 180

104 148 192 242 298 368 391 397 400

296 252 208 158 102 32 9 3 0

104 140 168 186 196 200 200 200 200

0 8 24 56 102 168 191 197 200

200 192 176 144 98 32 9 3 0

96 60 32 14 4 0 0 0 0

El procedimiento para obtener los valores de la Tabla 4.1 es como sigue: Paso 1 : En la primer columna (1) se colocan las clases adoptadas con un ancho de 20 UI/l. Paso 2 : En las columnas (2) y (4) se ponen las frecuencias obtenidas del Cuadro 3.3. Paso 3 : Se calculan las frecuencias acumuladas para ambos casos y se colocan en (3) y (5). Paso 4 : En la columna (6) se colocan los diferentes puntos de corte elegidos. Paso 5 : En la columna (7) se calcula el TN como la suma de todos los datos menores que el punto de corte adoptado. O sea, la suma de las frecuencias acumuladas correspondientes. En este caso resulta la suma de las columnas (3) y (5). Paso 6 : En la columna (8) se obtiene el TP como la diferencia entre el total de datos y TN de la columna (7). O sea TP = N TN. Paso 7 : En la columna (9) se calculan los vn como el nmero de pacientes cuyo diagnstico resulta (-) por el punto de corte adoptado, y que realmente son no infartados. Entonces, ser el valor de la frecuencia acumulada de los no infartados. As resulta: columna (3) = columna (9). Paso 8 : En la columna (10) se obtiene el valor de los fn con los datos de la columna (5). Pues todos los valores menores que el punto de corte corresponden a la frecuencia acumulada de los infartados, estos sern diagnosticados como (-) cuando en realidad tienen un infarto. Paso 9 : En la columna (11) se usa la relacin vp = TE fn. O sea, tp = 200 fn. Esto es: columna (11) = 200 - columna (10). Paso 10 : En la columna (12) se usa la relacin fp = TS - vn = 200 tn. Otra forma de obtener estos valores es usando: fp = TP - vp. As, columna (12) = 200 - columna (9). Se puede notar que, para cada punto de corte adoptado, se puede formar una Tabla de diagnstico. Analizando los resultados de la Tabla 4.1, puede verse que los fn son nulos slo cuando el punto de corte se adopta en 20 UI/l. Esto es, a todo paciente que ingrese al servicio con

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-16

una CPK mayor que 20 UI/l se lo internar porque se sospecha que est infartado. Naturalmente, esto arrojar el nmero ms alto de fp = 96 pacientes internados sin que sea necesario. A medida que se aumenta el valor del punto de corte, la situacin se invierte. As van aumentando los fn mientras disminuyen los fp, hasta el punto 120 UI/l; all resulta fp = 0. O sea, no habr pacientes internados sin necesidad, pero la contrapartida, son los fn = 32 pacientes diagnosticados como sanos, o peor an, dados de alta, a pesar de su infarto. A la luz de esta informacin, se puede contestar la pregunta planteada anteriormente: Cul es el mejor punto de corte a ser adoptado desde el punto de vista tico ? Para el caso de infartos de miocardio (Tipo I) el valor ptimo es aquel que reduce al mnimo la posibilidad de un fn. (para este ejemplo se debe tomar como punto de corte 20 UI/l). Claro que si al responsable del servicio, no le interesa minimizar el nmero posible de muertos por falta de atencin, sino reducir sus costos evitando las falsas alarmas, entonces para una persona as el valor ptimo sera de 120 UI/l, y slo internara a pacientes cuyas CPK sean superiores a tal valor. Pero, si al responsable lo que ms le interesa es no cometer errores, por una cuestin de imagen, mejorar su rendimiento adoptando como punto de corte 60 UI/l, pues all la suma de fp y fn es mnima. La adopcin de un punto de corte est influenciada por la subjetividad de las personas y por los condicionantes externos producto de las presiones laborales y econmicas de la cuestin. El deber es siempre usar la tica como criterio bsico de decisin. De todos los ndices propuestos hay dos bsicos de los cuales derivan todos los dems, que son la Sensibilidad y la Especificidad. Conviene tener la mxima Sensibilidad en aquellas enfermedades del Tipo I. Es decir, en enfermedades de consecuencias graves si no se las detecta a tiempo. Adems del infarto de miocardio, el caso ms comn son las enfermedades venreas. La sfilis en su fase IV ya no tiene remisin, pero en una etapa ms temprana igual puede tener secuelas nefastas, como la sfilis congnita que transmite la embarazada, la neurosfilis y la sfilis cardiovascular. En las fases tempranas hay mucha dificultad para detectarla cuando an no se observan reacciones epidrmicas y es fundamental usar una tcnica con el mnimo fn posible. Por lo tanto, si se est usando la VDRL para detectarla y aparece una nueva tcnica, el profesional debe optar por aquella con mxima sensibilidad entre ambas. Hay otros casos como el feocromocitoma, fatal si no se lo detecta a tiempo, pero curable con tratamiento; el hipotiroidismo, la toxoplasmosis en especial entre las embarazadas, el cncer de mama o de tero, etc. Conviene tener mxima especificidad en las enfermedades del Tipo II. Este caso se busca cuando es muy grave informarle al paciente que est enfermo, si en realidad est sano. Esto le podra ocasionar serios daos en lo psicolgico, moral o econmico. Por ejemplo, el caso de un cncer incurable, la esclerosis mltiple, etc. Cuando una enfermedad es muy grave y entr en una etapa de no-remisin, se requiere mucha especificidad para minimizar los falsos positivos. Cuando la magnitud clnica es continua, la especificidad vara con el punto de corte adoptado por el clnico. En la Tabla 4.2 se ilustra esta situacin para el caso de los pacientes con diagnstico presunto de infarto de miocardio. La especificidad es mnima cuando el corte adoptado es 20 UI/l y mxima luego de los 120 UI/l. Anlogamente para el ndice de Youden, este ser mximo cuando se igualen sensibilidad y especificidad, como es en el punto de corte 60 UI/l. Los dems ndices pueden obtenerse a partir de los anteriores, y de acuerdo al punto de corte adoptado, como se puede apreciar en la tabla siguiente:

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] Tabla 4.2: Obtencin de los ndices Clnicos (continuacin de la Tabla 4.1).
Clases
1

4-17

Puntos de corte
6

S %
13

E %
14

Y
15

A
16

VPP %
17

VPN %
18

LR+
19

LR20

0-20 21-40 41-60 61-80 81-100 101-120 121-140 141-160 161-180

20 40 60 80 100 120 140 160 180

100 96 88 72 49 16 4,5 1,5 0

52 70 84 93 98 100 100 100 100

0,52 0,66 0,72 0,65 0,47 0,16

0,76 0,83 0,86 0,825 0,735 0,58

67,57 76,19 84,62 91,14 96,08 100 100 100 ***

100 2,08 0 94,59 3,2 0,057 87,5 5,5 0,143 76,86 10,29 0,301 65,77 24,5 0,52 54,35 0,84 51,15 50,38 50 0,955 0,985 1

0,045 0,523 0,015 0,508 0 0,5

Paso 11 : Para calcular la sensibilidad S en forma porcentual de la columna (13), se emplea la relacin: S = (vp / TE) 100 y en este caso resulta ser S = vp/2, pues TE =200. Paso 12 : Para calcular la especificidad E en forma porcentual de la columna (14), se aplica la relacin: E = (vn / TS) 100 y en este caso resulta ser E = vn/2, pues TS =200. Paso 13 : El ndice de Youden de la columna (15) se obtiene con: Y % = [ S + E 1]. 100. O sea se suman las columnas (13) y (14) y se le resta 100. Paso 14 : La Eficiencia de la columna (16) se la calcula con la relacin A = ( vp + vn ) / N O sea, el nmero total de diagnsticos acertados sobre el nmero total de casos. Paso 15 : En la columna (17) se calcula el Valor Predictivo de Positivos en forma porcentual con: VPP = ( vp / TP ) 100 Paso 16 : En la columna (18) se saca el Valor Predictivo de Negativos en forma porcentual con: VPN = ( vn / TN ) 100 Paso 17 : En la columna (19) se saca el Likelihood Ratio de la enfermedad dado un resultado positivo con: LR+ = S / (1 E) usando los valores respectivos de las columnas (13) y (14). Paso 18 : En la columna (20) se saca el Likelihood Ratio de la enfermedad dado un resultado negativo con: LR- = (1 S) / E usando los valores respectivos de las columnas (13) y (14). Se pueden graficar los valores obtenidos, para ilustrar acerca de la variabilidad de los ndices clnicos con el punto de corte. Notar que, todos los ndices varan con el punto de corte adoptado, no as con la prevalencia de la enfermedad que es otra de las causas de variabilidad. Todo esto indica la dificultad de tener situaciones estables en la prctica. El supuesto principal es que la sensibilidad y la especificidad no varan con la prevalencia. Sin embargo se puede dar el caso de encontrar una variacin en ambas y las explicaciones ms comunes son: (a) el mtodo no es estable. (b) el avance de la enfermedad en los pacientes (se supone que cuanto ms avanzada est la enfermedad, hay menores posibilidades de equivocarse en el diagnstico).

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] Grfico 4.3: Variacin de Sensibilidad y Especificidad con el punto de corte en la CPK.

4-18

El hecho ms notable es que si la sensibilidad aumenta, la especificidad disminuye y viceversa.

Sensibilidad

Especificidad

1,0 0,8 0,6 0,4 0,2 0,0 0 20 40 60 80 100 120 140 160 180 CPK

Por eso, el problema real es decidir cual de ellas debe ser optimizada en cada caso, adoptando un punto de corte apropiado al tipo de enfermedad estudiada. Si la enfermedad es del Tipo I conviene elegir el punto de corte que maximiza la Sensibilidad ( X = 20 UI/l). Pero si la enfermedad es del Tipo II conviene elegir al punto que maximiza la Especificidad ( X > 120 UI/l). Cuando la enfermedad sea del Tipo III conviene maximizar el ndice de Youden, como se puede ver en el Grfico 4.5 siguiente. Notar que esto ocurre para el valor X 60 UI/l de la magnitud clnica, que es el punto donde se cortan las curvas de sensibilidad y especificidad aproximadamente. Grfico 4.4: Variacin del ndice de Youden con el punto de corte en la CPK

1,0 0,8 Indice 0,6 0,4 0,2 0,0 0 20 40 60 80 100 120 140 160 180 CPK

Esto muestra otra de las ventajas del ndice de Youden. Advierte el peligro de tomar puntos de corte tales que el diagnstico no se diferencie del azar. Por ejemplo, si se toma como punto de corte el valor 180 UI/l, en la Tabla 4.2, se obtiene E = 1 y S = 0, o sea un Y = 0 y el diagnstico resultar como al azar, esto es como si se utilizase el lanzar una moneda al aire para efectuar el diagnstico. En resumen, este ndice debe acompaar siempre el anlisis de sensibilidad y especificidad de los diagnsticos basados en una prueba clnica de laboratorio.

Indice

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-19

En el Grfico 4.5 se muestra la variabilidad de la eficiencia con el punto de corte. Adems se ha vuelto a mostrar la variabilidad del ndice de Youden en lnea punteada, para visualizar lo similar de ambas curvas en su forma. En ambos casos el punto ms aconsejable para una enfermedad del Tipo III es donde se maximizan ambas curvas (X 60 UI/l). Grfico 4.5: Variacin de la eficiencia (A) con el punto de corte en la CPK
1,0 0,8 Indice 0,6 0,4 0,2 0,0 0 20 40 60 80 100 120 140 160 180 CPK

Para ilustrar la variabilidad de los valores predictivos de acuerdo al punto de corte adoptado por el clnico, se presenta el Grfico 4.6 donde se puede ver que: (a) el punto de corte ideal para una enfermedad del Tipo I corresponde al valor mximo del VPN ( X = 20 UI/l), al igual que ocurri en el caso de la sensibilidad. (b) cuando X > 120 UI/l el VPP se maximiza y corresponde al punto ideal para las enfermedades del Tipo II, como en el caso de la especificidad. (c) ambas curvas se cortan en X 60 UI /l que es el punto ideal para las del Tipo III. Grfico 4.6: Variacin de los valores predictivos con el punto de corte en la CPK

VPN

VPP

1,0 Valores Predictivos 0,8 0,6 0,4 0,2 0,0 0 20 40 60 80 100 120 140 160 180 CPK

En resumen: 1) Sensibilidad, Especificidad, ndice de Youden y Likelihood Ratios varan con el punto de corte, pero no lo hacen con la prevalencia de la poblacin (son parmetros del mtodo clnico). 2) Eficiencia y Valores Predictivos varan con el punto de corte y con la prevalencia (no son parmetros sino variables del mtodo clnico).

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-20

4.8 Otros ndices diagnsticos

Adems de los ndices ya vistos, en la bibliografa aparecen algunos otros que no agregan mucho en el mbito conceptual; son variantes lgicas derivadas de los anteriores. Por ejemplo, en lugar de calcular el porcentaje de aciertos con la eficiencia, tambin se pude definir su complemento como: Porcentaje de errores : PE % = {( fn + fp ) / N } . 100 PE % + A % = 100% Se busca minimizar a este porcentaje para acercarse a la tcnica ideal para diagnosticar. A veces, tambin se lo llama error combinado. Otro ndice es el llamado Positivo presunto: se calcula como el porcentaje de pruebas, cuyo resultado dio positivo, respecto del total N de pruebas realizadas, es decir: Positivo presunto : PP% = ( TP / N ) . 100

Otra forma parecida es calcular el porcentaje de aciertos en positividad definido con : ndice de deteccin : ID = ( vp / N ) . 100

La proporcin de error se define como el cociente entre el nmero total de errores y los diagnosticados como enfermos correctamente, esto es : Proporcin de error : P%E = {( fp + fn) / TN } . 100

Hay confusiones en la bibliografa, acerca de los trminos: Incidencia, Predominancia y Morbilidad. Para acotar este problema se toma el aporte de Galen definiendo: Incidencia : Es la cantidad de enfermos que aparecen en un perodo dado de tiempo (un ao), en la poblacin, sobre el tamao de la poblacin expresado cada 100.000 habitantes. Es una medida epidemiolgica tomada en perodos fijos de tiempo. Predominancia : Es la cantidad de enfermos, en un momento dado de la poblacin, dividido el nmero total de habitantes y expresado cada 100.000. O sea, es una medida de tipo censal. Morbilidad : Se usa en Demografa, y puede adaptarse a los dos casos anteriores, pero sin usar un nombre especfico que los distinga. La predominancia o prevalencia de una enfermedad en la poblacin afecta grandemente a los Valores Predictivos y sus ndices relacionados, pero no lo hacen con la Sensibilidad, la Especificidad y el ndice de Youden. Por lo tanto, es muy importante tener en cuenta este valor a la hora de seleccionar un punto de corte buscando optimizar el diagnstico. Se podran seguir agregando otras proporciones e incrementando la lista de ndices clnicos, ms all de los vistos. Sin embargo, a modo de resumen se presentan los cuatro postulados de Galen y Gambino, para la eleccin prctica de las pruebas clnicas en el diagnstico:

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] (1) Se elige alta Sensibilidad cuando las enfermedades son del Tipo I

4-21

- La enfermedad puede curarse si es detectada a tiempo. - La enfermedad es grave y no puede dejarse pasar inadvertida. - La enfermedad es tratable. - Los fp no trauman ni psicolgicamente, ni econmicamente al paciente. - Ejemplos: Cncer de tero o de mama, enfermedades venreas y otras enfermedades infecciosas curables, la fenilcetonuria, el feocromocitoma (2) Se elige alta Especificidad cuando las enfermedades son del Tipo II - La enfermedad es grave, pero difcilmente curable o sin remisin. - Es muy importante para el paciente o para la poblacin l saberse un vn. - Los fp trauman seriamente al paciente. - Ejemplos: Cncer oculto, esclerosis en placas, etc. (3) Se elige un alto ndice de Youden cuando las enfermedades son del Tipo III : - Tanto los fp como los fn, sean igualmente graves para el paciente o para la poblacin. - Ejemplo: SIDA, lupus eritomatoso, ciertas formas de leucemia o linfoma, diabetes, etc.

4.9 ndices de riesgo o dao.

En el primer captulo se explicaron las cuatro cuestiones clnicas fundamentales que son: terapia, daos, diagnstico y prognosis. Para tratar la primera cuestin de la terapia, se mostr el diseo de los RCT para hacer investigaciones. Para tratar la segunda cuestin se usan las tablas diagnstica y los ndices detallados en los puntos anteriores. Para la tercera y cuarta cuestin se presentaron los diferentes diseos de investigacin del riesgo o dao, que se explicaron ms detalladamente en el segundo captulo (estudios por cohortes, caso-control y RCT). La forma ms sencilla de presentar los datos es con una tabla doble dicotmica llamada tabla de riesgo (ver Tabla 1.2) donde se generaliza el cuadro para los diferentes tipos de diseo experimental para el estudio del riesgo: Resultados observados Enfermos Sanos a c TE b d TS

Factor de riesgo Expuesto No expuesto Total

Total TEx TnEx N

Usando la informacin de esta tabla se pueden calcular los dos ndices clnicos bsicos para poder cuantificar el concepto de riesgo o dao:

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] Odds Ratio: OR = (a . d) / (b . c) Riesgo Relativo: RR = [a (c + d)] / [c (a + b)]

4-22

El Odds Ratio se define como el cociente entre dos Odds, el numerador es el Odds de un evento en el grupo de individuos expuestos, dividido el Odds del mismo evento entre los individuos no expuestos. El evento en este caso es la ocurrencia de la enfermedad o la aparicin del sntoma (efecto) buscado en la investigacin. Un Odds se define como el cociente entre la probabilidad de que ocurra un evento, dividida la probabilidad de que no ocurra. Por ejemplo, si la probabilidad de contraer una cierta enfermedad es del 20%, el Odds de ese evento ser el cociente entre ese 20% y el 80% de que no ocurra. Esto es, Odds = 20% / 80% = 1 / 4; lo que significa que en 5 casos hay una sola posibilidad de contraer la enfermedad y cuatro de no hacerlo. El significado del OR en Medicina representa la proporcin de pacientes que presentan la condicin buscada, dividida por la proporcin que no la presentan. Muchas veces se toma el concepto de Odds y de riesgo como si fuera la misma cosa, o aproximadamente iguales. Muchos autores calculan los Odds relativos (otra forma de denominar los OR) y entonces informan sus resultados como si hubiesen calculado el riesgo relativo. Por lo tanto conviene mirar esta cuestin ms de cerca, por ejemplo si se sabe que 1 / 5 de los pacientes estudiados sufren un golpe de presin, los Odds de que sufran el golpe es de 1 / 4 como se vio antes, o bien 0,25. Para convertir los Odds en riesgo se puede aplicar la relacin siguiente: Riesgo = (Odds) / (1 + Odds) En este caso sera, Riesgo = 0,25 / 1,25 = 0,2, que es lo mismo que 1 /5 o 20% que fue el punto de partida. Anlogamente se puede expresar la relacin inversa con: Odds = Riesgo / (1 Riesgo) Notar que el riesgo siempre es un valor entre 0 y 1, en cambio los Odds siempre son positivos entre dos casos extremos 0 e infinito. La siguiente es una tabla con los valores ms comunes: Tabla 4.3: Relacin entre el riesgo y los Odds Riesgo 80% 60% 50% 40% 33% 25% 20% 10% 5% Odds 4 1,5 1 0,67 0,5 0,33 0,25 0,11 0,053

Ejemplo: A 360 pacientes que tuvieron cesreas en sus partos, 170 de ellas tuvieron una cateterizacin umbilical durante la ciruga y las dems no. Entre ellas se observaron 60 que desarrollaron una bacteremia con 50 cateterizadas. Los datos se presentan en la tabla siguiente:

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] Resultados observados Infeccin No-infeccin 50 10 60 120 180 300

4-23

Factor de riesgo Cateterizacin No cateterizacin Total

Total 170 190 360

OR = (50 . 180) / (120 . 10) = 7,5 mientras que RR = (50 . 190) / (10 . 170) = 5,6 En este caso el Odds de enfermarse en las cateterizadas es de 50 versus las 120 que no se infectaron, o sea 50 /120 = 0,42. Mientras que el Odds de infectarse en las no cateterizadas es de 10 versus las 180 que no enfermaron, esto es 10 / 180 = 0,056. Por lo tanto, el cociente entre estos dos Odds resulta (50/120) / (10/180) = OR = 7,5. Si se hablase en trminos de riesgo o dao, se podra denominar al cociente de Odds como Odds relativos, pero el trmino impuesto por la Epidemiologa es OR. Un mdico tiene una buena intuicin acerca del riesgo y an del concepto de un cociente de riesgos como RR. Un jugador tiene buena intuicin sobre los Odds, pero nadie (excepto tal vez algunos estadsticos) puede intuitivamente captar el concepto de OR. A pesar de esto, el OR es la medida de asociacin ms empleada en Medicina, porque tiene ventajas estadsticas en cuanto al hecho de que es independiente de la seleccin arbitraria entre una comparacin de riesgos entre enfermos y sanos, lo cual no es verdadero con el RR. Los clnicos tienen una tendencia natural a sustituir el concepto intuitivo de RR por el concepto poco intuitivo del OR, lo cual puede ser correcto bajo ciertas condiciones: Por ejemplo si a <<< b y c <<< d. En otras palabras, la enfermedad tiene que ser mucho menos frecuente que la no-enfermedad, tanto entre los expuestos como entre los no expuestos. Por su parte el RR muestra la proporcin del riesgo original (en este ejemplo el riesgo de enfermarse al ser cateterizadas), que est an presente cuando las pacientes no fueron expuestas (en este caso sin cateterizacin). En el ejemplo, el riego de enfermarse al ser cateterizadas es de 50 casos entre las 170 en total (50/170), mientras que el riesgo de enfermarse sin haber sufrido una cateterizacin es de 10 casos entre las 190 en total (10/190). Por lo tanto el cociente entre ambos riesgos es: RR = (50/170) / (10/190) = 5,6. Esto significa que el hecho de sufrir una cateterizacin durante la cesrea incrementa el riesgo de infectarse 5,6 veces. Intuitivamente, uno puede pensar que no conviene la cateterizacin en cesreas, pero clnicamente se sabe que hay otros factores que pueden producir una infeccin en una ciruga, los que deben ser analizados cuidadosamente si lo que se busca es reducir el nmero de infectadas.

4.9.1 ndices de riesgo derivados.

Se suelen usar otros ndices de riesgo conceptualmente derivados de los anteriores como por ejemplo los siguientes: Riesgo absoluto: Es el riego de contraer la enfermedad habiendo estado expuesto, o el de enfermarse sin haber estado expuesto.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-24

En el ejemplo anterior sera 29,4% (50/170) el riesgo de infectarse habiendo sufrido la cateterizacin, mientras que el riesgo absoluto de enfermarse sin haber sido cateterizada es de un 5,3% (10/190). A este ltimo valor se lo denomina tambin proporcin del evento en el grupo control (CER) o bien riesgo bsico. En cambio al riesgo absoluto de enfermarse habiendo estado expuesto se lo denomina (EER) proporcin del evento experimental en el grupo expuesto. En otras palabras, se pude considerar al riesgo relativo como el cociente entre los dos riesgos absolutos: RR = EER / CER = [a / (a + b)] / [c / (c + d)] Reduccin del riesgo absoluto (ARR): Es la diferencia entre el riesgo bsico y el experimental tomado en valor absoluto. ARR = CER EER En el ejemplo visto se calcula como: ARR = 5,3% - 29,4% = 24,1%. Cuando la diferencia da negativa como en este caso, significa que el exponerse a una cateterizacin aumenta el riesgo de infectarse en un 24,1% en trminos relativos. En cambio cuando la diferencia da positiva significa que el riesgo disminuye, y corresponde al caso de aplicarse una terapia de cura, o al efecto de un medicamento que en efecto funcionan. Reduccin del riesgo relativo (RRR): Es una estimacin de la proporcin de riesgo bsico, que es removida por la terapia, o bien por la exposicin. Se calcula como el cociente entre: RRR = ARR / CER = 1 RR En el ejemplo es RRR = 24,1% / 5,3% = 4,6; o bien 1 5,6 = 4,6 Y significa, usando un lenguaje no tcnico que la cateterizacin incrementa el riego relativo de enfermarse 4,6 veces, en comparacin a la ciruga sin la cateterizacin.

4.10 Concordancia clnica

Adems de la validez interna de un mtodo, dada por su prestacin medida por los ndices clnicos antes descriptos, se necesita otra cosa ms: fidelidad. Esto es, no debe ser influenciado por la persona que lo ejecuta. No debe ocurrir que el mismo test, hecho por dos bioqumicos diferentes al mismo paciente, en el mismo tiempo y lugar, arrojen resultados opuestos o muy diferentes. Significa, que se necesita la reproducibilidad de los resultados de la prueba, independientemente de quien la ejecuta. Se define un ndice para cuantificar esta situacin, con el nombre de grado o Nivel de Concordancia ( %) : % = ( NC / N ) . 100 Donde NC: es el nmero de diagnsticos que concuerdan N : nmero total de casos

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-25

Un test perfectamente reproducible tendra un ndice C% = 100%. Para estudiar la concordancia entre dos mtodos clnicos, se arma la llamada Tabla de Concordancia que consta de 2 filas y 2 columnas (Tablas 2 x 2). A su vez cada fila o columna puede estar subdividida en clases o categoras. Se habla de una tabla de k x k cuando hay k clases en filas y columnas. Esto se esquematiza en el Cuadro 4.1, donde por ejemplo hay dos bioqumicos A y B, que pueden diagnosticar k casos diferentes, a partir de la misma prueba clnica. Entonces, se puede armar una tabla como la siguiente: Cuadro 4.1: Tabulacin cruzada en un diagnstico. Bioqumico A 1 2 3 ... 1 Bioqumico B 2 3 ... k n11 n21 n31 ... nk1 n.1 n12 n22 n32 ... nk2 n.2 n13 n23 n33 ... nk3 n.3 n1. n2. n 3. nk. N

k n1k n2k n3k ... nkk n.k

% = {( n11 + n22 + n33 + ... + nkk ) } . 100 / N % = ( 100 . k nkk ) / N La concordancia observada, es la sumatoria de la cantidad de diagnsticos coincidentes para cada caso nkk , dividida por el nmero total de casos, expresada porcentualmente. En el grfico, se suman filas y columnas, colocando un punto como subndice para subrayar este hecho. As, el total de la 2 columna es n.2 y el total de la primera fila n1. En el ejemplo anterior se obtuvo un ndice del 50% lo que significa una mala concordancia entre ambos bioqumicos. La manera ms usual de aplicar este concepto es para comparar dos test clnicos entre s, cuando se aplican al mismo paciente (es decir muestras apareadas), como fuera presentado en el primer captulo (Tabla 1.3) como la siguiente: Mtodo 1 Mtodo 2 (+) (-) Total (+) a c a+c (-) b d b+d Total a+b c+d N

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-26

Donde el nmero total de concordancias est dado por la cantidad (a + d) y el nmero total de discordancias por la cantidad (b + c). Siendo N el nmero total de casos analizados. Los ndices de concordancia ms usados son dos: Nivel de concordancia: = (a + d) / N (expresado en forma porcentual: % = 100 / [ 1 + DO]%) Odds de discordancia: DO = (b + c) / (a + d) y su relacin con % es: DO = (100 / %) - 1 El nivel de concordancia indica el porcentaje de xitos (concordancias) obtenido por la comparacin de las pruebas. La idea es compararlo contra un valor recomendado en la literatura mdica para que la concordancia sea considerada aceptable. Por ejemplo, un nivel de concordancia del 90% es suficiente para muchas enfermedades, pero no alcanza para casos como el Sida o ciertos tipos de cncer. Los Odds de discordancia son otra manera de expresar el mismo concepto y es usado por aquellos que prefieren el concepto de Odds al de probabilidad. Por ejemplo, un DO = 1/9 significa que habr 1 discordancia y 9 concordancias en 10 casos. O que se tendr un desacierto cada 9 aciertos entre ambas pruebas. La concordancia ideal se da cuando DO = 0 ( = 100%), en cambio cuando la concordancia sea DO = 1 significa que habr el mismo nmero de concordancias y de discordancias, lo cuan clnicamente est en el lmite de lo aceptable ( = 50%). Cuando DO sea mayor que 1, o bien < 50%, la discordancia entre ambos mtodos ser inaceptable desde un punto de vista clnico.

Ejemplo: Comparacin de diagnsticos hechos por dos individuos diferentes.

A 200 pacientes internados en un sanatorio, se les efectu una anlisis de sangre en heces. Dos bioqumicos proceden a efectuar el test al mismo grupo de individuos. Los resultados fueron: Sangre en heces 0 + ++ 120 56 24 120 56 24 200 200

Diagnsticos: Bioqumico A Bioqumico B

De acuerdo al cuadro anterior, la coincidencia entre ambos parece perfecta. Sin embargo, si se efecta una tabulacin cruzada para evitar que el mismo paciente aparezca dos veces en la tabla y lograr as independencia. Se obtiene: Bioqumico A 0 + ++ Total 0 + ++ Total 80 28 12 120 40 12 4 56 0 16 8 24 120 56 24 200

Bioqumico B

De donde se puede calcular:

% = 100 . (80 + 12 +8 ) / 200 = 50 %

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-27

4.11 Estadgrafos clsicos

En este punto se describen los diferentes estadgrafos, llamados tambin nmeros ndices, estadsticas, estadsticos, etc. Clsicamente, se trata de valores que se calculan para magnitudes clnicas cuantitativas, y no cualitativas. Se trata de valores que aportan mucha ms informacin que la propia, como datos en s mismos. As como un histograma puede ser considerado como una manera clara y prctica de resumir la informacin contenida en la nube de datos, los estadgrafos la condensan an ms, reducindola a unos pocos valores que toma el lector para darse una idea de todo el conjunto. El trabajo de analizar un gran nmero de datos siempre es engorroso; en la actualidad, con las computadoras la tarea est mucho ms aliviada, pero en los inicios era una tarea muy pesada. Por eso, desde siempre se busc la manera de unificar criterios y tcnicas para homogeneizar la manera de presentar datos en los informes cientficos. Eso evit la anarqua que se hubiese tenido, si cada investigador los tratase a su peculiar manera, para luego presentarlos a consideracin de los dems en congresos, simposios, publicaciones, etc. Todo esto llev a encontrar formas simples y concisas para describir el conjunto de datos hallados en experimentos. Formas conocidas y aceptadas por todos los cientficos, a manera de convencin. Maneras cuantitativas que permitan efectuar comparaciones entre trabajos y caracterizar la poblacin de donde fueron extrados los datos. Por esa necesidad, aparecieron los estadgrafos, como por ejemplo nmeros para dar una idea al lector de la posicin de la nube de datos, o un valor alrededor del cual los datos parecen agruparse, o un nmero que cuantifica la dispersin de los datos alrededor del anterior. Adems, cada profesin aporta ms ndices propios de su campo especfico. En Economa se usan en forma habitual, los ndices de costo de vida, de la construccin, de precios mayoristas no agropecuarios, etc. En Demografa se usan las tasas de mortalidad, morbilidad, fecundidad, casamientos, etc. En Sanitarismo se emplean la prevalencia, la predominancia, y otros muchos casos. En Clnica, los hay especficos para el diagnstico de enfermedades, a partir de los resultados de los anlisis del laboratorio. Los estadgrafos clsicos se dividen en dos tipos generales: los llamados estadgrafos de posicin que dan una idea de alrededor de que valor parecen agruparse los datos, y los de dispersin que muestran como se distribuyen los datos alrededor de los de posicin.

4.12 Estadgrafos de posicin

Se denominan as, a los estadgrafos que indican un valor, alrededor del cual los datos parecen agruparse de cierta manera, como si fuese el centro de gravedad de los datos, tal es el caso de los estadgrafos de tendencia central (media, mediana y moda ). O bien, dejando una cierta cantidad de valores por debajo o por encima de l (percentiles ).

4.12.1 Medias
Media aritmtica : _ x
n

=
i =1 m

( xi / n )

(para datos sueltos)

_ Media aritmtica ponderada : x

=
k=1

( f k . xk / n )

(para datos agrupados)

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-28

Cuando se conocen los datos en forma individual, se puede calcular la media aritmtica tradicional en forma directa aplicando la primera de las frmula de arriba. En cambio, si la informacin se suministra a travs de n datos agrupados en m clases, se usa la media aritmtica ponderada usando la otra frmula. Donde la frecuencia de cada clase se expresa con f k , siendo xk la marca de cada clase (es decir el punto medio del ancho de clase, obtenido como la semisuma de sus lmites reales de clase). La expresin de la media aritmtica usando las frecuencias de clase no es otra cosa que un promedio ponderada, donde se le da un peso porcentual a cada marca de clase, de acuerdo al tamao que tiene cada una. Como cada valor de frecuencia est dividido por la frecuencia total, la frmula resulta la sumatoria de las marcas de clase (o valores individuales) multiplicada por la frecuencia relativa respectiva. Esta frmula de media ponderada se aplica de muchas maneras en la prctica: es un concepto similar al centro de masa visto en Fsica (o centro de gravedad), la velocidad promedio en la teora cintica de los gases, etc. CUADRO 4.2: Clculo de la media aritmtica.
Caso 1: Datos individuales. (usando los datos para los no infartados del Cuadro 3.1).

_ x

=
i =1

( xi / n ) = 10 + 33 + 20 + ... + 120 + 92 + 90 = 30,735 UI/l

200

Caso 2 : Datos agrupados en clases (usando los mismos datos, pero tomados del Cuadro 3.3). CPK fk

xk
10,5 30,5 50,5 70,5 90,5 110,5 130,5 150,5 170,5

xk
La media aritmtica aproximada se calcula con :

1 - 20 21 - 40 41 - 60 61 - 80 81 - 100 101- 120 121- 140 141- 160 161- 180

104 36 28 18 10 4 0 0 0 200

1092 1098 1414 1269 905 442 0 0 0 6220

_
x = 6220 / 200 = 31,1 UI/l

El valor exacto de la media aritmtica, est dado por el primer caso, donde se tienen identificados los datos, uno por uno. El segundo valor de la media, obtenido a partir de su agrupacin en clases, es solo una aproximacin, pues al perder informacin se pierde exactitud (aument un 2,7%). Caso 3 : Datos y sus frecuencias ( valores tomados de un conteo celular - Student, 1907 ). N de clulas x cuadrcula 0 1 2 3 4 5 Frecuencias Observadas 213 128 37 18 3 1 _ x = {0 (213) + 1 (128) + 2 (37 ) + 3 (18) + 4 (3) + 5 (1)} = 273 = 0,6825 213 + 128 + 37 + 18 + 3 + 1 400 En este caso las marcas de clase coinciden con la cantidad de clulas por cuadrcula de la cmara que tiene en total 400.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-29

Caso 4. Una farmacia maneja 4 familias de productos en su trabajo. Los mrgenes de utilidad de cada uno de ellos, durante el perodo fiscal pasado fueron: Familia A: 8,4%; la B: 11,0%; la C: 14,8% y la familia D: 20,2%. Se pide calcular el margen de utilidad promedio. Producto A B C D Totales Ventas (miles de $) (V) 300 200 50 30 580 Mrgenes (%) (M) 8,4 11,0 14,8 20,2 Participacin (V.M) 25,20 22,00 7,40 6,06 60,66

Si se calculase el promedio de los mrgenes en forma directa, sera de: 13,6%, lo que no es correcto. Pero esto slo es correcto si las 4 familias tuvieron igual participacin en las ventas. Lo cual es muy raro que ocurra. Por lo tanto, el farmacutico debe estudiar como se le distribuyeron las ventas y hacer la ponderacin respectiva como se calcula ms arriba. Entonces, el margen promedio ponderado buscado es: M = ( Vk .Mk ) / Vk = 60,66 / 580 = 10,46% Caso 5. El tiempo de atencin al cliente en una farmacia con varios vendedores fue medido durante un da de trabajo donde se atendieron 47 clientes. El encargado de medir los tiempos inform lo siguiente. El farmacutico a cargo quiere calcular el tiempo promedio que tiene su negocio a fin de mejorarlo. Informe recibido Tiempo en minutos Nclientes Entre 5 y 8 10 Ms de 8 y menos de 11 17 Ms de 11 y menos de 14 12 Ms de 14 y menos de 17 6 Ms de 17 y menos de 20 2 Ms de 20 0 Totales 47 Clculos efectuados por el farmacutico Clases Medios Frec. ponderada Frec. acumulada 5- 7,99 6,5 65,0 10 8-10,99 9,5 161,5 27 11-13,99 12,5 150,0 39 14-16,99 15,5 93,0 45 17-19,99 18,5 37,0 47 20 y ms ----506,5

El tiempo promedio de atencin al cliente es: 10,8 minutos = 506,5 / 47 Caso 6. En una industria farmacutica se fabrican tres tipos de ampollas de un mismo medicamento. Se desea averiguar el porcentaje de fallas de la mquina envasadora. Luego de un mes de pruebas, Control de Calidad obtuvo los datos siguientes: Ampollas % defectuosas Tipo A Tipo B Tipo C Totales 1,1 1,5 2,3 N de ampollas Amp. defectuosas 210.000 120.000 50.000 380.000 2310 1800 1150 5260

El promedio ponderado de ampollas defectuosas es de 1,38 % = 5260/380.000 Caso 7. Se observan 10 pacientes adultos de sexo masculino, que llegan a hacerse a atender al laboratorio Otros 15 pacientes jvenes y 25 nios. En cambio, de sexo femenino llegan 20 adultas, 5 jvenes y 15 nias. Calcular el promedio de cada grupo de edades (grupo etreo). Resulta que en promedio llegan: 15 adultos, 10 jvenes y 20 nios.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-30

En el Cuadro 4.2 se han desarrollado ejemplos de aplicacin. En el primer caso se muestra un ejemplo de media aritmtica simple aplicado a los 200 casos de los no infartados del Cuadro 3.1. La media es 30,735 UI/l. En cambio, si se tuviesen los mismos datos pero agrupados en clases, solo se podra calcular una estimacin de la media a travs de una ponderacin. Usando los datos del Cuadro 3.3 para los no infartados y la frmula de media ponderada, se obtiene 31,1 UI/l, o sea un aumento del 2,7% respecto del valor exacto. En el tercer caso se calcula la media ponderada del conteo celular pues se carecen de las mediciones individuales hechas por Student en 1907. Los tres casos siguientes son aplicaciones en Farmacia del concepto de la media. En el Caso 4 se desea calcular el margen promedio de ganancias del negocio, utilizando los mrgenes de 4 lneas de productos. En el Caso 5 el farmacutico desea mejorar la atencin al pblico reduciendo los tiempos de espera de sus clientes. El primer paso para ello es calcular el tiempo promedio de atencin al cliente en el mostrador. Toma los tiempos agrupados en clases y sus frecuencias para poder hacer la ponderacin del promedio. Descubre que en su farmacia se tarda casi 11 minutos en despachar a un cliente. En el ltimo caso se desea saber el porcentaje de ampollas falladas de una mquina envasadora. Durante un perodo de un mes se calculan los porcentajes de fallas para tres productos diferentes A, B y C que se envasan en ese equipo, y efectuando la ponderacin resulta 1,38% de fallas. En el ltimo ejemplo, se muestran los promedios por grupo etreo de pacientes que concurren al laboratorio. La media slo se usa en variables cuantitativas, pues en las cualitativas carece de sentido. Las principales propiedades de la media se muestran en el Cuadro 4.3., y se explican a continuacin por su importancia en los captulos posteriores: Cuando a una media se le suma o resta una constante, la nueva media queda sumada (o restada) por la misma constante. Esto es el efecto que tiene un error de tipo sistemtico en una serie de mediciones, porque el efecto del mismo es siempre del mismo signo y aproximadamente de la misma magnitud. Todo ocurre como si se trasladase el eje de coordenadas a lo largo del eje de abcisas ( a la derecha cuando se le suma una constante y a la izquierda cuando se la resta). Cuando a la media se la multiplica o divide por una constante, la nueva media queda multiplicada o dividida por dicha constante. Esto es el efecto de cambiar de escala en un grfico. Otra propiedad de mucha importancia es: La sumatoria de los desvos de valores medidos en un sistema respecto de su media es nula. Esto significa que de todos los puntos posibles para referir las mediciones, la media aritmtica equilibra esos desvos. Lo que explica que se puede considerar a la media como el centro de gravedad de los datos. Una aplicacin prctica de la media aritmtica ponderada es el clculo del centro de masa, o el de inercia en Fsica. El mtodo de los mnimos cuadrados se basa en la propiedad: Si se suman los cuadrados de los desvos de todas las mediciones respecto a un punto cualquiera, se demuestra que tal suma se hace mnima cuando el punto elegido es la media aritmtica. Por eso, si se divide tal suma por los grados de libertad se tiene un desvo de referencia llamado: desvo estndar. Existen otros tipos de medias como la media geomtrica y la media armnica, usadas en otras disciplinas. Por eso, se deja al lector la inquietud de verlas en la bibliografa. La media geomtrica se usa para interpolar datos en funciones exponenciales. El uso clsico de la media armnica es el clculo de la velocidad promedio de un mvil que recorre una distancia a diferentes velocidades.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] CUADRO 4.3: Propiedades de la media aritmtica.

4-31

Sean n observaciones de una variable clnica cualquiera ( x1 , x2 , x3 , ... , xn ), cuya media aritmtica es: x , entonces : 1. Si a cada valor medido se le suma (o resta) una constante a , la nueva media aritmtica es igual a la anterior, ms (o menos) dicha constante. Esto se demuestra as:
n

Si z i = x i + a , entonces z = z i / n = (x i + a ) / n = (x i / n) + n . a / n
i=1

O sea z = x + a Por comodidad, se le han sacado los subndices a las sumatorias y as ser de ahora en ms. 2. Si a cada valor medido se le multiplica (o divide) por una constante a , la nueva media aritmtica es igual a la anterior, multiplicada (o dividida) por dicha constante. Esto se demuestra : Si z i = x i . a ; entonces z = z i / n = (x i . a ) / n = a . (x i /n) = a . x 3. La sumatoria de todos los desvos es nula. Esto se demuestra as : Por desvo, se entiende a la diferencia entre cada valor medido y su promedio, es decir, para el dato nmero i su desvo es d i = x i - x di = (xi -x) = xi - x = n.x - n.x = 0

4. La sumatoria de los cuadrados de los desvos es un mnimo. Ms conocida como el principio de los mnimos cuadrados. Esto se demuestra as : Sea un valor cualquiera a , para saber que valor de a hace mnima la sumatoria, se saca la primer derivada y se iguala a cero: ( d 2i ) = [ ( x i - a ) 2 ] = [ 2 ( x i - a ) (- 1) ] = - 2 ( x i - a ) = 0 a a El nico valor que cumple con la propiedad anterior, es el promedio. O sea, ( x slo s a = x , de acuerdo a la propiedad 3 vista ms arriba. Luego, 2 ( d2i ) = [ (-2) ( x i - a ) ] = (-2) ( - a ) = 2 . n . a a2 a Como (2 . n . a) es una expresin siempre positiva, cuando a = x hay un mnimo.
i

-a) =0

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-32

4.12.2 Mediana
La mediana de un grupo de datos se define como el valor que es superior al 50% de los mismos, e inferior del 50% restante. Si se ordenan los datos en forma creciente, la mediana debe quedar en el medio. Por ejemplo, la mediana del grupo ( 1 , 4 , 5 , 6 , 8 ) es el valor 5, pues deja dos valores por encima y dos por debajo. Cuando la cantidad total de datos es par, se toma como mediana a la semisuma de los dos valores centrales. Si se tiene ( 1 , 2 , 4, 8 , 9 , 10), la mediana es el valor 6, que deja igual cantidad de valores a ambos lados y est en el centro de 4 y 8. Cuando los datos vienen agrupados en clases, se usa la frmula de los percentiles para encontrar ms fcilmente el valor de la mediana. CUADRO 4.4 : Clculo de la mediana.
Caso 1: Datos individuales. (Usando los datos para los no infartados del Cuadro 3.1). El valor de la mediana es 19, porque deja la misma cantidad de datos a ambos lados. En este caso, donde hay una cantidad par (200), hay que calcular el promedio entre los dos valores centrales, y como ambos son 19, entonces la mediana adopta dicho valor. Caso 2 : Datos agrupados en clases (usando los mismos datos, pero tomados del Cuadro 3.3). La mediana cae dentro de la primer clase, donde los lmites reales de clase son 0,5 20,5. En este caso hay que aplicar la frmula de la mediana para datos agrupados, que se ver en el punto siguiente: los fractiles donde el percentil 50 deja el 50% de los datos por encima. O sea, dicho percentil es lo mismo que la mediana. Caso 3 : Hacer una estimacin de cunto ganan, en promedio, los empleados de una farmacia, con los siguientes datos: Gerente (1) $ 2000 Vendedores (5) $ 400 Repartidor (1) $ 350 Si se calcula el promedio directo es: 2000 + 5.(400) + 350 = $ 621,5 7

Se puede decir entonces que el sueldo promedio, o ingreso per cpita es de $ 621,5. Sin embargo, este valor no es muy representativo de la realidad, pues de los siete empleados slo uno de ellos supera dicho monto. En cambio, si se usa la mediana Md = $ 400; este valor se acerca mejor a la idea de ingreso per cpita. Esto muestra la conveniencia de usar la mediana, antes que la media aritmtica, para estimar los ingresos promedios en un mbito econmico.

La mediana se emplea en lugar de la media aritmtica cuando sta se ve influenciada por valores extremos. Cuando en el grupo de datos obtenidos existen unos pocos valores muy altos o muy bajos, o ambos a la vez. La debilidad de la media aritmtica, es esa sensibilidad a los valores extremos, que la corren mucho de la posicin centralista que debera tener. Por ejemplo, sea el grupo de datos ( 1, 2, 4, 5, 6, 6 , 7 , 7, 9, 9 , 10 , 174) , su valor medio es 20, mientras que su mediana es 6,5 , el cual da una mejor idea acerca del centro de los datos. El promedio est sesgado hacia arriba por el valor extremo de 174. Notar que si este se elimina, entonces la mediana pasa a ser 6 y el promedio pasa a ser tambin 6, algo ms coherente con la nocin de centro, o posicin central de los datos.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-33

4.12.3 Fractiles
Hay diferentes tipos de fractiles, pero en general son valores que dejan por debajo de l una cierta fraccin de los datos ordenados en forma creciente y el resto por encima. Cuando la fraccin es la mitad, se trata de la mediana. Los ms comunes son: - Quartiles : Las fracciones son cuartas partes del total. El primer quartil Q1 deja el 25% de los valores por debajo. El segundo quartil es igual a la mediana y el tercero Q3 deja el 75%. - Deciles : Las fracciones son dcimas partes del total. El primer decil D1 deja el 10% de los valores por debajo y el resto por encima. El quinto decil es la mediana. - Percentiles : Las fracciones son centsimas partes del total. As, el percentil catorce ( P14 ) deja el 14% de los valores por debajo. El percentil cincuenta es la mediana, o el quinto decil. El mtodo para calcular los percentiles es anlogo al de la mediana: primero se ordenan los datos en forma creciente, se calcula la fraccin buscada y se lo ubica entre ellos. Pero si los datos vienen agrupados en clases, la cosa se complica y hay que emplear la frmula siguiente: Fx = LRI i + ( a / fi ) [ N ( x / 100 ) - f ac i-1 ] Fx : Fractil x-avo a : ancho de clase N : total de datos donde

LRIi : lmite real inferior de la clase i donde se encuentra el fractil fi : frecuencia de la clase i f ac i-1 : frecuencia acumulada de la clase anterior a la del fractil

Cuadro 4.5: Obtencin de diversos fractiles (con datos de la Tabla 3.3). Caso 1 : Obtencin de la mediana ( segundo cuartil, quinto decil o cincuentavo percentil ) Lmites reales 0,5 - 20,5 .20,5 - 40,5 40,5 - 60,5 60,5 - 80,5 80,5 - 100,5 100,5- 120,5 fi 104 36 28 18 10 4 200 xi 10,5 30,5 50,5 70,5 90,5 110,5 f ac i 104 140 168 186 196 200 La mediana debe dejar 100 datos por debajo, como en la primer clase ya hay 104, significa que ah se halla el valor buscado. Por lo tanto es : F50 = 0,5 + (20 / 104 ) [ 200 ( 50/100) - 0 ] F50 = 19,73 UI/l = Q2 = D5 = P 50

Caso 2 : Obtencin del tercer cuartil Q3 . El 75% del total de valores es 150. Luego el valor buscado est en la tercer clase . Q3 = F75 = 40,5 + (20 /28) [ 200 ( 75/100) - 140 ] = 47,64 UI/l Caso 3 : Obtencin del percentil cinco y del noventa y cinco : P5 y P95. El 5% del total de valores es 10. Luego el valor buscado est en la primer clase.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-34

P5 = F5 = 0,5 + (20 /104) [ 200 ( 5 /100) - 0 ] = 2,42 UI/l El 95% del total de valores es 190. Luego el valor buscado est en la quinta clase. P95 = F95 = 80,5 + (20 /10) [ 200 ( 95/100) - 186 ] = 88,5 UI/l De esto ltimo, se puede concluir que el 90% de los pacientes sin infarto, pero con diagnstico presunto de infarto de miocardio, sac una CPK comprendida entre 2,42 y 98, 5 UI/l. Caso 4 : Calcular la mediana para el Caso 5 del Cuadro 4.2.1 y los percentiles 5 y 95. Mirando la columna de frecuencias acumuladas de este caso, se nota que la mediana cae en el segundo intervalo de clases. Siendo N = 47 ; Fac1 = 10 ; LRI2 = 8 ; F2 =17 y a = 2,99. Entonces, P50 = F50 = 8 + ( 2,99/17) [ (47/2) 10 ] = 10,4 minutos para atender a un cliente. Notar que en este caso, la mediana se parece al valor medio 10,8 minutos calculado ms arriba. Esto porque, al no haber valores extremos, como en el caso de los salarios del Caso 3 del Cuadro 4.4; los dos valores se pueden emplear indistintamente en los clculos economtricos. Anlogamente, el percentil 5 cae en el primer intervalo. P5 = F5 = 5 + (2,99 /10) [ (0,05 . 47 - 0 ] = 5,7 minutos Por su parte, el percentil 95 cae en el anteltimo intervalo, muy cerca del LRS4. P95 = F95 = 14 + (2,99 /6) [ 0,95 . 47 - 39 ] = 16,8 minutos Esto significa, que en el 90% de los casos, se tardar entre 5,7 y 16,9 minutos en atender a un cliente. Este dato, es de mayor utilidad para el farmacutico que el tiempo promedio de atencin (10,8). Le permitir calcular mejor el nmero de vendedores que necesita a medida que vaya variando el nmero de clientes que entra a su farmacia, para mantener el mismo ritmo de atencin.

4.12.4 Moda
Es el valor de la variable de mayor frecuencia. El ms salidor, el que se repite ms veces en el grupo de datos. Se lo usa en lugar de la media o mediana, cuando se desea sealar el valor ms tpico o comn del total de observaciones efectuadas. En trminos matemticos es un mximo relativo. Es ms ambiguo que la mediana, muy inestable y no permite tratamientos algebraicos sencillos. La moda no queda influenciada por valores extremos como la media y es el ms sencillo de comprender. A su anttesis, se lo llama antimoda, o sea el valor menos frecuente. Cuando la distribucin de datos presenta ms de un mximo relativo, se la llama bimodal por ese motivo. Para los datos del Cuadro 4.4 anterior, la moda pertenece a la primer clase que tiene el valor mximo de frecuencia: 104; para definirlo se toma el centro de la clase, o sea, la marca de clase que en este caso es: x1 = 10,5 UI/l = Moda

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-35

4.13 Estadgrafos de dispersin

Se denominan as a los estadgrafos que cuantifican la separacin de los datos entre s, respecto de un punto de referencia central, como la media aritmtica. Es una medida de la dispersin de los valores obtenidos al medir una variable clnica. Cuanto menor es la dispersin, tanto mayor ser la precisin del sistema de medicin. Por eso se usan a estos estadgrafos como ndices de la calidad de las tcnicas clnicas. Si los estadgrafos de posicin vistos en la seccin 4.3 se relacionan con el concepto de exactitud, los de dispersin se relacionan con la precisin de las tcnicas de laboratorio. Aquellos con el error sistemtico, estos con los errores casuales. Hay varias formas de cuantificar esta dispersin. La ms simple de todas es el rango, definido como la diferencia entre el valor mximo y mnimo del grupo de datos. De fcil clculo y comprensin, tiene la desventaja de ser la medida ms grosera de la dispersin. Dos grupos de datos, con muy distinta dispersin pueden llegar a tener rangos similares. Uno de ellos puede tener el 99% de los valores junto al mnimo y el otro el 99% junto al mximo, pero al tener extremos iguales, sus rangos resultaran iguales a pesar de ser tan dismiles intrnsecamente. Una medida un poco ms refinada estara dada por los desvos, o sea la diferencia entre cada valor y el promedio. La sumatoria de todos estos desvos sera una medida de la dispersin, pero resulta ser nula porque las desviaciones se compensan, tal como se vio en las propiedades de la media. Ahora bien, si se toman en valor absoluto el problema de los signos se resuelve, pero an as no es suficiente. Tal sumatoria tendra el defecto de ser mayor, cuantos ms datos se tomen en cuenta, utilizando el mismo sistema de medicin en condiciones similares. Por tal motivo, se define al desvo medio absoluto como la sumatoria del valor absoluto de todos los desvos, dividida el nmero total de mediciones. Este ndice es mucho mejor que el rango, pero tiene un defecto: es muy difcil de manejar algebraicamente. Otra forma de eliminar el signo de las desviaciones es elevndolas al cuadrado. O sea, la sumatoria de los cuadrados de los desvos, que es un mnimo, ponderada con el nmero total de mediciones. Esta es la idea de la varianza de un grupo de datos. Como las unidades de semejante ndice quedaran al cuadrado, conviene tomar la raz cuadrada para poder compararla con la media y otras medidas anlogas. Esta es la idea del desvo estndar o desviacin tpica. Tambin es la frmula planteada por Gauss en su teora de errores casuales. Como se ver ms adelante, la curva de Gauss tiene dos puntos de inflexin simtricos ubicados a una distancia del centro igual al desvo estndar. Una medida de posicin y otra de dispersin, son suficientes para dar una idea de la forma en que se agrupan los datos. En particular, si se supone que los datos fueron tomados de una poblacin normal o gaussiana, entonces la media y el desvo estndar son los valores necesarios y suficientes para definir la curva de Gauss involucrada en forma unvoca. Por regla general, los investigadores saben que mediciones repetidas de la misma magnitud, en condiciones anlogas, tienen una distribucin gaussiana. Separando a los pacientes por sexo y edad, las distribuciones de las magnitudes clnicas continuas en dichos segmentos suele ser gaussiana. Si bien algunos autores disienten en algunos aspectos, es indudable que separando a los pacientes sanos, agrupados por misma edad y sexo, con un nmero muy grande de casos, las distribuciones obtenidas se parecen mucho a la normal. Esto se discutir ms adelante con ms detencin.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-36

4.13.1 Desvo estndar y Varianza

Se definen a estos estadgrafos con las frmulas siguientes, Varianza poblacional : Varianza muestral : Donde : x es la media de la muestra es la media de la poblacin x i es la i-sima medicin o valor n es el tamao de la muestra N es el tamao de la poblacin di desvo de un valor respecto de su media 2 = ( d 2i ) / N = ( x i - ) 2 / N DS 2 = ( d 2i ) / ( n - 1 ) = ( x i - x ) 2 / ( n - 1)

A su vez, el desvo estndar poblacional ( ) y el muestral ( DS ) se obtienen con la raz cuadrada de las respectivas varianzas. Para poder conocer o calcular tanto la media como la varianza poblacionales, se necesita conocer la poblacin completa. Esto es imposible en el caso de mediciones repetidas porque estas son infinitas desde el punto de vista terico. Anlogamente, la cantidad total de muestras que se le puede extraer a un paciente, para hacerle una determinacin en el laboratorio, es tan grande que puede ser considerada infinita. Por lo tanto, para todos los efectos prcticos se consideran a las mediciones de magnitudes clnicas continuas, como provenientes de una poblacin de tamao infinito. Es decir, que nunca se podrn conocer con certeza sus parmetros poblacionales y . Necesariamente, habr que estimarlos a partir de sus respectivas medidas muestrales obtenidas con x y DS. Cuando los datos vienen agrupados en clases se emplea la frmula: DS 2 = ( xj - x ) 2 f j / ( n - 1) Donde f j es la frecuencia de la clase j xj su respectiva marca de clase Debe considerarse al desvo estndar como un estadgrafo y a la varianza como a otro. Aqu se desarrollan en conjunto para simplificar el texto, aprovechando la gran similitud de sus frmulas. Pero, mientras el primero se puede comparar directamente con cualquiera de los valores medidos o de sus estadgrafos de posicin, la varianza no. As, la media y el desvo se emplearan para construir intervalos donde se espera encontrar adentro al verdadero valor de la poblacin, llamado a veces parmetro. Eso se estudiar en la estadstica inferencial. En cambio el anlisis de la varianza, llamado ANOVA, es uno de los captulos ms importantes de la Estadstica aplicada a experimentos. Se usa fundamentalmente para testear supuestos que se hacen acerca de poblaciones, como detectar si un medicamento sirve, o si un fertilizante es til a la tierra, o si un alimento balanceado es mejor que otros y muchos usos ms. La frmula del desvo estndar muestral dada ms arriba, debe ser corregida por un factor presentado por Gurland y Tripathi. Si bien DS2 es un estimador insesgado de 2 , no ocurre lo mismo con su raz cuadrada DS que en forma consistente subestima a . El factor de correccin presentado por estos dos autores corrige ese defecto. Cuando n > 30 se calcula con la relacin Gn 1 + 1 / [ 4(n-1) ]. Para los dems valores ver en Cuadro 4.6.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-37

CUADRO 4.6: Clculo de desvo estndar y varianza.

Caso 1: Datos individuales. (usando los datos para los no infartados del Cuadro 3.1). DS2 = ( x i - x ) 2 / (n-1) = (10 - 30,3 )2 + (33 - 30,3)2 +...+ (90 - 30,3)2 = 771 (UI/l)2

200 - 1 DS = 27,77 UI/l

Caso 2 : Datos agrupados en clases (usando los mismos datos, pero tomados del Cuadro 3.3) CPK 1 - 20 21 - 40 41 - 60 61 - 80 81 - 100 101- 120 fj 104 36 28 18 10 4 200

xj
10,5 30,5 50,5 70,5 90,5 110,5

( xj - x ) 2
392,04 0,04 408,04 1616,04 3624,04 6432,04

2 f j .( xj - x )

40772,16 1,44 11425,12 29088,72 36240,40 25728,16 143256,00

DS2 = 143256 / 199 DS2 = 719,88 (UI/l)2 DS = 26,83 UI/l

El valor exacto del desvo y de la varianza est dado por el primer caso, donde se tienen identificados los datos uno por uno. A partir de su agrupacin en clases, los valores aproximados resultan ser un 3,5% menores, pues al perder informacin se pierde exactitud en el clculo. Caso 3 : Datos y sus frecuencias ( valores tomados de un conteo celular - Student, 1907 ). N de clulas x cuadrcula Frecuencias Observadas 0 213 1 128 2 37 3 18 4 3 5 1

DS2 = {213.(0-0,68) 2 + 128.(1-0,68) 2 + 37.(2-0,68) 2 + 18.(3-0,68) 2 + 3.(4-0,68) 2 + (5-0,68) 2}/399 DS2 = 324,68/399 = 0,8137 y el desvo estndar resulta DS = 0,902 En este caso las marcas de clase coinciden con la cantidad de clulas por cuadrcula de la cmara que tiene en total 400. Caso 4 : Factor de correccin de Gurland y Tripathi (1971). Este factor puede ser importante cuando el tamao muestral es pequeo ( n < 30 ). Gn = [ ( n-1/2) 1/2 (n-1/2) ] / (n/2) Y para n > 30 se reduce a : Gn 1 + 1 / 4 (n-1) Para el caso de Student, una mejor estimacin de es el valor DScorregido. DScorregido = Gn . DS = [ 1 + 1 / 4.(400-1) ] . 0,902 = 0,9026

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-38

CUADRO 4.7: Propiedades de la varianza: Sean n observaciones de una variable clnica cualquiera ( x1 , x2 , x3 , ... , xn ), cuya media aritmtica es: x y su desvo estndar DS, entonces: 1. Si a cada valor medido se le suma (o resta) una constante a , la nueva varianza no se altera. Si z i = x i + a DS2z = ( z i - z )2 / (n -1) = [(xi + a) - (x + a)] 2 / (n-1) O sea, DS2z = DS2x

Esto significa que la presencia de un error sistemtico en el sistema de medicin no altera la varianza, es decir, el error casual no se afecta. 2. Si a cada valor medido se le multiplica (o divide) por una constante a , la nueva varianza es igual a la anterior, multiplicada (o dividida) por el cuadrado de dicha constante. Si z i = x i . a DS2z = ( z i - z )2 / (n -1) = [(x i .a) - (x.a)] 2 / (n-1) O sea, DS2z = a 2 . DS2x

3. La varianza de la suma ( o resta ) de dos variables se obtiene con : Sea la variable z = x + y DS2z = ( nx - 1 ) DS2x + ( ny - 1 ) DS2y ( nx + ny - 2 ) x y

Las propiedades ms importantes de la varianza se dan en el Cuadro 4.7, recordando que al ser mnima la suma del cuadrado de los desvos, como se vio para la media, entonces la varianza respecto de la media aritmtica, ser un mnimo. Es decir, la medida de la dispersin de los valores alrededor de la media usando la varianza, ser menor que si se toma respecto de otra medida de posicin cualquiera.

4.13.2 Coeficiente de Variacin

Es una relacin entre la media y el desvo estndar de una poblacin, o de una muestra extrada de ella. Da una idea del error relativo que se comete en el sistema de medicin. No es un estadgrafo de dispersin en un sentido absoluto, sino una relacin entre dos de ellos: el de dispersin respecto al de posicin. Una especie de coeficiente, que mide la dispersin en trminos de la media. El CV no da una buena idea de la bondad o calidad de dos series de mediciones entre s, sino una primera aproximacin. Sin embargo, en la bibliografa clnica es comn encontrarlo usado como ndice para decidir entre dos mtodos. Al respecto, se debe remarcar que si bien es condicin necesaria, no es suficiente para optar entre tcnicas clnicas; la forma correcta de hacerlo se ver ms adelante en la seccin dedicada a ello.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] Coeficiente de variacin poblacional Coeficiente de variacin muestral / _ CV = DS / x =

4-39

Se suele expresar en forma porcentual ( CV % ). Mientras en la Fsica, un sistema de medicin con coeficientes superiores al 10% es inaceptable, en Clnica, donde las variabilidades inherentes al material de trabajo son mucho ms grandes, no se puede ser tan estricto. Por eso se sugiere usar : 10% < CV% < 50% 1% < CV% < 10% CV% < 1% CUADRO 4.8: Clculo del CV%.
Caso 1: Datos individuales. (usando los datos para los no infartados del Cuadro 3.1). Del Cuadro 4.6 anterior es DS2 = 771 (UI/l)2 y el DS = 27,77 UI/l con una media x = 30,3 UI/l. Por lo tanto, se puede obtener el CV% con la relacin: CV% = (27,77 / 30,3). 100 = 91,65 % Caso 2 : Datos y sus frecuencias ( valores tomados de un conteo celular - Student, 1907 ). DS = 0,902 y x = 0,68 Entonces: CV% = (0,902/0,68)100 = 132,6% Caso 3 : El precio de 2 acciones comunes de un Laboratorio en la Bolsa de valores tuvo un promedio, durante un mes, de $ 1500 para las del tipo A y de $ 5000 para las B. Sus respectivos desvos estndar fueron de $ 500 y $ 300 respectivamente. Comparando en valores absolutos, la variabilidad de las acciones tipo A fue mayor que las del B por tener mayor desvo estndar. Pero, con respecto al nivel de precios, hay que comparar ambos CV. Resulta, CVA = 500/1500=0,033 y CVB = 300/5000= 0,06. Se deduce que el precio de la accin del tipo B fue casi dos veces ms variable que las del tipo A.

poco aceptables aceptable muy aceptable

Sea el caso de un experimentador que mide tres longitudes diferentes, usando la misma regla milimetrada: A = 2 mm, B = 2 cm y C = 20 cm. Suponiendo que hace varias mediciones, siguiendo el mismo mtodo en condiciones anlogas; es de esperar que los valores promedios se acerquen a los valores reales y que el desvo estndar se mantenga constante en los tres casos, con un valor no mayor de 1 mm. Entonces: Caso A Caso B Caso C CV = 1 mm / 2 mm = 0,5 es decir un CV% = 50% (inaceptable) CV = 1 mm / 20 mm = 0,05 es decir un CV% = 5 % (aceptable) CV = 1 mm / 200 mm = 0,005 es decir un CV% = 0,5% ( muy aceptable)

Anlogamente en anlisis clnicos, si la misma tcnica se usa para medir concentraciones muy diferentes, puede ocurrir que el CV% vare demasiado y ya no sea confiable como ndice para la calidad de la tcnica.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-40

4.14 Problemas propuestos

1) Decidir sin son Verdaderas o Falsas las siguientes afirmaciones:
1) 2) 3) 4) 5) 6) 7) 8) 9) 10) 11) 12) 13) 14) 15) 16) 17) 18) 19) 20) 21) 22) 23) 24) 25) 26) 27) 28) 29) 30) 31) 32) 33) 34) 35) 36) 37) 38) 39) 40) 41) 42) 43) 44) 45) 46) Todos los ndices diagnsticos se pueden deducir con sensibilidad y especificidad. Los ndices clnicos forman parte de los estadgrafos de dispersin. Lo ideal para diagnosticar es tener mucha exactitud y precisin. Sensibilidad y especificidad varan con el punto de corte y con la prevalencia. La eficiencia vara con la prevalencia, lo mismo que el ndice de Youden Si aumenta la sensibilidad con los puntos de corte, tambin lo hace la especificidad. Punto de corte significa lo mismo que valor referente. Los pacientes Sanos y con resultado (+) son los verdaderos positivos. Las caractersticas: Sano, enfermo, (+) y (-) son una particin del conjunto pacientes. Donde se cortan las curvas de especificidad y sensibilidad, el Youden es mximo. dem anterior para la eficiencia. La eficiencia de una prueba clnica es el cociente entre sus aciertos y el total de casos. Si el VP de positivos aumenta, el VPN disminuye con los puntos de corte. El concepto de calidad puede ser interpretado como una dualidad Las enfermedades del Tipo I requieren el menor nmero posible de fn Las enfermedades del Tipo II requieren el menor nmero posible de fp Las enfermedades del Tipo III son las que se curan si se detectan a tiempo. A veces, la clasificacin de una enfermedad depende del grado de avance de la misma Clasificar las enfermedades en tres tipos y explicar en que consiste cada tipo ............... Los Likelihood Ratios varan con la prevalencia de la poblacin. Para una enfermedad del tipo I hay que maximizar la sensibilidad Para una del tipo II la especificidad y del tipo III el Youden Clasificar los ndices clnicos y explicar cuales varan con la prevalencia y cuales no..... Incidencia y prevalencia son lo mismo. Los ndices de riesgo y dao son los mismo. El Odds Ratio es el cociente entre dos tipos de Odds, el de expuestos y no expuestos. Hay una relacin matemtica entre los Odds y l riesgo, y viceversa. El RR es la proporcin de riesgo original presente en pacientes no expuestos. Los riesgos absolutos son la proporcin de enfermos expuestos y de no expuestos. El riesgo bsico es la proporcin de enfermos en los expuestos. El CER es la proporcin de enfermos no expuestos. El EER es la proporcin de enfermos expuestos. El RR se calcula dividiendo EER por CER. La reduccin del riego absoluto (ARR) es la diferencia entre CER y EER (sin el signo). La reduccin del riesgo relativo (RRR) es la diferencia entre 1 y RR (sin el signo). El RRR tambin se puede calcular como el cociente entre ARR y CER. Explicar el concepto de fidelidad o reproducibilidad......................................................... Explicar los conceptos de nivel de concordancia y Odds de discordancia ........................ La concordancia se usa para ver si se puede reemplazar un mtodo por otro. El anlisis de concordancia se hace para saber cual mtodo clnico es el mejor. Se puede analiza la concordancia de dos factores, y cada uno con muchos subgrupos. El error de apreciacin de una regla milimetrada es de 0,5 mm. El error casual no puede ser corregido por el investigador. Clasificar los ndices clnicos y a los estadgrafos en general ................................ Los estadgrafos de tendencia central son: ........................................................................ La suma de los desvos es nula. V F V F V F V F V F V F V F V F V F V F V F V F V F V F V F V F V F V F .. V F V F V F .............. V F V F V F V F V F V F V F V F V F V F V F V F V F .. ... V F V F V F V F V F .. ... V F

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

47) 48) 49) 50) 51) 52) 53) 54) 55) 56) 57) 58) 59) 60) La mediana es ms inmune a valores extremos que la media aritmtica. La suma de los cuadrados de los desvos respecto a la media es un mximo. La media ponderada se usa en Fsica para calcular el centro de masa. Si a un grupo de datos se le suma una constante la varianza no cambia, pero la media s El segundo cuartil, es lo mismo que el 50vo percentil y que la mediana. La moda es el valor de la variable que tiene mayor frecuencia. Si se multiplica a un grupo de datos por una constante, la varianza no se altera. Explicar las propiedades de la media aritmtica............................................................... Explicar las propiedades de la varianza............................................................................ El valor de la mediana coincide con uno de los datos cuando el nmero total es impar. El coeficiente de variacin puede medir la calidad de un test clnico. El coeficiente de variacin muestral es lo mismo que el poblacional. El rango es un ndice muy pobre en comparacin a la varianza. Explicar el concepto de fractiles ......................................................................................

4-41

V F V F V F V F V F V F V F .. ... V F V F V F V F ...............

2) Para los siguientes datos calcular: (+) (-) Sano 50 100 Enfermo 120 30

Sensibilidad = Eficiencia = ndice de Youden = VPP =

Especificidad = VPN = Likelihood ratio (+) = Likelihood ratio (-) =

En cual tipo de enfermedad conviene usar este mtodo clnico ? 3) Para los siguientes datos calcular: Protegido No-protegido Sano 46 36 Enfermo 18 29 4) Para los siguientes datos calcular: (+) (-) (+) 400 30 (-) 10 200

OR = RR = ARR =

CER = ERR = RRR =

Nivel de concordancia = Odds de discordancia =

5) Para los datos siguientes, encontrar el coeficiente de variacin la media, mediana y el desvo: Frecuencia 10 Valor 2 20 4 30 15 8 6 8 10

6) Los salarios semanales de los operarios de una industria medicinal son: Salario ($) 50-59,9 60-69,9 70-79,9 80-89,9 90-99,9 100-109,9 110-119,9 N operarios 8 10 16 14 10 5 2 Hallar: a) Los lmites reales de cada clase y sus frecuencias acumuladas (ancho = $10). b) La marca de cada clase. c) La media, mediana y moda. d) El desvo estndar, la varianza y el Coeficiente de variacin. e) El percentil 5 y el 95.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

4-42

f) Representar con un histograma y un polgono de frecuencias acumuladas, para calcular en forma grfica, todos los valores anteriormente pedidos. 7) Se lanza una moneda al aire 1000 series, de 5 veces cada una, para medir el nmero de caras. Los resultados obtenidos se muestran en la tabla siguiente: Nmero de caras (X) 0 1 2 3 4 5 Nmero de series (frecuencia) 38 144 342 287 164 25 Se pide: a) Graficar los datos con un diagrama de bastones y con un histograma. b) Calcular los ndices de tendencia central. c) Calcular los ndices de dispersin. d) Dibujar el polgono de frecuencias acumuladas porcentual. 8) Para hacer un test de Sfilis se emplea la tcnica 1 en 400 pacientes y se encuentran 220 pacientes que dieron un resultado (+). Los aciertos en (+) fueron 180 y 160 en (-). Con estos datos calcular la Sensibilidad y Especificidad de esta tcnica. A las mismas pacientes se les aplic la tcnica 2 y resultaron 240 pacientes con (+), mientras el nmero de aciertos en (+) fue de 190 y en (-) 150. Decidir de manera cualitativa cual de ambas tcnica es la mejor para adoptar en nuestro Laboratorio y explicar el porque. 9) Se midieron 50 alcuotas de un suero con el Kit de Glucosa marca A, y otros 50 con la marca B. Los resultados encontrados fueron: Marca A : Entre (80-80,9) 8 veces, (81-81,9) 22 veces, (82-82,9) 15 veces y el resto (83-83,9) Marca B : Entre (80-80,9) 6 veces, (81-81,9) 30 veces, (82-82,9) 10 veces y el resto (83-83,9) Decidir en forma cualitativa, si hay diferencia en la exactitud y en la precisin entre las marcas. Si adems se sabe que el suero utilizado tena una concentracin de 83 hallar en forma cualitativa el error sistemtico de cada marca. Estudiar la precisin si en la bibliografa se dice aceptable la dispersin de la glucosa cuando llega hasta un 8%. 10) Se sabe que la concentracin de coloides en el agua de un ro es del 5,4 /ml. Se tom una muestra del mismo a la que se le agreg un reactivo. Luego de un rato, se extrajo una pequea cantidad para analizarla en una cmara de recuento. Los resultados fueron: N de coloides: 2 Frecuencia: 10 3 20 4 170 5 100 6 90 7 (N /ml) 10

Decidir en forma cualitativa si hubo algn cambio significativo en la concentracin del agua, por la accin del reactivo (Sulfato de Aluminio). 11) Los clientes de una farmacia gastaron en remedios y son otros artculos los datos que se muestran en el cuadro siguiente expresados en $: Remedios: Entre (10-14,9) 5 veces, (15-15,9) 25 veces, (20-25,9) 10 veces. Otros: Entre (10-14,9) 3 veces, (15-15,9) 20 veces, (20-25,9) 12 veces, (26-30) 5 veces. Decidir en forma cualitativa si hay diferencia entre los promedios de ventas. Determinar el desvo estndar de cada grupo y su moda.

5
Probabilidad
En este captulo se introduce el concepto de la probabilidad, necesaria para la compresin de temas a desarrollar en captulos posteriores. Se comienza con el enfoque probabilstico clsico, se sigue con desarrollos algebraicos, para llegar a los teoremas bsicos, vinculantes de los ndices clnicos entre s. La mayora de los conceptos cientficos tienen un significado exacto como las cantidades fsicas; en cambio, la probabilidad es a menudo asociada con un concepto vago de casualidad, incertidumbre o azar. Muchas veces esta ignorancia oculta la verdadera naturaleza matemtica de la teora de las probabilidades, como una disciplina cientfica ms. Una ciencia exacta con conclusiones obtenidas por la lgica, partiendo de axiomas y principios bsicos y con muchas ramificaciones de uso extendido en la prctica. Sin embargo debe dejarse muy en claro que la incertidumbre, es una palabra usada para disimular la ignorancia que se tiene acerca de las mltiples causas que pueden ocasionar un efecto. Y que el azar, o la probabilidad es una forma de cuantificar dicha incertidumbre.

5.1 Introduccin
J. J. Bernoulli fue el primero en estudiar este tema en forma sistemtica con un enfoque cientfico. Observando los resultados del lanzamiento de una moneda un nmero grande de veces, not que el nmero de caras y secas tenda a igualarse. Es decir, que la frecuencia relativa de la obtencin de caras se acercaba ms al nmero de secas, cuanto mayor era el nmero de lanzamientos. O bien, ambas frecuencias relativas se parecan cada vez ms a 0,5. Otro tanto le ocurra en el lanzamiento de dados: la frecuencia relativa de un as tenda a 1/6. Repiti una y otra vez este tipo de experimentos con monedas, dados y cartas, y siempre llegaba a la misma conclusin. Imagin haber encontrado un fenmeno ms general y as dio comienzo la teora de probabilidades. Sus resultados tericos se corresponden razonablemente con la realidad. Sin embargo, debe marcarse siempre una clara distincin entre los resultados empricos y los tericos. El uso comenz en la teora de juegos de azar, en los albores del siglo XVII, y gracias a estos se hizo popular entre los gemetras de aquel entonces. Hoy se la emplea en el campo de los seguros, control de calidad, gentica, investigacin operativa, mecnica estadstica y muchos ms. Probabilidad terica: La probabilidad de ocurrencia de un suceso A se define como el cociente entre el nmero esperado de veces que ocurra un suceso NA y el nmero total de casos posibles N P(A) = NA / N

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-2

Esta definicin primaria de probabilidad se calcula en forma terica. Por ejemplo, una moneda tiene dos caras ( N = 2) y una sola de ellas es cara (N cara = 1), o sea que la probabilidad de sacar una cara en un lanzamiento, tericamente es P (sacar cara) = 1/2. Por otra parte, se puede calcular la probabilidad a partir de experimentos, como por ejemplo tirar la moneda para ver si en efecto hay una proporcin 0,5 de obtener cara. Esta nocin se define como: Probabilidad emprica: La probabilidad emprica de ocurrencia de un suceso A es igual a su frecuencia relativa (FrA). O sea, el cociente entre el nmero de veces en que ocurri el suceso A (FA ) y el nmero total de experimentos (Ft). FrA = FA / Ft

La relacin entre ambas, fue descripta por Bernoulli en su Ley emprica del azar de su famoso libro Ars Conjectandi publicado en 1713 donde se dice: Si la probabilidad de un suceso es p y se realiza un nmero muy grande N de pruebas, el cociente entre el nmero de casos favorables obtenidos y el nmero total de pruebas llega a diferir de p en tan poco como se quiera, con tal de tomar a N lo suficientemente grande. Esto es: FrA p (si N es grande)

Sin embargo, fue Laplace en su Teora Analtica de Probabilidades (1812) quien le dio una forma ms rigurosa definiendo la diferencia en valor absoluto entre ambas probabilidades como menor o igual a un cierto valor positivo , haciendo a este tan pequeo como se quiera. o sea: FrA - P ( A ) FrA P(A)

Naturalmente, como un experimento real nunca puede llegar a tener lugar infinitas veces, no se usa la definicin clsica de lmites sino una aproximacin del tipo FrA

P(A)

(si N es lo suficientemente grande)

Laplace introdujo dos conceptos nuevos en la definicin de la probabilidad terica: Principio de equiprobabilidad: todos los casos deben tener igual probabilidad de ocurrencia. Principio de razn suficiente: mientras nada haga sospechar lo contrario, se debe suponer que todos los casos son igualmente probables. Agregando estos dos principios se completa la definicin clsica de probabilidad. En los casos de un dado cargado, una moneda mal balanceada, y otros anlogos, no se puede aplicar la definicin porque los casos ya no tienen la misma probabilidad. Hay otros casos: por ejemplo, suponiendo un dado tal que tiene dos ases pintados en sus caras pues le falta el nmero 4, all habra cinco casos posibles en lugar de seis. Pero si el dado est bien construido la definicin se sigue cum-

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-3

pliendo, pues en tal dado todava hay seis caras con igual probabilidad de ocurrencia y la probabilidad de sacar un as sera 2/6 (2 caras que tienen un as, sobre 6 caras posibles). Mientras que la de sacar 4 sera nula y las dems de 1/6. CUADRO 5.1 Ejemplos de aplicacin 1) De la poblacin de pacientes de un laboratorio se eligieron N = 1000 personas al azar, y se encontrn que 38 de ellas padecan de hipoglucemia. Calcular la probabilidad de que si se escoge un paciente al azar este padezca la enfermedad. Frecuencia emprica = TE / N = 0,038 probabilidad terica = prevalencia

2) Al realizar una comprobacin de los valores predichos por la CPK, se encontr que 64 de ellos fueron mal clasificados como positivos y 36 como falsos negativos, del total de 400 historias clnicas analizadas. Calcular la probabilidad de acertar en el pronstico. Frecuencia emprica de aciertos = (vp + vn)/ N = (400 64 36)/ 400 = 0,75 eficiencia

3) En un curso de Bioestadstica hay 30 alumnos, 10 de la carrera de Bioqumica, 15 de Farmacia y 5 de Enfermera. El 70% del total son mujeres y el resto varones. Se escoge uno al azar; hallar la probabilidad de que sea de la carrera de: a) Bioqumica P(B) = 10 / 30 = 1 / 3 = 0,333 b) Farmacia P(F) = 15 / 30 = 1 / 2 = 0,5 c) Enfermera P(E) = 5 / 30 = 1 / 6 = 0,167 d) Cul ser la cantidad de mujeres M? P (Mujer) = 0,7 = M / N = M / 30 Por lo tanto M = 0,7. 30 = 21 mujeres

2) En una farmacia ingresan en promedio 60 clientes por da y hacen compras por $ 420. Si se sabe que el 30% se van sin comprar nada. Cunto vale el gasto per cpita promedio? La probabilidad de que un cliente compre es del 70%. O sea 0,7 = compradores / total. Luego el nmero de compradores diarios en promedio es: 42 clientes = 0,7 . 60, entonces si el ingreso diario es de $ 420, el gasto per cpita ser: $ 420/ 42 clientes = $10 por cliente. Aparecieron ms enfoques: Von Mises propuso la nocin de colectivo para evitar el defecto de la nocin clsica: cmo se puede estar seguro en la realidad que todos los casos son equiprobables? Muchos piensan que el principio de razn suficiente es una forma de cerrar los ojos, porque lo correcto sera hacer un experimento para asegurarse de la equiprobabilidad. Este autor propuso considerar una sucesin infinita de sucesos: S1, S2 ... dentro de los cuales se verifica cierto atributo A, tomando el cociente entre el nmero de veces que se da A y el total, se tiene un valor que tiende a P (A) dentro de un colectivo de sucesos. Esta propuesta no tuvo demasiado xito, comparada con la de Kolgomoroff (1933), que plante un acercamiento axiomtico a la nocin abstracta de probabilidad y el desarrollo de la teora como una disciplina matemtica basada en la teora de mediciones.

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-4

Hay otro tipo de probabilidades como la llamada probabilidad subjetiva o intuitiva que es una cierta evaluacin personal de la probabilidad, en lugar de ser terica o experimental. Por ejemplo, si se desea opinar acerca de la probabilidad de lluvia el da de maana, cada uno puede emitir una opinin, como 0,9 si hoy est nublado y no aparece el sol, o bien 0,1 si se est en el medio de una magnfica temporada estival. En Medicina, el uso de esta clase de probabilidades se hace cuando el clnico asigna un valor subjetivo de probabilidad a un paciente que est evaluando, la llamada probabilidad Pre-test, y mediante un clculo obtiene la probabilidad Post-test para evaluar si le conviene hacerle el test al paciente o no. Notar que la misma pregunta puede ser contestada de manera diferente por una misma persona, de acuerdo al momento en que se le haga. Adems, diferentes individuos darn diferentes valores subjetivos de probabilidad. Las encuestas de opinin calculan la frecuencia de las respuestas obtenidas, a preguntas subjetivas, para conformar tcnicas de mercadeo, propaganda, etc. Hasta ahora, se han planteado casos con N de tamao finito, pero si se trabaja con las probabilidades de encontrar un punto en una recta donde cualquier segmento de la misma tendr infinitos puntos posibles, las definiciones vistas ya no sirven. Si por ejemplo el suceso A (unos pocos centmetros) ocurre dentro de una recta de 3 metros, el cociente dado por la frmula clsica sera una razn irresoluble de infinitos. Por eso se desarroll el concepto de la probabilidad geomtrica, como la razn entre el espacio o tiempo, ocupado por los sucesos A, y el total. Como ser, si se sabe que el suceso dura 20 s, la probabilidad que ocurra en la hora siguiente se puede obtener con: 20 s / 3600 s = 1/180. En sntesis, la nocin de probabilidad tiene cuatro acepciones bsicas: 1) Clsica (terica con casos equiprobables) 2) Emprica (prctica con la frecuencia relativa) 3) Intuitiva (creencias o mediciones subjetivas) 4) Axiomtica (modelo matemtico)

5.2 Concepto de particin.

Para desarrollar un modelo matemtico conviene empezar con la teora de conjuntos, repasar los conceptos bsicos, y luego formular axiomas que permitan definir la nocin de probabilidad en forma ms precisa. Con los axiomas y ciertas reglas de comportamiento interno se puede definir un lgebra, dentro de un espacio de probabilidades (lgebra de Boole). A partir de all se deducen ciertas propiedades interesantes para poder demostrar teoremas como el de Bayes, de uso extendido en el campo del diagnstico clnico. En cambio, cuando los resultados posibles no son finitos se requerir de un lgebra especial (-lgebra), pero este caso escapa a los contenidos planeados para el presente trabajo. Las nociones bsicas de la teora de conjuntos fueron vistas en asignaturas anteriores dentro de las matemticas. Sin embargo, para quien desee repasar estos conceptos se le sugiere ver el Apndice 1 al final de este captulo. Anlogamente en el Apndice 2, para repasar la teora del clculo combinatorio que se necesita para la obtencin del nmero total de casos, o bien para calcular el nmero de casos favorables de ocurrencia del suceso A. Lo que interesa por ahora es recordar como se llega al concepto de particin, cuyo uso se vio en las Tablas 1.1 a 1.3

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link] Sean n conjuntos C1, C2, C3, ..., Cn pertenecientes al universo , se dice que: 1. La unin de todos ellos pertenece al universo y en el caso particular que resulten ser iguales, se los llama colectivamente exhaustivos.
n i=1

5-5

Por ejemplo, si cada marca comercial que se vende en una farmacia es un conjunto Ci, entonces el conjunto de todas las marcas existentes en la misma ser el conjunto universo, detallado en el listado completo del stock actualizado. 2. Son mutuamente excluyentes, cuando se excluyen entre s todos los pares posibles, o sea Ci Cj = i j El conjunto de medicamentos fabricado por los Laboratorios Roch: Ci, no tiene ningn elemento en comn con el conjunto de los fabricados por Bayer: Cj. Por lo que son excluyentes entre s. 3. Forman una particin del universo cuando estos conjuntos son a la vez: mutuamente excluyentes y colectivamente exhaustivos. Esto se puede denotar as: los Ci particionan a si se cumplen las dos condiciones siguientes: Ci Cj = i j
N i=1

Ci =

Particin de

Si se clasifica a la poblacin en: Sanos y Enfermos de una cierta dolencia, se tiene una particin de la misma, pues cada individuo de esta puede estar sano o enfermo nicamente y, adems, la unin de sanos y enfermos conforman todos los casos posibles. Lo mismo ocurre si se clasifica a la poblacin en Positivos y Negativos. As los cuatro casos posibles en la Tabla de la verdad conforman una particin del universo de pacientes. 4. Particionan al conjunto A cuando a la vez son mutuamente excluyentes y colectivamente exhaustivos, dentro de A. Esto es, los Ci particionan a A si se cumplen: Ci Cj A =
n y=1

Particin de A

Ci A

Si se toma el subconjunto: enfermos de gripe de la poblacin de Posadas. Este se puede particionar con la condicin de: Medicado No medicado, pues ambos casos son mutuamente excluyentes entre s y colectivamente exhaustivos para el conjunto de engripados. El conjunto de resultados positivos est particionado por los dos conjuntos: Sano y Enfermo, lo mismo que el conjunto de resultados negativos. Estos cuatro casos se visualizan mejor en el Grfico 5.1 siguiente:

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link] Grfico 5.1: Diagramas de Venn para el concepto de particin Colectivamente exhaustivos C1 C4 C2 C5 Cn C3 C2 C3 Cn Mutuamente excluyentes C1

5-6

Particin del universo C1 C3 C4 C5 C2

Particin de A C1 A C3 C5 C4 C2

5.3 Modelo Axiomtico

Para desarrollar un modelo axiomtico de probabilidad conviene definir primero una serie de conceptos, para poder usar un idioma comn. . Elemento: es uno de los resultados posibles de la prueba clnica o experimento. A veces se lo llama dato o resultado. Tiene el mismo significado que el visto en teora de conjuntos. . Suceso: es un conjunto de resultados obtenidos en una serie de pruebas. Se denomina tambin acontecimiento, evento o muestra (en el sentido estadstico del trmino). . Suceso imposible: cuando se sabe que no puede ocurrir, se lo denota con 0. . Suceso seguro: cuando se tiene la certeza que ocurrir, se lo denota con S. . Suceso elemental: est compuesto por un solo elemento, o sea, una muestra simple. . Tamao: el tamao de un suceso es la cantidad de sus elementos componentes. Equivale al concepto ya visto de tamao muestral. . Espacio Muestral: est formado por el conjunto de todos los resultados posibles del experimento. Se lo llama tambin: espacio de probabilidad. Se corresponde con el suceso seguro. La tarea fundamental a la que se dedica el bioqumico es efectuar anlisis de laboratorio para ayudar a efectuar un diagnstico correcto en los pacientes. Sea el caso de una enfermedad cualquiera, como ser el SIDA, empleando diversas tcnicas de laboratorio, junto con revisiones corporales del paciente, se puede llegar a uno de dos diagnsticos:

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link] A: luego de efectuarle todos los estudios se concluye que el paciente est infectado; B: luego de efectuarle todos los estudios se concluye que el paciente no est infectado.

5-7

Esos dos seran los resultados posibles o sucesos, no importa el camino seguido para realizar tal diagnstico. Habr un conjunto de anlisis diferentes, en la batera de anlisis, los resultados finales sern A o B. Es evidente que si se hace el estudio y se observa paso a paso el camino seguido, se podr determinar la serie de evidencias que condujeron al diagnstico final. O sea, se podr verificar uno de los dos sucesos. Ahora bien, es imposible que ocurran ambos sucesos a la vez, esto es A y B debe ser igual al suceso 0. Pero es seguro que ocurrir uno de ambos, entonces A o B coincide con S. Por su parte, el complemento de A es B y viceversa. Anlogamente, un cliente que entra a la farmacia puede hacer dos cosas: comprar algo (A) o no comprar (B). En resumen: Un conjunto de sucesos observables que presenta una estructura de lgebra de Boole para las leyes de composicin interna: conjuncin, interseccin y complemento, se la denomina lgebra de Sucesos. A su vez, un lgebra de Sucesos siempre puede ser representada por un lgebra de Conjuntos que es isomorfa a ella. En particular, tomando el conjunto de los nmeros reales , se puede definir una aplicacin del lgebra de Sucesos sobre tal conjunto, : como una probabilidad si cumple los tres axiomas siguientes: 1. La probabilidad de que ocurra un suceso A es siempre positiva o nula P (A) 0 2. La probabilidad de que ocurra el suceso seguro es una certeza y vale 1 P (S) = 1 3. Si dos sucesos son excluyentes, la probabilidad de su unin es igual a la suma de sus probabilidades individuales P ( A B ) = P (A) + P (B) A B = 0 Definicin: sea un conjunto de sucesos que definen un espacio muestral S; la probabilidad de ocurrencia de un suceso A perteneciente al mismo es un nmero adimensional que cumple con los tres axiomas anteriores. Debe destacarse que no se ha hecho mencin en la definicin de la probabilidad axiomtica a la manera en que se obtendr la cantidad P (A). Se puede usar una forma intuitiva de valorarla, o realizar un experimento para medir la emprica, o bien, hacer deducciones tericas para su clculo. Todas las maneras son igualmente vlidas para este enfoque algebraico. La mejor aproximacin a la realidad que se obtenga depender del modo de calcularla, y no del modelo matemtico usado. Mediante este modelo axiomtico o algebraico se pueden traducir a smbolos las relaciones entre acontecimientos para ver la aplicabilidad de los conceptos tericos en la vida real. La idea central es que todo modelo estadstico debe ceirse a la realidad lo ms posible y no

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-8

a la inversa. El peligro fue advertido por Einstein cuando afirm ... los cientficos suelen ver la realidad a travs de los anteojos que les pone la teora en la que creen.... Para analizar la consistencia entre probabilidad y frecuencia relativa se pueden ver: . Cuando se tenga la certeza que ocurrir un resultado al hacer una prueba, entonces en todos los casos se verificar la ocurrencia del suceso en cuestin. Por lo tanto, la frecuencia de casos favorables coincidir con la frecuencia total, y as la frecuencia relativa ser la unidad. FrA = FA / Ft = 1 P (A) = P (S)

. Cuando se tenga la certeza que nunca ocurrir un resultado al hacer una prueba, entonces el nmero de casos favorables ser nulo, y as anular la frecuencia relativa. FrA = FA / Ft = 0 P (A) = P (0)

De los dos puntos anteriores se deducen de inmediato los dos valores extremos de frecuencia relativa o probabilidad. 0 FrA P (A) 1 Cuando dos sucesos se excluyan mutuamente, la frecuencia relativa de ambos ocurriendo simultneamente ser nula (FAB = 0), y por lo tanto: FrA o B = (FA + FB +FAB) / Ft = ( FA / Ft ) + ( FB / Ft ) = FrA + FrB P ( A B ) Con los tres puntos anteriores se puede denotar la consistencia entre el modelo terico de la probabilidad axiomtica y las probabilidades empricas relacionadas. El smbolo fue usado en el sentido de la ley emprica de Bernoulli.

5.3.1 Propiedades derivadas

Al desarrollar los tres axiomas anteriores, deduciendo propiedades a partir de ellos, se va armando la teora de probabilidades. 1) Inclusin de sucesos entre s: si A B entonces P (A) P (B) Lo que se demuestra con B = A ( B A ) y como estos dos conjuntos no tienen elementos comunes, se les puede aplicar el axioma 3, as: P (B) = P (A) + P( B A ). Y como toda probabilidad es siempre positiva o nula, se deduce que la P (B) es siempre mayor, o a lo sumo igual que la P (A). Por ejemplo, el conjunto A (10 personas) de los internados por fracturas en un pabelln del hospital, es un subconjunto (B) de todos los internados que hay en el mismo (20 personas), y por lo tanto P (A) P (B). Si en el hospital hay 100 internados en total se pueden estimar: P (A) = 10/100 = 0,1 P (B) = 20/100 = 0.2 con lo que se muestra esta propiedad de inclusin que tienen los subconjuntos.

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link] 2) Unin de varios sucesos excluyentes:
n

5-9

P( Ci ) = P (C1) + P (C2) + P (C3) + ... + P (Cn) Ci Cj = 0 i j

i =1

Para demostrarlo basta hacer substituciones, se toman los n-1 conjuntos C2 ...Cn y a su unin se la llama B, as quedan dos conjuntos el C1 y el B a los que se le puede aplicar el axioma 3, resultando la suma de sus respectivas probabilidades. Luego a B se le descompone en C2 y el resto R, y se hace lo mismo. As queda la suma de las probabilidades de los dos primeros conjuntos ms la de la unin del resto. Procediendo anlogamente se llega a demostrar la propiedad anterior. Por ejemplo, sean los cuatro sucesos posibles al efectuar un diagnstico: VP: verdadero positivo FP: falso positivo VN: verdadero negativo FN: falso negativo

Como los sucesos son mutuamente excluyentes entre s, su unin equivale al universo, entonces: P( Ci ) = P (VP) + P (FP) + P (VN) + P (FN) = P (S) = 1 3) Sucesos complementarios: _ P(A) = 1 - P(A) _ Sean dos sucesos complementarios A y A, su unin es el universo y su interseccin es el conjunto vaco, o sea, son excluyentes entre s, por lo que se le puede aplicar los axiomas 1 y 3 _ _ P( A A ) = P ( S ) = 1 = P ( A ) + P( A ) De donde se deduce de inmediato la propiedad anterior. Por ejemplo, la probabilidad de estar sano ser igual a uno menos la prevalencia, y la probabilidad de resultar positivo ser igual a uno menos la probabilidad de resultar negativo. Por ejemplo, la prevalencia de una enfermedad en la poblacin se calcula como el cociente entre el nmero de enfermos y el total de individuos que componen la poblacin: p = TE / N. El complemento de esta probabilidad ser q =1 p, la cual se calcula con: q = 1 (TE / N) = (N TE) / N = TS / N. O sea la probabilidad de estar sano. En el caso de complementos relativos hay otra propiedad expresada por: P( B A ) = P( B A ) = P ( B ) - P ( B A ) De la figura se puede ver que el conjunto B est formado Grfico 5.2 por dos conjuntos excluyentes, tales que: ( B A ) ( B A ) = 0 El complemento relativo y la interseccin a su vez son ( B A ) ( B A ) = B Se aplica el axioma 3 y resulta B A B A

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link] P ( B A ) + P ( B A ) = P ( B ) luego es : P( B A ) = P ( B ) - P ( B A )

5-10

Por ejemplo, sea A el conjunto de todas las embarazadas que concurren al hospital, luego su complemento ser el conjunto de todas las mujeres que no estn embarazadas que concurren al hospital. Sea B el conjunto de todas las personas que vienen al hospital a tratarse de enfermedades venreas. Entonces, el complemento relativo P( B A ) = P( B A ) es la probabilidad de encontrar un mujer que concurra por una enfermedad venrea y que no est embarazada. 4) Unin de dos sucesos cualesquiera: Sean dos sucesos A y B, pertenecientes al espacio de probabilidades S; la probabilidad de la unin de ambos es la suma de sus probabilidades individuales, menos la de su interseccin. P(AB) =P(A) + P(B) - P(AB) Esto es una generalizacin del axioma 3, al caso general, cuando los conjuntos no son excluyentes, como en la figura del Grfico 5.2 anterior. Puede verse que el suceso (A B) es la unin de tres sucesos mutuamente excluyentes entre s, a saber, la interseccin entre ambos y los dos complementos relativos. O sea, ( A B ) ( B A ) ( A B ) = 0 ( A B ) ( B A ) ( A B ) = ( A B ) Aplicado el axioma 3 generalizado, resulta: P( A B ) + P( B A ) + P( A B ) = P( A B ) Reemplazando resulta: P( A B ) + { P( B ) - P( A B )} + { P( A ) - P( A B )} = P( A B ) O sea, P( B ) + P( A ) - P( A B ) = P( A B ) Usando el mismo ejemplo anterior sera: P ( A B ) la probabilidad del conjunto formado por mujeres embarazadas o que tengan enfermedades venreas, la que ser igual a la suma de la probabilidad de que una mujer est embarazada P ( A ), ms la probabilidad de que una mujer tenga una enfermedad venrea P ( B ), menos la probabilidad del conjunto formado por las mujeres embarazadas y con enfermedades venreas P( A B ). 5) Particiones de sucesos: Sean n sucesos pertenecientes al mismo espacio muestral S, tales que particionan al suceso A (ver Grfico 5.2), entonces se cumple que: (Ci Cj) A = 0 i j
n n

P( A ) = P( A Ci )
i=1

Ci A
i=1

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-11

Si se piensa que el suceso A est particionado por los Ci, entonces queda dividido en n pedazos del tipo: ( A Ci ) , que son sucesos mutuamente excluyentes entre s y, a su vez, su unin total debe ser igual al suceso A; entonces aplicando el axioma 3 generalizado se demuestra la expresin anterior. Por ejemplo, el suceso A resultar positivo est particionado por los sucesos C1: sano y C2: enfermo. Entonces: P( A ) = P( A Ci ) = P( A C1 ) + P( A C2 ) = P(FP) + P(VP) = (fp/N) + (vp/N) = TP/N 6) Conteo de resultados: Sea una prueba clnica con un total de N resultados posibles C1 ,C2 ...Cn que forman el espacio muestral S. Entonces cada experimento tendr una probabilidad individual dada por P (Ci ). Sea R un suceso cualquiera formado por r resultados, entonces puede ser escrito con:
r r

R = Ci
i=1

Y de all resulta P ( R ) = P(Ci ) por la propiedad anterior.

i=1

Extendiendo el caso al universo S al tomar todos los resultados posibles ser:

P ( S ) = P(Ci ) = 1
i=1

Para el caso particular de resultados igualmente probables la expresin se reduce a: P(C1 ) = P(C2 ) = P(C3 ) = ... = P(Cn ) = 1/N 7) Conclusin: De las expresiones del punto anterior se sabe que la P ( R ) es la suma de las probabilidades de cada uno de los resultados que verifican R, y si estos a su vez son equiprobables resulta:
r

P ( R ) = P(Ci ) = (1/N) + (1/N) + .... + (1/N) = NR / N = r / N

i=1

r veces o sea, P ( R ) = NR / N Entonces, la probabilidad P ( R ) de un evento cualquiera R es igual al nmero NR, de elementos de R, dividido por el nmero total de elementos N. Lo que se parece mucho a la definicin clsica de probabilidad; sin embargo existe una diferencia fundamental: . En el enfoque de la probabilidad axiomtica, la equiprobabilidad es un supuesto usado para establecer las probabilidades de los resultados de un experimento cualquiera. . En el enfoque de la probabilidad clsica, la equiprobabilidad es una conclusin lgica y es usada de hecho para definir a la misma.

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-12

5.3.2 Aplicaciones
a) Si se lanza una moneda al aire, los resultados posibles son cara y seca, ambos con una probabilidad igual a 0,5. O sea, cumplen las condiciones anteriores. Ahora, si se lanza la misma moneda dos veces al aire, los casos posibles son S { cc , cs , sc , ss } o sea, 4 casos igualmente probables, cada uno con un valor de probabilidad de . Un evento cualquiera como por ejemplo, R { obtener una seca en el primer lanzamiento } = { sc , ss } que tendr un valor de probabilidad dado por P ( R ) = + = = NR / N = 2/4. b) Si se lanza un dado al aire, hay seis resultados posibles, equiprobables (P = 1/6). Pero si se lanza el mismo dado dos veces, ahora el espacio muestral estar formado por 36 elementos (resultados posibles) S { (1,1) (1,2) (1,3) .... (6,5) (6,6) }todos igualmente probables (P = 1/36) Un evento cualquiera R { (3,3) (3,4) (4,3) }tendr una probabilidad P (R ) = 3/36 = 1/12. Otro suceso M {obtener dos ases }= { (1,1) } tendr P (M) = 1/36. c) Se lanza una moneda cargada al aire donde la probabilidad de cara p = 1/3 y la de seca q = 2/3 entonces se cumple p + q = 1 . Ahora se la lanza de nuevo y se genera un espacio muestral dado por S { cc , cs , sc , ss }, con P (cc) = p2 ; P (sc) = P (cs ) = p.q y P(ss)= q2. Se cumple que P ( S ) = p2 + p.q + q.p + q2 = (p+q)2 = 1. Lo anterior se cumple pues la ocurrencia de un resultado no incide en el siguiente ni es influenciado por el anterior. d) Se efecta un diagnstico a partir de los anlisis clnicos del paciente los resultados posibles son (+) con una probabilidad p y (-) con una probabilidad q. Se cumple la relacin p + q = 1 pues p = TP/N y q = TN/ N, de all p + q = (TP + TN) /N = 1. Se efecta otro diagnstico a otro paciente, las probabilidades p y q se mantienen iguales y constantes y el espacio muestral formado por este segundo caso es S { (+ +) (+ - ) (- + ) (- -) } con probabilidades anlogas a las del caso anterior. (TP: total de Positivos ; TN : Total de Negativos) e) Ocurre un nacimiento, la probabilidad que sea varn es igual a la de mujer y vale 0,5. Si son mellizos hay cuatro casos posibles, en forma anloga al ejemplo (a) de ms arriba. f) En un concurso para auxiliar de la ctedra de Bioestadstica se presentan 3 candidatas. La primera: A por ser profesional tiene dos veces ms posibilidades de ganar que una alumna avanzada B. Y esta a su vez el triple de ganarle a C que es de otra carrera. Se pide calcular las respectivas posibilidades de ganar y la probabilidad de que A no gane. Si P(C) = p entonces P(B) = 3 P(C) = 3 p y P(A) = 2 P(B ) = 6 p El suceso seguro es que alguna de las tres va a ganar: 1 = P(A) + P(B) + P(C) = 6p + 2p + p = 9p Y no es posible que gane ms de una, por lo tanto los tres sucesos son mutuamente excluyentes. De donde se obtiene p = 1/9 y con eso se pueden obtener: P(A) = 6/9 ; P(B) = 2/9 y P(C) =1/9 La probabilidad de que no gane A es igual a la de que ganen B o C. Esto es: _ P(A) = 1 P(A) = 1 6/9 = 3/9 = 1/3 = P (B C) = P(B) + P(C) = 2/9 + 1/9

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-13

g) Se fabrica un medicamento con 11,9 g de sulfato ferroso (SO4Fe . 7 H2O) en 100 ml. y el resto excipientes como sacarosa, sorbitol y cido ctrico con agua triple destilada. Las normas establecen una tolerancia para el sulfato de + 2,1 g/100ml, junto con otras especificaciones para los dems componentes. El farmacutico a cargo del control de calidad sabe, por su larga experiencia, que el 1% de lo producido se rechaza por superar el lmite y el 2% por no llegar al valor mnimo en el caso del sulfato. Adems, un 4% se rechaza por no cumplir las restantes especificaciones. Si tiene que inspeccionar 10.000 unidades: cul ser el nmero total de unidades que espera aceptar? Sea el esquema siguiente: S: lote de 10.000 unidades fabricadas A: unidades rechazadas por sobrepasar lmite de sulfato B: unidades rechazadas por no llegar al lmite de sulfato R: unidades rechazadas X: unidades aceptadas = R C: unidades rechazadas por otras causas R = C (B R) (A R) (sombreado) P ( X ) = 1 - P(X ) = 1 - P (A B C) = 1-{ P(A) + P(B) + P(C) - P(A C ) - P(B C )} P ( X ) = 1 - { P(A) - P(A C )} - { P(B) - P(B C )} - P(C) P ( X ) = 1 - { P (A C ) } - { P(B) - P(B C } - P(C) De los datos del problema surgen: P ( C ) = 4% = 0,04 P (A C) = 1% = 0,01 P(B C ) = 2% = 0,02

A R B

De all es P(X) = 1 - 0,01 - 0,02 - 0,04 = 0,93. O sea un 93% de unidades aceptadas, lo que significa N. X = 9.300 unidades aceptadas.

5.3.3 ndices clnicos como probabilidades

Sean los cuatro sucesos posibles al efectuar un diagnstico: Tabla 5.1: Eventos posibles al realizar un diagnstico o Tabla de diagnstico Diagnstico verificado Test clnico (+) (-) Total Enfermo: C1 FN : falso negativo TE : Total Enfermos Sano: C2 VN : verdadero negativo TS: Total Sanos Total TP : de Positivos TN : de Negativos N : Total pacientes VP: verdadero positivo FP : falso positivo

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-14

La Tabla 5.1 es un Diagrama de Venn, donde los sucesos sano (C2 ) y enfermo (C1) particionan al universo, igual que positivo y negativo. Y a su vez, los cuatro sucesos posibles VP, FP, VN, FN tambin particionan al universo. Notar que si el suceso es VP su valor observado o medido es la frecuencia (vp) usada en la Tabla 1.1, y lo mismo con los tres casos restantes. . FP = (C2 TP ) VP = (C1 TP ) FN = (C1 TN ) VN = (C2 TN ) P (VP) = nmero de casos posibles / nmero total de casos = vp / N es una probabilidad P (C1) = TE / N = p es una probabilidad llamada la prevalencia de la enfermedad. Por lo tanto el cociente entre ambas probabilidades ser: Sensibilidad = vp / TP = P (VP) / P (C1) De donde se deduce que la sensibilidad es un cociente de probabilidades. Anlogamente para la especificidad E = vn / TS pues: P (VN) = vn / N y P (C2) = TS / N es igual al complemento de la prevalencia; o sea que el cociente entre ambas probabilidades ser la Especificidad = P (VN) / P (C2) Puede verse que los ndices clnicos principales S y E son en realidad un cociente de probabilidades, cuyo significado se explicar mejor en el captulo siguiente. Lo mismo ocurre con los valores predictivos. En efecto: P (TP) = TP / N y por su lado P(TN) = TN / N VPP = vp / TP = P (VP) / P (TP) = (vp / N) / (TP / N) = vp / TP VPN = vn / TN = P (VN) / P (TN) = (vn / N) / (TN / N) = vn / TN Por su parte la Eficiencia (A) se puede obtener con la unin de los dos tipos de xitos: P (n de xitos) = A = P( VP VN ) = P (VP) + P (VN) = (vp / N) + (vn / N) = (vp + vn) / N En resumen, mientras que la prevalencia y eficiencia son probabilidades simples y directas, los ndices tales como la sensibilidad, especificidad y valores predictivos son un cociente de probabilidades directas.

5.4. Odds
Este concepto, que no tiene an una traduccin del idioma ingls, se puede definir como un cociente de probabilidades de la manera siguiente: Odds: es el cociente entre la probabilidad de ocurrencia de un suceso A y la de su complemento. _ Odds = P(A ) / P(A ) = P(A ) / [1- P(A) ] Se pueden definir diferente tipos de Odds como los de Enfermos o Sanos con:

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link] Odds de enfermos = P(Enfermo ) / P(Sano)

5-15

Si se considera a la poblacin total, entonces la Prevalencia de la enfermedad es la cantidad de enfermos que esta tiene y la relacin anterior se puede expresar con: Odds de enfermos = Prevalencia / 1 - Prevalencia Proporcin de enfermos: es la probabilidad de contraer la enfermedad (Prevalencia). Se puede encontrar la relacin siguiente: Prevalencia = P(E ) = TE / N = TE / (TS + TE) = (TE / TS) / [1 + (TE/ TS)] Prevalencia = Odds / ( 1 + Odds ) Esto ya fue presentado en la Tabla 4.3 para el concepto de riesgo, pero ahora se lo explica desde el punto de vista de las probabilidades para el caso particular de que el riesgo sea contraer una enfermedad cualquiera. Para entender el significado clnico de estos conceptos se dan algunos ejemplos como sigue: Caso 1) Si la probabilidad de enfermarse (Prevalencia) es del 80%, entonces la probabilidad de no enfermarse (1 Prevalencia) ser del 20%. Por lo tanto, el Odds de enfermos es 4 a 1, lo que significa que hay 4 chances entre 5 de enfermarse. Caso 2) Si se sabe que el Odds de enfermedad es de 5 a 1, entonces la prevalencia (o riesgo) se puede calcular como p = 5 / (1 + 5) = 5/6 = 0,83 Caso 3) Si se tiene una sensibilidad del 60% y una especificidad del 80%, se pueden calcular sus respectivos Odds con: Odds de sensibilidad = S / (1 S) = 0,6 / 0,4 = 1,5 Odds de especificidad = E / (1 E) = 0,8 / 0,2 = 4 El producto de ambos Odds ser igual a 6. Por su parte, se pueden calcular los Likelihood ratios: LR+ = S / (1 E) = 0,6 / (1 0,8) = 0,6 / 0,2 = 3 LR- = (1 S) / E = (1 0,6) / 0,8 = 0,4 / 0,8 = 0,5 Entonces, el cociente de ambos Likelihood Ratios es igual al producto de los Odds de sensibilidad y Especificidad. En efecto, LR+ / LR- = S . E / [(1 S) (1 E)] = Odds sensibilidad x Odds especificidad = 6 = Odds Ratio A este ndice se lo denomina Odds Ratio y se lo present en el Captulo 4, se lo puede entender como un cociente entre el producto de los xitos, dividido el producto de los fracasos.

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link] Caso 4) Si el suceso analizado es la cantidad de fallas cometidas en el diagnstico se tiene: Odds de fallas = P (fracasos) / [1 P(fracasos)] = P(fracasos) / P(xitos)

5-16

Pero la P(fracasos) = (fn + fp) / N y la P(xitos) = (tn + tp) /N Luego reemplazando y simplificando en la relacin anterior se obtiene: Odds de fallas = Failure Odds = (fp + fn) / (tp + tn) Significa que si se tiene 1 falla en 10 pruebas el FO = 1/9, o bien cuando el FO = 2/8 entonces habr 2 fallas cada 10 pruebas, o cada 8 xitos. Se puede tomar a este nmero como otro ndice para calificar la calidad de un diagnstico.

5.5 Cuadro resumen de los ndices clnicos

En el cuadro siguiente se muestra las relaciones tericas de todos los ndices clnicos con los dos ndices bsicos: sensibilidad, especificidad. Adems se clasifica entre aquellos que varan con la prevalencia y los dems: Cuadro 5.2 Relaciones entre ndices clnicos de diagnstico ndices clnicos bsicos: Parmetros o caractersticas principales de un test clnico Sensibilidad = S = vp / TE Especificidad = E = vn / TS ndices clnicos derivados: No dependen de la prevalencia, son otros parmetros del test clnico. ndice de Youden = Y = S + E 1 Likelihood Ratio de positivos : LR+ = S / (1 E) Likelihood Ratio de negativos: LR- = (1 S) / E ndices clnicos extrnsecos: Dependen de la prevalencia, son variables del test clnico Valor Predictivo de Positivos : VPP = vp / TP = S . p / {[(1-p) (1 E)] + [S .p ]} Valor Predictivo de negativos: NPP = vn / TN = E (1 p)/ {[E (1-p)] + [p (1 S)]} Eficiencia: A = (vp + vn) / N = E (1 p) + S . p Efecto de la poblacin en los tests clnicos: Prevalencia : p = TE / N Odds de enfermedad: O = p / (1-p) = TE / TS Odds / (1 + Odds) = Prevalencia ; o bien: p = O / (1 + O)

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-17

5.6 Problemas propuestos

V F 1) La probabilidad terica es exactamente igual a la emprica. V F 2) A medida que aumenta N la probabilidad emprica se aproxima mejor a la terica. V F 3) La nocin de probabilidad tiene 4 acepciones bsicas. V F 4) El conjunto universo est formado por todos los casos posibles. V F 5) El complemento del conjunto universo es el conjunto elemental. V F 6) El conjunto vaco tiene el cero como nico elemento. V F 7) Un elemento pertenece a un conjunto es lo mismo que decir: est incluido en l. V F 8) Si A est incluido en B, entonces son iguales. V F 9) Si A est incluido en B, y este se incluye en C, entonces A est incluido en C. V F 10) El complemento de A est formado por los del universo que no son A. V F 11) La unin de un conjunto y su complemento forman al universo. V F 12) Dos conjuntos se dicen excluyentes si no tienen elementos comunes. V F 13) La unin del conjunto universo con otro cualquiera es un nuevo universo. V F 14) La interseccin de un conjunto con el vaco es el mismo conjunto. V F 15) La unin de un conjunto con el conjunto vaco es el conjunto elemental. V F 16) La interseccin de un conjunto con el universo es el mismo conjunto. V F 17) La unin de un conjunto con otro ms grande es igual al ms grande. V F 18) Un grupo de conjuntos es colectivamente exhaustivo si es igual al universo. 19) Un grupo de conjuntos es mutuamente excluyente si lo son todos los pares posibles. V F V F 20) Una particin se forma con un grupo de conjuntos mutuamente excluyentes. V F 21) Las combinaciones son el cociente entre variaciones y permutaciones. 22) Escribir las frmulas de clculo de combinaciones, variaciones y permutaciones. V F 23) Es lo mismo realizar extracciones con y sin reposicin en el clculo combinatorio. 24) Definir los sucesos: Universo, Vaco y Elemental. 25) Para que un conjunto de sucesos observables sea un lgebra de Boole debe cumplir ............ 26) Los tres axiomas bsicos del lgebra de Probabilidades son: .................................................. V F 27) Las probabilidades del conjunto vaco y del universo son complementarias. 28) La probabilidad de la unin de sucesos excluyentes, es igual a la suma directa de: ................ 29) Para la particin del universo por un grupo de conjuntos se requiere: ..................................... 30) La relacin entre los ndices clnicos est dada por la relacin: .............................................. 31) Once estudiantes de la Facultad son condenados a muerte y se les concede pedir un ltimo deseo. Cuando el que aprob Bioestadstica nota que tardan 5 minutos en formarlos contra la pared, pide que los ejecuten luego de que los coloquen en el paredn de todas las formas posibles. Explicar porqu salv a sus compaeros. 32) Una bolsa contiene 4 bolas blancas y 2 negras, otra contiene 3 blancas y 5 negras; si se extrae una bola de cada bolsa. Hallar la probabilidad de que: a) ambas sean blancas; b) ambas sean negras; c) una blanca y la otra negra. 33) De cuntas formas pueden ordenarse 7 libros en un estante si: a) es posible cualquier ordenacin; b) tres libros determinados deben estar juntos;

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link] c) dos libros determinados deben estar en los extremos.

5-18

34) Una farmacia que hace reparto a domicilio tiene 4 cadetes con moto y llegan 3 pedidos a la vez. De cuntas formas puede el encargado asignar la tarea a los cadetes? 35) Doce estudiantes deben rendir un examen parcial y el profesor tiene 4 temas diferentes para interrogarlos. De cuntas formas diferentes puede hacerlo? 36) Cinco pacientes vienen a efectuarse cinco anlisis diferentes al laboratorio de anlisis clnicos. De cuntas maneras diferentes pueden colocarse en la fila de espera si se les da libertad para hacerlo? Ver si cambian las cosas si se les da un nmero por orden de arribo para ser atendidos por el bioqumico. 37) De cuntas maneras diferentes pueden sentarse en una fila 3 bioqumicos, 5 farmacuticos y 4 enfermeros? Ver si cambia el resultado si se sientan en una mesa redonda. 38) Se tiene un mazo de 40 cartas espaolas y se pide calcular la probabilidad de que salga: a) un as; b) una carta de oro; c) una figura; d) un nmero cualquiera; e) un dos o un tres. 39) En una farmacia hay 5.000 remedios distintos, 1.200 artculos medicinales y 600 productos de perfumera. Si se toma un tem al azar calcular la probabilidad de que sea: a) un remedio; b) un perfume; c) un artculo medicinal o un perfume. 40) Se fabrica una vacuna contra la gripe que falla en un 2% de los casos si la persona est tomando antibiticos, en un 4% si est haciendo un rgimen adelgazante y en un 8% por otras causas diferentes. Si se analizan 5.000 casos: cul ser el nmero total de curados? 41) Sopa de letras: buscar y marcar las palabras que se definen a continuacin:
B A L O X E R O J I O U G L A B V T K R E E E I M P O S I B L E L Q D Q I N I R A S Y B R O E S T A D I P E S B O N I N C T Q G Q M D N Z E M E L S W R G C E O J I D E Q S O B L W R F U D A R I S Y U V M L C U I N A T M U F A L A E T N C L H P X N S V R E U C I D I G N A A H U L N L I R U I B T R C I N C C N S T I J I T V E O P O A W I L A I I D V M Y N R W E P I U T C E I C L A P L A C E B D R S O D I I N B O N X R C B A T E F S E G U R O C T I N T I T X C I R H Q O D T M C N A E S H A X T Q W C V I B T Y K P L L R A N D Z P Z I A N A S F N Q R Q A E T N E O T A O R N E C R J V I X I C M N T S X O R U F O U I I L A N C Z E A I Y N A L T G O I C O J S C C Z Q K L W R G G Z I L I S E L U H E L A W R W G S H U E C T T U R A T L C U F E V D O L D E G I E A L F X A J Z S G C J U I L A S H O Z L C R V K A X I O M A S C N W X N W Q X E N K F I O T E R R I V O O B I C U E S R D I E N T O M I C M S U F L Q P M A O P I C T O G R A M A C M A A X Y O X E M P I R I C A F U T A T U W R O B P E V Z S E J A A N D N R R N C O M P L E M E N T O C I F I C I A A N W X L S Y S I L S K A A U T X O X S O G S A R T A V S N X S O P H D

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-19

1. Primer matemtico en estudiar probabilidades. 2. Teorema de ..... relaciona probabilidades empricas con las tericas. 3. Un grupo de conjuntos colectivamente exhaustivos y mutuamente excluyentes forman una .... del universo. 4. Una .... est formada cuando dos conjuntos no tienen ningn elemento en comn. 5. Lo inverso del punto

anterior, cuando un conjunto tiene todos los elementos de otro. 6. Suceso .... cuando no puede ocurrir. 7. Lo contrario del anterior. 8. El conjunto que tiene todos los elementos posibles. 9. El que no tiene ningn elemento. 10. Un conjunto es ... de otro cuando contiene a todos los elementos del universo que no pertenecen al primero. 11. Los tres ... bsicos del lgebra de Probabilidades. 12. El principio de razn .... se agreg a la definicin clsica de probabilidad. 13. Probabilidad ... se calcula como cociente de frecuencia experimentales. 14. Una ... de n elementos se calcula con el factorial de tal nmero. 42) Conociendo los siguientes valores de Prevalencia de una enfermedad, calcular los correspondientes Odds y la Probabilidad de estar sano: Prevalencia 10 20 33 43 50 66 80 88 94 Odds enfermos (1 Prevalencia)

43) Para los valores de las Tablas 4.1 y 4.2 del captulo anterior, calcular los correspondientes LR+ y LR- para cada uno de los puntos de corte adoptados. Cunto vale el Odds? 44) Encontrar la relacin entre el VP+ y LR+ reemplazando en las ecuaciones dadas en el punto 5.5.3 anterior. Qu relacin se encuentra con los Odds de enfermedad? 45) Calcular todos los ndices clnicos conociendo los datos de las tabla siguiente: En Realidad Est Sano Enfermo Total

Diagnstico D+ 45 105 150 D98 102 200 Total 143 207 350

46) Con la tabla de datos obtenidas en un experimento hecho sobre 400 sujetos, se pide calcular los ndices clnicos y compararlos con los del ejemplo anterior. Explicar cual de los dos es el mejor de acuerdo a los tres Tipos de enfermedades posibles, efectuando una comparacin cualitativa entre los mismos. Es decir una comparacin a ojo sin tener la correspondiente validacin estadstica de estas conclusiones.

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-20

Verdad + Sano Enfermo Total 180 40 220

Diagnstico 98 82 180 Total 278 122 400

47) Analizar la calidad de el test clnico desde un punto de vista dual, es decir teniendo en cuenta Sensibilidad, Especificidad si es una enfermedad del Tipo II. Analizar que ocurre con el Delta Predictor simulando 10 valores de prevalencia entre 0,1 y 0,9.

Verdad + Sano Enfermo Total 100 400 500

Diagnstico 250 250 500 Total 350 650 1000

48) Lo mismo que en el ejemplo anterior pero si se trata de una enfermedad del Tipo I

Verdad + Sano Enfermo Total 90 310 400

Diagnstico 350 50 400 Total 440 360 800

49) dem anterior pero para una enfermedad del Tipo III

Verdad + Sano Enfermo Total 40 360 400

Diagnstico 460 40 500 Total 500 400 900

50) Conociendo la sensibilidad (90%) y la especificidad (75%) de una prueba clnica se pide calcular todos los siguientes ndices clnicos que conozca. Representar la variabilidad de ciertos ndices con la prevalencia, y la obtencin de sus valores para p = 0,4.

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-21

Apndice 1: Teora de conjuntos

Se define como conjunto a una serie de objetos llamados elementos o entes. Como en Filosofa, se entiende por ente a todo lo que es. Los elementos pueden ser reales o imaginarios, tangibles o intangibles; mientras se pueda decir algo de ellos, son entes. Al caso contrario se lo denomina la nada, o sea lo que no es. Como la nada no puede tener elementos, conviene asimilar este concepto al denominado conjunto vaco que se denota con: : es el conjunto que no tiene elementos Si los pacientes se clasifican en (+) y (-), no puede haber ninguno que a la vez sea (+) y (-). Su opuesto, o complemento, es el conjunto que incluye a todos los elementos posibles, al que se llama conjunto universo denotado con:

: es el conjunto de todos los elementos posibles

Por ejemplo, todos los pacientes que concurren a hacerse atender por el clnico, configuran su universo de pacientes o su poblacin de referencia. Cualquier subconjunto del conjunto universo estar formado por una serie de elementos pertenecientes al mismo. Este conjunto ser una parte del universo porque no puede definirse fuera del mismo. Por ejemplo, el conjunto de pacientes sanos, el conjunto de enfermos, etc. Normalmente, en biologa el universo ser la poblacin en estudio. A : un conjunto formado por varios elementos ei Hay dos casos extremos: cuando el suceso A est formado por todos los elementos ser el universo, y cuando tenga un solo elemento ser el conjunto unitario o elemental. Se pueden usar como ejemplos de conjuntos a los casos siguientes: A: { centrfuga, jeringa, pipeta, balanza } = { e1, e2 , e3 , e4 } B: { sangre, suero, kit de glucosa, remedio } = { e5 , e6 , e7 , e 8 } C: { bioqumico, farmacutico, paciente } = { e9 , e10 , e11 } Donde con el smbolo ei se ha denotado a cada uno de los diferentes elementos usados como ejemplos. A partir de all se pueden definir una serie de relaciones entre los conjuntos y sus elementos, como la pertenencia: Se dice que un elemento pertenece a un conjunto cualquiera cuando est en el mismo, en caso contrario se dice que no pertenece al mismo. Se los expresa con: e3 A e23 A pertenece no pertenece (con e23: heladera)

Esta idea es algo diferente a la de inclusin que se utiliza para relaciones entre conjuntos. Por ejemplo: sea el conjunto K: { pipeta, balanza } = { e3 , e4 }, K est incluido en A, pues todos sus

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-22

elementos pertenecen tambin a A. En cambio, el conjunto L:{ e3 , e5, e7 , e23 } = { pipeta, sangre, kit de glucosa, heladera }no lo est: o bien, K A L A ( K est incluido en A ) ( L no est incluido en A )

El concepto de inclusin, significa que K es un subconjunto de A. En cambio, si algunos o todos los elementos de uno no pertenecen al otro, entonces no se trata de un subconjunto y no se puede hablar de inclusin. Para el caso particular donde ambos tienen los mismos elementos, la inclusin se transforma en igualdad. As, dos conjuntos son iguales cuando: A = X X : { ei i / ei A } A = X { centrfuga, jeringa, pipeta, balanza } = { e1, e2 , e3 , e4 }

o sea:

La unin de dos conjuntos es otro conjunto formado por los elementos de ambos. O sea: B C : { ei i / ei B o ei C } = { e5 , e6 , e7 , e8 , e9 , e10 , e11 } La interseccin de dos conjuntos es otro conjunto formado por todos los elementos comunes a ambos, y se denota con: B L : { ei i / ei B y ei L } = {e5 , e7 } El complemento de un conjunto A cualquiera es otro conjunto:A formado por los elementos del universo, que no pertenecen a A. O sea:

A : { ei i / ei y ei A }
Si para los ejemplos anteriores se define un universo formado por cien elementos, tal como : { ei i = 1, 2, 3, ... , 100 }, entonces el complemento del conjunto A ser: _ A : { e5 , e6 , e7 , ... , e 99 , e100 } Se dice que el conjunto B L es el complemento relativo del conjunto L cuando est formado por todos los elementos de B que no pertenecen a L . Esto es: _ B L = B L : { ei i / ei B y ei L } = { e6, e8 } o viceversa: _ L B = L B : { ei i / ei L y ei B } = { e3 , e23 } Se dice que dos conjuntos son excluyentes cuando no tienen ningn elemento en comn. A veces se los llama disjuntos. Esto significa que la interseccin de ambos conjuntos no tiene elementos.

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-23

O sea, debe ser igual al conjunto vaco. Por eso el concepto de exclusin no necesita un smbolo especial como los anteriores. Se define con: Si A C = , entonces son excluyentes o disjuntos.

Tambin se pueden ilustrar estos conceptos con la Tabla de la Verdad vista en el captulo anterior El conjunto de pacientes enfermos se expresa con TE y tiene una cantidad de elementos conformado por todos los individuos enfermos (TE) que concurrieron al laboratorio, donde se verific que padecan una cierta enfermedad. Anlogamente con los sanos, entonces: TE TS = (no hay ninguno que a la vez sea sano y enfermo. TE TS = (todos los casos posibles, el universo) Adems se puede hacer lo mismo con el conjunto de los diagnosticados positivos (TP) y los negativos (TN), entonces queda: TP TN = (no hay ninguno que a la vez sea sano y enfermo). TP TN = (todos los casos posibles, el universo). Los complementos seran: __ __ __ __ TS = TE o bien TE = TS y para el diagnstico TP = TN o bien TN = TP Para una mejor visualizacin de los conceptos de la teora de conjuntos, conviene utilizar un modo grfico al mostrar sus relaciones mutuas: Grfico A5.1: Diagramas de Venn en la teora de conjuntos KA A K (inclusin) BC (unin) B C

_ A (complemento) A

B L (interseccin ) B L

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link] A C = (exclusin) A C L L B L = B L (complemento relativo) B

5-24

Los Diagramas de Venn suelen usarse para esta tarea. Con un rectngulo se representa al universo . Dentro del mismo se usan entornos cerrados de forma ligeramente ovalada para mostrar a los conjuntos. Adecuados sombreados resaltan las relaciones que se quieren mostrar. Todo esto se muestra en el Grfico 5.1 siguiente, donde se han representado las relaciones vistas ms arriba entre los conjuntos definidos como A, B, C, K y L para los conceptos de inclusin, unin, interseccin, complemento comn y relativo y para la exclusin.

Propiedades
El siguiente conjunto de propiedades se puede deducir de las definiciones vistas ms arriba; aqu se generaliza para no repetir las mismas propiedades en cada una de las relaciones entre conjuntos descriptas. Propiedad transitiva: Si K A y A entonces K Propiedad conmutativa: B L = L B o bien B C = C B Propiedad asociativa: A (B C ) = (A B) C o bien A (B L) = (A L) B Propiedad distributiva: A (B C ) = (A B) (A C ) A (B C ) = (A B) (A C ) Idempotencia: Identidad: B B = B y tambin y tambin y tambin A A = A A = A A =

A = A = A

Por ejemplo, la unin de tres sucesos A (formado por 5 bolillas numeradas de 0 a 4) y B (formados por otras 3 bolillas numeradas de 5 a 7), y C (formado por 2 bolillas la 8 y la 9), va a resultar igual al conjunto de las diez bolillas que conforman un bolillero comn. Es lo mismo unir A con B primero, y luego unir C, que cualquier otra manera de unir a esos tres conjuntos, el resultado siempre ser el mismo y eso ilustra la propiedad transitiva. Anlogamente para el caso de dos conjuntos en lugar de tres. La idempotencia significa que todos conjunto unido a s mismo, da el conjunto original, al igual que su interseccin. La identidad significa que todos conjunto unido con el universo resulta el universo, mientras que si se hace la interseccin el resultado es el mismo conjunto.

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link] Ejemplos de aplicacin 1) Decidir si los siguientes conjuntos son vacos: a) X : {x x2 = 36 y 2 x = 8} = porque no hay ningn x que satisfaga ambas relaciones. b) X : {x x x} = porque no hay ningn x que cumpla el requisito. c) X : {x x + 23 = 23 } porque cero la satisface. O sea, X = [ 0 ] 2) Si un conjunto A de pacientes result positivo, y entre ellos un conjunto K estaba enfermo y el resto L estaba sano: Como se pueden usar las propiedades anteriores ? Lo mismo si se tiene un conjunto de pacientes B con resultado negativo y de entre ellos hay otro conjunto X que estaban sanos y otro Y que estaban enfermos. Hallar el conjunto de sanos y el de enfermos, si : A B = 3) Los 4 conjuntos de figuras en el plano son: A : {x x es un cuadriltero} C : {x x es un rombo} B : {x x es un rectngulo} D : {x x es un cuadrado} Determinar cules son subconjuntos de los otros.

5-25

Un cuadrado es un rectngulo por tener sus ngulos rectos, es un rombo por tener sus 4 lados iguales y adems es un cuadriltero por tener cuatro lados. Esto es: D B ; D C ; D A Como hay cuadrilteros, rectngulos y rombos que no son cuadrados, D es un subconjunto propio de los otros tres. Por su parte, como un rombo y un rectngulo son casos particulares de cuadrilteros resulta: B A y CA 4) Determinar cules de los siguientes conjuntos son iguales: ; {} ; {0} : Ninguno. El conjunto {0} tiene un elemento: el nmero cero. El conjunto {} tiene un elemen to: el conjunto vaco. Y el conjunto vaco : no tiene ningn elemento. 5) Determinar cul es la principal diferencia entre los conjuntos siguientes: A: Los das del ao. B: La cantidad de farmacias en Posadas. C: Los bioqumicos argentinos. D: El conjunto de los nmeros reales.

La principal diferencia es que el ltimo es un conjunto de tamao infinito, mientras que los tres primeros son finitos. 6) Determinar los cuatro conjuntos posibles al diagnosticar a muchos pacientes con la misma tcnica clnica: Son cuatro: vp es el conjunto de los verdaderos positivos, vn es el conjunto de los verdaderos negativos, fp los falsos positivos y fn los falsos negativos.

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-26

Apndice 2: Clculo combinatorio

Antes de entrar al campo algebraico conviene repasar los conceptos del clculo combinatorio, necesarios para calcular el nmero de casos en los problemas de probabilidad. . Conteos ordenados: si un suceso puede ocurrir de r maneras diferentes, y si, continuando el proceso, otro puede ocurrir de s maneras distintas, y luego un tercer evento de t formas, y as sucesivamente, entonces existirn N maneras de realizar todos los sucesos en el orden indicado. N = r . s .t ... Por ejemplo, para calcular la cantidad de Cdigos Postales del pas, que tiene cuatro cifras, donde la primera no puede ser cero. Entonces, en el primer puesto habr 9 casos posibles (los nmeros de 1 a 9), en el segundo, tercer y cuarto puesto habr 10 casos posibles (los nmeros de 0 a 9), por lo tanto resulta N = 9. 10 . 10 . 10 = 9000 cdigos posibles en total. . Variaciones: si se tienen n objetos diferentes en un conjunto, y de ellos se extraen r, se llama variacin de n objetos tomados de a r al nmero de maneras diferentes que hay de hacerlo en forma ordenada. V (n , r) = n! / (n-r)! Por ejemplo, se tienen n = 4 objetos diferentes a, b, c y d. Tomado de a uno ( r = 1 ), resultan 4 casos posibles a b c d; V ( 4,1) = 4! / (4-1)! = 4. En cambio, si se toman de a dos, entonces es r = 2 y los casos son: ab ac ad ba bc bd ca cb cd da db dc, o sea, 12 casos diferentes en total; V (4,2) = 4! / (4-2)! = 12. Para las variaciones, no es lo mismo el subconjunto ab que el ba pues interesa el orden. Adems, como son extracciones sin reposicin, no se pueden repetir los objetos, es decir el caso aa es imposible. Todo ocurre como si se colocara la mano en una bolsa de n objetos, y se sacan r de ellos,de a uno y por orden. Otro ejemplo: una secretaria debe distribuir a 5 pacientes en 3 salas de atencin diferentes con turnos disponibles; entonces dispone de V (5,3) = 5!/(5-3)! = 20 variaciones diferentes. .Permutaciones: si se tienen n objetos diferentes, se llama permutacin al nmero de formas diferentes que hay de ordenarlos entre s. Este concepto es equivalente al de una variacin, pero con r = n. O sea, Pn = V ( n , n ) = n! Como ejemplo, se puede imaginar a un bioqumico que debe realizar 3 determinaciones a, b y c en una muestra de un paciente. Las posibilidades son P3 = 3! = 6. Que se pueden visualizar con abc acb bac bca cab cba. .Combinaciones: si se tienen n objetos diferentes en un conjunto, y de ellos se extraen r a la vez, se llama combinacin de n objetos tomados de a r, al nmero total de maneras posibles que hay de hacerlo (sin tomar en cuenta el orden). C ( n , r ) = n! / (n-r)! . r!

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link] La relacin entre variaciones, permutaciones y combinaciones es: C ( n , r ) = V (n , r) / r! = V (n , r) / Pr

5-27

Por ejemplo, un visitador mdico de un laboratorio farmacutico concurre a un sanatorio a entrevistar a 5 mdicos, pero dispone de tiempo para solo 3 de ellos, entonces tiene 10 maneras distintas de hacerlo: 10 = C (5 , 3) = 5! / (5-3)! .3! = o sea hay 10 combinaciones posibles. Se trata de combinaciones pues no interesa el orden de las visitas. Otro ejemplo: un bioqumico quiere comprar 5 kits diferentes, pero solo le alcanza el dinero para 3 de ellos. Entonces, tiene 10 combinaciones posibles para hacer su compra. Vuelve a su laboratorio con los tres que pudo adquirir, y ahora se pregunta en qu orden los utilizar; resulta que puede hacerlo de 6 formas diferentes o permutaciones posibles. Finalmente, decide entregar uno a cada uno de sus dos ayudantes y guardar el tercero. As, tiene 3 variaciones posibles de cmo poder hacerlo. . Propiedades de la combinatoria: C ( n , 0 ) = 1 = C ( n , n ) = n! / 0! n ! = n! / n! C ( n ,1 ) = n = C ( n , n-1 ) = n! / 1! (n-1) ! = n! / (n-1)! C ( n , r ) = C ( n , n-r ) = n! / r! (n-r)! Las combinaciones de 10 productos tomados de a 1 son 10; lo mismo que si son tomados de a 9. A su vez, si se toman de a 10 no hay ninguna, lo que es lo mismo que si no se toma ninguno. Pero si se toman de a 2 entonces hay: 10! / 8! 2! = 45 combinaciones posibles. .Permutaciones con repeticin: puede ocurrir que muchos objetos se repitan en el conjunto total, entonces, el nmero de permutaciones se calcula con : PR (n / s , t , u... z ) = n! / s! . t! . u! ... z! Por ejemplo, si se tienen 10 clientes en una farmacia de los cuales 8 son hombres y 2 son mujeres, el nmero de permutaciones posibles es PR = 10! / 8! . 2! = 45. Eso significa que hay 45 maneras de formar dos grupos ordenados en la cola de espera, uno de a 8 y el otro de 2. . Pruebas repetidas: en muchos casos, el experimento consiste en escoger un elemento cualquiera de un conjunto de tamao n, y repetir esto r veces. En el caso de los juegos de azar, el ejemplo ms comn es cuando se extraen cartas de un mazo, o en un sorteo cuando se sacan bolillas del bolillero. El detalle a tener muy en cuenta en estos casos es ver si se reponen o no los elementos escogidos del conjunto. De acuerdo con ello se diferencian as: .. Pruebas con substitucin: cuando se repone el objeto escogido antes de seguir con la extraccin siguiente. En tal caso, cada vez que se escoge un elemento hay siempre un total de n elementos. As, el conteo de casos es : n . n . n . ... n = n r

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

5-28

Por ejemplo, en un mazo de barajas espaolas de 40 cartas se pueden sacar 3 de ellas en forma sucesiva una cantidad 40 . 40 . 40 = 64.000 maneras diferentes, si se hace con reposicin. .. Pruebas sin substitucin: cuando no se repone el objeto extrado, antes de seguir con la siguiente extraccin. En tal caso, cada vez que se escoge un elemento, el total de n elementos disminuye en una unidad. As, el conteo para r casos es: n . (n-1) .(n-2) . ...(n-r+1) = n! / (n-r)! = V (n , r) Por ejemplo, de un mazo de barajas espaolas de 40 cartas se sacan 3 de ellas en forma sucesiva y hay un nmero de: 40 . 39 . 38 = 59.280 maneras diferentes de hacerlo, cuando no hay reposicin. Un bioqumico toma 2 carpetas de su fichero de 150 pacientes, entonces tiene unas 22.350 formas diferentes de hacerlo. Un farmacutico saca 2 calmantes de su stock de 10 para mostrarle al cliente, entonces tiene 90 maneras distintas de hacerlo. .Producto cartesiano: sean dos conjuntos A y B cuyos respectivos elementos son Ai y Bi; se denomina producto cartesiano a un nuevo conjunto formado con todos los pares posibles AiBi C = A x B Por ejemplo, si A (calmante, laxante, antibitico) y B (agua, sangre) el producto cartesiano de ambos ser C (calmante-agua, calmante-sangre, laxante-agua, laxante-sangre, antibitico-agua, antibitico-sangre).

6
Probabilidad Condicional
En este captulo se introduce el concepto de la probabilidad condicional a la problemtica probabilstica. Se comienza con el enfoque clsico, para luego ir avanzando hacia las relaciones bayesianas, en particular entre ndices clnicos. Se discuten los conceptos de independencia y condicionalidad para lograr un enfoque ms general que el visto hasta ahora.

6.1 Introduccin
La Teora de Probabilidades comenz con el estudio de los juegos de azar. El caso ms simple es el lanzamiento de una moneda, donde pueden ocurrir dos casos posibles. (c: cara y s: seca). Al repetir la misma prueba, los casos posibles ahora sern cuatro, y al hacerlo una tercer vez sern ocho. Un diagrama de rbol ayudara a visualizar mejor la cuestin (Grfico 6.1). Es de esperar que la probabilidad p = de obtener una cara, o q = de tener una seca, siempre sea la misma y no se altere por ms veces que se lance la moneda al aire. Es decir, se trata de una probabilidad constante a lo largo de una serie de pruebas. Lo mismo ocurre con la mayora de los juegos de azar, incluso con barajas cuando las extracciones se hacen con reposicin. Result natural entonces, calcular la probabilidad de los lanzamientos sucesivos, como el producto de las probabilidades bsicas p y q. As, la probabilidad de sacar 3 caras seguidas es de 1/8 como se aprecia en el diagrama y se obtiene con p3. Grfico 6.1: Diagrama del rbol.
1/8

cara: ccc P(3 caras) = 1/8 = p3 seca: ccs P(2caras) = 3/8 = ppq + pqp + qpp cara: csc P (2secas)= 3/8= pqq + qpq + qqp seca: css cara : scc

cara: cc cara : c seca: cs

1/8 1/8 1/8

1/8

seca : s

cara: sc
1/8

P(1 seca) = 3/8 = ppq + pqp + qpp seca: scs P(1 cara) = 3/8 = pqq + qpq + qqp
1/8

cara: ssc P(3 secas) = 1/8 = q3

seca: ss

seca: sss 1/8 Como puede verse ms arriba, el producto de las probabilidades de cada rama, siguiendo el camino adecuado, permite obtener los valores de cada uno de los resultados posibles al hacer los tres lanzamientos. Ese mtodo se conoci con el nombre de regla del producto. A su vez,

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-2

cuando se busca obtener un resultado indirecto que se da en ms de una rama, entonces se aplica la regla de la suma, esto es, se suman las probabilidades de cada una de las ramas involucradas. Los ejemplos de todo se presentan en el Grfico 6.1. Sin embargo, esta manera de resolver problemas no sirve para todos los casos. Hay un ejemplo histrico de ello llamado La paradoja de Marte: ... Muchos aos atrs, se planteaba como problema la posible existencia de vida en el planeta Marte. Como no se saba mucho del planeta, salvo que tena atmsfera como la Tierra, se especulaba acerca de la existencia de alguna especie animal o vegetal con vida. Si se parte de la base de no saber nada, se puede asumir como la probabilidad p de que haya vida, o q de que no la haya, para una especie cualquiera como la del Homo-Sapiens. Ahora, tomando otra especie como los peces, por un razonamiento anlogo se llega al mismo valor, p = q. Y as sucesivamente, para n especies se tendr que la probabilidad total de que haya especimenes vivos en Marte ser: P( vida) = P (hombres y vacas y aves y .... peces vivos) P( vida) = P (hombres vivos) P(vacas vivas) P (aves vivas) ... P(peces vivos) P( vida) = p . p . p .... p = pn Lo que conduce a una paradoja, pues P( vida) = pn
n

O sea, se parte de una ignorancia estimada en p = q = y se llega a la certeza de que no hay vida. Y ocurre lo mismo tomado otros valores de p y q. Si se estima que la probabilidad de vida es muy baja p = 0,001, tambin tiende a cero con n muy grande. Si se estima lo contrario, una alta probabilidad de vida p = 0,9 , entonces tiende ms rpido. Otra paradoja: tomando una cepa de Drosophila que difiera de la cepa salvaje en dos caracteres: el color del cuerpo es negro bano (E), mientras el color normal es (E+) y las alas son vestigiales (A ), mientras las normales (A+). Si se cruza una hembra salvaje ( e a ) con un macho normal (e+ a+), en la primera generacin F1 se obtienen nicamente moscas del tipo (e+ a+) que son los caracteres dominantes. Luego, se realiza un segundo cruzamiento retrgrado, de los obtenidos en F1 con normales. En la segunda generacin filial F2 se obtendrn cuatro tipos de casos posibles, todos igualmente probable p = de acuerdo a las leyes de Mendel: los gametos slo transportan uno de los genes alelos presentes en los progenitores, habiendo igualdad de frecuencias para ambos gametos. Los cuatro tipos de Drosophilas son: Mendel Frec. obtenida cuerpo normal y alas normales : E+ A+ o sea ( e+ a+ ) 25% 240 cuerpo normal y alas vestigiales: E+ A o sea ( e+ a ) 25% 266 cuerpo negro y alas normales : E A+ o sea ( e a+ ) 25% 278 cuerpo negro y alas vestigiales: E A o sea ( e a ) 25% 252 Habr igual nmero de machos y hembras. Hecho el experimento se obtuvieron valores muy parecidos a los mendelianos, como era de esperar. p = . = Si se hubieran cruzado machos y hembras de la F1, entonces en la F2 se hubiesen obtenido tambin cuatro tipos de moscas, pero con diferentes proporciones, de acuerdo a la segunda ley de Mendel : 9/16, 3/16, 3/16 y 1/16. O sea ( [Link]), vlida para la segregacin de caracteres independientes cuando se cruzan entre s dos individuos de la F1.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-3

Si se analizan ahora otros caracteres, como por ejemplo una cepa salvaje con alas vestigiales y ojos pardos (B), en el primer cruzamiento F1, resultaran todos con los caracteres dominantes ( b+ a+ ) Un cruzamiento retrgrado entre una hembra F1 y un macho salvaje dar lugar a cuatro tipos de moscas: Mendel Frec. obtenida ojos normales y alas normales : B+ A+ o sea ( b+ a+ ) 25% 370 ojos normales y alas vestigiales: B+ A o sea ( b+ a ) 25% 138 ojos pardos y alas normales : B A+ o sea ( b a+ ) 25% 155 ojos pardos y alas vestigiales: B A o sea ( b a ) 25% 350 Se da una paradoja, pues los valores obtenidos, distan de parecerse a los mendelianos esperados. Tomando esa evidencia, la conclusin sera que para esos caracteres dejan de cumplirse las leyes de Mendel, cosa que ningn genetista est dispuesto a aceptar. En sntesis, se muestran dos paradojas que despertaron polmicas en su momento, consecuencia de aplicar la llamada regla del producto, lejos de su mbito natural de los juegos de azar. Se puede pensar lo siguiente: si la probabilidad de encontrar una vaca viva en Marte es p, seguramente la probabilidad de encontrar la misma vaca conviviendo con tigre vivo no ser la misma. Aumentar para el tigre y disminuir para la vaca. Esto es, hay hechos cuya ocurrencia condicionan la ocurrencia de otros. En cambio, si al tirar una moneda sale cara, este hecho no condicionar lo que salga en la tirada siguiente. Entonces, haba que replantearse el concepto de las probabilidades teniendo esto en cuenta. Y as, se lleg al concepto de Probabilidad Condicional. En la segunda paradoja, los genetistas lejos de sacrificar las leyes de Mendel, pensaron que los caracteres que no la cumplan no eran independientes, y as definieron un nuevo concepto el de los caracteres ligados.

6.2 Independencia
Se dice entonces que dos sucesos son independientes cuando la ocurrencia de uno de ellos, no modifica la ocurrencia del otro, ni esta influenciado por este. Si se realiza una serie de pruebas repetidas, las pruebas son independientes, cuando el resultado de una de ellas no est influenciada por el resultado de la prueba anterior, ni tampoco influenciar el resultado de la prueba siguiente. Es importante no confundir independencia con exclusin. Pues en este ltimo caso, la ocurrencia de un suceso hace imposible la ocurrencia del otro. O sea, se obligan entre s. Esto lleva a pensar que dos sucesos son excluyentes cuando su interseccin es el conjunto vaco, o sea, la probabilidad de que ocurra uno y el otro, ser nula. En cambio, para que sean independientes debern tener por lo menos un elemento en comn, para que la probabilidad de su ocurrencia conjunta no sea nula. Por otro lado, para que un suceso condicione a otro tambin debe haber algn elemento en comn, pues si no hay ninguna relacin entre ellos no podr haber influencia de uno sobre el otro. Se pueden resumir estos casos con: . Sucesos excluyentes : No tienen ningn elemento en comn. O sea, A B = 0 . Sucesos independientes: Deben tener algn elemento en comn. O sea, A B 0 . Sucesos condicionales : Deben tener algn elemento en comn. O sea, A B 0

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-4

Se dice que dos sucesos A y B son independientes cuando la probabilidad de que ambos ocurran es igual al producto de sus probabilidades mutuas (independencia estadstica). O sea: Si se cumple, P (A B ) = P (A) . P (B) entonces son independientes. Esta es la vieja regla del producto. Se cumple en las reglas de la herencia humana, en los juegos de azar, en la teora cintica de gases (Maxwell), y en un sinnmero de casos de la vida real. Adems, toda sucesin finita de experimentos en las cuales cada experimento tiene un nmero finito de resultados posibles, se llama proceso estocstico y es el caso tpico de aplicacin de la regla del producto donde las probabilidades en cada rama son independientes paso a paso; en cambio, si ocurre la secuencia de una rama, es imposible que ocurra la secuencia de otra. O sea, las ramas son excluyentes entre s, y se les puede aplicar el axioma 3 o la regla de la suma para obtener la probabilidad de ms de una rama. Se puede generalizar con: Sean n sucesos Ci todos independientes entre s, entonces se cumple que : P ( C1 C2 C3 ... Cn ) = P(C1) . P(C2) . P(C3) ... P(Cn) Si se realiza una prueba n veces, donde cada resultado es un suceso independiente de los dems, la probabilidad de ocurrencia de un resultado comn a todos ellos es el producto de sus probabilidades. Por ejemplo, en el diagrama del rbol de Grfico 6.1, la probabilidad que salgan 3 caras es igual al producto p . p . p = 1/8, y generalizando al caso de n lanzamientos, la probabilidad de obtener todas caras ser ( )n. Como corolario de la propiedad anterior, se cumple que si los n sucesos son independientes entre s, entonces tambin lo sern para una cantidad menor de sucesos. P ( Cj Cj+1 Cj+2 ... Ck ) = P(Cj) . P(Cj+1) . P(Cj+2) ... P(Ck) Pero debe destacarse que lo contrario no se cumple, es decir si n sucesos son independientes de a pares, en todos los pares posibles, eso no permite afirmar que lo sern de a tres, de a cuatro, etc. Lo mismo para el caso inverso. Todo esto se muestra en los siguientes ejemplos: Ejemplo 1) Una clnica tiene nueve pacientes en la sala de espera. De los cuales 3 son adultos, 3 son nios y 3 son ancianos. Cada paciente, de cada grupo, tiene un nmero de turno que va de 1 a 3. Adems, el paciente adulto con el turno 1, el nio con el turno 2 y el anciano con el 3 son del sexo masculino y los dems del sexo femenino. Sean los sucesos: A : un adulto B : con el turno 1 C : de sexo masculino

Donde:

P(A) = P(B) = P(C) = 1/3

Entonces se pueden obtener las relaciones siguientes: P( A B ) = 1/9 = P(A) . P(B) A y B son independientes entre s P( A C ) = 1/9 = P(A) . P(C) A y C son independientes entre s P( B C ) = 1/9 = P(B) . P(C) B y C son independientes entre s

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-5

Son independientes en todos los pares posibles. Sin embargo, no son independientes entre s tomados los tres a la vez, como puede verse con: P( A B C ) = 1/9 1/27 = P(A) . P(B) . P(C) Ejemplo 2) Se tira un dado una vez, sean los sucesos: A : sacar 4, 5 o 6 B : sacar 2, 3 o 4 C : sacar 1, 2 , 3 o 4 Donde: P(A) = P(B) = 1/2 P(C) = 2/3

P(sacar 4) = P( A B C ) = 1 / 6 = P(A) . P(B) . P(C) O sea, son independientes entre s tomados de a tres; sin embargo ninguno de los pares lo es: P( A B ) = 1/6 1/4 = P(A) . P(B) A y B no son independientes entre s P( A C ) = 1/6 1/3 = P(A) . P(C) A y C no son independientes entre s P( B C ) = 1/2 1/3 = P(B) . P(C) B y C no son independientes entre s Ejemplo 3) En un laboratorio de Biologa Molecular se tienen 9 preparados a base a fragmentos de RNA, cada una de ellos con un fragmento consistente en dos bases como se muestra en el esquema siguiente donde A: adenina, C: citosina, G: guanina y U: uracilo Tubo 1 : AC Tubo 6 : GG Tubo 2 : GC Tubo 7 : GG Tubo 3 : AG Tubo 8 : UU Tubo 4 : CG Tubo 9 : AG Tubo 5 : UU

El bioqumico no conoce la identidad de los fragmentos, y no se puede distinguir de que tubo proviene cada uno de las duplas analizadas. Entonces, habr una particin del espacio muestral S : { AC , GC , CG , AG , GG , UU } donde AC se da en el tubo 1, GC en el tubo 2, CG en el tubo 4, AG en los tubos 3 y 9, GG en los tubos 6 y 7 y por ltimo, UU en los tubos 5 y 8. Sobre esta particin de S se pueden calcular las probabilidades de los 9 casos equiprobables: P (AC) = P (GC) = P(CG) = 1/9 Sean los sucesos y P(AG) = P(GG) = P(UU) = 2/9

A : el fragmento escogido contiene adenina C : el fragmento escogido contiene citosina G : el fragmento escogido contiene guanina U : el fragmento escogido contiene uracilo P(A) = P (AC AG) = P(AC) + P(AG) = 1/9 + 2/9 = 1/3 (por el axioma 3) P(C) = P (AC GC CG) = P(AC) + P(GC) + P(CG) = 1/3 (generalizacin de axioma 3) P(G) = P (GC AG CG GG) = 1/9 + 2/9 + 1/9 + 2/9 = 2/3 (idem anterior) P(U) = P (UU UU ) = P(UU) = 2/9 P(A C ) = P(AC) = 1/9 = P(A) . P(C) entonces A y C son independientes P(A G ) = P(AG) = 2/9 = P(A) . P(G) entonces A y G son independientes P(C G ) = P(CG) = 2/9 = P(C) . P(G) entonces C y G son independientes

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-6

En cambio P (A C G ) = P(0) = 0 P(A) . P(C) . P(G) no son independientes. Se puede interpretar esto diciendo: Si un fragmento contiene adenina, la probabilidad de que contenga citosina o uracilo se mantiene constante; en cambio, si contiene adenina y guanina, es imposible que contenga citosina. Los tres ejemplos anteriores ilustran la cuestin de independencia de a pares y de a triples. Puede verse que, si los pares lo son, no hay garanta que los tripletes lo sea, y viceversa, que lo sean los tripletes, no implica que lo sean de a pares. La nica forma de asegurarse, es aplicando la definicin a cada caso particular en estudio. No se puede ver la independencia de un vistazo

6.3 Condicionalidad
Recordando las ancdotas de la paradoja de Marte, o el concepto gentico de carcter ligado, como as tambin la extraccin de cartas de un mazo sin reposicin, resulta clara la existencia de sucesos que condicionan la ocurrencia de otros. Las relaciones ya vistas de probabilidad resultan insuficientes para tratar estos casos. Se necesita entonces, definir un nuevo concepto: la probabilidad condicional que ocurra un suceso A, luego de que ha sucedido un suceso B, puede ser calculada con: P( A / B ) = P(A B ) / P(B) O lo que es lo mismo, P(A B ) = P( A / B ) . P(B) Se dice entonces, la ocurrencia de B incide en la ocurrencia de A. Por ejemplo, la probabilidad de sacar dos cartas sucesivas de espadas en un mazo de 40 cartas espaolas, se obtiene con: P (sacar 1 y 2 de espadas) = P(2 espada / 1 espada) . P(1 espada) = 9/39 . 10/40 = 0,058 Esto permite encontrar otra manera de definir dos sucesos independientes. Si sucede que se cumple: P( A / B ) = P(A), entonces B no condiciona la ocurrencia de A y resultan independientes. Resumiendo : Condicionalidad : P (A B ) = P ( A / B ) . P(B) Independencia : P (A B ) = P ( A) . P(B) Exclusin : P (A B ) = 0 Como se ve, la condicin ms general es la condicionalidad, y como casos muy particulares de la misma, se da la condicin de independencia o la de exclusin. La consistencia entre esta probabilidad de tipo terica y la emprica se da con el lema de Bernoulli. Si se sabe que en una serie de N experimentos hay resultados que verifican la condicin A, acompaado por la ocurrencia de la condicin B, entonces habr un cierto nmero de pruebas NAB , donde se verifican juntas ambas condiciones; entonces su frecuencia relativa se calcula con : FrAB = NAB / N B

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-7

Pues ahora el nmero total de casos posibles no es ms N sino NB , porque se sabe que debe ocurrir primero B, para que ocurra A, de acuerdo a la condicin impuesta a priori. De todos los casos NB , solo algunos NAB se verificarn junto con A. Entonces, FrAB N Adems, FrAB FrAB P( A / B )

= NAB / N B = ( NAB / N) / ( N B / N ) = Fr(A B) / Fr B = Fr(A B) / Fr B N P(A B ) / P(B) = P( A / B )

Se puede generalizar la definicin de probabilidad condicional de la manera siguiente: Sean n conjuntos C1, C2, C3, ..., Cn pertenecientes al universo , tales que no son mutuamente excluyentes, o sea s C1 C2 C3 ... Cn 0 entonces, P (C1 C2 C3 ... Cn ) = P(C1 ) . P(C2 / C1 ) . P(C3 / C1 y C2) ... Por ejemplo, para obtener la probabilidad de sacar flor de espadas en un juego de truco, dando las tres primeras cartas seguidas: P(flor espadas) = (10/40) . (9/39) . (8/38) = 0,0012

6.3.1 Simulacin para un test clnico

Se pude realizar una simulacin con probabilidades condicionales siguiendo los lineamientos del experimento de Bernoulli. Imaginando que se tienen 20.000 fichas, la mitad rojas y la otra mitad blancas, cada una numerada consecutivamente de 1 a 20.000. Esto simula a 10.000 individuos enfermos (rojas) y el resto sanos (blancas), como si fueran la poblacin general. El supuesto principal es que la capacidad de la prueba clnica para detectar a los enfermos y a los sanos es constante en toda la poblacin. Y puede ser expresada con por ejemplo: 1) El mtodo es capaz de detectar correctamente a 3 enfermos de cada 4 enfermos. 2) El mtodo es capaz de detectar correctamente a 8 sanos entre 10 de ellos. Esto significa que la sensibilidad es S = = 0,75 y la especificidad es E = 8/10 = 0,8. Esta capacidad es la misma para todo individuo de la poblacin, y esos valores son los tericos para dicha poblacin, que tiene una prevalencia = 0,5. Luego se marcan al azar a las fichas para que cumplan con este requisito: 3 de cada 4 rojas se las identifica como verdadero positivo (vp), y 8 de cada 10 blancas se las identifica como verdadero negativo (vn). Luego cada ficha tendr un nmero propio (como si fuese nombre y apellido del individuo) y su verdadero estado (uno de estos cuatro: vp, vn, fp y fn). Caso 1: Se mezclan las fichas rojas y blancas, y de entre ellas se eligen al azar a N = 4.000. Luego se cuentan los casos encontrados y se tendrn las cuatro frecuencias experimentales: vp : nmero de casos encontrados de fichas rojas con diagnstico verdadero positivo. vn : lo mismo que arriba pero de las fichas blancas (verdadero negativo).

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] fp : la frecuencia encontrada de fichas rojas con diagnstico falso. fn : lo mismo que arriba pero para las fichas blancas.

6-8

Con estas cuatro frecuencias se puede armar una Tabla de diagnstico experimental. Pero, por el lema de Bernoulli, como N = 4.000 es grande se sabe estas frecuencias experimentales tendern a sus respectivos valores tericos. Y entonces, con los valores experimentales se pueden obtener los ndices clnicos experimentales, para ver que tanto se acercan a los valores tericos. Por ejemplo, se puede deducir que: S = P (VP/ TE) es la probabilidad condicional de encontrar un verdadero positivo, sabiendo que el individuo est enfermo. Lo que se puede expresar como: S = P (VP TE ) / P (TE) y en otros trminos sera: S = nmero de fichas rojas y positivas / nmero total de fichas rojas Anlogamente, E = nmero total de fichas blancas y negativas / nmero total de fichas blancas. De esta forma se pueden obtener experimentalmente los valores de S, E, Y, LR+ y LR- muy parecidos a los esperados. Adems la prevalencia experimental p es aproximadamente igual a la terica p = 0,5. Mientras que los valores predictivos y la eficiencia obtenidos son similares a los esperados cuando la prevalencia p = 0,5. Se puede repetir muchas veces esto hasta convencerse de que el lema de Bernoulli funciona bien. Caso 2: Se separan las fichas rojas y blancas en dos conjuntos, y se eligen al azar 2.000 fichas rojas y otras tantas blancas, para tener un total de N = 4.000 muestras en total. La diferencia con el caso anterior es que la muestra ha sido estratificada en mitad enfermos y mitad sanos, antes de hacer la seleccin al azar. Luego se cuentan los casos seleccionados en sus cuatro resultados posibles y se puede armar otra Tabla de la Verdad experimental. Los resultados son muy similares a los del caso anterior. Para estudiar que pasa si se cambia el valor de la prevalencia en la muestra, se puede comenzar por ejemplo eligiendo 400 fichas rojas y 3.600 blancas. Esto simula el llamado diseo de estudio del tipo Caso-control, donde la relacin es de 1 caso cada 9 controles. O sea, una prevalencia simulada en esta muestra p = 0,1. Se cuentan las frecuencias halladas y se arma la Tabla de la Verdad experimental, con lo que se calculan todos los ndices clnicos. Los resultados son que: a) S, E, Y, LR+ y LR- son iguales a los anteriores. b) A y valores predictivos cambian. Si se van simulando distintas prevalencias p = 0,2; 0,3; ...; 0,9 las consecuencias son iguales a las dos anteriores (a) y (b). Se puede repetir esto tantas veces como se quiera hasta convencerse que: Hay un grupo de ndices que no varan no importa la manera en que se tome la muestra (los llamados parmetros o caractersticas internas del mtodo), y hay otros que varan con la prevalencia de una manera muy similar a la explicada en el captulo 4. Si se grafican los valores variables,

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-9

se pueden encontrar las mismas curvas detalladas en los Grficos 4.2 y 4.3. Esto demuestra experimentalmente el razonamiento efectuado antes. Caso 3: Se separan las fichas en dos grupos, uno con los resultados positivos (15.500 fichas) y otro con los negativos (4.500 fichas) sin que importe el color de las mismas. Luego se eligen al azar 2.000 casos de positivos y otros tantos de negativos, de manera tal que el tamao de la muestra sea N = 4.000. Es decir, que ac se ha estratificado la muestra en positivos y negativos, para simular el llamado estudio por cohortes. En este caso, la relacin entre positivos y negativos elegida es P = 50%. Se cuentan los resultados obtenidos para obtener las cuatro frecuencias, con las cuales se arma la Tabla de la Verdad experimental para este caso. Los resultados obtenidos son p = 0,5, y los mismos resultados obtenidos en el Caso 1. Luego para ver la influencia del porcentaje de positivos y negativos seleccionados, se eligen una serie de valores P = 10%, 20%, ..., 90% y se vuelven a obtener los mismos resultados anteriores. De donde se puede concluir que: No importa el porcentaje de positivos y negativos, los ndices clnicos no se alteran. En otras palabras, no interesa la manera de estratificar la muestra basada en los resultados del diagnstico, nada cambia (Ver Cuadro 5.2 del captulo anterior). En conclusin, la manera de seleccionar las muestras no afecta los ndices clnicos paramtricos como S, E, IY y Likelihood Ratios. Los nicos afectados son la eficiencia y las valores predictivos por el efecto de la prevalencia simulada en los estudios del tipo caso-control. Todo esto desde el punto de vista experimental, la explicacin desde un punto de vista terico se alcanza a travs del teorema de Bayes como se explica a continuacin.

6.4 Teoremas de Probabilidad Total y de Bayes

En el apartado 5.2. se puede ver el Diagrama de Venn para la particin de un suceso cualquiera A por un grupo de n sucesos Ci. y en la propiedad (5) vista en 5.3.1, se puede ver la probabilidad del suceso P(A), expresada como la sumatoria de las probabilidades de sus trozos componentes P ( A Ci ), formados por la particin del suceso. Ahora bien, reemplazando estas probabilidades compuestas con la definicin de probabilidad, se tiene la expresin del Teorema de la Probabilidad Total. Sean n sucesos pertenecientes al mismo espacio muestral S, tales que particionan al suceso A (ver Grfico 5.2) entonces se cumple que : (Ci Cj) A = 0 i j
n

P( A ) = P( A Ci )
i=1

Ci A
i=1

Reemplazando P( A Ci ) por la definicin resulta:

P( A ) = P(Ci ) . P(A / Ci )
i=1

Teorema de Probabilidad Total

Como una consecuencia del teorema anterior, haciendo substituciones adecuadas, se obtiene el otro teorema. En efecto, de la definicin resulta :

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] P(Ci ) . P(A / Ci ) = P( A Ci ) = P( Ci A ) = P(A ) . P(Ci / A) Despejando, P(Ci / A) = { P(Ci ) . P(A / Ci ) } / P(A )

6-10

Y reemplazando P(A ) con el Teorema de Probabilidad Total, se obtiene el Teorema de Bayes P(Ci ) . P(A / Ci ) P(Ci / A) =
n

P(Ci ) . P(A / Ci )
i=1

Donde : P(Ci ) : son las llamadas probabilidades a priori por ser las que tienen los sucesos Ci antes de saber que ha ocurrido el suceso A. P( A Ci ) : son las probabilidades conjuntas P(A / Ci ) : son las probabilidades condicionales P(Ci / A) : son las llamadas probabilidades a posteriori porque son las que tienen los sucesos Ci, luego de saber que ha ocurrido el suceso A. Para ilustrar estos conceptos se desarrollan los ejemplos siguientes: Ejemplo 1) En una sala de una clnica especializada solo se tratan tres tipos de enfermedades. Se sabe que en promedio ingresan un 50% de pacientes con la afeccin K, 30% con la enfermedad L y el resto con la afeccin M (datos obtenidos con las estadsticas de los ltimos dos aos). Realizando un relevamiento de historias clnicas se dedujo que un 70% de los ingresados con la enfermedad K se curan, mientras que para L y M, se obtuvieron 80% y 90% respectivamente. En la fecha, se dio de alta a un paciente: Cul es la probabilidad que se haya internado por la enfermedad K ? Sean P(C1) = 0,5 y la P(C / C1) = 0,7 C1 : pacientes con la enfermedad K . C2 : pacientes con la enfermedad L . P(C2) = 0,3 y la P(C / C2) = 0,8 C3 : pacientes con la enfermedad M . P(C3) = 0,2 y la P(C / C3) = 0,9 C : pacientes curados y dados de alta. C / Ci : pacientes curados y dados de alta que se internaron con la afeccin i

Con los datos anteriores se puede armar la tabla del Tabla 6.1 Tabla 6.1 : Cuadro bayesiano para resolucin de problemas.
Sucesos C1 C2 C3 Totales A priori (a) 0,5 0,3 0,2 1 Condicional (b) 0,7 0,8 0,9 Conjunta (c)=(a) . (b) 0,35 0,24 0,18 0,77 A posteriori (d)=(c)/ (c) 0,4546 0,3117 0,2337 1

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-11

Las probabilidades a priori, se colocan en la primer columna de datos (a). Como verificacin, el total de las mismas debe ser 1. Las probabilidades condicionales se colocan en la segunda (b). Luego se calculan las probabilidades conjuntas, multiplicando las dos anteriores entre s. O sea, la columna (c) es igual a (a) .(b) La sumatoria de esta columna, es la probabilidad total de que el paciente se cure P(C) = 0,77. Finalmente, se pueden calcular las probabilidades a posteriori, dividiendo cada trmino de la columna (c) por la probabilidad total igual a 0,77. La respuesta a la pregunta del problema, se halla en el primer casillero de la columna (d). Esto es, la probabilidad de que el paciente dado de alta haya ingresado con la enfermedad K es de 45,46%. Ejemplo 2) En una farmacia se sabe por experiencia que el 60% de su clientela es de sexo femenino. La estadstica histrica muestra que un 4% de los hombres gasta ms de $100 en una compara, mientras que solo el 1% de las mujeres lo hace. Se elige al azar una compra mayor de $100 y se desea saber cul es la probabilidad de que el cliente sea mujer. Definiendo los sucesos: H : hombre es P(H) = 0,4 M : mujer es P(M) = 0,6 C : compra mayor a $100

P(M) P(C/M) La probabilidad pedida es: P(M/C) = P(M) P(C/M) + P(H) P(C/H) (0,6) (0,01) P(M/C) = (0,6) (0,01) + (0,4) (0,04) Hay un 27,3% de probabilidad que el cliente sea una mujer. = 3/11 = 0,273

6.5. Diagnstico y el Teorema de Bayes

Los cuatro casos posibles al efectuar un diagnstico, basndose en la evidencia suministrada por el resultado de un anlisis clnico, fueron presentados en el Tabla 5.1. (apartado 5.3.3). A la luz de los nuevos conceptos, conviene volver a revisar tal deduccin, pero tratando de entender el significado de los ndices clnicos, usando el concepto de la probabilidad condicional. VPP : Se calcula con la frmula del Teorema de Bayes. O sea, es una probabilidad bayesiana a posteriori y se puede imaginar como la probabilidad de diagnosticar al paciente en forma correcta un resultado positivo, sabiendo que el resultado de su anlisis dio + Permite discriminar de entre todos los resultados positivos, la fraccin de resultados correctos. P(C1 TP ) VPP =
2

= P(C1 / TP )
i=1

P (Ci TP )

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] P(C1 ) . P(TP / C1)
VPP

6-12

= P(C1 ) . P(TP / C1) + P(C2 ) . P(TP / C2)

= P(C1 / TP )

Sensibilidad : es la probabilidad condicional P(TP / C1) de que un paciente sea diagnosticado como enfermo, cuando se sabe que en realidad est enfermo. Prevalencia : es la probabilidad de enfermarse P(C1 ). O sea, es la probabilidad de encontrar la enfermedad en la poblacin. Sensibilidad . Prevalencia : El producto de ambos ndices es P(C1 TP ), una probabilidad conjunta que significa, la probabilidad de que un paciente este enfermo y al mismo tiempo su diagnstico haya dado positivo. Difiere del concepto anterior, pues no se parte de un hecho condicionante conocido. Es la probabilidad de obtener un verdadero positivo P (VP). P(VP) = Sensibilidad . Prevalencia = P(C1 TP ) = P(TP / C1) . P(C1 ) Especificidad : Es la probabilidad condicional P(TS / C2) de que un paciente sea diagnosticado como sano, cuando se sabe que en realidad est sano. Probabilidad de estar sano : Es el complemento de la Prevalencia P(C2 ) = 1 - P(C1 ). Adems: P(TP / C2) = P(C2 TP ) / P(C2 ) = P (FP) / P(C2 ) = (fp /N ) / (TS /N) = fp / TS = (TS vn)/TS P(TP / C2) = 1 (vn /TS) = (1 especificidad) : Complemento de Especificidad Entonces, P(C2 ) . P(TP / C2) = (1- especificidad) (1 prevalencia) O bien, P (C1 TP ) = (1 Prevalencia) ( 1- Especificidad) = P(FP) El Teorema de Bayes para los ndices clnicos se puede escribir con: [ Prevalencia . Sensibilidad]
VPP

= P (C1 / TP) [1 Prevalencia)(1- Especificidad)]+ [ Prevalencia . Sensibilidad]

VPP = S p / [(1-p) (1-E) + p S] = 1 / [ 1 + (O . LR+)-1] donde O = p / (1 p) y anlogamente: VPN = 1 / [1 + (O . LR-)] frmulas ms sencillas de recordar el Teorema de Bayes. Notar que los valores predictivos son funcin de la prevalencia, y reemplazando los valores del problema visto en el Grfico 4.2 anterior, con S = 0,9 y S = 0,75, se verifican tericamente las dos curvas mostradas. Adems, se verifican las relaciones experimentales halladas en 6.3.1, con este modelo terico. O sea que el Teorema de Bayes puede ser comprobado en forma emprica.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-13

6.5.1 Odds a posteriori

Aplicando el Teorema de Bayes a los nuevos ndices clnicos, se pueden calcular los Odds a posteriori. Esto es, el Odds de la enfermedad luego de hacer el test clnico. Ya sea que los resultados encontrados modifiquen o no los Odds a priori disponibles. Esto se usa cuando hay un dilema en el diagnstico a efectuarle al paciente y no se est seguro de cmo proceder. Es virtualmente imposible recordar la Sensibilidad y Especificidad de cada test clnico efectuado para hacer un diagnstico. Sin embargo, cuando hay un dilema con el diagnstico a efectuar, es muy til usar la informacin de S; E; LR+; LR- y los Odds a priori como gua a seguir. En especial, cuando se hacen varios tests clnicos en secuencia y el Odds a posteriori del primero, se usa como a Odds a priori para la segunda prueba clnica y as sucesivamente. Un cuidadoso anlisis de la informacin contenida en un Odds a priori, arroja luz sobre cual debera ser el paso siguiente hacia el diagnstico. O sea, cul debiera ser la prueba clnica a ordenar. Como se vio en el captulo anterior, el Odds de la enfermedad se calcula como el cociente entre la probabilidad de enfermedad y su complementaria. Como esta informacin se dispone al armar la tabla de decisin para el diagnstico, se define como: Odds a priori = TE / TS (para la enfermedad) El Odds a posteriori se calcula con el Odds del valor predictivo de positivos: Odds a posteriori = VPP / (1 VPP) = (p. S / X) / [( 1 - (p . S / X)] Donde X = p S + (1 E) (1 p), simplificando queda Odds a posteriori = p . S / [ X (p . S)] = p . S / [ p . S + (1 E) (1 p) - p . S ] Odds a posteriori = p . S / [(1 E) (1 p)] y reagrupando resulta: Sensibilidad x Prevalencia Odds a posteriori = Sensibilidad Prevalencia

= x (1-Especificidad)(1-Prevalencia) (1 Especificidad) (1 Prevalencia)

Odds a posteriori = LR+ . Odds a priori

Concepto mucho ms sencillo de recordar y usar que el Teorema de Bayes. El uso de los Odds a posteriori tanto en el caso de positivos como de negativos, se ejemplifica a continuacin: Ejemplo 1) Para diagnosticar una enfermedad en la arteria coronaria, un cardilogo realiza un test de tolerancia a un ejercicio fsico programado. De sus historias clnicas con resultados verificados escoge a 147 pacientes con problemas coronarios y los clasifica de acuerdo a su diagnstico, junto con el estado real que se pudo verificar despus. De esta forma, arma una Tabla de diagnstico para ver que tan bien trabaja (datos tomados del trabajo de Simel). Los resultados fueron:

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] Enfermedad Coronaria Test de tolerancia Si No Total (+) 73 9 82 al ejercicio fsico (-) 28 37 65 Total 101 46 147 Se pueden calcular los principales ndices clnicos con: Sensibilidad = vp / TE = 73 / 101 = 0,72 Especificidad = vn / TS = 37 / 46 = 0,80 LR+ = Sens. / ( 1- Espec) = 0,72 / 0,2 = 3,6 LR- = (1- Sens.) / Espec. = 0,28/0,80 = 0,35

6-14

Prevalencia = TE / N = 101/147 = 0,69 Eficiencia = (vp + vn) / N = (73+37)/147= 0,75 PPV = vp / T+ = 73 / 82 = 0,89 NPV = vn/ T- = 37 / 65 = 0,57

Ejemplo 2) Luego de este trabajo, viene un paciente de 52 aos de edad que tiene antecedentes familiares importantes de enfermedades coronarias y presenta los sntomas de una tpica angina inducida por esfuerzo. Se desea saber si el test de tolerancia al ejercicio fsico influir en el diagnstico. El cardilogo estima en un 80% la sospecha de que tenga esta enfermedad y usando la informacin obtenida en el ejemplo anterior, calcula: Su estimacin de un 80% implica un Odds de 4 a 1 de que tenga la enfermedad. Y usando sus antecedentes vistos en el ejemplo anterior como referencia poblacional, deduce que: . Si el paciente da (+) con el test, el Odds a posteriori ser de 4 x 3,6 = 14,4 su chance de estar enfermo. Esto implica que el Odds sube de 4 a 1 hasta 14,4 a 1 (o sea, de un 80% a un 93,5%). . Si el paciente da (-) con el test, el Odds a posteriori ser de 4 x 0,35 = 1,4 . Esto implica que el Odds baja de 4 a 1 hasta 1,4 a 1 (o sea, de un 80% a un 58%). Se concluye que un resultado (+) no influye mucho en el diagnstico de enfermedad coronaria y adems, un resultado (-) tampoco aade mucha ms informacin. Por lo tanto, no conviene indicarle que se haga un test de tolerancia al ejercicio fsico porque no ayuda mucho al diagnstico. La probabilidad pre-test no vara demasiado y no agregar informacin importante. Ejemplo 3) Otro hombre de 52 aos de edad, robusto en apariencia tiene dolores en el pecho desde hace unos meses. No encuentra relacin entre dolor y esfuerzo fsico, adems carece de los sntomas asociados. Puede un test de tolerancia al ejercicio fsico ser de utilidad para diagnosticar una enfermedad coronaria, al sospechar que el dolor es una seal de una angina no tpica ? Se sabe de los libros de texto que la prevalencia para una angina no tpica es del 48%. La estimacin de un 48% implica a priori un Odds de 0,92 a 1 de que tenga una angina no tpica. Los LR no varan porque Sensibilidad y Especificidad no dependen del paciente sino de la poblacin tomada como referencia. Usando los antecedentes del ejemplo (1) anterior como referencia, se deduce que: . Si el paciente da (+) con el test, el Odds a posteriori ser de 0,92 x 3,6 = 3,3. Esto implica que el Odds sube de 0,92 a 1 hasta 3,3 a 1 (o sea, de un 48% a un 77%).

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-15

. Si el paciente da (-) con el test, el Odds a posteriori ser de 0,92 x 0,35 = 0,32. Esto implica que el Odds baja de 0,92 a 1 hasta 0,32 a 1 ( o sea, de un 48% a un 24%). Se concluye que un resultado (+) o (-) influye mucho en el diagnstico de enfermedad coronaria. Por lo tanto, conviene indicarle que se haga un test de tolerancia al ejercicio fsico porque sera de gran ayuda para el diagnstico. En este caso la informacin pre-test resultar enriquecida y se ve la conveniencia de efectuar el ejercicio a la tolerancia fsica en ese paciente.

6.5.2 Simplificacin del Teorema de Bayes

Una forma ms sencilla de recordar el Teorema de Bayes es usando las relaciones: NPV = 1 / {1 + [ (LR- . O ) ]} y PPV = 1 / {1 + [1 / (LR+ . O ) ]}

En la bibliografa clnica (JAMA) la recomendacin actual es usar la metodologa siguiente para calcular las probabilidades Post-test (a posteriori) a partir de las probabilidades Pre-test (a priori): Paso 1: En forma subjetiva el clnico asigna una probabilidad a priori, luego de estudiar al paciente, de acuerdo a su experiencia en este tipo de casos. Esto es, la probabilidad sospechada que el mismo est enfermo (Pre-test), que en el Ejemplo 2 anterior era 80%. Paso 2: Luego transforma esta probabilidad en Odds (0,8/0,2 = 4). Entonces tiene el llamado Pretest Odds, que en el ejemplo vale 4 : 1 Paso 3: A continuacin aplica el Teorema de Bayes para obtener los Odds a posteriori, denominados Post-test Odds, que para el ejemplo ser: 14,4 Paso 4: Transforma este Odds en probabilidad con la relacin p = O / (O +1) resultando el valor de la llamada probabilidad Post-Test, que en el ejemplo es: 93%. Paso 5: De acuerdo al resultado obtenido en el paso anterior, decide si le conviene, o no, hacerle el test al paciente y obtiene su primera conclusin. En el ejemplo, como la probabilidad sube de 80% a 93,5% decide que no ayudara en mucho el hacerle la ergometra al paciente. Paso 6: Para el caso en que el paciente de (-) en el test, aplica nuevamente el Teorema de Bayes para obtener el Odds a posteriori en el caso de los negativos. Es decir, multiplica el Pre-Test Odds de estar enfermo (4 : 1), por el Likelihood ratio de negativo (0,35) y obtiene 1,4 = 4 x 0,35. Paso 7: Transforma este Odds en probabilidad y obtiene la probabilidad a posteriori de no estar enfermo (Post-test para el caso de negativo) de un 53%. Paso 8: De acuerdo al resultado anterior decide si le conviene hacerle el test al paciente, en el caso de que este estuviera sano. Como la probabilidad antes de hacerle el test es del 80% y luego de hacerle la ergometra baja al 53%. Le puede ayudar mucho el hacerla, pero por otro lado sera riesgosa si el paciente estuviera enfermo como l sospecha (80%). Concluye finalmente, que no es conveniente efectuar la ergometra.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-16

Como puede verse no es un procedimiento tan sencillo de seguir, a pesar de la simplificacin hecha con el Teorema de Bayes. Un estudio realizado en Suiza en marzo del 2002 a ms de 600 concurrentes a un curso de especializacin, mostr que solo 30% de ellos haba odo de este procedimiento y tan solo un 10% lo aplicaba en su prctica diaria. No parece lgico pedirle al clnico que tenga que hacer estos clculos cada vez que estudie a un paciente. Por ese motivo, la ctedra propuso un mtodo grfico, que consta de un solo paso, y que no requiere del conocimiento de conceptos tales como Pre y Post-Odds de sanos y enfermos, ni del Teorema de Bayes. Esta idea se basa en dos grficos, donde se muestra la variabilidad de las probabilidades a posteriori, partiendo de la probabilidad a priori (un grfico para el caso de positivos y otro para el de negativos). El concepto se basa en las siguientes relaciones: Caso positivo: La probabilidad Pre-test y Post-test se relacionan con: Odds a posteriori (+) = LR+ Odds a priori (+) = [S / (1-E)] x [p / (1-p)] = vp / fp O sea, Odds a posteriori (+) = PPV / (1- PPV) De donde se puede deducir que la Post-test probabilidad de estar enfermo cuando el resultado del test fue positivo es simplemente el VPP. Caso negativo: La probabilidad pre-test y Post test se relacionan con: Odds a posteriori (-) = LR- Odds a priori (+) = [(1 S) / E] x [p / (1 p)] = fn / vn Odds a posteriori (-) = (1 NPV) / NPV De donde se puede deducir que la Post-test probabilidad de estar sano cuando el resultado del test fue negativo es simplemente (1 NPV). Entonces, recordando la simulacin para verificar experimentalmente el Teorema de Bayes, se pueden graficar las variabilidades de los valores predictivos con una probabilidad cualquiera (tomada como la prevalencia del estudio antes, y que ahora es sencillamente la probabilidad asignada por el clnico al paciente en forma subjetiva) Grfico 6.2. Probabilidades Pre-test y Post-test
Probabilidad si el resultado es (+)
100 80

60 40 20 0 0,00

0,20

0,40

0,60

0,80

1,00

Post-Test

Post Test (%) 0,00 28,57 47,37 60,67 70,59 78,26 84,38 89,36 93,51 97,01 100,00

Pre-Test (%) 0 10 20 30 40 50 60 70 80 90 100

Pre-test

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-17

Probabilidad si el resultado es (-)

100 80
Pret-Test

60 40 20 0 0 20 40 60 80 100
Post-Test

Post Test (%) 0,0 3,7 8,0 13,0 18,9 25,9 34,4 45,0 58,3 75,9 100,0

Pre-Test (%) 0 10 20 30 40 50 60 70 80 90 100

Se puede observar de estos grficos, que entrando con la sospecha del clnico del ejemplo anterior (80%) se obtienen directo ambas probabilidades Post-test, sin hacer ninguna cuenta. Para obtener este par de grficos en forma rpida, la ctedra ha desarrollado un programa en Excel para computadoras, donde entrando con los valores de sensibilidad y especificidad se pueden obtener directamente ambos grficos, y luego imprimirlos para tenerlos disponibles. Sin embargo, a pesar de esta nueva simplificacin del problema, no es razonable esperar que cada clnico tenga a mano el par de grficos para decidir si le efecta la paciente el test. Por lo tanto, se presenta a continuacin una manera simplificada de hacer todo esto de manera sencilla, rpida y fcil de recordar: La idea es jugar con el par de grficos para derivar criterios clnicos generales, que a modo de gua faciliten la tarea de ver si conviene hacer un test clnico para un caso individual. A modo de ejemplo se puede usar el caso de la ergometra anterior: Paso 1: Se toma una probabilidad subjetiva alta de que el paciente est enfermo cuando viene a la consulta, como ser del 80%. Mirando en los grficos se obtienen las dos probabilidades posteriores al test asociadas de un 93,5% si en realidad est enfermo, y de un 58,3% si estaba sano. Paso 2: Se toma una probabilidad subjetiva baja respecto a que el paciente est enfermo, como ser del 20%. Ahora las probabilidades posteriores al test son del 47,4% si estaba enfermo y del 8% si estaba sano. Paso 3: Se toma una probabilidad subjetiva intermedia, como ser del 50% (esto significa en el fondo que el clnico no tiene una sospecha clara en ningn sentido, sera como el tirar una moneda al aire, o bien usar estos casos para cuando no se tiene mucha idea acerca del estado real del paciente). Mirando en los grficos se puede obtener una probabilidad Post-test del 78,3% si en realidad estaba enfermo, y del 26% si estaba sano. De estos 3 pasos se pueden deducir unas reglas generales, a modo de protocolo, para saber como proceder en este tipo de casos. Por ejemplo, las reglas generales pueden ser: 1) Si la sospecha de que el paciente est enfermo es alta, no conviene hacerle la ergometra. 2) Si la sospecha de que est enfermo es baja, conviene efectuar la ergometra. 3) Si no se tiene una idea clara del estado del paciente conviene hacer el test.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-18

6.6 Estudio de la independencia en tablas de riesgo

En el primer captulo se vieron los estudios de riesgo, donde el objeto era ver el efecto de cierto factor (de exposicin, de proteccin, etc.) sobre la condicin buscada. Es el tpico estudio epidemiolgico que se clasificaba en: Caso-control, Cohortes o RCT. En todos ellos se usaba una tabla de 2 x 2 para volcar los datos del estudio como la siguiente: Tabla 6.2. Tabla de riesgo: datos observados Condicin observada Enfermos Sanos a c a+c b d b+d

Factor Expuesto No expuesto Total

Total a+b c+d N

Como puede verse, se trata de una particin de la poblacin usada en el estudio en cuatro conjuntos bsicos, mutuamente independientes y colectivamente exhaustivos. Esta tabla est construida con los datos observados. Haciendo el siguiente supuesto: . El factor de riesgo es independiente de la condicin observada. O bien, . El factor y la condicin no estn asociados. Aqu se habla de asociacin estadstica, que no es una asociacin del tipo causa-efecto, sino que podra llegar a serlo. Es muy importante tener muy en claro esta diferencia, porque es comn ver que se confunde una cosa con la otra. Entonces, bajo ese supuesto se pueden calcular las frecuencias esperadas, usando la teora de que hay independencia estadstica, como se muestra en la tabla siguiente: Tabla 6.3. Tabla de riesgo: datos esperados tericamente si hay independencia Condicin observada Enfermos Sanos (a +c) (a + b)
N

Factor Expuesto No expuesto Total

Total a+b c+d N

(b +d) (a + b)
N

(a +c) (c + d)
N

(b +d) (c + d)
N

a+c

b+d

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-19

Notar que la frecuencia esperada de cada celda, se saca con el producto de sus respectivos totales marginales, dividido el tamao muestral total N. La manera de demostrar esto es como sigue, sean los sucesos siguientes: E : la condicin de enfermo. S : la condicin de sano. X : la condicin de expuesto. Y : la condicin de no-expuesto

Los conjuntos siguientes son los cuatro casos posibles: (E X ): el conjunto de los enfermos que estuvieron expuestos, cuya frecuencia observada es a (S X ): el conjunto de los sanos que estuvieron expuestos, cuya frecuencia observada es b (E Y ): el conjunto de los enfermos que no estuvieron expuestos, con frecuencia observada c (S Y ): el conjunto de los sanos que no estuvieron expuestos, cuya frecuencia observada es d Sus probabilidades se pueden estimar con: P (E X ) = a* / N P (E Y ) = c* / N P (S X ) = b* / N P (S Y ) = d* / N

Donde el asterisco denota que son valores tericos y no observados. Luego, para que haya independencia se tiene que cumplir la condicin: P (E X ) = P (E Y ) = P (S X ) = P (S Y ) = P (E ) . P (X ) = [(a + c) / N] . [(a + b) / N] = a* / N P (E ) . P (Y ) = [(a + c) / N] . [(c + d) / N] = c* / N P (S ) . P (X ) = [(b + d) / N] . [(a + b) / N] = b* / N P (S ) . P (Y ) = [(b + d) / N] . [(c + d) / N] = d* / N

Despejando y simplificando se obtienen las frecuencias esperadas de la Tabla 6.3 anterior. Por ejemplo, si las frecuencias observadas fueron: Condicin observada Enfermos Sanos 20 50 70 80 150 230

Factor Expuesto No exp. Total

Total 100 200 300

Las frecuencias esperadas si hay independencia sern: Condicin observada Enfermos Sanos 23,3 46,7 70 76,7 153,3 230

Factor Expuesto No exp. Total

Total 100 200 300

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-20

6.7 Probabilidad hipergeomtrica

Se trata de un caso muy frecuente en los muestreos de aceptacin donde se debe decidir si el comprador acepta comprar un lote de mercadera, a partir del anlisis de una pequea muestra del lote. Los profesionales que trabajan en el sector Control de Calidad de la industria farmacutica, qumica, cosmticos, alimentos, etc. suelen aplicarla desde otro punto de vista. All interesa saber si se da por bueno un lote de produccin, a partir del control de una muestra del mismo. O sea, el control no lo hace el consumidor sino el fabricante. En ambos casos, la idea central es la misma, no se pueden revisar todas las piezas fabricadas, ya sea porque llevara mucho tiempo, o porque el ensayo es destructivo, o porque es muy caro, etc. Existen Normas IRAM para el control de calidad, que se usan como una solucin de compromiso entre los intereses encontrados de comprador y vendedor. Por un lado, el comprador quiere minimizar su riesgo de comprar un lote malo aumentado el tamao de la muestra a revisar. Y por el otro lado, el vendedor desea minimizar el costo del control revisando la menor cantidad posible de piezas. Entonces, la norma ayuda a definir el tamao de la muestra a controlar, que es el cuello de botella de toda negociacin de esa naturaleza, a partir de riesgos de compra y venta aceptables para ambas partes. Tal riesgo se calcula a partir de la probabilidad hipergeomtrica. Sea un lote de produccin de tamao N que se lleva al laboratorio de Control de Calidad para su revisin, antes de lanzarlo a la venta. El profesional a cargo, sabe por su larga experiencia, el porcentaje de piezas falladas que encontrar al efectuarle una serie de anlisis que permitan dos conclusiones: pieza aceptada o pieza rechazada. Multiplicando tal porcentaje de fallas p Por el tamao del lote N, obtiene el nmero esperado R de piezas rechazadas. De acuerdo a las normas vigentes, se elige una muestra control de tamao n. Cuanto vale la probabilidad de encontrar exactamente r piezas falladas en la muestra control ? Tal pregunta se responde con la probabilidad hipergeomtrica denotada con PH (r / n, N, R ). Como toda probabilidad, esta tambin resulta el cociente entre el nmero de casos favorables y el nmero total de casos posibles. El numerador son todos los casos donde al revisar una pieza se la rechaza. Hay que hacer un conteo ordenado, pues habr C (R , r) combinaciones diferentes de encontrar las r piezas falladas de la muestra, dentro de las R piezas totales del lote de produccin. Pero a su vez, esto ocurre con cada una de las formas posibles de encontrar la (n -r) piezas buenas, restantes de la muestra, de entre todas las piezas buenas del lote ( N-R). O sea, C (N-R , n-r). En sntesis, el nmero total de casos donde hay rechazo se obtendr con el producto de ambos valores, esto es: C (R , r) . C (N-R , n-r). El denominador esta dado por todas las combinaciones posibles que existen al tomar n elementos, de un total de N elementos del lote: C (N , n )

C ( R , r) . C ( N-R , n-r) PH (r / n, N, R ) = C (N , n )

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

6-21

Ejemplo 1) Se fabric un lote de 1000 ampollas conteniendo un medicamento liofilizado. Se sabe que un 0,2 % tiene problemas con el cierre hermtico del vidrio. Se elige al azar una muestra control de 10 ampollas. Cunto vale la probabilidad de encontrar una fallada ? PH ( r=1 / n=10, N=1000, R=2) = C(2 , 1) C ( 998 , 9 ) / C (1000 , 10 ) 2 ( 998 )! (990)! 10! PH ( r=1 / n=10, N=1000, R=2) = (989)! 9! 1000! = 989! . 9! . 1000 . 999 . 998! 2 . 998! . 990 . 989! .10. 9!

PH ( r=1 / n=10, N=1000, R=2) = 0,0198 La probabilidad de no encontrar ninguna fallada ser PH ( r=0 / n=10, N=1000, R=2) = C(2, 0) . C (998 , 10) / C (1000 , 10) = 0,98 En sntesis, hay un 98% de probabilidades de no encontrar ampollas falladas y 1,98% de encontrar una sola fallada. Entonces habr: (100-98-1,98)% =0,02% de encontrar dos o ms falladas. Ejemplo 2) El mismo caso de sacar tres barajas de espadas del mazo, visto antes y resuelto con el concepto de probabilidad condicional, ahora se puede resolver con: 10! 37! 3! PH ( r=3 / n=3, N=40, R=10) = C(10 , 3) . C (30 , 0) / C (40 , 3) = 40! 7! 3! PH ( r=3 / n=3, N=40, R=10) = (10 . 9 . 8 ) / (40 . 39 . 38) = 0,012

Ejemplos 3) Un mdico suministra un frmaco a siete enfermos de similares caractersticas. Seis de ellos experimentan una gran mejora, en cambio el restante permanece igual. Por otra parte, durante todo el tiempo transcurrido se ha controlado a un grupo de cinco pacientes, de caractersticas similares a los otros sometidos al tratamiento. La diferencia es que, a este grupo control se le ha suministrado un placebo. Result que slo uno mejor, mientras los otros cuatro permanecieron iguales. El problema es calcular si la mejora observada en el grupo tratado, se debe al azar o a la accin del medicamento. La probabilidad hipergeomtrica puede emplearse en estos casos para contestar tal pregunta. En efecto, tomando en conjunto total de pacientes (N=12), de los cuales (n=7) fueron tratados; los resultados finales fueron (R=7) han mejorado y entre stos (r=6) fueron los medicados, mientras que al restante (R-r =1) se le haba suministrado un placebo inocuo para tratar la enfermedad. Se puede presentar lo mismo en forma esquemtica con el diagrama del Grfico 6.3. Asumiendo que los pacientes fueron distribuidos al azar entre ambos grupos, para evitar cualquier tipo de tendencia, y tratando de mantener todas sus caractersticas lo ms parecidas posibles para no introducir fluctuaciones extraas. Se puede asumir, que se trata de un problema de n extracciones al azar sin reemplazamiento, de un grupo de tamao N.

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] Grfico 6.2 Diagrama esquemtico para el problema 3. Con mejora Con frmaco (medicados) Sin frmaco (placebo) Total 6=r 1 7=R Sin mejora 1 4 5 Total 7 = n 5 12 = N

6-22

Entonces, la probabilidad de ocurrencia por azar en una tabla del tipo 2 x 2 como las vistas en ndices clnicos, de los sucesos esquematizados en el diagrama, se calcula con: PH ( r=6 / n=7, N=12, R=7) = C(7 , 6) . C(5 , 1) / C(12 , 7) = 0,0442 La probabilidad de que no ocurra por azar, sino por la accin del medicamento ser el complemento de la anterior, o sea 0,9558. Se tiene entonces un 95,58% de probabilidad de que el medicamento (o tratamiento) sea eficaz y un 4,42% que no lo sea. Se puede afirmar que es muy improbable, que la mejora de los pacientes sea casual. Sin embargo, todava esto no es una prueba cientfica con evidencia estadstica. Para que as ocurra, se deben plantear tests de hiptesis como se ver en captulos posteriores.

6.8 Problemas propuestos

1) Marcar la respuesta correcta a cada una de las afirmaciones siguientes, o completar la frase:
1) La regla del producto se puede aplicar en todos los casos. 2) La probabilidad de sacar tres caras al lanzar al aire tres monedas es 1/8. 3) Dos sucesos son independientes si la ocurrencia de uno no afecta al otro. 4) Dos sucesos independientes no tienen ningn elemento en comn. 5) Si tres sucesos son independientes, tambin lo son todos los pares posibles. 6) Si todos los pares posibles son independientes, tambin lo son si se toman de a tres. 7) Dos sucesos son excluyentes si no tienen ningn elemento en comn. 8) Es lo mismo el concepto de independencia que el de exclusin. 9) En sucesos condicionales, la probabilidad de uno se afecta si se sabe que ocurri el otro. 10) Exclusin e independencia, son casos particulares de la Condicionalidad. 11) El Teorema de Bayes se puede aplicar si un suceso, es particionado por otros. 12) dem para el Teorema de Probabilidad Total. 13) Los ndices Clnicos se relacionan entre s, a travs del Teorema de Bayes. 14) Algunos ndices Clnicos se pueden interpretar como probabilidades condicionales. 15) En los muestreos de aceptacin se emplea la probabilidad Hipergeomtrica. 16) La Normas IRAM el Control de Calidad aplican la probabilidad Hipergeomtrica. 17) Si el producto de las probabilidades de dos sucesos es igual a la conjunta, son .................. 18) Si la probabilidad condicional de dos sucesos es igual a la del producto de ambas, hay.... 19) El diagrama del rbol se usa para visualizar ................. V V V V V V V V V V V V V V V V ........... ........... F F F F F F F F F F F F F F F F

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link]

20) La sensibilidad es la capacidad de un test de detectar como positivos a los enfermos 21) La especificidad es la capacidad de un test de detectar como negativos a los sanos 22) Sensibilidad, especificidad, Youden y los Likelihood ratio no varan con la prevalencia. 23) Se puede mostrar experimentalmente lo anterior. 24) La eficiencia y los valores predictivos varan con la prevalencia. 25) La forma de extraer las muestras de la poblacin altera a los ndices clnicos. 26) Para un estudio por cohortes se hace un muestreo basndose en la exposicin. 27) Para un estudio caso-control se hace un muestreo basndose en la condicin buscada. 28) Explicar como hacer un experimento, el estilo Bernoulli, para verificar lo anterior ......... 29) Expresar el Teorema de Bayes en forma ms simplificada. ............................................... 30) No hay relacin entre el teorema de probabilidad total y el de Bayes. 31) Las probabilidades Pre-test se relacionan con las Post-test. 32) Los Odds a priori multiplicados por el LR+ dan los Odds a posteriori en sanos. 33) Se pueden transformar las probabilidades en Odds y viceversa. 34) La probabilidad a posteriori en el caso de enfermos es igual al VPP. 35) La probabilidad a posteriori en el caso de sanos es igual al VPN. 36) Con dos grficos se pueden resumir los 8 pasos recomendados por JAMA para Post-Test. 37) Es mejor disear un protocolo general que usar los grficos en cada paciente. 38) La independencia estadstica significa: ................................................................................ 39) En una tabla de riesgo la asociacin estadstica significa: ................................................... 40) Si hay asociacin estadstica, hay una relacin del tipo causa-efecto. 41) Si hay una relacin causa-efecto, tiene que haber una asociacin estadstica. 42) Los valores de frecuencias esperadas, bajo el supuesto de independencia, se calculan con: 43) El producto de los totales marginales dividido N es la frecuencia esperada de una celda. 44) Las tablas de independencia 2 x 2 son un caso general de la tabla de riesgo. 45) Las tablas de riesgo pueden llegar a considerarse como tablas diagnsticas

6-23

V F V F V F V F V F V F V F V F ............. ............. V F V F V F V F V F V F V F V F ............. ............. V F V F .............. V F V F V F

2) La clasificacin por edades de los profesionales de una zona de salud es:

Servicios Mdicos Bioqumicos Alimentacin Registracin Enfermeros Farmacuticos Radiologa Terapeutas Otros servicios Total Menor de 25 0 20 3 7 200 1 4 5 20 260 Entre 26 y 30 5 30 6 15 375 12 10 25 35 513 Entre 31 y 35 25 35 6 8 442 8 19 15 50 608 Mayor de 35 75 35 10 12 203 3 12 10 25 385 Total 105 120 25 42 1220 24 45 55 130 1766

a) Calcular las probabilidades para cada uno de los cuatro grupos de edades. b) Lo mismo para los nueve tipos de servicios. c) Si se escoge una persona al azar. Averiguar la probabilidad de que: - Sea un mdico de ms de 35 aos - Sea un enfermero menor de 25 aos. - Sea un farmacutico de 28 aos. c1) Sabiendo que tiene 33 aos, cuanto vale la probabilidad de que sea: - de Radiologa - de otros servicios

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] c2) Sabiendo que es un bioqumico, cuanto vale la probabilidad de que tenga: - ms de 35 aos. - 30 aos. - 21 aos d) Si se escogen dos personas al azar, cuanto vale la probabilidad de que: - Uno sea mdico y el otro bioqumico. - Los dos sean farmacuticos e) Verificar el Teorema de Probabilidad Total en los puntos (a) y (b)

6-24

3) Una compra en una farmacia fue de 7 tabletas de aspirinas y 3 paquetes de algodn. Si se saca de la bolsa de a uno, averiguar la probabilidad de que se saquen dos tabletas y un algodn. 4) Calcular los ndices clnicos para una prueba de laboratorio, que en un estudio de 400 personas arroj los resultados siguientes: Enfermedad Si No 30 190 20 160 50 350

Test Clnico (+) (-) Total

Total 220 180 400

Con los valores obtenidos de S y E, simular una prevalencia variable entre p = 0,1; 0,2; ...; 0,9 para obtener las curvas que muestren la variabilidad de la eficiencia y los valores predictivos con la prevalencia. Verificar si se cumplen las relaciones tericas expuestas en el cuadro resumen 5.2. 5) Resolver la siguiente sopa de letras:
B X E R O J I O U G N A M B E I D A N K R B F C V W T S I S D O S K A G U S Q I N S Y B R O E S T A L A A U J Y G R U B O C O N D I C I O N A L S S I E I A W R H J I D E Q S O B D C M S M N K S R D A Y L V M L C U I N R U Z R G A A B T A L N C N H P X C S V E S X O P N D H D I A H U R S O C I T S O N G A I D G I I N S T I J U T R E O T I R T O A C O P L A V M Y N R W F P I R T D W B S I J E I C A V R M E D N S O U R I S R A N C R B O C B A T S F T I M T I N W I D A E G I N X C I R T Q O P R O D U C T O A E S H Q W C W O B T Y K R Z L L E O U F O N D I A N A C F N Q R E F E R O U L U M E O R E E D A J V C X S R S A R M A L E S X F X U E S L A C C N E S L E I D S T N A O C C S T S C N Z I D C A M L I I R G G I L E L I H E L A O M V S A A M R I H U T U R A C L C I F I U I O R A U A C D E A Y F X O J Z C T I R G N I D A R A A S L E R V P O A I N R O O B M U S Z W Q N E N K F D S T S M I L L I B O T O O U T S R D I E O T I D A L O S T O S U P E A O P I C T O O A L A S T T A R C M Y S X D I Q A T P A D O R I R A R T A T O X P E S E T N E I D N E P E D N I R R L L D M D A D I S E C S E U M S P I A X L S Y S I L S K L V O C S I V E L O X S A R T A V S N E S T G U Z I R A D

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] a) b) c) d) e) f) g) h) i) j)

6-25

El tipo de probabilidad ms general de todas. Teorema de ..... es el que permite relacionar los ndices clnicos entre s. La probabilidad usada en los muestreos de aceptacin. Dos sucesos cuya probabilidad conjunta es igual al producto de sus probabilidades individuales. Dos sucesos cuya probabilidad conjunta es nula. Proceso conformado por una sucesin finita de experimentos, cada uno con probabilidad finita. La regla del .... permite calcular la probabilidad conjunta de dos sucesos independientes. ....... de Probabilidad Total se aplica cuando un grupo de sucesos particiona a otro. Conclusiones de los mdicos cuando examinan a un paciente. La probabilidad de sacar cara es la ..... de la probabilidad del suceso seguro.

6) Usando los datos del ejercicio (4) anterior, e imaginndolos como las frecuencias observadas en el experimento, se pide: a) Calcular las 4 frecuencias esperadas tericamente si hay independencia total entre el test clnico y el hecho de que exista o no la enfermedad. b) Recalcular los ndices clnicos obtenidos en el ejercicio 5 con los datos tericos bajo el supuesto de independencia. c) Discutir los resultados obtenidos y explicar como se puede relacionar la independencia estadstica con la independencia clnica. 7) En un estudio epidemiolgico se determinaron los datos siguientes:

Enfermedad Si Exposicin a una fuente de contagio Si No Total 50 50 100 No 150 150 300 Total 200 200 400

a) Haciendo el supuesto de que la enfermedad no tiene nada que ver con la fuente de contagio (tambin llamado factor de riesgo), esto es que son estadsticamente independientes. Calcular las cuatro frecuencias esperadas. b) Calcular la Prevalencia en el caso de frecuencias esperadas y tambin en el caso de las frecuencias observadas. Qu conclusin puede sacarse ? c) Calcular el odd de los enfermos y de los que no enfermaron entre los pacientes expuestos. d) Calcular el odd de los enfermos y de los no enfermos entre los pacientes no expuestos.

8) Se pide repetir el ejemplo anterior pero con estos nuevos datos:

Bioestadstica aplicada a Bioqumica y Farmacia Azzimonti Renzo, JC - arroi_pss@[Link] Enfermedad Si Exposicin a una fuente de contagio Si No Total 150 150 300 No 50 50 100 Total 200 200 400

6-26

9) Comparar los resultados de los ejercicios 7 y 8 para sacar algunas conclusiones entre la independencia estadstica y la realidad. 10) Explicar la diferencia entre variabilidad de los ndices clnicos debidas a la prevalencia y la debida a la eleccin de un punto de corte en un mtodo clnico. 11) Se efectuaron dos estudios epidemiolgicos con un total de 400 individuos. De entre todos los casos disponibles, se seleccionaron 200 enfermos al azar y otros tantos sanos. Efectuando un estudio retrospectivo se separaron los casos que estuvieron expuestos a la fuente de contagio de los otros, y las frecuencias encontradas fueron las siguientes:

Enfermedad Si Exposicin a una fuente de contagio Se pide calcular: a) El Odds Ratio b) El riesgo relativo 12) En un estudio similar al anterior se encontraron los datos siguientes: Enfermedad Si Exposicin a una fuente de contagio Si No Total 150 50 200 No 150 50 200 Total 300 100 400 Si No Total 50 150 200 No 50 150 200 Total 100 300 400

Se pide calcular los ndices OR y RR y compararlos con el caso anterior.

7
Pruebas repetidas
En este captulo se tratan dos tipos de procesos bsicos en pruebas repetidas. El primero es el estudiado por Bernoulli en Ginebra, a fines del siglo XVI, aplicado a los juegos de azar. Condujo al modelo de la Probabilidad Binomial, Binomial Negativa, Probabilidad de Pascal y la Probabilidad Multinomial. El segundo fue desarrollado por Poisson en Pars, en los inicios del siglo XVIII, como un caso particular de la binomial aplicado a los casos raros. La Probabilidad de Poisson se aplica en las tcnicas de recuentos celulares, fenmenos de contagio, virologa, como as tambin en la Ley de Radiactividad General, seguros de vida, teora de las lneas de espera o teora de colas, etc.

7.1 Procesos tipo Bernoulli

Se denominan procesos de tipo Bernoulli, a todo experimento consistente en una serie de pruebas repetidas, caracterizadas por tener resultados que se pueden clasificar en si verifican o no cierta propiedad o atributo, siendo aleatorios e independientes. La relacin con un proceso de tipo hipergeomtrico, visto en el captulo anterior, es directa: Si las extracciones se hacen con reposicin se transforma en un proceso del tipo Bernoulli. Para identificar un proceso Bernoulli en una serie de pruebas repetidas, se deben verificar tres condiciones: 1) Resultados dicotmicos: Los resultados de cada prueba se pueden clasificar en xito si verifican cierta condicin, o fracaso en el caso contrario. No importa el tipo de magnitud clnica que se trate; al efectuarle la determinacin en el laboratorio, siempre se podr ver si el resultado obtenido en la muestra del paciente verifica o no cierto atributo. Y entonces, siempre se podrn clasificar los resultados en forma dicotmica. En el caso de la determinacin de la CPK -que es una magnitud de tipo continua- al tomar un punto de corte se clasifican los infinitos resultados posibles en dos: Infartado - No infartado. En una determinacin del fenmeno Psi, el recuento de resultados -que es una magnitud de tipo discreta- siempre se podr clasificar en: hay evidencia de percepcin extrasensorial, o no la hay. En un concurso de belleza, o el resultado de una carrera (magnitudes ordinales), se puede subdividir en: gan-perdi. 2) Independencia de las pruebas: El resultado de una prueba cualquiera es independiente del resultado obtenido en la prueba anterior, y no incide en el resultado de la prueba siguiente. Esto se cumple en los juegos de azar como al lanzar una moneda o un dado, y en la extraccin de barajas, si se realizan con reposicin luego de cada extraccin. Es uno de los supuestos bsicos de la Teora Gentica de Mendel y en las leyes de la herencia humana, como el sexo de un recin nacido. La independencia deja de cumplirse cuando se da un fenmeno de contagio o repulsin.

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

7-2

3) Estabilidad de las pruebas: La probabilidad p de obtener un resultado considerado como un xito se mantiene constante a lo largo de toda la serie de pruebas. Anlogamente, para la probabilidad q de obtener un fracaso. Como los resultados son dicotmicos, el universo de resultados aparece particionado por ambos sucesos, entonces p + q = 1 = P(S). La tirada de una moneda o de un dado es el ejemplo clsico de este proceso. Se debe notar que eso no cambia si la moneda o el dado estn viciados. Si un dado cargado tiene una probabilidad de 2/6 de sacar un as, como esa probabilidad se mantiene constante e independiente a lo largo de la serie de pruebas, se cumplen las condiciones anteriores. En cambio, si se da un fenmeno de reaccin en cadena, o en cascada, o contagio, las probabilidades dejan de ser constantes. Por ejemplo, si la probabilidad de enfermarse de hepatitis en Misiones es p, y se presenta una epidemia, entonces el contagio hace crecer mucho el nmero de enfermos, p cambia y deja de ser estable. El corrimiento de los puntos de una media de nylon femenina es un ejemplo de fenmeno en cascada. Para los ltimos casos, se podr emplear otro modelo, el de Poisson, que se ver ms adelante. Notar que el Odds de xitos en el modelo Bernoulli es p / q = p / (1-p).

7.2 Probabilidad Binomial

Cuando en un proceso del tipo Bernoulli se desea saber la probabilidad de obtener exactamente r xitos, en una serie de n pruebas, con una probabilidad de xito p, se puede aplicar la frmula de la probabilidad binomial:
r n-r

PB ( r / n , p ) = C (n , r) . p (1 - p)

Sea S1 la primera serie de n pruebas realizadas donde se verifica la ocurrencia de r xitos, con una probabilidad p y la de fracaso q: S1 : E F E F F ....E (donde E indica la ocurrencia de un xito y F la de un fracaso)

P (S1 ) = P( E F E F F ... E) y como los sucesos son independientes P (S1 ) = P(E) . P(F) . P(E) . P(F) . P(F) ... P(E) = p .q .p . q . q ... p = p (1 - p)
r n-r

Pero esta secuencia, es una de todas las k posibles series donde se verifican r xitos en n pruebas. Otra serie cualquiera como la S2 : E F E F F ....F P (S2 ) = P( E F E F F ... F) = P(E) . P(F) . P(E) . P(F) . P(F) ... P(F) r n-r P (S2 ) = p .q .p . q . q ... q = p (1 - p) En esta segunda serie, diferente de la primera en el orden de ocurrencia de los sucesos, se obtiene r n-r la misma probabilidad. Generalizando, para una serie cualquiera i es: P (Si ) = p (1 - p)

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

7-3

El nmero k total de pruebas posibles se obtiene con la combinatoria de n elementos tomados de a r. O sea: C (n , r). La probabilidad binomial pedida ser la probabilidad de la unin de todos los sucesos posibles, esto es : PB ( r / n , p ) = P (S1 S2 S3 ... Sk) = P (k Sk ) = k P( Sk ) = k . P( Sk ) Y reemplazando por las relaciones anteriores, se llega a la frmula de la Binomial de ms arriba Ejemplo 1) Sea el caso de una droga X, con una dosis mortal de 1g/100 ml para cobayos experimentales, en el 25% de los casos. Aplicando esta dosis a cien cobayos se desea saber cuanto vale la probabilidad de que mueran veinte de ellos. Esto se calcula con la binomial, siempre y cuando se cumplan los supuestos bsicos, a saber: 1) Los cobayos mueren (xito) o sobreviven (fracaso). 2) Que un cobayo muera con la dosis, no significa que lo har el siguiente (independencia) pues no se trata de una epidemia. 3) La probabilidad de que mueran se mantiene constante a lo largo de la serie de pruebas (p = 0,25). Entonces, aplicando la frmula ser: PB ( r=20 / n=100 , p=0,25 ) = C (100 , 20) . (0,25)
20

(1 - 0,25)

= 0,04902

Ejemplo 2) En el Cuadro 7.1 se presenta un ejemplo de proporcin de sexos la descendencia de parejas humanas; los datos provienen de un estudio de Geissler (1889), quien analiz 6.115 familias de doce hijos cada una en Sajonia. La proporcin de sexos es 1 : 1 aproximadamente. Sin embargo, como se sabe que en poblaciones humanas diferentes estos pueden variar un poco, para este trabajo se tom la proporcin obtenida en el mismo. La proporcin de 519 : 481 entre hombres y mujeres. Si el nmero de hijos es n = 12, la cantidad r de mujeres, puede ser imaginada como una variable que va de 0 a 12, ya para cada valor de r habr un valor de la binomial que se muestra en la columna PB ( r ) del Cuadro 7.1, calculado con : PB ( r=0 / n=12 , p=0,481 ) = C (12 , 0) . (0,481) (0,519)
0 12

= 0,00038

Eso implica que en 6.115 familias de 12 hijos, la probabilidad de encontrar familias sin hijas mujeres es de 0,00038, esto es, una frecuencia esperada de 2,3 familias del total. Los valores esperados se obtienen multiplicando el nmero total de familias estudiadas por la frecuencia esperada. Esto es, 6.115 PB ( r = 12) = 2,3. Geissler obtuvo 7 casos reales, ms del doble de lo esperado. En el caso inverso, es decir familias de 12 hijas, da : 6.115 PB ( r = 0) = 0,9 familias es el nmero de casos esperado. Pero hubo 3 casos reales, casi el triple. Si se comparan los valores esperados con los observados, se nota una buena concordancia en los valores del centro de la tabla, pero en las puntas eso deja de verse. Por ejemplo, para el caso de 6 mujeres y 6 varones, se observan 1.343 casos y se esperaban 1.367,3 o sea una diferencia del orden del 1,8%; en cambio, en ambas puntas ronda el 100%. La base gentica de este fenmeno no est muy clara. Pero hay familias que tienden a tener todos varones y otras a mujeres. Todo ocurre como si hubiese una especie de contagio. Para tener una prueba cientfica de esto, hay que realizar un test estadstico para hacer una prueba de hiptesis, como se ver en captulos posteriores. En muchos casos de estudios mendelianos, la proporcin de sexos se calcula con la relacin 1:1; en este caso no se hizo as, sino que se usaron los datos experimentales para su obtencin, en lugar de los tericos. Ms adelante, se ver la importancia de esta diferencia.

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

Cuadro 7.1 Aplicaciones de la Probabilidad Binomial. Caso 1 : Proporcin de sexos en 6.115 familias con doce hijos de Sajonia -datos tomados de Sokal(*) Cantidad de mujeres en familias de 12 hijos r 0 1 2 3 4 5 6 7 8 9 10 11 12 Probabilidad Binomial Nmero de casos esperados Er = N . PB ( r ) 2,3 26,1 132,8 410,0 854,3 1265,6 1367,3 1085,2 628,1 258,5 71,8 12,1 0,9 Nmero de casos observados Diferencias relativas

7-4

PB ( r )
0,000384 0,004264 0,021725 0,067041 0,139703 0,206973 0,223590 0,177459 0,102708 0,042280 0,011743 0,001975 0,000153

Or
7 45 181 478 829 1112 1343 1033 670 286 104 24 3

(Or - Er)/Er
+ 2,04 + 0,724 + 0,363 + 0,166 - 0,030 - 0,121 - 0,018 - 0,048 + 0,066 + 0,106 + 0,448 + 0,164 + 2,333

Ejemplo 3) Se toman al azar 1000 muestras de n = 5 individuos cada una, de la especie Homo Sapiens. Se formula la hiptesis de un 40% de ellos presenta cierta enfermedad, no contagiosa. Con computadora se simulan los casos observados usando la tabla de nmeros al azar - (*)
Cantidad de enfermos por muestra r 0 1 2 3 4 5 Probabilidad Binomial Nmero de casos esperados Er = N . PB ( r ) 388,8 1296,0 1728,0 1152,0 384,0 51,2 Nmero de casos Diferencias simulados relativas

PB ( r )
0,07776 0,25920 0,34560 0,23040 0,07680 0,01024

Or
416 1327 1686 1110 406 55

(Or - Er)/Er
+ 0,0694 + 0,0238 - 0,0243 - 0,0365 + 0,0586 + 0,0703

En este ejemplo, se simula la poblacin humana, con la tabla de nmeros al azar, haciendo N= 1000 extracciones de 5 nmeros cada una; como no hay lmite para hacer esto, el tamao terico de la poblacin es infinito. Cuando en la muestra aparecen los nmeros 1,2,3 o 4 se toma como infectada. Cuando aparecen los nmeros 0,5,6,7,8 o 9 se la toma como no infectada. Por ejemplo, si en una de las muestras simuladas resulta (3,8,9,6,0) se la cuenta como una muestra con 1 infectado. Estos datos se vuelcan en la columna correspondiente a frecuencias observadas. En la primer columna se calcula la probabilidad binomial con un nmero de xitos que vara de 0 a 5, un tamao de muestra de n = 5, y una probabilidad p = 0,4. Esta porque hay diez dgitos posibles en la tabla de nmeros al azar, de los cuales 4 se usan para los xitos. Como puede verse hay una buena concordancia (ninguna diferencia relativa supera el 7% ) entre los valores esperados y los

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

7-5

observados. Se cumple que cada muestra es independiente de la otra y que la probabilidad es constante a lo largo de la serie de pruebas. Ejemplo 4) En una farmacia se ha calculado la probabilidad de venderle a un cliente con obra social es del 20%. Se eligen al azar 15 clientes de ese tipo que ingresan al negocio y se desea calcular la probabilidad de concretar menos de tres ventas. Para analizar este problema conviene determinar todos los casos posibles. Menos de 3 ventas significa que se pueden concretar dos, una o ninguna venta, es decir los casos posibles son: A : no se vendi nada ( r = 0 ) B : solo se hizo una venta ( r = 1) C : se concretaron dos ventas ( r = 2) Estos sucesos son excluyentes entre s, por lo tanto aplicando el Axioma 3 generalizado ser: P(menos de 3 ventas) = P ( A B C ) = P (A) + P(B) + P(C) P(A) = PB ( r=0 / n=15 , p=0,2) = C (15 , 0) . (0,2) (0,8) = 0,0352 1 14 P(B) = PB ( r=1 / n=15 , p=0,2) = C (15 , 1) . (0,2) (0,8) = 0,1319 2 13 P(C) = PB ( r=2 / n=15 , p=0,2) = C (15 , 2) . (0,2) (0,8) = 0,2309 Sumando los tres valores anteriores se obtiene P (menos de 3 ventas) = 0,398. Es decir, hay casi un 61% de probabilidades de que se concreten 3 ventas o ms.
0 15

7.2.1 Contagio y repulsin

Para aplicar la frmula de la funcin binomial se deben verificar los tres supuestos de un proceso Bernoulli. El ejemplo clsico es en los juegos de azar. Recordando el problema de lanzar tres veces una moneda, resuelto con el diagrama del rbol en el punto 6.1, puede verse que es mucho ms elegante y simple resolverlo con la binomial. En efecto, la probabilidad de sacar tres caras (o secas) seguidas ser: PB ( r=3 / n=3 , p=0,5 ) = C (3 , 3) . (0,5) (0,5) = (0,5) = 0,125 Naturalmente, si en lugar de ser tres, fueran cien lanzamientos, la resolucin usando el Diagrama del rbol sera sumamente engorrosa y es ms prctico usar este modelo. En los lanzamientos de una moneda, es muy claro el cumplimiento de los tres supuestos, pero en los casos de la vida real, ya no lo son tanto. Si se piensa en el ejemplo visto cuando se simul por computadora el nmero de casos observados usando una tabla de nmeros al azar, los valores necesariamente son aleatorios e independientes. Pero cuando dejan de cumplirse uno o ms de estos supuestos, los resultados varan mucho. Sea el mismo caso anterior, pero ahora se le obliga a la computadora a seguir buscando en la tabla, cada vez que salga el valor 3, hasta que encuentre otro de los cuatro nmeros correspondientes al suceso: infectado. Entonces, las proba3 0 3

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

7-6

bilidades de cada nmero dejan de ser iguales, no son ms constantes. Luego de efectuar un cierto nmero de sorteos aumentar la frecuencia de las clases con dos o ms enfermos en la muestra y disminuir el nmero de clases con un solo enfermo. Todo ocurre como si, cuanto ms enfermos hay en la muestra, ms fcil se enferman sus vecinos. O sea, se ha simulado un fenmeno de contagio. En cambio, si se arregla el programa de la computadora, para que sean ms frecuentes los casos heterogneos, es decir, con similar proporcin de infectados, disminuyen los casos ms homogneos (todos sanos, o todos infectados) y se simula un fenmeno de repulsin.
Cuadro 7.2 Contagio y repulsin Cantidad de enfermos Probabilidad Nmero de casos por muestra Binomial esperados PB ( r ) r Er = N . PB ( r ) 0 1 2 3 4 5 0,07776 0,25920 0,34560 0,23040 0,07680 0,01024 388,8 1296,0 1728,0 1152,0 384,0 51,2

Nmero de casos Nmero de casos simulados para simulados para

contagio
464 1450 1368 1160 488 70

repulsin
295 1275 1946 1131 324 29

En el Cuadro 7.2 se muestran los resultados de la simulacin. Las frecuencias de contagio aumentan mucho para los valores extremos de r y disminuyen para r=2. Lo contrario ocurre en la repulsin, con dos enfermos por muestra la frecuencia sube y baja en los dos extremos. La forma correcta de verificar si estas diferencias son debidas al efecto de contagio o repulsin, es con una prueba o test de hiptesis estadstico, que se ver ms adelante. Si en vez de ser un caso simulado, fuese real, el significado de un contagio es que cada vez se encuentra ms muestras totalmente infectadas o totalmente sanas, y menos muestras con igualdad de sanos y enfermos. Todo esto, con respecto a lo que cabra esperar si la probabilidad de contraer la enfermedad fuese independiente. El contagio es un fenmeno entre los integrantes de cada muestra. O sea, si uno de ellos est enfermo, la probabilidad de enfermarse aumenta en sus vecinos de la muestra. Cabe la posibilidad de encontrarse con este fenmeno en la prctica debido a una mala eleccin de las muestras, porque el investigador tiene tendencia a tomar muestras infectadas. Es decir, no hay un contagio sino una seleccin mal hecha. Pero si se hace correctamente, con un muestreo al azar, entonces los resultados muestran contagio. Por ejemplo, puede haber ocurrido que se hayan expuesto a un mismo foco infeccioso, o que se hayan contagiado en el intervalo de tiempo entre que fueron extrados y revisados. El fenmeno opuesto, ya es ms complicado para explicarlo clnicamente. El nmero de grupos homogneos ha disminuido sensiblemente, aumentando aquellos grupos con proporciones similares de enfermos y no enfermos. Todo ocurre como si, al estar dos o tres individuos de la muestra enfermos, los restantes son menos propensos a estarlo. Como si los enfermos de alguna manera inmunizaran a sus compaeros muestrales. Se da una especie de repulsin. Una interpretacin es que hay un nmero limitado de grmenes patgenos y una vez que se ubicaron en sus respectivos huspedes, se agot la fuente de infeccin. En infecciones del tipo microbianas, esto es menos plausible, pero muy razonable en el caso de parsitos. Otra cosa que puede haber ocurrido es que con los primeros enfermos se haya vacunado a sus vecinos y de all los resultados.

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link]

7-7

7.3 Probabilidad Pascal

Cuando en un proceso Bernoulli, se busca la probabilidad de que sean necesarias exactamente n pruebas, para lograr r xitos, con una probabilidad de xito p, entonces se recurre a la frmula de Pascal, para resolver el problema.
r n-r

PPa ( n / r , p ) = C (n-1 , r-1) . p (1 - p)

Sea S1 la primera serie de n pruebas realizadas donde se verifica la ocurrencia del r-avo xito, en la prueba nmero n, con una probabilidad p y la de fracaso q: S1 : E F E F F ....F E (donde el ltimo debe ser un hay E )

P (S1 ) = P( E F E F F ... F E) = P (R1 E ) = P (R1 ) . P (E ) Donde R1 es el suceso : Obtencin de r-1 xitos en las primeras n-1 pruebas realizadas dentro de la primer serie de pruebas S1. Como los sucesos son independientes se obtiene P (S1 ) = P(E) . P(F) . P(E) . P(F) . P(F) ... P(F) . P(E) = p .q .p . q . q ... p = p (1 - p)
r n-r

Pero esta secuencia es una de todas las m posibles series donde se verifican r xitos en n pruebas. Otra serie cualquiera como la S2 : F F E F F ....E P (S2 ) = P( F F E F F ... E) = P(F) . P(F) . P(E) . P(F) . P(F) ... P(E) r n-r P (S2 ) = P (R2 E ) = P (R2 ) . P (E ) = p .q .p . q . q ... q = p (1 - p) En esta segunda serie, diferente de la primera en el orden de ocurrencia de los sucesos, se obtiene la misma probabilidad. Generalizando, para una serie i es : P (Si ) = p (1 - p)
r n-r

El nmero m total de pruebas posibles se obtiene, con la combinatoria de n-1 elementos tomados de a r-1 : C (n-1 , r-1). La probabilidad Pascal pedida, ser la probabilidad de la unin de todos los sucesos posibles, esto es: PPa ( r / n , p ) = P (S1 S2 S3 ... Sm) = P (m Sm ) = m P( Sm ) = m . P( Sm ) Reemplazando m con el valor de la combinatoria, se llega a la frmula general de la PPa. Otra forma de deducir lo mismo es la siguiente: Sea R el suceso: Obtencin de r-1 xitos en las primeras n-1 pruebas realizadas y X el suceso: Obtencin de un xito en la ltima prueba realizada

Bioestadstica aplicada a Bioqumica y Farmacia J.C. Azzimonti Renzo: arroi_pss@[Link] Entonces la probabilidad buscada ser PPa ( n / r , p ) = P (R X ) = P (R) . P (X) Donde P (R) es una binomial de parmetros r-1, n-1 y P (X) es la probabilidad p de xito PPa ( n / r , p ) = PB ( r-1 / n-1 , p ) . p = C (n-1 , r-1) . p PPa ( n / r , p ) = C (n-1 , r-1) . p (1 - p) La relacin entre la binomial y la Pascal se deduce con: C(n-1 , r-1) = (r/n) . C(n , r) De donde, PPa ( n / r , p ) = (r/n) . PB ( r / n , p )
r n-r r-1

7-8

(1 - p)

n-1-r+1

Lo que significa que todos los problemas del tipo Pascal se pueden resolver con la Binomial. Desde el punto de vista del clculo si se tienen tablas para los valores binomiales (ver la bibliografa), no hace falta tener otra tabla para las probabilidades tipo Pascal. Ejemplo 1)