GRADO EN ESTADÍSTICA
Métodos Básicos de Bioestadística
GUIONES DE LAS CLASES DE TEORÍA TEORÍA
Curso 2020-2021
I.- ENSAYOS CLÍNICOS
II.- MODELOS DE TABLAS 22
III.- TEST EXACTOS EN TABLAS 22
IV.- TEST ASINTÓTICOS EN TABLAS 22
V.- TAMAÑO DE MUESTRA EN TABLAS 22
VI.- MEDIDAS DE ASOCIACIÓN EPIDEMIOLÓGICAS
VII.- ANÁLISIS DE VARIAS TABLAS 22
VIII.- METODOLOGÍA DE BIOEQUIVALENCIA
IX.- MEDIDAS DE CONCORDANCIA O ACUERDO
2 GRADO EN ESTADÍSTICA: Métodos Básicos de Bioestadística (Prof. Martín Andrés)
GRADO EN ESTADÍSTICA: Métodos Básicos de Bioestadística
GUIONES DE LAS CLASES DE TEORÍA (2020-2021)
PE Práctica de Evaluación (entregar al día siguiente); PO Práctica de Ordenador
I.- ENSAYOS CLÍNICOS
I.1. INTRODUCCIÓN
Objetivo: Planificar experiencias con seres humanos de modo que “los grupos sean comparables en
todo, salvo en el tratamiento recibido” (para que así la significación, si se produce, se deba al ttto).
Hablaremos de:
Dos muestras: extensible a más de dos.
EC: también de otros asuntos relacionados.
Tratamiento: en sentido amplio (p.e. “gestantes” serán ttto).
I.2. NECESIDAD DEL GRUPO CONTROL
Para reseñar la importancia agente vs. enfermedad/accidente (periodistas):
Como 20% accidentados consumieron alcohol su consumo predispone al accidente.
¡Falso!: sería la abstinencia (80%).
¡Falso!: también tomaron leche en el desayuno …
Usualmente es cierto, pero no por esa razón falta grupo control o testigo:
Grupo tratado: SÍ ACCIDENTE: 20% de alcohol.
Grupo Control: NO ACCIDENTE: 5% de alcohol.
Naturaleza comparativa de la Medicina: Grupo tttado vs. Grupo no tttado (Control) u otro ttto.
I.3. CONCEPTO DE ENSAYO CLÍNICO
Muchas definiciones … la que sigue es de Meinert (1986) algo modificada (su terminología la veremos
poco a poco):
Un Ensayo Clínico es un diseño experimentalmente planificado para verificar la eficacia de
un tratamiento en humanos a través de la comparación de los resultados obtenidos en dos
grupos de pacientes que reciben, uno el tratamiento problema, y otro un tratamiento
alternativo (nuevo o clásico) o ningún tratamiento, ambos grupos tomados, tratados y seguidos
durante igual período de tiempo y obtenidos por la partición al azar en dos de un grupo inicial
único. Se rigen por un protocolo.
GUIONES DE LAS CLASES DE TEORÍA: I. Ensayos Clínicos 3
En humanos: no en animales (ahora algo) por sicología y derechos humanos cuidados especiales.
Protocolo: documento de conformidad, planificación e información entre el enfermo, el hospital, los
investigadores y la administración ( contrato) en el que se señalan los antecedentes, objetivos,
planificación, organización etc. del EC.
Un EC = potente mecanismo para evaluar la eficacia de un ttto (pero requiere de un buen planteamiento
y análisis).
I.4. OBJETIVO DE UN EC
El objetivo de un EC es que los dos grupos de individuos A y B sean comparables en todo, excepto en el
tratamiento. Las diferencias entre ambos (test para H0: A = B) pueden deberse:
a) Al azar de la toma de muestras: lo controla el método estadístico.
b) A diferencias entre los efectos de los dos tratamientos (AB): su determinación, si existe, es el
objetivo del EC.
c) A diferencias existentes entre los dos grupos de individuos (distintas del tratamiento y previas a su
aplicación) o SESGO ANTES: lo controla el tipo de diseño del EC y el tipo de estudio.
d) A diferencia ocurrida en la manipulación y evaluación de los dos grupos en el curso de la
investigación (simultáneas o posteriores a la aplicación de los tratamientos) o SESGO
DURANTE/DESPUÉS: lo controla el tipo de EC.
Las causas c) y d) producen un sesgo o error sistemático de los datos: Sesgos “ANTES” y
“DURANTE/DESPUÉS” respectivamente.
I.5. TIPOS DE ENSAYOS CLÍNICOS (control del sesgo “durante/después”)
Generalidades
Si no hay un ttto estándar ttto vs. Control (visto antes):
Grupo Control: el que no recibe tratamiento alguno.
Pero el ttto tiene dos efectos:
El curativo en sí: SÍ de interés.
El del rito de aplicación (personas y pastillas de glucosa; ratas y electrodos en cráneo en humanos
“saberse tratados” ocasiona incluso efectos fisiológicos en análisis clínicos): NO de interés
eliminarlo mediante:
Grupo Placebo: el que recibe un tratamiento ficticio, aplicado con los mismos “ritos” que el ttto problema
ttto vs. placebo
Absurdo placebo si se sabe … rechazo sicológico al placebo
4 GRADO EN ESTADÍSTICA: Métodos Básicos de Bioestadística (Prof. Martín Andrés)
Técnica de simple ciego: el enfermo no conoce el tratamiento que recibe.
Técnica de doble ciego: ni el enfermo ni el médico conocen el tratamiento que se está aplicando.
Técnica de triple ciego: ni el enfermo, ni el médico, ni el comité que monitoriza el EC (incluyendo
al bioestadístico) conocen el tratamiento que se está aplicando.
Cuanto más ciego más problemas éticos y prácticos
Notas sobre el ciego
Conveniente incluso si A vs. B (puede preferirse uno a otro).
Imprescindible:
Si placebo: el médico tiende a penalizar.
Si respuesta subjetiva: estoy mejor, igual o peor.
Problemas especiales:
Doble ciego quirúrgico: evaluador cirujano.
Doble ciego con tóxicos: apertura rápida de la clave.
Pericia igual para A y B.
Posición segura y respetada: de dos investigaciones con resultados se da más crédito a la que más
ceguera tenga.
Regla General
El investigador debe probar + Al crítico le basta con apuntar
I.6. TIPOS DE ESTUDIOS CLÍNICOS Y CONDICIONES PARA QUE SEAN UN ENSAYO
CLÍNICO (control del sesgo “antes”)
El EC debe ser controlado
Un estudio puede ser:
Experimental: cuando el tratamiento está controlado (es el investigador quien decide qué
tratamiento se da a cada enfermo).
Observacional: en caso contrario (tratamiento no controlado).
El EC ha de ser controlado para que no haya dudas de comparabilidad.
Observacionales clásicos (que sí son “concurrentes” por más abajo):
Ttto Quirúrgico vs. Médico: ¡la edad!
Voluntarios para ttto (gripe) NO quiero vs. SÍ quiero: ¡los muy afectados por el problema!
El EC debe ser concurrente
Un estudio puede ser:
GUIONES DE LAS CLASES DE TEORÍA: I. Ensayos Clínicos 5
Concurrente: cuando los dos grupos de individuos se toman, tratan y siguen durante el mismo
período de tiempo.
No concurrente: en otro caso.
El EC ha de ser concurrente pues los enfermos de periodos de tiempo no son comparables
(diagnóstico precoz de las enfermedades).
El grupo Control no concurrente puede ser histórico o literario:
Ventajas: fáciles de recopilar + no problemas éticos.
Lícito: si efecto espectacular o enfermedad rara (o de larga duración) o problemas de reclutamiento
(cortar una pierna).
El EC debe ser aleatorizado
La estadística se basa en la selección aleatoria de las muestras ( representativas de la población).
En los EC eso no es posible pues están limitados por los:
Enfermos de su medio.
Criterios de admisión.
Lo trascendente es que los grupos sean comparables tomar un único grupo y luego partirlo en dos al
azar asignación aleatoria del ttto aleatorización “randomización” (¡).
Un estudio puede ser:
Aleatorizado: si, siendo controlado, la asignación del tratamiento se hace por un mecanismo de
sorteo (al azar).
No aleatorizado: en otro caso.
Los SÍ aleatorizados:
Prejuicios no influyen en la elección del ttto.
Tienden a dar grupos comparables a largo plazo (pero si n es pequeña puede que no) debe
indicarse al final la ficha técnica de las muestras utilizadas (incluyendo en ella toda la información
pertinente sobre la distribución en cada muestra de todos los posibles factores de riesgo): Tabla 1.1.
Tradicionalmente muy difícil de admitir por los médicos (ahora menos).
Los NO aleatorizados:
Siempre son criticables (mejor hacerlo bien que tener que justificar).
No valen las imitaciones: días alternos, orden alfabético, … ¡son predecibles! impiden el ciego.
La aleatorización no es tan costosa como para evitarla.
Distinguir:
Asignación aleatoria: ¡obligatoria! + conclusiones (no comparativas) NO extensibles a la población.
Selección aleatoria: ¡voluntaria! + conclusiones (no comparativas) SÍ extensibles a la población.
6 GRADO EN ESTADÍSTICA: Métodos Básicos de Bioestadística (Prof. Martín Andrés)
Tabla 1.1
Comparación de las características del grupo sometido al tratamiento “tradicional” con
el sometido a “rehabilitación psicosocial” en los individuos con Infarto de Miocardio
Tradicional Rehabilitación
Características (n = 91) (n = 89)
Socio-Demográficas
Edad ( x s) 50,2 7,7 51,6 7,1
Sexo (% Varones) 85,7 85,4
Profesión (% Obreros) 45,1 47,2
Médicas
Infarto Transmural (%) 53,4 59,0
Estado Hemodinámico (% Indice de Killip1) 80,1 86,0
Psicológicas ( x s)
Escala de Ansiedad 17,2 7,9 15,8 8,8
Escala de Estrés 22,0 15,5 19,9 17,2
Escala de Depresión 34,3 8,2 34,7 8,4
Sociales ( x s)
Escala de cuidados de la Familia 13,3 3,1 13,7 2,3
Ocupacionales
Presencia de barreras para la vuelta al trabajo (%) 13,8 8,5
Infarto ligado al trabajo (%) 43,5 39,8
I.7. TIPOS DE DISEÑOS (control del sesgo “antes”)
I.7.1. Introducción
Hasta ahora: qué hacer para que la experiencia sea útil.
Pero: de entre varios EC bien formulados uno puede ser más preciso que otro a igual coste, uno es
más fiable o potente que el otro.
Lo que sigue es genérico del diseño de experimentos (no solo de los EC).
I.7.2. Diseños en muestras independientes o en muestras apareadas
Fármaco para alterar la tensión: H0: SIN = CON vs. H1: SIN CON tomar dos muestras de presiones
sanguíneas de individuos que sí o no tomaron el fármaco.
Muestras independientes
Tabla 1.2: Presentación de resultados en un diseño con muestras independientes
Grupo Datos
SIN x x … x (20 datos)
CON x x … x (20 datos)
20 CON y 20 SIN el fármaco (cada individuo proporciona una única observación recibe un único ttto)
como en Tabla 1.2 (los tamaños de muestra no tienen por qué ser iguales):
Si test significativo “medias ” (CIERTO)
“Fármaco efectivo” PUEDE SER FALSO pues las dos muestras pueden diferir en otras
características (ver Tabla 1.1) … la partición al azar equilibra eso, pero es mejor controlarlo.
GUIONES DE LAS CLASES DE TEORÍA: I. Ensayos Clínicos 7
Muestras apareadas, relacionadas o dependientes
Tabla 1.3: Presentación de resultados en un diseño con muestras apareadas
Individuo nº 1 2 ................. n = 20
Medición
ANTES x11 x12 ................. x1n
DESPUÉS x21 x22 ................. x2n
20 individuos que se miden ANTES y DESPUÉS del ttto (cada individuo proporciona dos
observaciones recibe dos tttos los datos se obtienen por parejas) como en la Tabla 1.3:
Los dos grupos ¡son el mismo!
Ahora sin duda (salvo un asunto posterior): “medias ” “fármaco efectivo”.
El apareado es factible:
Si no es destructivo.
Si se pueden recibir los dos tttos a la vez (brazos) o sucesivamente en el tiempo (tensión de antes).
El apareado es conveniente:
SÍ en general: pues elimina la variabilidad entre pacientes (reduce el n necesario).
NO: si la asociación entre las parejas de respuestas es nula o negativa.
El apareamiento puede ser:
Natural: en base a un mismo individuo (sus dos brazos) o bloque natural (dos personas de una
misma familia).
Artificial: en base a valores iguales de los factores de riesgo (tomar parejas de individuos de igual
edad en el ejemplo de los fármacos): ver Tabla 1.4.
Ejemplos de apareamiento:
Cada individuo es su propio control: antes vs. después.
Los dos tttos se reciben a la vez: brazos izdo y derecho.
Los dos tttos se reciben sucesivamente: analgésico A un día y el B otro día.
Tabla 1.4: Presentación de resultados en un diseño con dos muestras apareadas artificialmente en base a la edad
Edad
20 25 30 ...............................
Tratamientos
A x11 x12 x13 ...............................
B x21 x22 x23 ...............................
I.7.3. Diseños cruzados
Problema en muestras apareadas: ¡el orden de aplicación de los tttos! (que puede influir en el resultado).
Para evitarlo: la mitad de los individuos reciben los tratamientos en un orden y la otra mitad en el orden
contrario (¡al azar!) diseño cruzado de la Tabla 1.5.
8 GRADO EN ESTADÍSTICA: Métodos Básicos de Bioestadística (Prof. Martín Andrés)
Tabla 1.5: Presentación de resultados en un diseño cruzado
Secuencia A-B Secuencia B-A
Individuo nº 1 2 ................. (n/2)+1 ............. n
Tratamientos
A x11 x12 ................. ...................... x1n
B x21 x22 ................. ...................... x2n
Precauciones:
Periodo de blanqueo.
Enfermedad de síntomas estables (reuma).
Prohibidas las dosis ascendentes.
I.7.4. Diseños estratificados
Objetivo apareamiento artificial: que los dos grupos sean homogéneos en una variable pronóstica (un
factor de riesgo como “la edad”) como en la Tabla 1.4 buscar individuos de igual edad hace
desaprovechables muchos de los datos.
Estratificación (a mitad de camino entre muestras independientes y apareadas): categorizar las variables
pronósticas (cualitativas o cuantitativas) en estratos como en las Tablas 1.6 y 1.7:
¿Qué variables incluir?: 2 ó 3 factores pronósticos (uno de ellos el Hospital, si multicéntrico).
¿En cuántos niveles estratificar?: 2 ó 3 niveles nº de estratos = (nº de niveles).
¿Qué límites entre niveles en cuantitativas?: media o mediana (si dos niveles).
Tabla 1.6: Presentación de resultados en un diseño con dos muestras estratificadas respecto de la edad (3 niveles).
Edad (años) Menos de 20 De 20 a 65 Más de 65
Tratamientos
A Resultados Resultados Resultados
B Resultados Resultados Resultados
Tabla 1.7: Presentación de resultados en un diseño con dos muestras estratificadas
respecto de la edad (3 niveles) y el sexo (2 niveles) 32 = 6 estratos.
Edad (años)
Tratamiento Sexo Menos de 20 De 20 a 65 Más de 65
V Resultados Resultados Resultados
A
H Resultados Resultados Resultados
V Resultados Resultados Resultados
B
H Resultados Resultados Resultados
I.8. MÉTODOS DE ASIGNACIÓN ALEATORIA DEL TRATAMIENTO
I.8.1 Aleatorización pura o simple
Objetivo: Regla práctica para llevar a cabo la aleatorización (respetando el diseño y el estudio).
Ejemplo base: 2 tttos + muestras independientes + pacientes entran de uno en uno ( asignación
inmediata proceso rápido): ¿se le da A o B? por sorteo:
GUIONES DE LAS CLASES DE TEORÍA: I. Ensayos Clínicos 9
Mediante moneda, bolas …: no imitan bien al azar + experimentador influye + relación médico
paciente se deteriora.
Por Tabla de Números Aleatorios (Tabla 5): nº par = A; nº impar = B (si queremos que nA ≈ nB).
Mejor tenerlo preparada de antemano en una lista aleatoria.
Si doble ciego: en sobres opacos cerrados desventaja: permutas inadvertidas + apertura
voluntaria mejor por teléfono o por internet.
Si apareadas: A secuencia AB y B secuencia BA.
I.8.2. Aleatorización no estratificada
Si no estratos la aleatorización no depende del enfermo lista de antes.
Antes se perseguía que nA ≈ nB (por ello p = ½ en el sorteo) aleatorización pura o simple. Pero con
muestras pequeñas el azar puede desequilibrar (nA = 4 y nB = 16 [Link].): ¿cómo estabilizar?
Repetición de la aleatorización simple
Repetir la aleatorización hasta que nAnB 10 en N = nA+nB = 100 ([Link].)
Aleatorización por bloques
Sistema: decidir el tamaño del bloque (K = 6 [Link].) + obligar a que en cada bloque los ni sean iguales (si
en un bloque sale BAAA los dos faltantes han de ser BB).
Desventaja/Problemas: al final del bloque se sabe qué pasará no decir que hay bloques (aunque si K
<< se adivinará). Para evitarlo:
Si N 100: hacer K grande (20 [Link].).
Variar K al azar.
Partir los bloques e insertar al azar.
Método de la Moneda Sesgada
Antes: Pr (A) = Pr (B) = 0,5 probabilidades iguales y constantes método de la moneda correcta.
Ahora: Pr (A) = p con:
p > 0,5 si nA < nB hasta ese momento.
p < 0,5 si nA > nB hasta ese momento.
p = 0,5 si nA = nB hasta ese momento.
probabilidades desiguales y variables método de la moneda sesgada.
En general: aleatorización con asignación igual (p = 0,5) o desigual (p 0,5).
Problemas:
¿Qué p’s?
Si p >> ó << los resultados son previsibles.
10 GRADO EN ESTADÍSTICA: Métodos Básicos de Bioestadística (Prof. Martín Andrés)
Se sabe que: si N >> (<<) p = 5/9 ó 4/9 (1/2) va bien.
Regla óptima (d = 6 u 8 para N = 100):
Si nAnB d p = 1/2.
Si nAnB < d p = 2/3.
Si nAnB > +d p = 1/3.
Modo de aplicarlo: Si p es la probabilidad de asignar el tratamiento A a un individuo (B es el otro
tratamiento): tomar un grupo de números de la Tabla 5, convertirlos en decimales (sin enteros) y
asignar A si el número resultante es menor o igual que p (en el caso de muestras apareadas la
conclusión será que el individuo comienza recibiendo A).
Tamaños de muestra distintos
A r = nA/N, con N = nA+nB, se le llama razón de asignación hacer p = r.
En general es preferible que sea r = 1/2 (asignación igual), pero si el costo de una unidad de A (cA) es
diferente al costo de una unidad de B (cB) entonces el costo total se hace mínimo si r = {cB/(cA+cB)}0,5
(asignación desigual).
I.8.3. Aleatorización estratificada
Problema estratificado: hay que respetar los tamaños por estrato la asignación depende del enfermo:
Es más difícil: controlar por filas y columnas.
Actuar como antes, pero por estratos si n pequeño hay mucha predeterminación.
Muchos enfermos se desaprovechan.
La lista es imposible.
Solución de la sección siguiente.
I.8.4. Aleatorización adaptativa
Aleatorización fija o no adaptativa: p = constante aleatorización pura o simple.
Aleatorización adaptativa: p = variable moneda sesgada:
Adaptativa a la “base-line”: p = f(nA; estado del paciente antes del ttto) método de minimización
(que no vemos) para solventar I.8.3.
Adaptativa a la respuesta: p = f(resultados del ttto) el ttto con más éxitos se aplica más
procedimiento del juego al ganador sorteo el 1º (A [Link].) + si éxito (fracaso) el 2º es A (B) + …:
Tiene menos problemas éticos.
Requiere una respuesta inmediata al ttto.
Su análisis estadístico es más complejo.
GUIONES DE LAS CLASES DE TEORÍA: I. Ensayos Clínicos 11
I.9. EL ENSAYO CLÍNICO IDEAL
El que a un mínimo costo no deja lugar a dudas de que el efecto (de observarse) se debe al ttto y tiene
una máxima potencia.
Con respecto al tipo y diseño: aleatorizado (con placebo si uno de los tratamientos es un control) a doble
ciegas y con diseño cruzado. El orden de importancia es el de escritura. Si el EC es multicéntrico,
conviene estratificar por Centros.
Con respecto al tipo de aleatorización:
Si N 200: aleatorización simple.
Si N < 200: aleatorización restringida (por estratos, si hay pocos factores de riesgo; adaptativa a la
base-line, si hay muchos).
I.10. MEDIDA DE LA RESPUESTA
Un EC debe tener claro:
¿Qué se va a demostrar?: hipótesis.
¿Qué diseño se va a hacer?
¿Qué tipo de aleatorización?
¿Qué se va a medir?: medida de la respuesta.
Puede ser:
Una medida directa: un suceso clínico como “curación”, “muerte”, etc: requiere MÁS DATOS pero
son MUY RELEVANTES.
Una medida indirecta: la presión sanguínea, nivel de colesterol, etc: requiere MENOS DATOS pero son
POCO RELEVANTES.
La medida ha de ser fácil de diagnosticar u observar, estar libre de errores de medida, poder ser
observada con independencia del tratamiento, tener relevancia clínica, ser elegida antes de comenzar la
recolección de los datos y ser lo más informativa posible.
Los EC suelen tener un objetivo primario (basado en variables primarias) y otro u otros secundarios
(basados en variables secundarias). Cualquiera de ellas puede ser directa o indirecta.
I.11. TAMAÑO DE MUESTRA
En los EC es imprescindible que las dos conclusiones posibles sean fiables:
H1 (ttto nuevo mejor que el clásico usar el NUEVO): para darle garantías de mejora a la sociedad
garantizado por el método estadístico (error fijado).
12 GRADO EN ESTADÍSTICA: Métodos Básicos de Bioestadística (Prof. Martín Andrés)
H0 (ttto nuevo igual que el clásico seguir con el CLÁSICO): para darle garantías a la sociedad de
que no se desprecia un ttto mejor garantizado si se fija el tamaño de muestra (error fijado).
Por ello CUALQUIER PAÍS CIVILIZADO EXIGE QUE EL EC HAYA DETERMINADO n.
La fórmula a utilizar depende de:
1) El diseño utilizado (en general muestras independientes o apareadas);
2) El tipo de medida de la respuesta (una cualidad o una cantidad);
3) La distribución estadística (usualmente la Normal);
4) Las hipótesis a contrastar (clásicas o de bioequivalencia);
Pero una vez determinada la fórmula apropiada, su aplicación requiere conocer:
5) Las razones muestral K = n2/n1 o de asignación r = n1/(n1+n2) (usualmente K = 1 y r = 1/2).
6) El número de colas del test (1 ó 2 colas);
7) La mínima diferencia a detectar ( = 12 ó = p1p2);
8) El error ( = 5% es lo usual);
9) El error -o la potencia =1- asociado a ( = 10% ó 20% - = 90% ó 80%- es lo usual);
10) Información acerca de los valores reales de ciertos parámetros implicados o no en el test
(proporciones, varianzas o coeficientes de variación);
Y, cuando hay más de una variable principal, hay que:
11) Elegir la más relevante (normalmente un suceso clínico) o elegir el mayor de los tamaños calculados
para cada una de esas variables.
I.12. DURACIÓN DEL ENSAYO
Depende del tiempo requerido hasta observar la respuesta, del tamaño de las muestras y del número de
Centros participantes.
I.13. LOS ENSAYOS CLÍNICOS EN ESPAÑA
La legislación española (B.O.E. del 7-2-04) entiende por tal a toda investigación efectuada en
seres humanos para determinar o confirmar los efectos clínicos, farmacológicos y/o demás efectos
farmacodinámicos, y/o de detectar las reacciones adversas, y/o de estudiar la absorción, distribución,
metabolismo y excreción de uno o varios medicamentos en investigación con el fin de determinar su
seguridad y/o su eficacia
No exige: comparación con otros productos.
Se restringe: a sustancias o medicamentos y no a otros tratamientos (acupuntura).
GUIONES DE LAS CLASES DE TEORÍA: I. Ensayos Clínicos 13
I.14. LA ÉTICA EN LOS ENSAYOS CLÍNICOS
Son éticamente admisibles por ser el único mecanismo científico válido para comprobar la eficacia de
un tratamiento.
Un EC tiene condicionamientos:
Prácticos: como en toda experiencia.
Éticos: ¡son seres humanos!
I.14.1. El consentimiento informado
Requieren del consentimiento informado del paciente (por escrito): legislación + código de Nüremberg
+ Declaración de Tokyo (Helsinki II) problemas
Trauma de decir que el ttto es al azar.
Difícil equilibrio del entusiasmo y la incertidumbre.
Si el paciente prefiere algo fuera del EC.
Si Placebo vs. Ttto: trauma de incurable, no sé nada, …
Solución de Zelen:
Grupo al que NO se le pide el consentimiento: asignar el ttto estándar.
Grupo al que SÍ se le pide el consentimiento: asignar el ttto que deseen (estándar o nuevo).
Al final comparar los grupos del “SÍ consentimiento” vs. “NO consentimiento”.
Ventajas Zelen: todos los enfermos entran + son informados + deciden qué quieren.
Problemas Zelen:
Si demasiados prefieren el estándar.
Tttos estándar y nuevo confundidos.
Tratamiento estadístico especial en construcción.
I.14.2. ¿Es ético asignar el placebo y negar el ttto?
Si ttto a prueba no está probada su eficacia.
Menos ético es utilizarlo sin probar: se propaga en la práctica (sin conocer sus efectos reales/ secunda-
rios) + bloquea la investigación (pues ya hay algo): ligadura de arterias mamarias vs. angina de pecho.
Menos ético es no utilizarlo nunca: pues puede que sea eficaz.
Ejercicio 1.1.- Comentar las características principales de la siguiente experiencia (20 líneas como
máximo) y discutirla. “Para determinar si la alimentación con leche materna influía en un mejor
desarrollo de los lactantes, se tomó un grupo al azar de niños que seguían solamente lactancia
materna y otro grupo, también al azar, que sólo tomaba leche artificial; ambos grupos de niños
14 GRADO EN ESTADÍSTICA: Métodos Básicos de Bioestadística (Prof. Martín Andrés)
tenían la misma edad (2 meses). A todos los niños se les anotaron diversos parámetros (aunque con
fines indicativos sólo nos referiremos al peso) y, tras realizar los oportunos test, se concluyó que los
niños con lactancia materna tienen por término medio un peso superior al de los niños con
lactancia artificial”.
Son dos muestras independientes elegidas al azar: SÍ/NO leche artificial.
Es observacional no es un EC. Los niños que a los dos meses seguían con la leche materna es porque
les iba bien tendrán mejor salud. Los resultados no son concluyentes.
Debería haberse hecho:
Tomar una muestra antes de nacer el niño.
No debe ser ciego: el efecto del “rito” (mamar) forma parte de la investigación.
Encargar PE1.1
I.15. METAANÁLISIS
I.15.1. Introducción
El metaanálisis es el análisis de los análisis: el análisis estadístico de un conjunto de resultados
procedentes de estudios individuales cuya selección se ha realizado mediante una revisión sistemática.
Su propósito es integrar el conocimiento contenido en los estudios seleccionados para dar un resultado
final, a cuyo efecto hay dos enfoques:
Combinar los niveles de significación P correspondientes a los diferentes estudios: son métodos
desarrollados a partir de los años 30 de forma paralela por Fisher, Pearson y Cochran (aún no se
hablaba de metaanálisis). Hay diferentes estrategias para combinar los niveles de significación, la
más conocida es el método de Fisher-Pearson.
Combinar los tamaños del efecto de los diferentes estudios para obtener un tamaño del efecto
global: es el enfoque más usado actualmente, originado en los años 70 y bautizado como
metaanálisis por Gene Glass en 1976.
1.15.2. MA considerando los niveles de significación. Método de Fisher-Pearson
Si ningún experimento de entre varios es conclusivo ¿qué decisión final se debe tomar? Por ejemplo,
los niveles de significación de tres EC son
P1 = 0,06; P2 = 0,10; P3 = 0,20
¿Qué hacer para obtener un único P global y decidir?
Mezclar los 3 EC`s en uno solo: ¡NO! protocolos .
GUIONES DE LAS CLASES DE TEORÍA: I. Ensayos Clínicos 15
Mezclar los 3 P`s en uno solo: SÍ! + varios procedimientos (vemos solo el método de Fisher-
Pearson)
Método de Fisher-Pearson
Si en base a K experiencias independientes se contrastan unas mismas hipótesis y se obtienen K p-
values Pi (significativos o no), el método de Fisher globaliza tales valores para proporcionar un test
único a través de la comparación del estadístico:
2
exp 2 ln Pi con 2 2 K gl .
NOTA: El método es de utilidad general en estadística para otros problemas similares. Por ejemplo en
un ANOVA de dos vías con dos ttos. (en filas), varios bloques (en columnas) y varios elementos por
casilla (pero de varianzas no homogéneas) es difícil responder a la pregunta de si los dos ttos. son
iguales. Alternativamente, puede calcularse el valor P1 de comparar los dos ttos. en bloque 1, etc. y
luego analizar los valores Pi así obtenidos por el método de Fisher (lo que responderá a la pregunta
global si no hay interacción).
Ejercicio 1.2.- Demostrar el método anterior siguiendo los pasos que se describen.
Paso 1: Demostrar que si X F(X) es continua Y = F(X) Uniforme [0; 1] g(y) = 1.
G(y) =
Paso 2: Si Z = 2ln Y, como por el cambio de va h(z) = g(y)dy/dz Z 2(2).
h(z) =
Paso 3: Si Zi son K va independientes Zi 2(2K).
Paso 4: Como los p-values de una cola son funciones de distribución F(x) –similarmente para los de dos
colas entonces:
Zi =
Ejercicio 1.3.- Resolver el problema de la introducción (en base a los datos indicados allí).
2
exp 2 ln Pi =
P los tratamientos son
16 GRADO EN ESTADÍSTICA: Métodos Básicos de Bioestadística (Prof. Martín Andrés)
1.15.3. MA considerando el tamaño del efecto
Por tamaño del efecto se alude a cualquier parámetro que caracterice la fuerza con la que se da un
fenómeno, como la diferencia o razón de medias o proporciones:
Ello permite evaluar la significación sustantiva (práctica) de los resultados,
En contraste con la evaluación de la significación estadística (que indica si las diferencias pueden
atribuirse al azar) del método de Fisher-Pearson.
El problema es cómo promediar los efectos de los diferentes estudios, lo que lleva a analizar el
problema desde muy diversas perspectivas (que no se ven aquí).