0% encontró este documento útil (0 votos)
42 vistas31 páginas

Referente 1

Cargado por

Jenifer Jimenez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
42 vistas31 páginas

Referente 1

Cargado por

Jenifer Jimenez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

BIOESTADÍSTICA

APLICADA
Darío Mendoza

EJE 1
Conceptualicemos

Fuente: adobestock/128152424
Hipótesis e inferencia a partir de dos muestras . . . . . . . . . . . . . . . . . . . . . . . 4

Errores en los contrastes de hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Error tipo I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Error tipo II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

La prueba de Chi cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

Aplicación en SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

Test exacto de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Prueba de McNemar para datos emparejados . . . . . . . . . . . . . . . . . . . . . . 17

Comparación de medias entre dos grupos independientes . . . . . . . . . . . . 19

Prueba T de Student para varianzas homogéneas . . . . . . . . . . . . . . . . 20

Prueba T con ajuste para varianzas desiguales (test de Welch) . . . . . . . . 21

Comparación de medias entre dos grupos pareados . . . . . . . . . . . . . . . . . 22

Ejemplo con T-student para grupos independientes . . . . . . . . . . . . . . . . . . 24

Ejemplo con T-student para datos emparejados . . . . . . . . . . . . . . . . . . 26


ÍNDICE

Aplicación en SPSS 28

Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Después de dominar los conceptos de esta-
dística descriptiva vistos en el primer nivel de
Bioestadística, es necesario comenzar con
los métodos inferenciales. Estos métodos se
caracterizan por plantear hipótesis estadísti-
cas (Hoffman, 2019), por ejemplo, si se quiere
determinar qué grupo presenta una caracte-
rística determinada en mayor medida o pro-
porción con respecto a otro grupo, las pruebas
inferenciales son la herramienta predilecta
para evaluar este tipo de comparaciones.
INTRODUCCIÓN

En este referente se tratarán las principa-


les pruebas bivariadas para comparar medias
cuantitativas o cualitativas. En primera ins-
tancia, cuando se pretende inferir a partir
de proporciones se emplearán pruebas cate-
góricas como el chi cuadrado de Pearson, el
test exacto de Fisher o la prueba pareada de
McNemar. Estas pruebas son de naturaleza no
paramétrica, pero se incluyen en esta sección
ya que contribuyen a dar respuesta a la pre-
gunta orientadora y su uso es más habitual,
especialmente el chi cuadrado en la investi-
gación en salud.

Posteriormente, se trata la situación de


comparar medias a partir de dos grupos inde-
pendientes y pareados. En esta situación se
explican las pruebas paramétricas de T-stu-
dent para grupos independientes con varian-
zas homogéneas, varianzas heterogéneas
y pareada. Este tipo de pruebas se emplean
en diferentes tipos de investigación básica y
epidemiológica, son manejadas por un buen
número de investigadores con un enfoque
cuantitativo, su razonamiento no requiere
de mayores esfuerzos por parte de aquellos
aprendices que se inician en el proceso de
investigación científica.

Se comparten algunos enlaces al final de


cada explicación de las pruebas, donde es
posible realizar los cálculos estadísticos expli-
cados en el presente referente.
Hipótesis e inferencia a
partir de dos muestras
Las hipótesis de investigación son frases predictivas sobre la relación entre las variables,
mientras que las preguntas de investigación son similares a las hipótesis, excepto que
no implican predicciones específicas (Leech, 2014). En Bioes-
tadística, las hipótesis se plantean como hipótesis nula (Ho)
e hipótesis alterna (H1). La Ho supone que no hay diferencias
entre lo que se ha asumido o hipotetizado y la media de la
Hipótesis nula
población, mientras que la H1 se encuentra en desacuerdo con
Dos parámetros son simila-
la Ho (Dawson-Saunders et al., 2005). res y tomados de la misma
población.
Hoffman, J. (2019). Biosta-
Para evaluar pruebas a favor de cualquiera de estas dos tistics for Medical and Bio-
hipótesis, la Bioestadística hace uso principalmente de tres medical Practitioners (Edi-
ción: 2). Academic Press
estimaciones:
Hipótesis alterna
• Estimación puntual (valores p).
Si la hipótesis nula no es
aceptada, es decir, los dos
• Estimación por intervalos (intervalos de confianza). parámetros provienen de di-
ferentes poblaciones, luego
hay tres posibles escenarios:
• Tamaño de los efectos. Parametro 1 no es igual a
Parámetro 2
Parámetro 1 es mayor a Pa-
En cualquiera de los tres casos, la ciencia ha acordado esta- rámetro 2
blecer algunos puntos de corte para dar pruebas a favor de Parámetro 1 es menor a Pa-
una u otra hipótesis. En el caso de los valores p, valores de pro- rámetro 2
Hoffman, J. (2019). Biosta-
babilidad o valor de significancia se ha seleccionado un valor tistics for Medical and Bio-
p≤0.05 para determinar pruebas a favor de la H1. La estimación medical Practitioners (Edi-
ción: 2). Academic Press
por intervalo proporciona un abanico de valores posibles dentro
de los cuales se encuentra el verdadero valor en la población y,
Tamaño de los efectos
por lo general, se asigna una confianza del 95 % para asegurar La magnitud absoluta de la
que este se encuentre ahí. Finalmente, el tamaño del efecto es diferencia entre dos o más
una medida objetiva y estandarizada de la magnitud del efecto parámetros.
Hoffman, J. (2019). Biosta-
observado. Una de las medidas que se han visto para entender tistics for Medical and Bio-
un tamaño del efecto es el coeficiente de correlación de Pearson medical Practitioners (Edi-
ción: 2). Academic Press
y lo que permite es adicionar información que en algunas oca-
siones no es posible obtener a partir de los valores p (Field, 2013).

Lectura recomendada

Para ampliar la importancia de estas tres estimaciones se sugiere realizar la


siguiente lectura, que ofrece una guía práctica para su determinación.
Effect size, confidence interval and statistical significance: a practical guide for
biologists
Shinichi Nakagawa y Innes Cuthill

Bioestadística aplicada - eje 1 conceptualicemos 5


Instrucción

Ahora los invito a realizar la lectura del caso modelo para interpretar
hipótesis y valores p a partir de un resumen de un artículo científico.

Errores en los contrastes de hipótesis


Alfa
Por lo general se suelen llamar error alfa y error beta, pero La máxima probabilidad
en la mayoría de la literatura en bioestadística se les dice predeterminada de cometer
un error tipo 1.
mejor error tipo 1 y 2 por el riesgo asociado, que sí suele tomar Hoffman, J. (2019). Biosta-
la nomenclatura de alfa y beta. tistics for Medical and Bio-
medical Practitioners (Edi-
ción: 2). Academic Press
Error tipo I
Beta
Un error de tipo I se presenta cuando una prueba de hipó- La máxima probabilidad
tesis declara que el resultado de un estudio es estadística- predeterminada de cometer
un error tipo 2.
mente significativo, pero la hipótesis nula es verdadera (no Hoffman, J. (2019). Biosta-
hay diferencia real en la población). Los errores tipo I son una tistics for Medical and Bio-
medical Practitioners (Edi-
motivación importante para replicar los resultados de los estu- ción: 2). Academic Press
dios de investigación. Si hay un 5 % de posibilidades de que
ocurra un error tipo I en un estudio, entonces la posibilidad
de que dos estudios independientes encuentren un resultado
estadísticamente significativo cuando no exista una verdadera diferencia de población
es solo 0.5 %*0.5 %=0.25 % (Kestenbaum, 2009).

Bioestadística aplicada - eje 1 conceptualicemos 6


La tabla 1 expone las situaciones que se pueden presentar.

Resultado real
Contraste de hipótesis

Ho H1

Resultado Ho Acierto Error tipo II


encontrado H1 Error tipo I Acierto

Tabla 1. Resultados de un contraste de hipótesis


Fuente: propia, basada en Martínez y González (2014)

Un error tipo I significa que los inves- tado de un estudio es estadísticamente


tigadores concluyeron que el tratamiento no significativo, pero existe una verdadera
de una investigación no tiene un efecto diferencia o asociación en la población. En
cuando realmente sí lo tiene. Es más, otras palabras, los investigadores declaran
muchos reportes de investigación son encontrar un efecto cuando realmente no
construidos en base a errores tipo I y pos- lo hay y al igual que el error tipo I se invier-
teriormente probar la existencia o no de
ten muchos recursos en replicar estudios
pruebas a favor de la Ho puede consu-
cuando se presentan este tipo de errores.
mir muchos recursos y tiempos a otros
investigadores.
Este error suele presentarse cuando el
Para disminuir la probabilidad de pre- efecto es pequeño.
sencia del error tipo I, se hace necesa- Se sugiere un valor
rio emplear métodos de selección y un de riesgo de este
tamaño de la muestra que sean repre- tipo de error II, al
Potencia
sentativos de la población. Este riesgo de que se le llama Esto es la probabilidad
cometer este tipo de error I se le conoce riesgo beta (β) del de encontrar una ver-
con el nombre de riesgo alfa (α). La 20 %. Como el error dadera diferencia entre
parámetros.
determinación a priori de un riesgo alfa es tipo II consiste en Hoffman, J. (2019). Bios-
una decisión que los investigadores deben no rechazar Ho tatistics for Medical and
Biomedical Practitioners
asumir antes del inicio del estudio y el valor cuando se debería (Edición: 2). Academic
p obtenido posterior a la recolección de Press
haber rechazado, se
la información les brindará herramientas
emplea el concepto
para aceptar o rechazar la Ho.
de potencia de una
Error tipo II prueba estadística
para detectar una diferencia cuando ésta
Un error tipo II ocurre cuando una existe realmente. Por tanto, la potencia es
prueba de hipótesis declara que el resul- el complementario de β, Potencia = 1 - β.

Bioestadística aplicada - eje 1 conceptualicemos 7


Visitar página Lectura recomendada

Se recomienda la lectura del


artículo de Erdfelder, Faul, &
Buchner para el manejo de
G*Power.

G * Po w e r 3 : A f l e x i b l e
statistical power analysis
program for the social,
behavioral, and biomedical
sciences

Franz Faul, Edgar Erdfelder,


Para calcular p otencias Albert Lang y Axel Buchner
estadísticas de diferentes
pruebas y tamaños de efecto,
se recomienda la instalación
de G*Power (Faul et al.,
2007). El enlace disponible
para la descarga de este
software de uso libre es el
siguiente: Instrucción
https:// www.psychologie.
hhu.de /arb eitsgrupp en /
allgemeine-psychologie-und-
arbeitspsychologie/gpower.
html

Adicionalmente se invita
a revisar el siguiente
videorresumen antes de
iniciar con el estudio de
las pruebas estadísticas
del presente referente.

Bioestadística aplicada - eje 1 conceptualicemos 8


La prueba de Chi cuadrado

Parámetros como la media y la desviación estándar son comunes para describir una
población. Sin embargo, también es común que los investigadores
deben responder preguntas sobre variables que son proporciones
o frecuencias relativas de una distribución. Para estos casos la
Parámetros
prueba de Chi cuadrado es la indicada al permitir comparar dos
Una cantidad que des-
cribe o caracteriza una categorías de datos y ver si ellas son independientes de cada otra
población. (Gravetter & Wallnau, 2016; Hinton et al., 2014).
Hoffman, J. (2019). Bios-
tatistics for Medical and
Biomedical Practitioners Si bien existen casos de cálculo de la prueba de chi cuadrado
(Edición: 2). Academic
Press
para una sola muestra, el caso más común es el de comparar
proporciones. Para esto es necesario organizar la información en
tablas de 2x2 o tablas de contingencia. En las filas se ubica la
variable de exposición o factor de riesgo y en las columnas el
evento o la enfermedad, en forma similar a lo detallado en la tabla 1. Estas tablas de
2x2 tienen valores periféricos que son la suma de las columnas y filas. La tabla 2 permite
apreciar la organización de la información en un ejemplo hipotético (Hoffman, 2019).

Tratamiento Vivo Muerto Total


A 60 40 100
B 70 30 100
Total 130 70 200

Tabla 2. Ejemplo de dos tratamientos y el resultado en una muestra de 200 individuos.


Fuente: propia, basada en Hoffman, (2019)

Para calcular el estadístico de Chi cuadrado es necesario aplicar la fórmula:

Los valores observados son los expuestos en la tabla 2. Para calcular los valores espe-
rados es necesario multiplicar el subtotal de la columna por el subtotal de la fila y dividir
por el total de los totales. Es decir, para calcular el valor esperado de los 60 observa-
dos que están vivos con el tratamiento A, es necesario realizar la siguiente operación:
(130*100)/200=65. Este proceso se realiza para todas las casillas y el resultado de los
esperados se detalla en la tabla 3.

Bioestadística aplicada - eje 1 conceptualicemos 9


Tratamiento Vivo Muerto Total
A 65 35 100
B 65 35 100
Total 130 70 200
Tabla 3. Resultados esperados de dos tratamientos en una muestra de 200 individuos
Fuente: propia, basada en Hoffman, (2019)

Ahora se reemplazan los datos en la fórmula:

Visitar página

• http://vassarstats.net /tabs.html#csq

• https://stattrek.com/online-calculator/chi-square.aspx

Como el valor p = 0.138, se entiende que no se encontró diferencia en la proporción de


pacientes tratados con el método A con respecto al método B.

Instrucción

Aplique el ejemplo en la hoja de cálculo en la primera actividad de


aprendizaje práctica que se encuentra en la parte principal del eje.

Bioestadística aplicada - eje 1 conceptualicemos 10


Aplicación en SPSS

Visitar página

Para realizar la prueba de chi cuadrado en el paquete SPSS será necesario


disponer del archivo “Chi cuadrado” disponible en el siguiente enlace:

https://drive.google.com/file/d/16BzUFIl2PKp-mirKHm-KHwaa-cxy91Xx/
view?usp=sharing

En este archivo hay dos variables, “Tratamiento” y “Condición”, la primera está codi-
ficada como 1=A y 2=B, y la segunda 1=Vivo y 2=Muerto. La ruta para solicitar la prueba
de chi cuadrado se encuentra en la figura 1.

Al hacer clic en tablas cruzadas se va a desplegar una ventana presentada en la figura


2, donde es necesario ubicar el “Tratamiento” en filas y la condición en “Columnas”. Luego
es necesario hacer clic en estadísticos y activar la casilla de Chi cuadrado.

También hay estadísticos para evaluar relaciones entre variables ordinales, nominales
y estadísticos de concordancia. En esta oportunidad no se explorarán estas opciones.

Figura 1. Ruta en SPSS para evaluar la relación entre dos variables cualitativas.
Fuente: propia

Bioestadística aplicada - eje 1 conceptualicemos 11


Figura 2. Configuración de la prueba Chi cuadrado en SPSS
Fuente: propia

En la opción de casillas se pueden solicitar los valores esperados para que se pueda
comparar con los datos calcula-
dos en forma manual. La figura 3
también ofrece posibilidades de
presentar los porcentajes y reali-
zar la Prueba z que compara las
proporciones de columna y en
algunas ocasiones puede ser de
utilidad. Por el momento, solo se
activarán los valores esperados,
teniendo en cuenta que los obser-
vados están activados en forma
predeterminada.

Figura 3. Ventana de casillas para tablas


cruzadas en SPSS.
Fuente: propia

Bioestadística aplicada - eje 1 conceptualicemos 12


En la figura 3 es posible calcular los residuos no estandarizados, estandarizados y
estandarizados corregidos. Estos últimos se emplean para calcular post hoc en Chi cua-
drado cuando se dispone de más de dos variables categóricas.

En los resultados interesa la tabla cruzada, tabla 4 y la prueba de chi cuadrado, tabla
5. Se puede observar que el programa deja en una misma tabla los observados con los
esperados y en otra tabla los estadísticos. Solo interesa para este ejemplo el calculado
por el Chi cuadrado de Pearson.

Tabla 4.
Fuente: propia

Tabla 5.
Fuente: propia

Bioestadística aplicada - eje 1 conceptualicemos 13


Los resultados confirman pruebas a favor de la hipótesis nula al no encontrarse rela-
ción entre el tratamiento y la condición de estar vivo o muerto (Chi cuadrado (1) = 2.198;
p=0.138).

Video

Les invitamos a consultar la videocápsula: Ejemplo de pruebas post hoc


de chi cuadrado en SPSS.

Chi-Square - Post-Hoc Testing - SPSS (Part 1)

https://youtu.be/cOu9rv83G-I

Test exacto de Fisher

En caso de presentar muestras pequeñas y un valor esperado menor a 5, la prueba de


chi cuadrado es inexacta y es mejor reemplazarla por el test exacto de Fisher. Las fórmulas
a emplear son (Martínez-González, 2014):

El símbolo “!” indica que es el factorial del número, por ejemplo 5 factorial (5!) es igual
a 120 (5*4*3*2*1).

Bioestadística aplicada - eje 1 conceptualicemos 14


Ejemplo

Un grupo de 30 adultos mayores se han asignado a dos grupos, uno para evitar caídas y el
otro control. Los datos son:

Grupo No se caen Se caen Total


Intervención 14 5 19
Control 5 6 11
Total 19 11 30

Tabla 6. Datos de 30 abuelitos en dos grupos


Fuente: Martínez y González (2014)

Como uno de los valores esperados es menor a 5, se debe aplicar el test exacto de Fisher.

Para entender el concepto de “n” factorial en las fórmulas expuestas anteriormente, es


necesario preguntarse de cuántas formas se pueden producir 11 caídas en los 30 abuelitos.

Esto indica que hay más de 54 millones de formas de que entre 30 personas se caigan 11.
Para los datos de la tabla se tiene:

Esto es un valor p, pero es necesario considerar otras posibles tablas manteniendo los
marginales fijos.

Para obtener el valor p del test exacto de Fisher es necesario sumar los valores p anteriores.
Se obtiene así un valor p=0.124. Este valor p es a una cola, para obtener el valor a dos colas
es necesario calcular las probabilidades en el otro extremo de la distribución. Para este caso
es p=0.238.

Bioestadística aplicada - eje 1 conceptualicemos 15


Visitar página Instrucción

En los siguientes recursos se pueden


encontrar calculadoras para tablas Se invita a realizar la
de contingencia (Hoffman, 2019): segunda actividad de
a p re n d i z a j e p rá c t i c a
• https:// www.graphpad.com/ mediante la prueba
quickcalcs/contingency1.cfm exacta de Fisher que se
encuentra en la parte
• https://statpages.info/ctab2x2.
principal del eje.
html

Tabla 7. Todas las posibles combinaciones, marginales fijos y su respectiva probabilidad


Fuente: propia, basada en Martínez y González (2014)

Bioestadística aplicada - eje 1 conceptualicemos 16


Prueba de McNemar para datos emparejados

Cuando las proporciones son emparejadas, la prueba McNemar es la indicada para


resolver la hipótesis nula sobre las frecuencias de las categorías diferentes que ocurren
en la misma proporción (Triola, 2018).

La tabla de 2x2 tendrá la siguiente asignación de letras para cada una de sus casillas:

a b
c d
Tabla 8. Letras asignadas a las casillas de una tabla 2x2
Fuente: propia

La fórmula de McNemar es (Triola, 2018):

Ejemplo

500 sujetos fueron indagados mediante un cuestionario sobre si algún profesional de la


salud le ha preguntado si tiene Diabetes. Posteriormente se verifica en la historia médica
este antecedente para verificar inconsistencias (Goodman, 2017). Los datos son:

Historia médica
Diabetes Total
No diabetes

Diabetes 183 20 203


Auto reporte
No diabetes 12 285 297

Total 195 305 500

Tabla 9. Datos de 500 pacientes para verificar si hay inconsistencia con el cuestionario aplicado y
la historia médica
Fuente: Tomado de Goodman (2017)

La hipótesis nula indica la no asociación entre el auto reporte y la historia clínica. Para
corroborar esto se reemplaza en la fórmula:

Bioestadística aplicada - eje 1 conceptualicemos 17


Visitar página

Este valor de chi cuadrado claramente no es significativo. Se puede corro-


borar esto en los siguientes enlaces de calculadoras para analizar casos
pareados mediante la prueba de McNemar (Hoffman, 2019):

• http://vassarstats.net /

• https://www.graphpad.com/quickcalcs/McNemar1.cfm

Instrucción

A su vez, se invita a realizar la actividad de aprendizaje número 3 en


los enlaces suministrados.

Por tanto, no hay evidencias de asociación entre la historia médica y el auto reporte
(p=0.1573).

Bioestadística aplicada - eje 1 conceptualicemos 18


Comparación de medias entre tamaño de la muestra es menor a 30, debe
dos grupos independientes realizarse la prueba de Shapiro-Wilk. Si el
tamaño de la muestra es igual o mayor
Cuando se desea hacer comparaciones 30, debe realizarse la prueba de Kolmo-
entre variables cuantitativas medidas en gorov-Smirnov con corrección de Lilliefors.
dos grupos o sujetos diferentes, se emplea Para cualesquiera de estas pruebas, un
la prueba t para medidas independientes. valor de significancia p<0,05 se interpreta
Se habla de grupos independientes cuando como una distribución no paramétrica. Por
no están relacionados de manera alguna el contrario, si el resultado es p>0,05, se
entre ellos, no están emparejados o combi- interpreta como una distribución paramé-
nados. Ahora bien, cuando dos grupos pre- trica o normal.
sentan tamaños de la muestra distintos sin
tener datos faltantes, deben ser tratados 4. Las varianzas de las dos muestras
también como grupos independientes. son homogéneas. Para evaluar si las
varianzas son iguales o no lo son, se
En este caso, la hipótesis nula es: emplea la prueba F para homogenei-
dad de varianzas. Para esto, primero
H0: μ1 = μ2 se calcula el cociente de varianzas:

Los requisitos para realizar la prueba de


hipótesis empleando t son los siguientes
(Martínez-González, 2014):

1. Las dos muestras son independientes.


A continuación, se determinan los gra-
2. Las dos muestras son aleatorias dos de libertad para cada una de las mues-
simples. tras, como:

3. Se cumple, al menos, una de las g-l=n-1


siguientes condiciones:
Finalmente, se determina si el cociente
• Los tamaños de la muestra son de varianzas supera el valor crítico en la dis-
mayores a 30 en cada una de las tribución F de p<0,05, de acuerdo con los
muestras. grados de libertad de las dos muestras. Si el
cociente de varianzas no supera este valor
• La distribución de los datos es crítico, se considera que son homogéneas
normal. y se puede emplear la prueba T de student.
Por el contrario, cuando el cociente de
La normalidad de la distribución de varianzas supera el valor crítico de p<0,05,
los datos puede evaluarse mediante una se considera que las varianzas no son
prueba de normalidad en SPSS o STATA. Las homogéneas y debe emplearse una prueba
pruebas de normalidad deben realizarse de t con ajuste para varianzas desiguales (test
manera separada para cada grupo. Si el de Welch).

Bioestadística aplicada - eje 1 conceptualicemos 19


Prueba T de Student para varianzas homogéneas

Esta prueba consiste en calcular el cociente de la diferencia entre las medias (efecto)
dividida entre el error estándar de esta diferencia (EEDM):

Para calcular el error estándar de la diferencia de medias (EEDM) se requiere determi-


nar primero la varianza ponderada (Sp), de la siguiente manera:

Siendo n= el tamaño de la muestra y s= varianza. A continuación, se calcula la EEDM


empleando la siguiente fórmula:

Visitar página

Recursos disponibles para calcular T-student se encuentran disponibles en los siguientes


enlaces (Hoffman, 2019):

• https://www.easycalculation.com/statistics/ttest-calculator.php

• https://www.mathportal.org/calculators/statistics-calculator/t-test-calculator.php

Bioestadística aplicada - eje 1 conceptualicemos 20


Prueba T con ajuste para Después de calcular el valor de la prueba
varianzas desiguales (test de t de student y los grados de libertad, se pro-
cede a determinar el valor p exacto usando
Welch)
Excel, como será ilustrado más adelante en
un ejemplo. Si se obtiene un valor p<0,05
La fórmula que se emplea para la prueba
en la prueba t se interpreta como una dife-
t con varianza iguales es:
rencia estadísticamente significativa entre
las dos muestras. Por el contrario, si el valor
p>0,05, se interpreta como que no hay tal
diferencia (Sullivan, 2017).

Visitar página

Siendo, x= media de la muestra; S=


varianza de la muestra; y n2= tamaño de
la muestra.
Recursos disponibles para
Una vez determinado el valor en la c a l c u l a r T- s tu d e n t s e
prueba t de student, es necesario determi- encuentran disponibles
nar los grados de libertad de las muestras. en los siguientes enlaces
Los grados de libertad para la prueba t se (Hoffman, 2019):
calculan mediante la siguiente fórmula: • h t t p s : / / w w w. g r a -
p h p a d . c o m / q u i c k-
calcs/ttest1.cfm

• https://arosh.github.
io/ttest/unpaired.html

Bioestadística aplicada - eje 1 conceptualicemos 21


Comparación de medias entre se mencionó anteriormente, puede
dos grupos pareados emplearse SPSS o STATA. Para ta-
maños de muestra menores de 30
Cuando queremos comp arar dos se emplea la prueba de Shapiro-Wilk
medias, pero los grupos no son indepen- mientras que para muestras de 30 o
dientes, sino que están emparejados, debe más, se emplea la prueba de Kolmo-
emplearse la prueba t de student para gorov-Smirnov.
datos emparejados. Se considera que hay
emparejamiento cuando se realizan medi- • Si el tamaño de la muestra es igual
ciones repetidas en los mismos sujetos o o mayor a 30, o la distribución de los
cuando se comparan entre sí individuos de datos de la diferencia tiene distribu-
dos en dos. En el primer caso, al realizar ción normal, se procede a calcular el
las mediciones y las comparaciones dentro error estándar de la media de las di-
de un mismo individuo (auto empareja- ferencias (EEMDIF):
miento), no se tiene en cuenta la varia-
bilidad entre individuos (inter individual) Siendo SDif= la desviación estándar de la
sino la variabilidad dentro de un mismo diferencia y N= tamaño de la muestra.
individuo (intra individual). En este caso,
la hipótesis nula puede plantearse en tér- • Se calculan los grados de libertad
minos de las dos medias o en términos de empleando la expresión general:
la diferencia entre ellas, de la siguiente grados de libertad= N-1, siendo N el
manera (Martínez-González, 2014): número de individuos en la muestra.

• Se calcula la t para datos empareja-


dos, mediante la siguiente fórmula:
H0: μ1 = μ2 ó μ1 _ μ2 = 0
Siendo Media(DIF)= la media de las
diferencias y EEMDIF= error estándar de la
• El primer paso para comparar gru- media de las diferencias.
pos emparejados consiste en crear
una nueva variable que es la diferen- • Después de calcular el valor de la
cia entre los valores emparejados, prueba t de student para datos em-
por ejemplo, la diferencia entre an- parejados, se procede a determi-
tes y después. A partir de esta nueva nar el valor p exacto usando Excel,
variable se calculará una media de como será ilustrado más adelante
las diferencias. en un ejemplo. Si se obtiene un va-
lor p<0,05 en la prueba t se inter-
• A continuación, debe considerarse preta como una diferencia estadís-
si el tamaño de la muestra es ma- ticamente significativa entre las dos
yor a 30, y en caso de que no lo sea, muestras. Por el contrario, si el valor
debe comprobarse la normalidad de p>0,05, se interpreta como que no
la nueva variable. Para esto, como hay tal diferencia.

Bioestadística aplicada - eje 1 conceptualicemos 22


Visitar página

Calculadoras en línea para grupos pareados están disponibles en


los siguientes enlaces (Hoffman, 2019):

• https://www.graphpad.com/quickcalcs/ttest1.cfm

• https://mathcracker.com/t-test-for-paired-samples

Figura 4. Diagrama de flujo para comparación de medias entre dos grupos


Fuente: propia

Bioestadística aplicada - eje 1 conceptualicemos 23


Ejemplo con T-student para grupos independientes

En un seguimiento de seguridad y salud en el trabajo, a un grupo de trabajadores,


hombres y mujeres, se les realizaron mediciones de niveles de colesterol total en sangre
y se obtuvieron los valores detallados en la tabla 10.

Hombres (n1= 7) Mujeres (n2=6)

185 150

260 195

Niveles de colesterol 200 210


(ml/dL) 180 190

210 180

350 167

190
Media 225,0 182,0
Varianza 3758,3 454,0
Desviación estándar 61,3 21,3
Shapiro-Wilk p=0,081 p=0,979
Tabla 10. Niveles de colesterol total en sangre (md/dL) en trabajadores
Fuente: propia

Para determinar si existen diferencias en los valores de colesterol total entre y mujeres,
con un nivel de significancia p<0,05, deben seguirse los pasos indicados en el diagrama
de flujo presentado en la figura 1:

• Las muestras son independientes porque corresponden a hombres y mujeres y no


están relacionadas o emparejadas. Además, los tamaños de la muestra son des-
iguales.

• Como las dos muestras son menores a 30, se empleó la prueba de Shapiro-Wilk,
cuyo resultado fue p>0,05, lo cual indica que la distribución de los datos en ambas
muestras es normal.

• Se evalúa la homogeneidad de varianzas, para lo cual se calcula el cociente de


varianzas y los grados de libertad.

Bioestadística aplicada - eje 1 conceptualicemos 24


Los grados de libertad para las dos muestras son:

Para determinar el valor p, se emplea en excel la siguiente función:

=DISTR.F.CD(8,28;6;5)

Devuelve un valor p=0,017, por lo tanto, las varianzas son desiguales.

• Se emplea entonces la fórmula para prueba t con ajuste para varianzas desigua-
les (test de Welch). Reemplazando en la fórmula los valores de media, varianza
y tamaño de la muestra para la muestra 1 (hombres) y la muestra 2 (mujeres),
tendríamos:

A continuación, se calculan los grados de libertad corregidos para la prueba t:

Para determinar el valor p de la prueba t empleando Excel, se usa la siguiente función:

=DISTR.T.2C(1,73;7,62)

Devuelve un valor de p=0,126, por lo tanto, no hay diferencias significativas entre


las medias de los dos grupos, es decir que no hay diferencias en la media de niveles de
colesterol total en sangre entre hombres y mujeres.

Bioestadística aplicada - eje 1 conceptualicemos 25


Instrucción

Se invita a realizar la cuarta actividad de aprendizaje práctica, sobre


T-student para grupos independientes que se encuentra en la parte
principal del eje.

Ejemplo con T-student para datos emparejados

A un grupo de personas con sobrepeso y obesidad se les realizó una intervención multi-
disciplinaria consistente en modificaciones del estilo de vida y tratamiento farmacológico
para bajar de peso. Se les midió el peso antes y después de 2 meses de intervención y los
resultados se muestran en la tabla 8.

Antes Después DIF


100 90 10

85 84 1

92 88 4

102 95 7

95 93 2

78 65 13

96 90 6

88 75 13

94 89 5

110 95 15

76 69 7

Media 7,5

Desviación estándar 4,7

Shapiro-Wilk p=0,575

Tabla 11. Peso (kg) antes y después de la intervención


Fuente: propia

Bioestadística aplicada - eje 1 conceptualicemos 26


Para determinar si existen diferencias en el peso antes y después de la intervención,
con un nivel de significancia p<0,05, de acuerdo con el diagrama de flujo presentado en
la figura 1, primero debe determinarse si se trata de muestras independientes. En este
caso, las muestras no son independientes, sino que se trata de mediciones emparejadas
porque se realizaron mediciones repetidas en los mismos sujetos, antes y después de una
intervención.

Por lo anterior, se debe crear una nueva variable con la diferencia (DIF) entre los
valores antes y después. A continuación, debe determinarse si la nueva variable DIF tiene
distribución normal. Para esto, considerando que el tamaño de la muestra es de 11, se
emplea la prueba de Shapiro-Wilk, en SPSS o STATA, y se obtiene un valor p=0,575, por lo
cual se concluye que la distribución es normal y puede emplearse la prueba t de student
para grupos emparejados, reemplazando en las fórmulas:

Posteriormente, para calcular el valor exacto de p de la prueba t se emplea la función


de excel, teniendo en cuenta N-1 grados de libertad (N-1=11-1=10) y dos colas:

=DISTR.T(5,4;10;2)

De esta manera, se obtiene un valor de p=0,0003, es decir que se rechaza la hipótesis


nula. Por lo tanto, se puede concluir que hubo una diferencia significativa entre el peso
antes y después de la intervención.

Video

Les invitamos a consultar la siguiente videocápsula:

Prueba de hipótesis y T student en Excel

https://youtu.be/f7s52BJdwJw

Bioestadística aplicada - eje 1 conceptualicemos 27


Aplicación en SPSS

Al hacer clic en Analizar y luego en Comparar medias en el paquete estadístico SPSS


se encontrarán las pruebas paramétricas que comparan medias a partir de una muestra
(situación poco común), en grupos independientes, relacionados y el análisis de varianza
de una vía.

Para el presente ejemplo se escogerá la opción de “Prueba T para muestras indepen-


dientes de resumen”, figura 5 y se introducirán los datos del ejemplo empleado en grupos
independientes.

Figura 5
Fuente: propia

Las salidas de SPSS ofrecen los resultados descriptivos, valores introducidos más la
media del error estándar y en la tabla 12 la prueba de varianzas junto con la prueba de
T-student. En esta tabla se muestran dos renglones, el m primero es para cuando las
varianzas son homogéneas, pero la prueba F está indicando un valor p=0.0099, por tanto,
será necesario reportar los valores del segundo renglón para varianzas heterogéneas.
Para los datos introducidos, no se encontraron diferencias significativas en la media del
colesterol entre hombres y mujeres, T-student=1.73 (7.62); p=0.122.

Bioestadística aplicada - eje 1 conceptualicemos 28


Tabla 12
Fuente: propia

Conclusiones

En este primer referente se ha tenido la oportunidad de retomar con los conceptos de


planteamiento de hipótesis vistos en el anterior curso de Bioestadística e indispensables
para entender la parte inferencial de las pruebas analíticas.

Estas primeras pruebas bivariadas explicadas desde la aplicación de ejemplos ficticios


adaptados al nivel de aprendizaje que se encuentran los maestrantes de epidemiología,
les permite interactuar con aplicaciones en línea o paquetes estadísticos que empiezan a
exigir competencias, no solo de razonamiento cuantitativo, sino habilidades tecnológicas
para la introducción, análisis y procesamiento de la información.

Se han considerado principalmente tres situaciones, la relación o comparación de


datos categóricos, la comparación de grupos independientes a partir de distribuciones
paramétricas y de grupos relacionados paramétricos y no paramétricos. Son quizás las
pruebas analíticas bivariadas de mayor aplicación en ciencias de la salud y la primera
aproximación inferencial de los maestrantes. Estas les han permitido interpretar esti-
maciones puntuales, a partir de valores p, para dar pruebas a favor de alguna hipótesis
planteada.

En el próximo referente tendrá la oportunidad de continuar con este tipo de inferencias,


pero solo desde distribuciones de datos no paramétricos, casos también muy aplicados
en bioestadística e investigación epidemiológica cuando se presentan muestras pequeñas
con escalas de medición ordinal.

Bioestadística aplicada - eje 1 conceptualicemos 29


Dawson, B., Trapp, R. & De la Vega Sánchez, M. (2005). Bioestadística médica.
El Manual Moderno. Tomado de https://books.google.com.co/books?id=xs-
1AAAACAAJ

Faul, F., Erdfelder, E., Lang, A. & Buchner, A. (2007). G* Power 3: A flexible statistical
power analysis program for the social, behavioral, and biomedical sciences. Be-
havior research methods, 39(2), pp. 175–191.

Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics. SAGE.


BIBLIOGRAFÍA

Goodman, M. (2017). Biostatistics for Clinical and Public Health Research (Edición:
1). Routledge.

Gravetter, F. & Wallnau, L. (2016). Statistics for the Behavioral Sciences—Stand-


alone Book (Edición: 10). Cengage Learning.

Hinton, P. R., McMurray, I., & Brownlow, C. (2014). SPSS Explained (Edición: 2). Rout-
ledge.

Hoffman, J. (2019). Biostatistics for Medical and Biomedical Practitioners (Edición:


2). Academic Press.

Kestenbaum, B. (2009). Epidemiology and Biostatistics: An Introduction to Clinical


Research (Edición: 2009). Springer.

Leech, N. (2014). IBM SPSS for Intermediate Statistics (Edición: 5). Routledge.

Martínez, M. (2014). Bioestadística amigable. Elsevier.

Nakagawa, S., & Cuthill, I. (2007). Effect size, confidence interval and statistical sig-
nificance: A practical guide for biologists. Biological reviews, 82(4), pp. 591–605.

Sullivan, L. (2017). Essentials of Biostatistics in Public Health (Edición: 3). Jones &
Bartlett Learning.

Triola, M. (2018). Essentials of Statistics (6 edition). Pearson.

También podría gustarte