Bioestadística
conceptos básicos
La bioestadística es la aplicación de las estadísticas a un amplio campo de tópicos en
biología, esta envuelve el desarrollo y aplicación de técnicas estadísticas al investigación
en campos relacionados a la salud incluyendo medicina, epidemiología y salud pública
también envuelve trabajo estadístico en áreas de estudio ambientales, investigación
agrícola y biología.
Es decir es la ciencia que se ocupa de la recolección, organización, presentación, análisis
e interpretación de la información biológica que puede ser expresada numéricamente.
En la Bioestadística existen conceptos básicos como:
• Población: una población o colección de elementos puede consistir de personas,
animales, valores, máquinas, vegetales, fincas, etc. normalmente es demasiado
grande para poder estudiar la totalmente, las poblaciones encuentran presentes
en un espacio y tiempo determinado.
Las poblaciones pueden ser finitas o infinitas. Las poblaciones finitas consisten en
un número fijo de valores mientras que las poblaciones infinitas están formadas
de una sucesión sinfín de valores.
• Muestra: es un subconjunto representativo de la población el cual debe ser
seleccionado de acuerdo a ciertos principios probabilístico, sobre el que
realmente se efectúan las observaciones es decir medición. Está formado por
miembros seleccionados de la población. Es la porción de la población que se
selecciona para su análisis.
• Individuo: Se denomina individuo o unidad de investigación a cada uno de los
elementos de una población. Ej.: cada mujer en edad fértil
• Estadística: es una medida que se calcula para describir una característica de una
sola muestra de la población, es una cantidad que varía de muestra a muestra.
Las estadísticas se utilizan principalmente para realizar estimaciones acerca de
ciertos parámetros poblacionales, probar hipótesis y tomar decisiones óptima en
un contexto de incertidumbre.
• Datos: todo lo que se recoge o mide de una variable, fenómeno o evento, son el
resultado de la observación de la realidad. Los datos es la información numérica
necesaria para tomar una decisión en base a una situación particular.
• Variables: es una característica, propiedad o atributo observable que varía entre
los diferentes individuos que conforman una población, puede ser medible o no
medible. Esta propiedad hace que los individuos de un grupo puedan diferir de
las de otro grupo en la muestra o población de estudio.
Existen distintas técnicas de muestreo u obtención de muestras:
Muestreo probabilístico: En el que se conoce la población objeto del estudio y la
posibilidad de ser incluido en la muestra es conocida para cada individuo antes de ser o
no seleccionado.
• Muestreo aleatorio simple: Garantizar que todos los elementos de la
población tengan la misma probabilidad de ser seleccionados (muestra de
tamaño “n”, seleccionada de una población “N”, de manera que cualquier
posible muestra de tamaño “n” tiene la misma probabilidad de ser
seleccionada). Es la más empleada.
• Muestreo estratificado: Se divide la población en grupos o estratos y
después se obtiene una muestra aleatoria de cada uno de ellos.
• Muestreo sistemático: Se selecciona uno de cada k individuos, siendo k la
constante de muestreo (se calcula dividiendo el no de sujetos de la
población entre el tamaño calculado de la muestra)
• Muestreo polietápico o por conglomerados: Se seleccionan unidades de
muestreo de la población (unidades primarias), a partir de estas se
seleccionan unidades secundarias y así sucesivamente. Se pueden
emplear distintas técnicas de muestreo para cada etapa.
Muestreo no probabilístico: La posibilidad de ser incluido en la muestra no se conoce para
cada individuo antes de ser seleccionado. No se asegura la representatividad de la
población.
Estadística descriptiva:
Estadística inductiva o inferencial
Es una parte de la estadística que comprende los métodos y procedimientos que por
medio de la inducción determina propiedades de una población estadística, a partir de
una parte de. Su objetivo es obtener conclusiones útiles para hacer deducciones sobre
una totalidad basándose en la información numérica de la muestra.
Estudio de la estadística inferencial:
• Toma de muestras que se refiere a la forma adecuada de considerar una muestra
que permita obtener conclusiones estadísticamente válidas y significativas.
• Luego se realiza una estimación de parámetros o variables estadísticas que
permite estimar valores poblacionales a partir de muestras de mucho menor
tiempo.
• Contraste de hipótesis, que permite decidir si dos muestras son estadísticamente
diferentes o si un determinado procedimiento tiene un efecto estadístico
significativo.
El estudio puede comenzar de nuevo a partir de este momento, en un proceso cíclico que
permite conocer cada vez mejor la población y características de estudio.
Hay dos tipos de inferencia:
• Estimación
ü Con ella solo se pretende acercarnos a la realidad de la población.
ü Podemos obtenerla calculando el rango de variación probable de los
resultados obtenidos.
• Test de hipótesis
ü Se analizan estadísticos (datos muestrales) para ver si soportan o no una
especulación o conjetura (hipótesis) sobre la magnitud de los
parámetros (datos poblacionales).
ü Generalmente, se trata de establecer comparaciones o situaciones de
igualdad o desigualdad entre variables.
ESTIMACIÓN
• Tiene especial interés la ESTIMACIÓN POR INTERVALOS (intervalo de confianza o
IC)
• Definido con el rango dentro del cual se sitúa el parámetro estimado, con un
determinado grado de seguridad, en el caso extremo, podríamos decir que, con
un grado de seguridad del 100%, nuestro dato se sitúa entre +∞ y -∞.
• Para variables cuantitativas se aplica la estimación por intervalos de confianza
de medias, mientras que para variables cualitativas se emplea la estimación por
intervalo de confianza de proporciones.
TEST DE HIPÓTESIS
- La hipótesis constituyen un elemento clave del método científico, mediante la cual se
establece una suposición a partir de conocimientos previos para extraer determinadas
conclusiones.
- En el contexto estadístico, a menudo nos interesa establecer conjeturas y
comparaciones entre determinadas características de la población o entre distintas
poblaciones, para ello se establecen dos tipos de hipótesis:
• Hipótesis nula (H0):
ü Supone la igualdad o que no existen diferencias entre dos variables
comparadas.
ü Se formula solo para rechazarla
• Hipótesis alternativa (H1):
ü Supone la desigualdad o la existencia de diferencias.
ü Es el objetivo de la mayoría de las investigaciones y constituye una
opción más arriesgada.
-Existen test para contraste de hipótesis que nos permiten aceptar
o rechazar una determinada hipótesis en condiciones de incertidumbre.
Métodos estadísticos básicos.
PRUEBA T
La Prueba T fue desarrollada en 1899 por William Sealey Gosset (1876-1937),
que publicaba sus trabajos bajo el pseudónimo de “STUDENT”, para evitar la
discriminación laboral de la época.
Compara las medias de una variable continua en muestras para determinar si o
no la diferencia entre las dos medias esperadas excede la diferencia que debería
ser esperada por azar. Ejemplo: ¿que probabilidad hay que las medidas difieran?
v Requerimientos para la prueba T:
Ø Las observaciones son independientes
Ø Extraídas de poblaciones normalmente distribuidas
Ø Tamaño de muestra <30 si es mayor a 30 usar la prueba de z de la
distribución normal (prueba binominal).
v Tipos de pruebas T:
ü Prueba t para una muestra: prueba si la media de la muestra de una
variable difiere significativamente de la media conocida de la
población.
ü Prueba t no pareada o independiente: prueba si las medias
estimadas de la población por 2 muestras independientes difieren
significativamente (grupo de hombres y grupo de mujeres)
ü Prueba t pareada: prueba si la media estimada de la población por
muestras dependientes difieren significativamente (media de pre y
post-tratamiento para el mismo grupo de pacientes.
POR SUERTE, LOS MODERNOS PROGRAMAS ESTADÍSTICOS REALIZAN TODOS LOS
CÁLCULOS REPRESENTADOS POR LA FÓRMULAS ANTERIORES
LO IMPORTANTE ES CONOCER LOS CONCEPTOS NECESARIOS PARA APLICAR UNOS
ESTADÍSTICOS U OTROS EN CADA CASO.
(como se presenta en la imagen del slide).
PRUEBA CHI2.
• Usada para probar la fuerza de asociación entre dos variables cualitativas.
• Usada para datos categóricos.
Requerimientos
• Datos deberán estar en forma de frecuencias.
• El total número de observaciones deberá exceder 20.
• Frecuencia esperada en una categoría o en cualquier celda deberá ser >5
(cuando un de las celdas tiene <5 observados se usa corrección de Yates o si
tiene <5 de esperados se usa exacta de Fisher).
• El grupo de comparación deberá ser aproximadamente igual.
•
CORRELACIÓN Y REGRESIÓN
Métodos para estudiar magnitud de la asociación y la relación funcional entre dos
o más variables.
CORRELACIÓN:
Su objetivo es estudiar la relación existente entre dos variables de tipo cuantitativo.
Métodos de expresión y cuantificación
1. Diagrama de dispersión o nube de puntos (Representación gráfica):
El diagrama de dispersión o nube de puntos es la representación
gráfica de los pares de valores Xi Yj. Permite observar la dirección de
la posible relación (relación positiva o negativa). También podemos
intuir la forma de la relación.
2. Coeficiente de correlación: Este coeficiente es una medida (un
número) que expresa la relación lineal entre dos variable
cuantitativas X e Y y se representa por la letra “r” :
El valor de “r” puede tomar cualquier valor entre –1 y 1
Si r toma valores cercanos a 0, entonces no existe relación lineal entre
las dos variables.
Existen distintos métodos en función de la distribución de las
variables:
ü El C. de correlación empleado en condiciones paramétricas es el de
PEARSON
ü El C. de correlación empleado en condiciones no paramétricas es el
de SPEARMAN
REGRESIÓN
• La regresión es una técnica estadística que permite el estudio de la relación
entre dos variables cuantitativas X e Y osea una variable dependiente y una
o más variables independientes.
• Regresión lineal simple y regresión múltiple son apropiadas para variables
como tensión arterial, peso.
• Regresión logística es aplicable para respuestas binarias como vivo/muerto.
Tipos de regresión lineal
• Regresión lineal simple: Ejemplo de regresión lineal simple: Recta de
regresión mínimo cuadrática entre PESO2 (variable independiente o
explicativa) y ESTATU2 (variable dependiente o explicada), se quiere
estudiar la diferencia de estatura en función del peso, con SPSS y el
diagrama de dispersión con la recta superpuesta
• REGRESIÓN LINEAL MULTIPLE: Es un modelo de regresión lineal en el
que existen más de dos variables explicativas. Ejemplos PPT