Principios de estadística
para ciencias de la salud
ALGUNOS CONCEPTOS BÁSICOS Y
ESTADÍSTICA DESCRIPTIVA
El estudio de la estadística explora: la recolección, organización,
análisis, presentación e interpretación de datos, y su uso para
estimar asociaciones y poner a prueba hipótesis.
Cuando se aplica a ciencias biológicas o de la salud:
Bioestadística, estadística médica
En investigación…la estadística juega un rol clave no
solo en el análisis de resultados, sino también en el
diseño y desarrollo del estudio
Conceptos básicos
• Excepto cuando se hace un censo, recopilamos datos de una
muestra que proviene de un grupo mayor llamado la población.
• La muestra es de interés, no por sí misma,
sino por lo que dice sobre la población.
• La estadística nos permite utilizar la muestra para hacer
inferencias sobre la población de la que se derivó.
Ejemplo: Una muestra de 20 hospitales
de la población de todos los hospitales del país.
Conceptos básicos
Los datos en bruto de una investigación son observaciones
realizadas en personas, células, muestras de sangre,
ratones, hospitales, etc.
El número de ‘individuos’: tamaño de la muestra.
Cualquier aspecto o característica que se mide, como la
presión arterial, el número de dientes naturales, la edad o
el sexo, se llama una variable.
Primero lo primero…
Conocer - Entender - Resumir los datos
Estadística descriptiva: organizar y resumir datos.
Nos da una visión general de las características generales de los datos.
¡Siempre es el primer paso en cualquier análisis!
Diferentes formas: tablas, gráficos, medidas resumen.
Tipo de variable (datos)
Formas de presentar, resumir, analizar
Conceptos básicos - Tipos de Variables
Numéricas Categóricas
Continuas Binaria o dicotómica
(solo dos valores)
(escala continua)
- Muerte (si/no)
- Peso - Enfermedad (si/no)
- Altura
- Presión arterial Nominales
Requieren de algún instrumento/ (no tienen orden natural)
aparato para su medición
- Estado civil
Discretas - Lugar de nacimiento
(números enteros)
Ordinales
- Número de hijos (tienen orden natural)
- # Dientes naturales - Severidad del dolor
- Número de episodios de (ninguno, algo, mucho)
asma en el último año
Qué tipo de variable es…
• Salud oral auto-percibida
Muy mala, mala, regular, buena, excelente
• Colesterol total
• Actividad económica
Empleado, desempleado, ama de casa, pensionado
• Tener cáncer de pulmón o no
• Concentración de flúor en una muestra de agua
Estructura de una base de datos - biomédica
En un estudio típico de ciencias de la salud, se recoge
una gama de información de cada participante
Una base de datos típica tiene:
- Filas (usualmente cada participante tiene una fila)
- Columnas (usualmente cada variable tiene una columna)
Ejemplo de una base de datos
¿Tendría sentido
reportar el promedio
de esta variable?
Visualizando/presentando/
resumiendo los datos
• Usando tablas, gráficos
• Medidas resumen
Tablas
Una forma muy común de presentar los datos.
En una tabla descriptiva sencilla, usualmente se presenta el número
de observaciones (frecuencia absoluta) y la proporción o
porcentaje (frecuencia relativa) en cada categoría
Frecuencia Frecuencia
absoluta relativa
Edad Número de personas Proporción
0.16 = 4/25
La suma de las proporciones es
siempre 1 (o 100%)!
Edad Número de personas Frecuencia relativa F. relativa
acumulada
0.00
0.04
0.12
0.24
0.40
0.64
0.80
0.92
1
Interpretación
¿Nombre del gráfico?
Gráficos
Gráfico circular, de sectores, pastel
≥4 veces semana
2-3 veces semana
1 vez semana
<1 vez semana
Número de veces por semana en las que
un grupo de personas realiza actividad
física moderada o intensa.
Momentos del día en que los adultos
se cepillan los dientes
Gráfico de barras
Al irse a dormir
Después del desayuno
Antes del desayuno
Otro -mañana
Después de la cena
Medio día
Al salir de la casa
Onces - media mañana
Otro
Porcentaje
Las frecuencias absolutas y relativas son comúnmente
ilustradas con los gráficos pie y de barras
Mientras que los gráficos de barras y circulares son los
indicados para distribuciones de variables categóricas;
los histogramas muestran la distribución de
frecuencias para variables numéricas.
Número de estudiantes
Pulsaciones por minuto
En el eje x del histograma, cada barra representa un rango de datos
En el eje x -la variable numérica
En el eje y -la frecuencia absoluta o relativa
Rango de estatura de los integrantes del curso Principios de Estadistica
7
6
Número de personas
5
6
4
2
3
1
2 2
0
1,50- 1,58 1,59-1,67 1,68- 1,76 1,77- 1,86
Rango de Estatura
Otros tipos de gráficos…
Polígono de Frecuencia
Se crea a partir de un histograma, colocando un punto en el
centro de cada intervalo y luego uniendo esos puntos…
350
300
Número de personas
250
200
150
100
50
0
Nivel de colesterol (mg/100 ml)
En un estudio de factores de riesgo de enfermedad cardiovascular,
se midieron niveles de cotinina en sangre* en personas
fumadoras y no fumadoras
Nivel de cotinina Fumadores No fumadores
(ng/ml) (n) (n)
0-13 78 3300
14-49 133 72
50-99 142 23
100-149 206 15
¿Sería adecuado
150-199 197 7
comparar fumadores y
200-249 220 8
no fumadores basados
250-299 151 9
en la frecuencia absoluta
300+ 412 11
de cada intervalo?
Total 1539 3445
Nivel de Fumadores No fumadores
cotinina Número de Porcentaje Número de Porcentaje
(ng/ml) personas (%) personas (%)
0-13 78 5.1% 3300 95.8%
14-49 133 8.6% 72 2.1%
50-99 142 9.2% 23 0.7%
100-149 206 13.4% 15 0.4%
150-199 197 12.8% 7 0.2%
200-249 220 14.3% 8 0.2%
250-299 151 9.8% 9 0.3%
300+ 412 26.8% 11 0.3%
Total 1539 100.0% 3445 100.0%
Ojiva (polígono de frecuencia acumulada)
Similar al polígono de frecuencia, pero en este caso el eje
vertical es la frecuencia acumulada (relativa o absoluta).
Frecuencia acumulada
120
100
Frecuencia relativa acumulada Hombres
80
Mujeres
60
40
20
0
44.5 54.5 64.5 74.5 84.5 94.5 104.5 114.5 124.5
Frecuencia cardiaca (latidos/min)
Gráficos
Para variables categóricas ~ binarias, nominales, ordinales
- De sectores (circular)
- Barras (horizontal o vertical)
Para variables numéricas ~ discretas o continuas
- Histogramas
- Polígonos de frecuencia
- Ojiva (polígonos de frecuencia acumulada)
Gráficos de caja (y bigotes)
Representación gráfica de variables numéricas en una caja dividida según los percentiles.
Percentiles
Al organizar los datos de menor a mayor…
El percentil 50 será aquel valor de la mitad, 50% de las
observaciones tendrán un valor menor y 50% un valor mayor.
2 2 5 5 6 7 10 23 26 28 30
Percentil Percentil Percentil
25 50 75
Primer Tercer
cuartil cuartil
El percentil 75 es el valor que es mayor al 75% de las
observaciones y menor que el otro 25%
Gráfico de caja (y bigotes)
Un dato cuyo valor es más alto
Valor más alto que no pase de
que 1.5 veces el alto de la caja
1.5 veces el alto de la caja
desde el tercer cuartil
desde el tercer cuartil
.
Consumo de cigarrillos/mes
Menor valor que no pase de
1.5 veces el alto de la caja
desde el primer cuartil
Gráfico de dispersión o
nube de puntos
Se utiliza para ver la relación
entre dos variables numéricas.
Cada punto representa una
pareja de datos: su posición
horizontal es determinada por
una variable y su posición
vertical por la otra variable.
Gráfico de dispersión o nube de puntos
18
16
Tiempo de estudio (horas)
14
12
10
8
6
4
2
0
1.5 2 2.5 3 3.5 4 4.5 5
Calificación obtenida en el parcial
Gráfico de líneas
Sala de sistemas:
Taller 1
Gráficos en Excel
Podrán encontrar los datos
que utilizaremos y la guía
del taller en sus correos