03
Metodología Básica de la Investigación Clínica
Representaciones gráficas
Víctor Quirós González
Marcos Alonso García
Antonio Martín Conejero
En la mayor parte de las ocasiones, los complejos sistemas de análisis que se emplean en epi-
demiología, permiten alcanzar conclusiones importantes pero poco intuitivas o de difícil inter-
pretación.
Representar gráficamente los resultados permite, de un único y rápido golpe de vista, hacerse
una idea de la realidad a la que uno se enfrenta.
A continuación, se muestran las principales opciones de las que se dispone, incluyendo algunos
tipos poco utilizados pero realmente interesantes. Con el fin de facilitar la explicación, se han
seleccionado las características correspondientes a los 30 primeros individuos de la cohorte
“CTOData”.
3.1. Gráfico de sectores
Quizás, el modo de representación gráfica más empleado y sencillo de interpretar sea el gráfico
de sectores. Su forma recuerda a una tarta o pastel (de hecho, en inglés se conoce como pie-
chart).
En este tipo de representación, la frecuencia de determinada variable en nuestra muestra será
directamente proporcional al área. Se asignará a cada categoría el valor que le corresponda de
un total de 360º. Como ya habrá deducido el lector, su empleo se limita a variables cualitativas,
especialmente aquéllas que siguen una escala nominal.
En la Figura 3.1 y la Figura 3.2, se observa la distribución de las variables “sexo” y “nacionali-
dad” en nuestra muestra “CTOData”:
Módulo I • Introducción a la metodología. Estadística descriptiva
Sexo 40%
Mujer
30%
Hombre
Porcentaje (%)
36,3% 20%
10%
63,7%
0%
Bajo Medio Alto
Nivel socieconómico
Figura 3.1. Gráfico de sectores. Variable “sexo” en cohorte “CTOData” Figura 3.3. Diagrama de barras. Variable “nivel socioeconómico”
en cohorte “CTOData”
País nacimiento 10% 3,3%
Andorra
16,7%
3.3. Histograma
Ecuador
España
y polígono de frecuencias
Marruecos La forma ideal de representación gráfica de las variables cuanti-
tativas continuas será el histograma. En este caso, en el eje hori-
12 70% zontal representará las categorías e intervalos y en el eje vertical
las frecuencias dentro de esos intervalos. En los rectángulos ob-
tenidos para cada categoría, la anchura será igual a la longitud
del intervalo; el área resultará proporcional a la frecuencia.
Si se unen con líneas rectas los puntos medios de las bases supe-
Figura 3.2. Gráfico de sectores. Variable “nacionalidad” en cohorte
riores de los rectángulos, se obtendrá el polígono de frecuencias.
“CTOData”
En la Figura 3.4 se puede observar un ejemplo concreto de va-
riable cuantitativa continua (edad) representada por medio de
un histograma y el polígono de frecuencias.
3.2. Diagrama de barras
5
Este segundo método de representación gráfica es el que se
utilizará para variables cualitativas y cuantitativas discretas.
4
Resulta especialmente interesante cuando estas variables cua-
litativas siguen algún orden o jerarquía. 3
Frecuencia
En el eje horizontal se sitúan las categorías de la variable que se 2
esté estudiando, mientras que en el eje vertical se representa-
rán sus frecuencias (absolutas o relativas). Los rectángulos que 1
se obtengan tendrán una anchura constante y una altura pro-
porcional a la frecuencia. 0
0 20 40 60 80 100
Edad
La Figura 3.3 muestra el nivel socioeconómico de los sujetos de
nuestra muestra. Figura 3.4. Histograma. Variable “edad” en cohorte “CTOData”
Representaciones gráficas 03
3.4. Otras formas Aunque se profundizará en este concepto más adelante, quiere
decir que la altura de la caja corresponderá al rango intercuar-
de representación gráfica tílico y orientará sobre la dispersión de la muestra. Dentro de la
caja se puede ver una línea horizontal resaltada, que correspon-
Al llegar a este punto, el lector conoce los tipos principales de de a la mediana como medida de tendencia central. Terminará
representación gráfica de los que se dispone en epidemiología. el gráfico con las barras verticales a ambos lados de la caja y
No obstante, existen métodos menos utilizados pero que apor- cuya longitud es 1,5 veces el rango intercuartílico.
tan una información muy valiosa.
En primer lugar, con los ejemplos anteriores se puede apreciar
3
con un golpe de vista la distribución de las variables, pero no
P75 + 1,5 x RIC
se cuenta con los datos originales. Una gran alternativa en esta
situación es el gráfico de tallo y hojas. Como se aprecia en la 1,5 x RIC
Figura 3.5, para cada observación de la variable se separará el
Valores variable de interés
2
P75
último dígito significativo (hoja) del resto de valores (tallo). Mediana Rango
intercuartílico
P25
Seleccionando a los 10 primeros sujetos de la cohorte
1,5 x RIC
“CTOData”, las alturas se distribuyen de la siguiente forma: 1 suje- 1
to mide 1,58 m (tallo 1,5 y hoja 8), 3 sujetos miden entre 1,60 m
P25 - 1,5 x RIC
y 1,70 m (tallo 1,6), siendo la verdadera altura de 1,62 m; 1,65 m
y 1,69 m (hojas 2,5 y 9), etc.
0
Figura 3.6. Interpretación de un diagrama de caja (RIC: rango
13
intercuartílico)
Frecuencia Tallo Hoja
1 1,5 8
Como se puede observar en la figura, están representados los
3 1,6 259 valores extremos con círculos. En caso de existir valores muy ex-
3 1,7 069 tremos (superiores a 3 veces el rango intercuartílico), se denota-
3 1,8 369
rán mediante un asterisco.
Figura 3.5. Gráfico de tallo y hojas de la altura, en metros, de los 10 Recuerda...
primeros sujetos de “CTOData”
33 Las representaciones gráficas permiten conocer muchas
de las características de la muestra con un solo golpe de
Otra de las opciones, y quizás la más interesante dentro de los vista.
tipos menos frecuentes de representación, es un diagrama que 33 Se elegirá un gráfico o diagrama en concreto, en función
del tipo de variable que se quiera representar.
permita a la vez evaluar la tendencia central, dispersión y sime-
33 El gráfico de sectores resultará ideal para variables cua-
tría de la distribución de las variables: el diagrama de caja (en litativas, especialmente aquellas que siguen una escala
inglés box-plot o box and whisker-plot). nominal.
33 El diagrama de barras será el método apropiado para
representar variables cualitativas y cuantitativas discretas.
En la Figura 3.6, que servirá como referencia, los límites infe- 33 Las variables cuantitativas continuas quedarán representa-
rior y superior de la caja corresponden a los percentiles 25 y 75. das por el histograma y polígono de frecuencias.