DIPLOMATURA SUPERIOR EN INVESTIGAC IÓN C LÍNIC A
MÓDULO 1
Docentes:
Antonietti Laura, Cahn Pedro, de Abreu Maximiliano, D´Imperio Heraldo, Mariani Javier, Martínez
Ma. José, Tajer Carlos
BASES DE DATOS
Los estudios de investigación clínica, sean retrospectivos o prospectivos, requieren de un archivo
claro de la información. La misma debe ser volcada en una planilla que abarque todos los datos de
interés. Antes de la era computacional, esto se hacía utilizando unas planillas apaisadas, constituidas
por hojas cuadriculadas con columnas en las cuales se volcaban los datos de cada variable en cada
uno de los pacientes. Actualmente, una vez que se dominan las bases de datos electrónicas, volcar
los datos en formatos adecuados. Esto facilita enormemente el análisis ulterior.
¿Cómo se configura una base de datos?
La primera tarea es definir cuáles serán los datos que queremos guardar de cada una de las
unidades de análisis (habitualmente pacientes), lo que dependerá obviamente del estudio de que se
trate. Cada dato se carga en una celda o campo de la base de datos.
A los fines del manejo operativo de una base de datos existen diferentes campos posibles:
1) De texto: (alfa-numéricos): expresan conceptos que no pueden ser reducidos a números
convencionales. Estos campos de texto pueden ser:
a) libres: puede escribirse sin condiciones. Un ejemplo clásico es cuando se interroga sobre
complicaciones y se pregunta en última instancia si tuvo otra. Si la respuesta es sí, descríbala. Esta
descripción es en texto e inicialmente es descriptiva, no analizable.
b) respuestas preestablecidas: sólo puede llenarse el campo con textos prefijados, que
pueden incluir dos o más categorías. Por ejemplo, en el caso de sexo, si decidimos guardarlo en
forma de texto las opciones serán masculino y femenino. No se permitirá el ingreso de F, Fem,
varón, mujer, etc. Esto favorece el análisis posterior. Debe recordarse que cuando se le consulte a
la base de datos con un programa estadístico la distribución de sexos, la clasificará de acuerdo a
todas las palabras que se hayan incluido sin ningún criterio, de tal manera que pueden figurar 10
sexos diferentes (masc, masculino, M, F, fem, varón, etc). Otro ejemplo de respuestas
preestablecidas con más de dos opciones es el estado civil (soltera/o, casada/o, divorciada/o,
viuda/o) Usar respuestas preestablecidas es muy importante cuando se registran diagnósticos,
medicamentos, y categorías ordinales (leve, moderado, severo).
Material de uso restringido a estudiantes de la Diplomatura Superior en Investigación Clínica. Todos los derechos
de Propiedad Intelectual pertenecen a su directora Laura Antonietti y equipo docente, es ilegal el reenvío, la
reutilización, transmisión, distribución o modificación de todo o parte del contenido sin permiso escrito de la titular.
DIPLOMATURA SUPERIOR EN INVESTIGAC IÓN C LÍNIC A
Los campos de texto son utilizados para variables descriptivas, cualititativas en general y también
para ordinales, aunque en este último caso puede optarse por una escala numérica (leve = 1,
moderado = 2, grave = 3).
Muchos programas utilizados para elaboración de bases de datos solicitan, cuando se define un
campo de texto o alfanumérico, la longitud del texto (el número máximo de letras o caracteres que
podrán contener). Por ejemplo, para apellido suele requerirse 30 letras y para sexo 9 (masculino
tiene nueve letras y femenino 8).
2) Numéricos: los números son utilizados para guardar diferente tipo de información. Algunos
son verdaderos números (edad, frecuencia cardíaca), y otros son solo indicativos (número del
paciente, teléfono, número de documento).
Estos campos numéricos pueden ser:
a) números enteros
b) números decimales
c) campos definidos para cálculos: en muchas bases de datos puede preestablecerse que
uno de los campos será calculado por los demás. Por ejemplo, se ingresa el peso y la talla, y la
máquina calcula el BMI (body mass index).
3) Campos especiales
a) fechas: las fechas son guardadas en forma de texto pero cada programa tiene su sistema
propio. Es muy conveniente sistematizar el formato de las fechas en el formulario de carga y en la
base de datos, indicando si se usará la nomenclatura europea (día, mes, año) o norteamericana
(mes, día, año). Aunque es un cuadro de texto, los programas permiten restar fechas para calcular
el tiempo transcurrido entre las mismas.
b) opciones: cuando se puede optar por sólo una respuesta entre dos (muerte: si o no) se
define un campo de opción. Este puede ser definido como numérico (0 y 1 por ejemplo), texto (si
o no) o campo lógico (true or false, Y or N). Si bien lo consideramos especial por contener solo
dos categorías, tiene las mismas características que las variables de texto con variables
preestablecidas.
c) ID number (ID): cada paciente (o unidad de análisis) debe tener un número de
identificación único e inmodificable (número de historia clínica, documento, etc). Muchos
programas asignan el número en forma automática de acuerdo al orden de ingreso, pero aun en
esos casos debe agregarse un número independiente que permita identificar al paciente si se borran
casos o se transportan grupos parciales a otras bases. La conformación de este número ID puede
variar de acuerdo al tipo de proyecto. Por ejemplo, si realizamos un estudio de investigación en un
solo centro, puede ser el número de historia clínica, que será único e irrepetible entre los pacientes.
En cambio, en los ensayos clínicos multicéntricos, suele ser una combinación entre el número de
centro (cada institución participante posee un número identificatorio), el número del paciente (cada
paciente tiene un número único en su institución) y las iniciales de su nombre y apellido (por
ejemplo: JP o PJ para Juan Pérez).
Material de uso restringido a estudiantes de la Diplomatura Superior en Investigación Clínica. Todos los derechos
de Propiedad Intelectual pertenecen a su directora Laura Antonietti y equipo docente, es ilegal el reenvío, la
reutilización, transmisión, distribución o modificación de todo o parte del contenido sin permiso escrito de la titular.
DIPLOMATURA SUPERIOR EN INVESTIGAC IÓN C LÍNIC A
Bases de datos. ¿Una o muchas?
Cuando la información que se va a recoger es muy extensa conviene dividirla en diferentes bases
de datos (hojas de la historia clínica). Hay programas que realizan esto en forma sencilla o no tanto.
Para que puedan usarse hojas diferentes, en cada una de ellas debe figurar el número de
identificación del paciente (ID). El campo ID será el que nos permitirá relacionar las diferentes
tablas, manteniendo la individualidad de los pacientes con sus propios datos.
Por ejemplo: Hoja 1: filiación.*, Hoja 2: antecedentes.*, Hoja 4: examenfísico.* , Hoja 5:
evolución.*, etc. El asterisco indica aquí el sufijo de la base de datos (Ej: filiación.xls en excel).
Reconocimiento de las diferentes bases de datos
Cada programa de bases o estadística ordena la información con criterios propios, pero existen
medios para transferir las bases de un formato a otro de manera sencilla. La excepción son los
programas desarrollados para usuarios individuales que tienen un diseño intencionado para
dificultar el acceso libre a los datos.
Los programas habituales de bases de datos o análisis estadístico usan los siguientes sufijos, que se
resumen en la Tabla.
Supongamos que se trata de una base de diabetes
BASE SUFIJO Ejemplo
Excel xls Diabetes.xls
Epi6 rec diabetes.rec
Lotus wks, wk1 diabetes.wks
Statistix sx1 diabetes.sx
Acces mdb diabetes.mdb
Statistica for windows sta diabetes.sta
SPSS sav diabetes.sav
Dbase dbf diabetes.dbf
Egret bdf diabetes.bdf
Epistat epi diabetes.epi
SAS sas diabetes.sas
Definida por el usuario sdf, dat diabetes.dat o diabetes.sdf
Material de uso restringido a estudiantes de la Diplomatura Superior en Investigación Clínica. Todos los derechos
de Propiedad Intelectual pertenecen a su directora Laura Antonietti y equipo docente, es ilegal el reenvío, la
reutilización, transmisión, distribución o modificación de todo o parte del contenido sin permiso escrito de la titular.
DIPLOMATURA SUPERIOR EN INVESTIGAC IÓN C LÍNIC A
Cabe aclarar que los casos definidos por el usuario pueden tener configuraciones muy diversas.
Por ejemplo, para guardar edad sexo y frecuencia cardíaca pueden archivar los datos:
54, masculino, 72 (delimitado por comas)
54 masculino 72 (delimitado por dos espacios)
54; masculino; 72 (delimitado por punto y coma)
Esta delimitación debe ser conocida para proceder a la transformación o lectura de los datos.
Ejercicio
Como parte de la cursada, vamos a elaborar una base de datos utilizando el aplicativo Formularios
de Google, siguiendo el trabajo práctico correspondiente.
Al finalizarlo, sugerimos la carga de 4 o 5 pacientes imaginarios para luego observar cómo quedan
cargados en la hoja de cálculos Excel, que conformará la base de datos.
Material de uso restringido a estudiantes de la Diplomatura Superior en Investigación Clínica. Todos los derechos
de Propiedad Intelectual pertenecen a su directora Laura Antonietti y equipo docente, es ilegal el reenvío, la
reutilización, transmisión, distribución o modificación de todo o parte del contenido sin permiso escrito de la titular.