BIG DATA
&
LABORATORIO CLÍNICO
Marcela Henríquez Henríquez. [Link].
Departamento de Laboratorios Clínicos
Escuela de Medicina UC.
[Link]
TEMARIO
• ¿Qué queremos decir cuando hablamos de Big Data y Data
Science?
• ¿Cuál es la relación con Laboratorio Clínico?
• Aplicaciones para Big Data y Data Science en Laboratorio Clínico
• Control de Calidad Analítico Basado en Datos Reales
• Test Multianalíticos basados en IA: Nuestra experiencia en el
desarrollo de un test de diagnóstico bioquímico para TDAH
• Grandes desafíos del Big data en Laboratorio Clínico
[Link]
BIG DATA: ¿QUÉ ES?
…Set de datos cuya
extensión,
complejidad y/o
diversidad dificulten
su análisis usando
herramientas
estadísticas y
computacionales
tradicionales….
[Link]
BIG DATA: ¿QUÉ ES?
Por lo tanto…
¡ Todos los datos emanados de la
rutina del laboratorio clínico!
[Link]
Lo que sabemos
Lo que queremos entender
[Link]
[Link]
CIENCIA DE DATOS: ¿QUÉ ES?
Búsqueda de información
con significado dentro de un
gran set de datos.
Multidisciplinario
Con un propósito:
1) Predicción
2) Toma de decisiones
[Link]
CIENCIA DE DATOS: ¿QUÉ ES?
[Link]
APLICACIÓN EN BIOMEDICINA
• Predictores clínicos
• Biomarcadores. Nuevos test diagnósticos
• Medicina Personalizada
• Desarrollo de fármacos
• Predicción y control de brotes epidémicos
• Biología de sistemas
• Evaluaciones económicas en salud
[Link]
APLICACIÓN EN LABORATORIO CLÍNICO
• Biomarcadores. Nuevos test diagnósticos
• Medicina Personalizada
• Sistemas de control de calidad analítico en tiempo real
• Gestión/Optimización de Procesos al interior del laboratorio
• Optimización de Límites de decisión clínica para test
diagnósticos
• Sistema de Gestión de Calidad: Metas basadas en impacto
clínico
• Medicina Transfusional: Predicción de uso de hemoderivados,
predicción/estandarización de reacciones adversas.
[Link]
❖Control de calidad interno basado en datos reales
[Link]
BIG DATA Y CONTROL DE CALIDAD
Desafíos en Torno al Control de Calidad Tradicional
• Conmutabilidad del material utilizado
• Asignación correcta de valor
• Costo elevado
• No permite monitorizar el ensayo en tiempo real
[Link]
BIG DATA Y CONTROL DE CALIDAD
La Alternativa:
Control de Calidad centrado en Pacientes
• Basado en el uso de muestras de pacientes
• Costo nominal
• Resultados robustos y reproducibles en
laboratorios/analitos con suficiente demanda de
exámenes
• Permite monitorización en tiempo real
[Link]
BIG DATA Y CONTROL DE CALIDAD
Control de Calidad Basado en la Media Móvil
• Solución más conocida
• Distintos métodos o sistemas disponibles se
diferencian en:
• Algoritmo de cálculo
• Qué datos se incluyen/excluyen (límites para truncar)
• Modo de establecer los límites de aceptación para el
control de calidad (distribución poblacional vs optimización
del número de falsas alarmas)
[Link]
BIG DATA Y CONTROL DE CALIDAD
Control de Calidad Basado en la Media Móvil
versus Control Estadístico Tradicional
Control Calidad Media Control Tradicional
Móvil
Frecuencia Continuo Puntual , según agenda
Conmutabilidad Conmutable Riesgo de no ser
conmutable
Control ciclo del Analítico y Pre-analítico Sólo Analítico
examen
Número de Uno, basado en la media Múltiples, a elección
Niveles a poblacional
controlar
[Link]
BIG DATA Y CONTROL DE CALIDAD
Control de Calidad Basado en la Media Móvil versus
Control Estadístico Tradicional (continuación)
Control Calidad Media Móvil Control Tradicional
Tipo de error Sesgo (no entrega Sesgo e Imprecisión
detectado información sobre
imprecisión)
Proceso de Complejo, poco Tradicional, conocido.,
optimización y estandarizado, varios mayor estandarización
validación métodos
Representación Accuracy plot, Gráficos de Gráficos de Levey-Jennings
gráfica de Bland y Altman, gráficos
resultados de Levey-Jennings
Costos Bajos Medio-alto
operacionales [Link]
BIG DATA Y CONTROL DE CALIDAD
[Link]
BIG DATA Y CONTROL DE CALIDAD
Implementación QC basado en la mediana móvil de
pacientes ambulatorios
- Fase pre-desarrollo
- Evaluación de la distribución de valores en la población ambulatoria.
- Determinación de algoritmo estadístico para cada analito.
- Fase de desarrollo (21000 exámenes)
- Aplicación de programa de simulación “in house”, con datos
retrospectivos + datos fuera de QC simulados cada 1000 exámenes
- Regla: “release from the back”; n por bloque 50
- Error tolerado basado en variabilidad biológica o +- 10% media
[Link]
BIG DATA Y CONTROL DE CALIDAD
Mediana móvil para datos en control (azul) y con simulaciones fuera de
control
[Link]
BIG DATA CONTROL DE CALIDAD
Corrida Real para Creatinina. A) Mediana móvil para creatinina (3 canales), mostrando
uno de ellos fuera de control. B) Gráfica de Bland-Altman mostrando comparación entre
los valores del bloque analizados en instrumento en control y fuera de control
[Link]
BIG DATA Y CONTROL DE CALIDAD
En esta experiencia, la implementación de un sistema de control
de calidad basado en datos reales demostró:
• Disminución significativa de la necesidad de usar controles
comerciales para QC, con reducción concomitante de costo
• Reducción del número de muestras repetidas (>50%)
• Manera efectiva de detectar mediciones sujetas a error en la
rutina del laboratorio
• A mediano-largo plazo, herramienta complementaria a QC
externo para detectar sesgo y sus posibles fuente
[Link]
❖Test Multinanalíticos basados en algoritmos de IA:
Hacia un test para diagnóstico bioquímico de TDAH
[Link]
MULTIDISCIPLINA:
¡TODOS PARA UNO… UNO PARA TODOS!
[Link]
TRASTORNO POR DÉFICIT DE ATENCIÓN E
HIPERACTIVIDAD (TDAH)
Impulsivida
Inatención Hiperactividad
d
dimensiones
TDAH
DSM-5 ICD-10
Feldman, H. M. and M. I. Reiff (2014). "Clinical practice. Attention deficit-hyperactivity disorder in children and adolescents."
N Engl J Med 370(9): 838-846.
[Link]
RELEVANCIA
• Prevalencia: 5-7% niños. 4% en adultos
• TDAH aumenta el riesgo de morir en niños y adultos.
Seguimiento
183049
años/persona
grupo TDAH
Dalsgaard, S. et al (2015). "Mortality in children, adolescents, and adults with attention deficit
hyperactivity disorder: a nationwide cohort study." Lancet 385(9983): 2190-2196.
[Link]
EL DIAGNÓSTICO DE TDAH PUEDE SER
UNA PESADILLA PARA EL MÉDICO
CLÍNICO
[Link]
MODELO CLÁSICO: DOPAMINA
Genes Ambiente
Disfunción circuitos Dopaminérgicos
Mesocorticale Nigro-
Mesolimbicos
s estriatales
Déficit de la atención y
Impulsividad. Pobre
desorganización del Aversión a la espera por la
adquisición de hábitos
comportamiento recompensa
Sagvolden, T., et al. (2005). "A dynamic developmental theory of attention-deficit/hyperactivity disorder (ADHD) predominantly
hyperactive/impulsive and combined subtypes." Behav Brain Sci 28(3): 397-419; discussion 419-368.
[Link]
NUEVAS HIPÓTESIS: MIELINA
➢ Sujetos con TDAH cuando niños presentan disminución de Fracción Anisotrópica en
la edad adulta (33 años de seguimiento).
Cortese, S., et al. (2013). "White matter alterations at 33-year follow-up in adults with childhood attention-
deficit/hyperactivity disorder." Biol Psychiatry 74(8): 591-598.
[Link]
¿¿¿Ciertos lípidos funcionales podrían estar relacionados
etiopatogénicamente y/o servir como biomarcador para TDAH????
ESFINGOLÍPIDOS Y TDAH:
SIN DATA SCIENCE
Sphingomyelin Sphingomyelin Sphingomyelin Sphingomyelin
C16:0 C18:1 C18:0 C24:1
128
64
Serum levels (uM)
32
16 Henriquez-Henriquez, M.P., et al (2015).
"Low serum sphingolipids in children with
attention deficit-hyperactivity disorder."
8
Front Neurosci 9: 300.
4
ol
ol
ol
ol
D
D
ol
ol
ol
ol
H
H
tr
tr
tr
tr
tr
tr
tr
tr
D
D
on
on
on
on
on
on
on
on
A
A
-C
-C
-C
-C
-C
-C
-C
-C
R
R
R
R
U
[Link]
ESFINGOLÍPIDOS Y TDAH:
SIN DATA SCIENCE
ROC
Area bajo la curva (AUC):
0.81 (95% CI: 0.71- 0.89)
p-value<0.0001
Sensibilidad: 79%
Especificidad: 78%
VPN: 98%
Henriquez-Henriquez, M.P., et al (2015). "Low serum sphingolipids in children with attention deficit-hyperactivity disorder."
Front Neurosci 9: 300.
[Link]
ESFINGOLÍPIDOS Y TDAH:
Cases = 25 CON DATA SCIENCE
Controls = 29
Red Neuronal con 6 analitos
seleccionados entre 60 especies
100 moleculares y ratios
biológicamente significativos
80
AUC = 0.95
Sensitivity%
60
Sensitivity = 93.1%
40
Specificity = 84.0%
20
0
0 20 40 60 80 100
100% - Specificity%
• Post-hoc analysis cohorte piloto (en total=90).
• Red Neuronal en Set variables predictoras: Incluye 4 marcadores esfingolipídicos y 2 LC-PUFAs.
• Variables predictoras selelccionadas entre 60 variables biológicamente relevantes
[Link]
NUESTROS RESULTADOS POBLACIONALES
CONCUERDAN CON MODELOS ANIMALES. KO EN
CERS6 Y GM3 MUESTRAN FENOTIPO HIPERACTIVO
CerS6KO
Wild
Ebel, P., …Willecke,K. (2013). "Inactivation of ceramide Niimi, K., C. Nishioka, T. Miyamoto, E. Takahashi, I. Miyoshi, C
synthase 6 in mice results in an altered sphingolipid Itakura and T. Yamashita (2011). "Impairment of
metabolism and behavioral abnormalities." J Biol Chem neuropsychological behaviors in ganglioside GM3-knockout
288(29): 21433-21447. mice." Biochem Biophys Res Commun 406(4): 524-528.
[Link]
GRANDES DESAFÍOS EN LA INTERFASE
MATEMÁTICA- BIOQUÍMICA CLÍNICA
• Robustecer algoritmos de IA en relación a incertidumbre analítica
• Establecer metas de calidad analítica que aseguren la reproducibilidad de la
técnica
[Link]
• Predecir vulnerabilidades en la clasificación
DESAFÍOS:
HACIA UNA CULTURA DE BIG DATA EN LC
- Incorporación de científicos de datos en el equipo de
laboratorio
- Data Science en el curriculum de la especialidad
- Estandarización del análisis de datos: Discusión, discusión y
más discusión!!!
- Concepto clave: Data Science es ciencia y no magia…Análisis
de datos es completamente homologable al mesón de
trabajo!!!
[Link]
MENSAJES DE DESPEDIDA
• La ciencia de datos necesita del trabajo
MULTIDISCIPLINARIO para cumplir con su objetivo de
asignar SIGNIFICADO a la información contenida en los
BIG DATA
• ENORME potencialidad del uso de estas herramientas
en Laboratorio Clínico y biomedicina…. Que dicha
potencialidad se transforme en REALIDAD, DEPENDE DE
NOSOTROS
[Link]
Escuela de Medicina
INFORMACIÓN DE CONTACTO
Marcela Henríquez Henríquez
Departamento de Laboratorios Clínicos
Escuela de Medicina
Pontificia Universidad Católica de Chile
mhenri@[Link]
mphenriq@[Link]
¡¡¡¡¡Gracias!!!
[Link]