Introduccin a los microarrays
(No tan) nuevas aproximaciones al estudio de la actividad de los genes
Esquema de la sesin
Presentacin Introduccin Microarrays de expresin Experimentos con microarrays Anlisis de los datos Ejercicios prcticos
Presentacin
Objetivos
Conocer la tecnologa de experimentacin con microarrays Comprender sus posibilidades y limitaciones Familiarizarse con el proceso de experimentacion basado en los microarrays Saber donde acudir para aprender ms
Introduccin-Objetivos
Contenidos
Introduccin
Antecedentes histricos: El cambio de paradigma Que es un microarray Que tipos de microarrays existen Aplicaciones de los microarrays Cmo funciona un microarray de expresin El ciclo de vida de un experimento con microarrays Preprocesado Anlisis de los datos
Experimentos con microarrays
De los nmeros a la interpretacin biologica
Introduccin-Contenidos
Introduccin
Antecedentes histricos
La biologa molecular dispone de mltiples tcnicas para medir los niveles de ARN, ADN, protenas o metabolitos
Northern Blot, differential display, SAGE Southern Blott: [similar a los microarrays] Lo que caracteriza la era post genmica no es lo que se puede medir sino la cantidad de mediciones simultaneas que se pueden realizar
Antecedentes Histricos
Una analoga
En la era pre-genmica la biologa espiaba los genes
Individualmente, de uno en uno Cada gen se poda estudiar a fondo
Antecedentes Histricos
Una analoga (y 2)
En la era prost-genmica se pueden estudiar muchos genes a la vez Pero, como separamos el grano de la paja?
Lo he odo todo
W W W
Antecedentes Histricos
El cambio de paradigma (J. Dopazo)
Con los mismos recursos Obtenemos una imagen de menor resolucin pero con una perspectiva ms general
Antecedentes Histricos
Pero, Qu es un microarray?
Un formato experimental, basado en la sntesis o fijacin de sondas, que representan los genes (o proteinas, o metabolitos), sobre un sustrato slido (cristal, plstico, silice,...), y expuestos a las mol-culas diana (la muestra).
Ques es un microarray
Cmo funciona un microarray
El nivel de hibridacin entre
la sonda especfica (probe) y la molcula diana (target) mediante fluorescencia y se mide por anlisis de imagen
se indica generalmente
e indica el nivel de expresin del gen correspondiente a la sonda en la muestra problema
Cmo funciona un microarray
Que tipos de microarrays existen
De Protenas De Tejidos De DNA
Arrays de CGH SNPs De cDNA De oligonucletidos:
De Expresin
GeneChip Affymetrix Otras marcas
Tipos de microarrays
Aplicaciones de los microarrays
Los microarrays se han aplicado al estudio de casi cualquier tipo de problema biolgico El numero de publicaciones anuales con la palabra microarray en el ttulo es muy alto y continua creciendo (?)
1600 1400 1200 1000 800 600 400 200 0
98 19
1372 1305
1061
789
434
169 15
99 19
55
00 04 20 01 02 03 05 20
20
20
20
20
Aplicaciones de los microarrays (2)
Estudio de genes que se expresan diferencialmente entre varias condiciones
Sanos/enfermos, mutantes/salvajes, tratados/no tratados
Clasificacin molecular en enfermedades complejas Identificacin de genes caractersticos de una patologa (firma o signature) Prediccin de respuesta a un tratamiento Deteccin de mutaciones y polimorfismos de un nico gen (SNP) Etc, etc, etc
Construccin y uso de los microarrays de expresin
Microarrays de expresin
Existen muchos tipos de microarrays Los principios en que se basan son similares Los detalles de su funcionamiento varan de uno a otro caso En este primer contacto nos centraremos en los arrays de expresin
Arrays de 2 colores (spotted) Arrays de oligonucletidos sintetizados in situ
Microarrays de 2 colores (spotted)
Diseo y produccin del chip Preparacin de la muestra Hibridacin Escaneado del chip Anlisis de la imagen
Visin general del proceso
Pulse este enlace para visualizar una animacin del proceso
Microarrays de oligos sintetizados in situ
Diseo ms avanzado que los de 2 colores Utilizan tecnologas desarrolladas en el entorno de la microelectrnica Algunos rasgos distintivos
No se basan en hibridacin competitiva: cada chip contiene muestras de un solo tipo ( 1 color) Las sondas se sintetizan directamente sobre el chip en vez de sintetizarlas in vitro y adherirlas despus Cada gen esta representado por un grupo de sondas cortas en vez de por una solo
Los GeneChips de Affymetrix
Affymetrix (www.affymetrix.com) es la compaa lider en este tipo de chips Se denominan genericamente GeneChips Cada gen esta representado por un conjunto de secuencias cortas que lo caracterizan Algunos chips contienen genomas completos con ms de 50.000 grupos de sondas! NOTA: Grupos de sondas = Probesets
Probesets, probes, PM & MM
Un grupo de sondas se utiliza para medir niveles de mRNA de un nico gen Cada grupo (probeset) consta de mltiples pares de celdas (probe cells)
Con millones de copias de un oligo de 25bp Organizadas en parejas (probe pairs) con un Perfect Match (PM) y un Mismatch (MM)
PM: coincide exactamente con una parte del gen MM: idntico al PM excepto en el nucletido central reemplazado por su complementario
Distintos Pares de Sondas representan partes distintas del mismo gen (1 gen=1 grupo de sondas)
Secuencia del gen
Las sondas se seleccionan para ser especficas del gen que representan y para tener buenas propiedades de hibridacin
Resultado de la sintesis de oligos en el chip
Cada celda contiene mltiples copias de la misma secuencia
Image courtesy of Affymetrix.
Proceso de hibridacin
la sntesis de los oligos se realiza la hibridacin, depositando el mRNA marcado del tejido a estudiar sobre cada chip
Tras
Image courtesy of Affymetrix.
Visin general del proceso (Affy)
@Affymetrix
Comparacin entre los 2 tipos de chips
Microarrays de cDNA
Microarrays de Oligonucletidos
VENTAJAS Fabricacin Rpida y ms robotizada Elevada Reproducibilidad Elevada especificidad (secuencias cortas) Utiliza muchas sondas/gen
VENTAJAS Econmicos Flexibilidad en el diseo experimental Elevada intensidad de seal (secs largas) DESVENTAJAS Baja Reproducibilidad Hibridacin cruzada (baja especificidad) Elevada manipulacin manual (Posibilidad de contaminacin)
DESVENTAJAS Requiere equipamiento ms especializado Caros Poca flexibilidad
Experimentos con microarrays
Experimentos con microarrays
Fuentes de variabilidad y su control Ciclo de vida de un experimento con microarrays El diseo del experimento
Tipos de cuestiones que se desea responder Factores que debemos tener en cuenta Control de calidad Normalizacin
Preprocesado: de los datos crudos al anlisis
Experimentos con microarrays
Tal y como su nombre indica un experimento con microarrays es un experimento, es decir:
Se lleva a acabo para determinar si ciertas hiptesis previas son ciertas o falsas (aun cuando tambin puede llevar a generar nuevas hiptesis
Como todo experimento est sujeto a errores que pueden provenir de mltiples fuentes y ser de tipos distintos
Aleatorios Sistemticos
Fuentes de variabilidad
Biological Heterogeneity in Population. Specimen Collection/ Handling Effects.
Tumor: surgical bx, FNA. Cell Line: culture condition, confluence level.
Biological Heterogeneity in Specimen. RNA extraction. RNA amplification. Fluor labeling. Hybridization. Scanning. PMT voltage. laser power.
(Geschwind, Nature Reviews Neuroscience, 2001)
Tipos de variabilidad
La variabilidad sistemtica es aquella que afecta de manera similar a todas las mediciones
Cantidad de material disponible Instrumental de laboratorio
La variabilidad aleatoria puede afectar de forma distinta a cada componente del experimento
Calidad del material Eficiencia de los procedimientos de laboratorio
Cmo se afronta la variabilidad
Cada tipo se trata de forma distinta
Variabilidad Sistemtica
Podemos estimar las correciones necesarias a partir de los datos: NORMALIZACION o CALIBRACIN Suponemos ciertos modelos de error (e.g. ei~N(0, 2)) y recurrimos al
Variabilidad Aleatoria
DISEO EXPERIMENTAL Para controlarla INFERENCIA ESTADSTICA para extraer conclusiones en su presencia
Todos estos procedimientos se integran en un flujo de trabajo (pipeline) o ciclo de vida de un experimento con microarrays
El ciclo de vida de un experimento
De la cuestion biologica al experimento
Una vez planteada una cuestin los implicados en el estudio deberan planearlo conjuntamente Researchers / Core Facility/ Statisticians Es preciso especificar
Cual es el propsito del estudio Que objetivos persigue Que limitaciones y de que tipo presenta
A partir de aqu podr elaborarse el diseo experimental adecuado
Diseo experimental
Deben tomarse decisiones relativas a aspectos diversos implicados en el experimento
Tipos de muestras
Mezcladas (pooled) o individuales Con rplicas independientes o sin ellas Nmero de arrays necesarios/posibles Cantidad de material necesaria/disponible
Limitaciones fsicas (coste)
De aqu saldr
La forma en que se realizar el experimento Los mtodos estadsticos que debemos aplicar
El preprocesado de los datos
Preprocesado (1) El control de calidad
Preprocesado (2) Normalizacin
El anlisis de los datos
Tipos de anlisis
Los investigadores suelen estar interesados en distintos tipos de cuestiones:.
Encontrar genes diferencialmente expresados entre dos o ms condiciones o a lo largo del tiempo. Identificar nuevos subtipos en una poblacin Descubrir patrones de expresin caractersticos. Predecir la respuesta al tratamiento or clasificar un nuevo individuo utilizando informacin molecular. Identificar genes co-regulados o expresndose en la misma ruta metablica.
Mtodos de anlisis
Para cada problema existen mltiples mtodos
Modelos lineales, pruebas-t con shrinkage para estudios de expresin diferencial Distintos tipos de anlisis de conglomerados (clustering) para descubrir patrones de corregulacin Mtodos de clasificacin tradicionales (LDA, kNN) y modernos (SVM, PAM) para construir predictores Mtodos de anlisis basados en la GO (GSEA) para buscar significacin biolgica Y muchos ms
Tests para expresin diferencial
Para comparar dos o ms grupos: extensiones del test t
El tamao muestral suele ser Se compensa estimando la varianza de cada gen a partir de la de todos los genes SAM, Empirical Bayes,
Para cada gen se hace un test Problema de multiplicidad
Es preciso hacer ajustes para mtiple testing O estimar la tasa de falsos positivos (FDR)
Anlisis de conglomerados
Los genes no varan de forma independiente El anlisis de conglomerados permite descubrir grupos de genes que varan de forma similar Puede utilizarse tambin para agrupar muestras: (fenotipos similares) descubrimiento de subclases
Anlisis basados en la GO
Los resultados de los estudios de microarrays suelen ser largas listas de genes Para contribuir a su interpretacin podemos
Proyectarse en bases de datos de anotaciones como la GO o KEGGS Estudiar si hay clases funcionales enriquecidas entre los genes seleccionados Agrupar los genes por su similitud funcional
Conclusiones y perspectivas
Los experimentos con microarrays han revolucionado el estudio de la genmica funcional
Mejorando el conocimiento de la funcin de los genes a partir de la similitud de patrones de expresin Mejorando el conocimiento de las familias de genes: Permiten incluir nuevos genes en las familias Descubren patrones de expresin coordinados Aumenta el nmero de familias conocidas de genes Algunas como la baja reproducibilidad o la calidad del genoma se solucionaran con el tiempo Otras como el uso adecuado de sus posibilidades dependen del buen (o mal) uso que se haga de ellas
Como toda tecnologas los tiene sus limitaciones
The Promise of Microarray Technology in Treating Disease (NCBI) (1)
Now that you understand the concept behind array technology, picture this:
A hand-held instrument that a physician could use to quickly diagnose cancer or other diseases during a routine office visit. What if that same instrument could also facilitate a personalized treatment regimen-exactly right for you?
The Promise of Microarray Technology in Treating Disease (NCBI) (2)
Personalized drugs, Molecular diagnostics and Integration of diagnosis and therapeutics These are the long-term promises of microarray technology Maybe not today or even tomorrow, but someday For the first time, arrays offer hope for obtaining global views of biological processes by providing a systematic way to survey DNA and RNA variation