0% encontró este documento útil (0 votos)
55 vistas20 páginas

Genomic A

El capítulo describe las principales etapas en la cartografía y secuenciación del genoma, incluyendo los mapas genéticos, físicos y la secuenciación. Explica que los mapas genéticos y físicos proveen información de ubicación creciente sobre los genes y marcadores en el genoma, mientras que la secuenciación determina la secuencia completa de nucleótidos.

Cargado por

xolar2002
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
55 vistas20 páginas

Genomic A

El capítulo describe las principales etapas en la cartografía y secuenciación del genoma, incluyendo los mapas genéticos, físicos y la secuenciación. Explica que los mapas genéticos y físicos proveen información de ubicación creciente sobre los genes y marcadores en el genoma, mientras que la secuenciación determina la secuencia completa de nucleótidos.

Cargado por

xolar2002
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

CAPÍTULO 16

Genómica, cartografía
del genoma y secuenciación

16.1 INTRODUCCIÓN 239 [Link] Mapa físico con enzimas de restricción 248
16.2 MAPAS GENÉTICOS 240 [Link] Mapas físicos de STS y EST 248
16.2.1 Fracción de recombinación como medida [Link] Mapas de cóntigos 250
de distancia en un mapa genético 241 16.4 SECUENCIACIÓN 252
16.2.2 Obtención del mapa genético 243 16.4.1 Método químico de secuenciación del DNA 252
16.3 MAPAS FÍSICOS 244 16.4.2 Método enzimático de secuenciación del DNA 252
16.3.1 Obtención de mapas físicos a baja resolución 244 [Link] Síntesis de un DNA complementario
[Link] Métodos basados en empleo de líneas de longitud variable 253
celulares somáticas híbridas 244 [Link] Separación de los fragmentos y análisis 254
[Link] Obtención de mapas mediante ensayos [Link] Automatización 255
de hibridación con sondas fluorescentes 246 [Link] Variantes del método 256
a) Mapas por hibridación in situ (FISH) 16.4.3 Métodos de secuenciación masiva 257
cromosómica 246 16.4.4 Secuenciación del RNA 257
b) Mapas por citometría de flujo 247 16.5 EL PROYECTO GENOMA 257
16.3.2 Mapas físicos de alta resolución 247
[Link] Mapa físico por hibridación in situ (FISH)
de alta resolución 247

16.1 INTRODUCCIÓN

Se conoce como genómica el conjunto de estrategias y tecnologías empleadas para la caracterización molecular
del genoma y, en general, el estudio del genoma de un organismo en su conjunto (por contraposición a cues-
tiones que afecten a genes individuales). Una buena parte de la genómica corresponde a la cartografía, u
obtención del mapa de un genoma, que a su vez puede considerarse como la estructura fina del material
genético de cualquier especie. Por tanto, constituye también la base de una biología molecular e ingeniería
genética modernas aplicadas a la sanidad.
De acuerdo con estos objetivos, se pueden distinguir dos áreas dentro de la genómica, consecutivas, en
apariencia independientes pero totalmente relacionadas entre sí:
En primer lugar, la genómica estructural, que corresponde al estudio de las técnicas y estrategias necesarias
para obtener tanto los mapas físicos del genoma, posibles a distintos niveles de resolución, como la secuencia
completa del DNA genómico, o mapa físico a la resolución máxima, el nucleótido individual.
En segundo lugar, la genómica funcional, correspondiente a la caracterización del proteoma, es decir, el
conjunto de todas las proteínas originadas por el genoma, bajo los diversos patrones posibles de expresión
génica a proteínas, modificación y degradación de éstas y desarrollo de su función, todo ello dentro de cada tipo
de célula, momento celular, condiciones particulares in vivo, etc. Corresponde, en definitiva, al estudio
funcional del DNA codificante. Por analogía, se denomina proteómica al conjunto de técnicas y estrategias
utilizadas para el estudio del proteoma. En contraste con la genómica estructural, la proteómica progresa con
un desfase, y el número de organismos modelo para los que se dispone de datos es más limitado. Aunque los
avances conseguidos en los últimos 10 años son extraordinarios, aún se necesita tiempo para conocer al
completo la función de todos los genes humanos y sobre todo para dar utilidad práctica, en su caso, a las
proteínas, tanto con fines básicos como aplicados en favor de la humanidad (por ejemplo, a la biomedicina).
Los Proyectos Genoma poseen tal envergadura que sus objetivos no se pueden alcanzar con el simple
planteamiento de buscar métodos para la etapa de secuenciación, a pesar de su creciente eficiencia. De hecho,
el progreso conseguido ha supuesto la implicación de numerosas iniciativas y metodologías que superan con

© 2012. Elsevier España, S.L. Reservados todos los derechos 239


240 I I . TR A N SMI S IÓ N D E L A IN FOR M AC I ÓN G EN ÉTIC A Y TEC NO LO GÍ A S R ELA C IO NA DA S

creces dicha etapa. Ante la imposibilidad material de recoger toda esta información (por otro lado, ya
disponible de forma especializada día a día en internet), se presentan en este capítulo las líneas básicas para
un enfoque ‘‘lógico’’ del conocimiento del genoma.
La elaboración del mapa, o cartografía, de un genoma, tanto del ser humano como de otros organismos, se
ha abordado a lo largo del tiempo en varias etapas consecutivas, en niveles crecientes de resolución. Éstos se
corresponden, a grandes rasgos, con tres grandes estrategias metodológicas, complementarias entre sí:
cartografía genética, cartografía física y secuenciación. Además, ha sido necesario el desarrollo de técnicas
informáticas para recoger, almacenar, distribuir y analizar el creciente volumen de datos obtenidos.

Fases del Proyecto Genoma Características


Cartografía Mapa genético o de Proporciona la menor resolución. Sitúa de forma
ligamiento aproximada en los cromosomas diversos loci (de genes y
de otros marcadores o secuencias identificables). El cálculo
de la distancia y, por tanto, la ubicación relativa de genes
o marcadores, se basa en la frecuencia con la que los pares
de loci se transmiten conjuntamente a la descendencia
Mapa físico Asigna localizaciones a los marcadores, definidas por
distancias en pares de bases. Destacan entre sus variantes los
mapas de restricción (ordenación en el cromosoma de las
dianas para enzimas de restricción)
Secuenciación Equivale a la obtención del mapa genómico en su nivel más
detallado. Su objetivo es establecer la secuencia nucleotídica
completa del genoma. Se lleva a cabo en paralelo y con el
apoyo de la información proporcionada por los mapas
genético y físico. Hace uso de planteamientos y métodos
sumamente específicos, completamente automatizados
e informatizados
Trabajo posterior Refinamiento Se resecuencian algunas regiones para corregir errores
o completar los tramos difíciles que no se habían podido
analizar.
Se añade la ‘‘anotación’’: sobre la secuencia se marcan
las posiciones para las que se dispone de información sobre
función biológica: identificación de genes, regiones
de control, exones, mutaciones relacionadas con
enfermedades, etc.
Variabilidad individual Análisis del genoma de diferentes individuos para ubicar las
posiciones de variabilidad, normal o patológica, en la
secuencia. Polimorfismos genéticos y mutaciones
Genómica comparada Secuenciando otras especies y comparando resultados se
observan los tramos fuertemente conservados, indicativos de
secuencias génicas o, al menos, funcionales. La comparación
ofrece además información útil sobre el desarrollo evolutivo
del genoma

16.2 MAPAS GENÉTICOS

En un principio, los mapas genéticos consistían en una representación gráfica de la ordenación y ubicación de
los genes en cada cromosoma. Sin embargo, hoy día se incluyen en estos mapas no sólo genes, sino también
otras regiones del DNA, de modo que para englobar a ambos se emplea la expresión marcador genético; este
papel puede desempeñarlo cualquier característica física o molecular del DNA que difiera entre individuos y
que sea detectable en el laboratorio, para poder seguir su patrón de herencia. Como marcadores genéticos, por
tanto, se incluyen tanto regiones que forman parte de un gen (marcadores génicos) como segmentos no
codificantes (marcadores no génicos). La gran mayoría de marcadores genéticos en los mapas actuales son
marcadores no génicos.
16. Genómica, cartografía del genoma y secuenciación 241

16:1

16.2.1 Fracción de recombinación como medida de distancia en un mapa genético

Durante la meiosis tiene lugar el sobrecruzamiento, o intercambio recíproco de fragmentos de DNA entre
cromosomas homólogos (recombinación homóloga o meiótica, pág. 108). Debe destacarse que la re-
combinación nunca tiene lugar entre cromosomas diferentes, sino únicamente entre los dos miembros de un
par de cromosomas homólogos. Los mecanismos moleculares de la recombinación no se describen en esta obra;
puede consultarse para ello un texto de genética. Aquí interesan, esencialmente, las consecuencias del proceso.
Por un lado, que los cromosomas recombinantes que aparecen en cada gameto ya no son idénticos a los
originales (paterno y materno) y, por otro, que la variación genética resultante depende, obviamente, de la
posición del sobrecruzamiento en cada par de cromosomas.
Como fase previa a la obtención de mapas genéticos, deben recordarse algunos términos básicos (v. también
pág. 97 y web 8.2):

16:2
242 I I . TR A N SMI S IÓ N D E L A IN FOR M AC I ÓN G EN ÉTIC A Y TEC NO LO GÍ A S R ELA C IO NA DA S

La característica que define la cartografía genética es el análisis de la fracción o frecuencia de


recombinación, definida como la probabilidad de que los alelos presentes en dos loci diferentes (correspon-
dientes a la posición de los marcadores considerados) se separen o segreguen como consecuencia de la
recombinación meiótica. Dicho de otro modo, es la frecuencia con la que dos alelos determinados aparecen
recombinados en la descendencia. Como se discute a continuación, esta fracción depende de la distancia entre
los dos loci en el cromosoma, lo que permite emplearla para establecer el mapa.

16:3
16. Genómica, cartografía del genoma y secuenciación 243

16:4

16.2.2 Obtención del mapa genético

Una vez conocidas las posiciones relativas de un número elevado de marcadores genéticos, se puede estudiar la
frecuencia de recombinación con respecto a ellos de cualquier nuevo gen o secuencia y así situar su locus en el
‘‘mapa’’ definido por aquéllos. De esa forma, se dice que se ha ‘‘cartografiado’’ su posición en el cromosoma.
Una vez localizado, el nuevo gen o secuencia pasa a engrosar el conjunto de marcadores que forman el mapa.
La escala en los mapas genéticos se mide en unidades centimorgan (cM); 1 cM corresponde, por definición, a
la distancia que separa dos loci que experimentan recombinación en el 1% de las meiosis. Empíricamente, en el
genoma humano esta distancia corresponde aproximadamente a 106 pb (1 Mb). A partir de la frecuencia de
recombinación se deducen las distancias relativas entre varios loci y se puede establecer su ordenación en el
cromosoma, comenzando así a precisar el mapa genético.

Web 16.1. Construcción del mapa genético.

Experimentalmente, los mapas genéticos requieren estudios familiares con árboles genealógicos, en los que
se examina, para alguno de los marcadores, la combinación de alelos que se va heredando. Éstos se analizan en
los distintos individuos a lo largo de varias generaciones. La presencia de una u otra forma alélica se detecta por
los procedimientos, variados, que permitan distinguirlas: bien a través de su influencia sobre el fenotipo
(caracteres observables, aparición de enfermedad, etc.) o bien mediante técnicas moleculares de detección de
secuencias (hibridación in situ por fluorescencia, hibridación de Southern, amplificación por PCR, incluso
secuenciación actualmente). A partir de la información de la herencia de alelos se calculan las frecuencias de
recombinación entre éstos.
En contraste con organismos modelo experimentales –como plantas, levadura, Drosophila o ratón–, en los
seres humanos es difícil determinar mediante estudios familiares las frecuencias de recombinación de loci
génicos. Esto se debe, por un lado, a la escasez de casos en los que se transmiten de forma simultánea dos alelos
representativos, por ejemplo los que causan dos enfermedades. Por otra parte, la baja tasa de reproducción del
ser humano dificulta el cálculo fiable de dicha frecuencia. Para superar esta limitación, en la práctica se acude a
marcadores polimórficos, es decir, los que presentan en la población un elevado número de alelos (formas
alternativas), con lo cual son muy frecuentes los individuos heterocigóticos y la recombinación podrá detec-
tarse en un alto porcentaje de la descendencia (debe recordarse que la recombinación de loci homocigóticos no
244 I I . TR A N SMI S IÓ N D E L A IN FOR M AC I ÓN G EN ÉTIC A Y TEC NO LO GÍ A S R ELA C IO NA DA S

puede apreciarse). Los marcadores polimórficos son en general no génicos, no relacionados con enfermedades
o con genes, sino simplemente secuencias de DNA detectables en una posición fija del cromosoma. Entre ellos
destacan los basados en el DNA mini- y microsatélite que presentan polimorfismo en el número de repeticiones
(VNTR, pág. 421). El número de marcadores polimórficos caracterizados, especialmente los microsatélites, ha
crecido de forma exponencial a lo largo del tiempo. En años más recientes se han empleado cada vez más como
marcadores los polimorfismos de un solo nucleótido (SNP, págs. 418 y 424). Hoy día se dispone de un mapa
para cada cromosoma con la ubicación de un elevado número de marcadores.
La utilidad del mapa genético se ilustra, por ejemplo, con la posibilidad de localizar el gen responsable de
una enfermedad hereditaria, aun sin conocer la identidad de dicho gen ni la base molecular de la enfermedad.
Para ello, se busca, entre todos los que componen el mapa, un alelo de un marcador que esté presente en los
individuos afectados, pero no en los sanos, lo que indica que el locus de dicho marcador está ligado al del gen
buscado. Por consiguiente, el gen debe estar muy próximo a la posición conocida del marcador en el mapa. Esta
posibilidad de ubicación de genes se potencia si se elabora el mapa con marcadores dispuestos a lo largo de todo
el genoma; se asegura así, por puro azar, que siempre exista algún marcador suficientemente próximo al gen
como para que ambos estén ligados. De esta forma se ha podido encontrar, por ejemplo, la localización
cromosómica de los genes responsables de la fibrosis quística, la anemia drepanocítica, la enfermedad de
Tay-Sachs, el síndrome del cromosoma X frágil y la distrofia miotónica.

16:5

16.3 MAPAS FÍSICOS

Como se ha indicado, estos mapas miden de manera directa distancias físicas (es decir, en pares de bases) entre genes
u otros marcadores de DNA en el genoma. Las estrategias metodológicas son muy diversas y conducen a distintas
variantes de mapas y niveles de resolución. Dependiendo de la escala o nivel de resolución, conocida como ‘‘unidad
cartográfica o de mapa’’, se distinguen tres estrategias: baja resolución (con una precisión de varias Mb), alta
resolución (por debajo de 105 bases) y máxima resolución (secuencia nucleotídica, 1 pb).

16.3.1 Obtención de mapas físicos a baja resolución

Este nivel cartográfico corresponde a la asignación de cada marcador a un cromosoma o región cromosómica. Se
utilizan distintos planteamientos que, además, implican muestras diferentes, según se describe a continuación. En
general, el marcador se detecta mediante el empleo de sondas o de cebadores de PCR, ambos específicos para la
secuencia de aquél; en el caso de un marcador génico, puede acudirse también a la detección de su producto
funcional (proteína o RNA).

[Link] Métodos basados en líneas celulares somáticas híbridas

Consisten en la búsqueda del marcador (génico o no) en líneas celulares híbridas, preparadas de tal forma que
contienen material genético de dos orígenes diferentes: el genoma completo de un roedor (aunque con una
mutación útil, explicada más adelante) y una parte del genoma humano que se quiere cartografiar, que puede
consistir en varios cromosomas, uno solo o un fragmento de cromosoma. Disponiendo de una colección (o
panel) de tales clones celulares híbridos, cada uno con partes distintas del genoma humano, se puede ensayar la
presencia del marcador en cada uno de ellos y así ubicar en qué cromosoma o parte de éste se encuentra.
Repitiendo el proceso para distintos marcadores se llega a construir un mapa físico.
16. Genómica, cartografía del genoma y secuenciación 245

16:6
246 I I . TR A N SMI S IÓ N D E L A IN FOR M AC I ÓN G EN ÉTIC A Y TEC NO LO GÍ A S R ELA C IO NA DA S

16:7

Un aspecto sumamente importante para la cartografía mediante células somáticas híbridas es la capacidad
de seleccionar los híbridos, es decir, que en cultivo sólo sobrevivan estas células. (Esta misma estrategia se
emplea en la preparación de anticuerpos monoclonales.) El sistema de selección más utilizado hace uso del
medio HAT, así llamado por contener hipoxantina, aminopterina y timidina.
Web 16.2. Selección de las células híbridas empleando medio HAT.

La preparación de híbridos a partir de células somáticas humanas sólo permite identificar el cromosoma en
el que está situado el DNA de interés. Se puede alcanzar mayor resolución cartográfica empleando híbridos
similares preparados con una porción menor del genoma humano: híbridos monocromosómicos, conteniendo
un solo cromosoma, e híbridos subcromosómicos, con un fragmento de cromosoma. Con estos últimos se
construye lo que se denomina ‘‘mapa de asignación regional’’, es decir, la localización de cada marcador en una
región determinada de un cromosoma.

[Link] Obtención de mapas mediante ensayos de hibridación con sondas fluorescentes

La ubicación de marcadores para formar un mapa físico de baja resolución puede también conseguirse
realizando ensayos de hibridación con sondas que contengan la propia secuencia del marcador. Esta técnica
adquirió gran aplicabilidad en la cartografía con el desarrollo de las sondas fluorescentes (hibridación in situ
por fluorescencia o FISH, pág. 177). La sonda se marca con un fluorocromo, bien de forma directa o a través de
un grupo ‘‘indicador’’ (por ejemplo, biotina o digoxigenina, págs. 188-189). Para identificar el cromosoma o
la región del mismo donde hibrida la sonda se puede acudir a la observación bajo el microscopio de fluores-
cencia o a la citometría de flujo (pág. 127).
a) Mapas por hibridación in situ (FISH) cromosómica
La hibridación se realiza sobre preparaciones para el microscopio de cromosomas metafásicos, previamente
desnaturalizados. La identidad de los cromosomas se revela por las técnicas habituales de establecimiento del
cariotipo (forma, tamaño y bandas bajo tinción, pág. 90). El DNA diana (marcador) se manifiesta bajo el
microscopio de fluorescencia como puntos luminosos dobles, debido a la hibridación de la sonda con las
dos cromátidas (pág. 168). Se alcanza con esta técnica un nivel de resolución cromosómico o subcromosómico,
y es posible localizar o cartografiar de forma simultánea varios marcadores empleando varias sondas marcadas
con fluorocromos distintos.

16:8
16. Genómica, cartografía del genoma y secuenciación 247

b) Mapas por citometría de flujo


La identificación del cromosoma en el que se encuentra cada marcador puede también realizarse si la sonda se
hibrida con muestras que contienen cada una un solo tipo de cromosoma. Éstas pueden conseguirse aplicando la
clasificación de células activada por fluorescencia (FACS, pág. 127), adaptada a la cartografía del modo siguiente:
los cromosomas se tratan con fluorocromos que se intercalan entre las bases nitrogenadas apiladas del DNA; los
de mayor longitud pueden incorporar mayor cantidad de ese agente intercalante, por lo que adquieren más
fluorescencia. Esto permite diferenciar los cromosomas en la etapa de análisis o caracterización, proporcionando
lo que se ha llamado un cariograma de flujo, así como separarlos en la etapa de clasificación y obtener muestras,
cada una con un solo tipo de cromosoma. Finalmente, estos cromosomas separados pueden emplearse, por
ejemplo, en hibridación en formato dot-blot (pág. 171) con la sonda específica para el marcador buscado.

16.3.2 Mapas físicos de alta resolución

Estos métodos, complementarios a los anteriores, permiten alcanzar una resolución inferior a 1 Mb, incluso
hasta llegar a unos pocos nucleótidos, lo que ya supone el nivel molecular de resolución; de ahí que sean los
métodos de cartografía física más importantes. Sirven de enlace entre los mapas físicos anteriores y los de
secuenciación o mapas de resolución total a escala de un nucleótido (pág. 252). Se plantean principalmente dos
tipos de abordaje: hibridación y enzimas de restricción.

[Link] Mapa físico por hibridación in situ (FISH) de alta resolución

La baja resolución asequible sobre cromosomas metafásicos puede aumentarse mediante la hibridación sobre
cromosomas menos compactados.

16:9
248 I I . TR A N SMI S IÓ N D E L A IN FOR M AC I ÓN G EN ÉTIC A Y TEC NO LO GÍ A S R ELA C IO NA DA S

[Link] Mapa físico con enzimas de restricción

Antes de que se descubrieran las endonucleasas de restricción y se extendiera su uso en el laboratorio de


investigación, se emplearon otras nucleasas para secuenciar RNA (pág. 257), siguiendo el mismo enfoque
utilizado previamente para secuenciar polipéptidos, es decir, la fragmentación de la molécula por puntos de
características conocidas y la reconstrucción del conjunto mediante solapamiento de los fragmentos. Este
método no dio los resultados esperados con DNA, debido a su mayor longitud y, sobre todo, a la menor
especificidad de las DNasas, por lo que sólo se consiguió secuenciar algunos oligodesoxirribonucleótidos.

Web 16.3. Reconstrucción de la secuencia mediante alineación de fragmentos.

La ventaja de estos planteamientos iniciales es que sirvieron de pauta para la confección de los actuales mapas
físicos del genoma a partir de fragmentos de DNA originados por enzimas de restricción. Un mapa de restricción
para una región determinada del genoma está constituido por una relación ordenada de sitios que pueden
cortarse con enzimas de restricción concretas, con indicación de las distancias entre ellos (en pb). A diferencia de
los mapas genéticos, para su elaboración no afecta la funcionalidad de la región de DNA (su carácter génico) ni
la presencia en ella de mutaciones (salvo que éstas alteren precisamente el sitio de restricción). Por el contrario, sí
importan algunas alteraciones que puede sufrir el DNA, como translocaciones, deleciones o inserciones.
La resolución o escala de los mapas de restricción depende de la separación entre los sitios de corte o, dicho
de otro modo, de la frecuencia con que la secuencia diana reconocida por la enzima aparece en el genoma
(frecuencia de reconocimiento del genoma por la enzima). Por ejemplo, asumiendo que en un DNA de gran
longitud las cuatro bases queden distribuidas aleatoriamente, cuanto más corta sea la secuencia del sitio de
restricción, más probabilidad habrá de encontrarla, por puro azar, es decir, mayor será la frecuencia de
reconocimiento (v. web 15.2).
La construcción de un mapa de restricción se simplifica si el número de sitios de restricción es reducido. Esto
es especialmente necesario para cartografiar moléculas grandes de DNA, en las que las secuencias específicas
para las enzimas de restricción habituales se hacen muy numerosas. Para estos fragmentos grandes la
cartografía sólo se puede abordar empleando enzimas ‘‘cortadoras infrecuentes’’ y electroforesis en campo
pulsante (pág. 142). En cualquiera de los casos, el revelado de los geles y la hibridación Southern con diversas
sondas permiten deducir la distribución de los sitios de restricción, o ‘‘cartografía’’ del mapa.
Para facilitar la comprensión del método de obtención de mapas físicos de restricción, se proponen a
continuación unos ejemplos prácticos. En el primer caso, se emplean dos enzimas (A y B), que actúan de
forma aislada o conjunta (experimento de digestión doble). En el segundo ejemplo, las dos enzimas actúan
de forma sucesiva. En el tercero, la digestión enzimática es idéntica al primero, pero se emplea la
hibridación para enriquecer la información obtenida.
Finalmente, debe resaltarse que, puesto que un mapa de restricción no identifica la posición de genes, su
utilidad es tanto mayor cuando más pueda relacionarse con un mapa genético. Para establecer esta relación es
necesario encontrar mutaciones que afecten a los sitios de restricción y determinar su ligamiento con altera-
ciones que afectan a genes, como las que producen enfermedades u otros cambios fenotípicos. Ello permite
situar ese gen dentro del mapa de restricción (y otros que puedan haberse localizado respecto a aquél en un
mapa genético); éste es un ejemplo de cómo se complementan los diversos abordajes de cartografía para ir
construyendo el mapa completo del genoma.

[Link] Mapas físicos de STS y EST

Cada vez con mayor frecuencia, para la construcción de mapas físicos se utilizan marcadores no génicos
(pág. 240). Dos de los tipos de marcador más extendidos son los STS (sequence-tagged sites), también llamados
‘‘secuencias de referencia’’, ‘‘sitios marcados únicos’’ o ‘‘sitios de secuencia marcada’’, y los EST (expressed
sequence tags), también denominados ‘‘etiquetas o marcas de secuencias expresadas’’. En ambos casos, se trata de
regiones cortas del genoma (entre 50 y 500 pb) que se han podido secuenciar y para las que se han desarrollado
cebadores de PCR (Capítulo 14), lo que permite su amplificación y consiguiente detección. Reciben el nombre de
STS los marcadores encontrados en el DNA genómico, mientras que los EST se identifican en moléculas de cDNA,
resultantes de la transcripción inversa de mRNA. En consecuencia, los STS son marcadores que sirven para
elaborar mapas físicos de todo el genoma, mientras que los EST sólo sirven para mapas de la parte del genoma de
16. Genómica, cartografía del genoma y secuenciación 249

16:10
250 I I . TR A N SMI S IÓ N D E L A IN FOR M AC I ÓN G EN ÉTIC A Y TEC NO LO GÍ A S R ELA C IO NA DA S

16:11

mayor interés aplicado, los genes responsables de la síntesis de proteínas. Entre otras cosas, estos últimos se han
empleado para estimar el número de genes del genoma humano suprimir cita.
A pesar de que la posición de estos marcadores en el genoma se desconoce inicialmente, se puede usar una
colección de ellos para caracterizar los clones componentes de una genoteca (pág. 238) –genómica en el caso de
los STS, genoteca de cDNA con los EST–, mediante la deducción del solapamiento de clones, o construcción de
mapas de cóntigos.

[Link] Mapas de cóntigos

Se denomina así a los mapas que se obtienen mediante el solapamiento de fragmentos de DNA. Estos
fragmentos proceden en general de la digestión parcial con enzimas de restricción de otros fragmentos mayores,
cada uno de los cuales se ha obtenido a su vez por fragmentación de los 24 tipos diferentes de cromosomas
(humanos) de la muestra. El planteamiento de la cartografía es idéntico en ambos niveles, y similar al descrito
para las nucleasas. Para la deducción del orden o solapamiento de los diferentes fragmentos se acude a la
comparación de los marcadores presentes en cada uno, que constituyen generalmente mapas de restricción o
mapas de STS o EST.
16. Genómica, cartografía del genoma y secuenciación 251

16:12
252 I I . TR A N SMI S IÓ N D E L A IN FOR M AC I ÓN G EN ÉTIC A Y TEC NO LO GÍ A S R ELA C IO NA DA S

16.4 SECUENCIACIÓN

Los esfuerzos iniciales para secuenciar ácidos nucleicos dieron pocos resultados. Hasta la década de 1970 era
difícil y costoso secuenciar incluso fragmentos de sólo 5 a 10 nucleótidos. Fueron los métodos químico de
Maxam y Gilbert (1977) y enzimático de Sanger (1980) los que abrieron el camino a dicho gran objetivo. Se
consiguió secuenciar moléculas mayores de DNA y se definieron algunas secuencias concretas como las del fago
fX174 (5,4 kb), mitocondria humana (16,5 kb), fago lambda (48,5 kb) y virus animal de Epstein-Barr
(170 kb).
Estos dos métodos pioneros de la secuenciación tienen en común algunos aspectos, como la utilización de
fragmentos del DNA original escindidos con enzimas de restricción, el marcaje del DNA de forma radiactiva o
química (con fluoróforos) y el empleo de métodos electroforéticos para separar los fragmentos generados, entre
otros. El auge de los Proyectos Genoma llegó cuando se consiguieron los avances tecnológicos que permitieron
acelerar la tasa de secuenciación, aún aplicando de manera básica el método de Sanger. A continuación se han
desarrollado métodos de ‘‘nueva generación’’ y de ‘‘secuenciación masiva’’, algunos basados en principios
radicalmente diferentes a los dos anteriores, que suponen un nuevo salto en el progreso de los proyectos de
secuenciación de genomas de forma rápida y económica.
La muestra de DNA de partida para la secuenciación procede en general de clonación celular, de
amplificación por PCR o de la digestión controlada con una enzima de restricción de un genoma, un cromo-
soma u otro fragmento de DNA. Con frecuencia, las muestras se amplifican mediante PCR para disponer de
suficiente cantidad. Asimismo, es conveniente la purificación para eliminar DNA contaminante en la muestra
(por ejemplo, DNA bacteriano) y reactivos procedentes de la purificación o de otros procesos previos (como
cebadores y nucleótidos remanentes de la PCR). Se puede acudir también a recuperar el DNA contenido en una
banda de electroforesis, extrayéndolo del gel.

16.4.1 Método químico de secuenciación del DNA

Este procedimiento, que se utilizó mucho pero ha quedado desplazado por el método enzimático, se basa en la
hidrólisis química y en un diseño original aplicable a secuencias de DNA de menos de 250 nucleótidos. Se suele
conocer como método de Maxam y Gilbert. Puede describirse en tres etapas: marcaje del DNA, hidrólisis
química selectiva del DNA y análisis de los productos.

Web 16.4. Método de Maxam y Gilbert.

16.4.2 Método enzimático de secuenciación del DNA

El método enzimático o de Sanger es la base de las variantes que se han utilizado exhaustivamente durante años
para la secuenciación a gran escala del DNA. Sólo en la década posterior a la finalización del Proyecto Genoma
Humano ha comenzado a ser desplazado por métodos más modernos. En él no se degrada el DNA como en el
método químico, sino que se acude a la interrupción controlada de la síntesis de una hebra complementaria
durante una replicación in vitro. Esta síntesis, catalizada por una DNA polimerasa, define el carácter
enzimático del método. La comprensión de los principios del método y el gran cambio introducido con la
utilización de fluorocromos son de interés tanto por sí mismos como para la interpretación de métodos
posteriores.
El método se apoya en dos conceptos fundamentales: la síntesis a cargo de una DNA polimerasa y el uso de
nucleótidos terminadores. Dado que la actividad 5’-exonucleasa de las DNA polimerasas naturales no es
conveniente aquí, se suelen usar variantes, como el ‘‘fragmento de Klenow’’ o fragmento grande de la DNA-
polimerasa I de E. coli (pág. 150), o formas alteradas artificialmente de la DNA polimerasa del fago T7
(algunas comercializadas con el nombre de ‘‘secuenasa’’, Sequenase ). También se emplean en ocasiones
transcriptasas inversas o la DNA polimerasa Taq (polimerasa termoestable de la arquea Thermus aquaticus,
conocida por su aplicación en PCR, pág. 202). Estas alternativas intentan, además de evitar la actividad
5’-exonucleasa, conseguir mayores procesividad, actividad enzimática y eficacia sobre regiones homo-
poliméricas y regiones con tendencia a adoptar estructura secundaria. Todo ello ha conducido a la posibilidad
de secuenciar cada vez fragmentos más largos y con menor margen de error.
16. Genómica, cartografía del genoma y secuenciación 253

Asimismo, han ido surgiendo distintas variantes del método inicial en lo relativo al tipo y posición de
marcaje de los nucleótidos, en especial al aparecer los fluorocromos como alternativa a los isótopos radiactivos.
Para simplificar, y puesto que el fundamento no varía, se expone a continuación una de ellas, que emplea cuatro
fluorocromos distintos y ofrece la posibilidad de automatización. El método puede describirse en tres secciones:
síntesis enzimática, análisis de los fragmentos y automatización. Al final se indicarán los matices que supone el
empleo de variantes alternativas del método.

[Link] Síntesis de un DNA complementario de longitud variable

Dado que se emplea una DNA polimerasa para sintetizar hebras complementarias a la que se quiere secuenciar,
una primera característica del método es la necesidad de un cebador, un oligonucleótido diseñado para que se
hibride con el extremo 3’ de la región que se quiere secuenciar.
La segunda, y principal, característica de este método de secuenciación es el uso de didesoxi-
nucleótidos, análogos estructurales de los desoxinucleótidos pero que provocan la detención de la
reacción de síntesis de DNA. Por ello, el método se conoce también como secuenciación didesoxi o de
terminación de cadena.

16:13

Web 16.5. Estructura de didesoxinucleótidos.

La razón por la que se emplean didesoxinucleótidos es que compiten con los desoxinucleótidos en la
reacción de síntesis. La DNA polimerasa utiliza el ddNTP como sustrato, por su analogía estructural con el
dNTP, y queda incorporado a la hebra en crecimiento como ddNMP, pero a partir de él la cadena no se puede
elongar debido a la falta de grupo -OH en 3’, que impide que forme enlace fosfodiéster con el siguiente
nucleótido. Los ddNTP, por tanto, detienen la síntesis de la molécula a la que se incorporan.
254 I I . TR A N SMI S IÓ N D E L A IN FOR M AC I ÓN G EN ÉTIC A Y TEC NO LO GÍ A S R ELA C IO NA DA S

16:14

[Link] Separación de los fragmentos y análisis

Para analizar las 4 mezclas de moléculas obtenidas, se separan todos ellas de acuerdo con su tamaño,
empleando electroforesis. El tamaño de cada molécula marcada indica directamente la posición en la secuencia
del didesoxinucleótido responsable de la interrupción de su síntesis.
16. Genómica, cartografía del genoma y secuenciación 255

16:15
[Link] Automatización

La posibilidad de usar un fluorocromo distinto en cada una de las 4 reacciones de síntesis permite automatizar el
método, de forma que se ‘‘lean’’ simultáneamente las hebras marcadas componentes de las 4 mezclas. Además,
esta lectura de la fluorescencia se puede hacer en continuo, con lo que la electroforesis sigue transcurriendo, las
moléculas de menor tamaño, ya detectadas, salen por el extremo inferior del gel, y se sigue consiguiendo la
separación de moléculas mayores en el gel, de modo que se amplía el número de nucleótidos que es posible
secuenciar en un solo experimento.

16:16
256 I I . TR A N SMI S IÓ N D E L A IN FOR M AC I ÓN G EN ÉTIC A Y TEC NO LO GÍ A S R ELA C IO NA DA S

A título ilustrativo, de los numerosos fluorocromos disponibles se indica un grupo de cuatro que se ha usado
con frecuencia para la secuenciación (todos como N-hidroxisuccinimidilésteres, forma activa que permite su
unión a un grupo amino del nucleótido).

Propiedades de fluorescencia
Nombre común Nombre completo lex (nm) lem (nm) Color emitido
FAM (5 o 6)-carboxifluoresceína 494 518 Rojo anaranjado
JOE (5 o 6)-carboxi-4’,5’-dicloro-2’,7’-dimetoxifluoresceína 520 548 Rojo-púrpura
TAMRA (5 o 6)-carboxitetrametilrodamina 553 576 Púrpura
ROX (5 o 6)-carboxi-X-rodamina 578 604 Azul verdoso

Web 16.6. Estructura y propiedades espectrales de fluorocromos para la secuenciación.

[Link] Variantes del método

El método que se ha ilustrado es representativo, una de las variantes posibles, pero sirve para comprender el
diseño y los fundamentos, válidos para todos. El marcaje de la hebra recién sintetizada puede conseguirse de
otras maneras, aplicándolo a otros componentes de la reacción en la que se sintetizan dichas hebras:

16:17
16. Genómica, cartografía del genoma y secuenciación 257

16.4.3 Métodos de secuenciación masiva

Bajo este epígrafe se pretende recoger las técnicas de secuenciación diseñadas después de la consecución del
Proyecto Genoma Humano, que abandonan la estrategia del método enzimático de Sanger. En muchos casos
algunas de estas técnicas se han denominado ‘‘de última generación’’ o ‘‘de próxima generación’’, términos
muy atrayentes pero que, obviamente, pierden su sentido de forma rápida. La indicación ‘‘masiva’’, si bien no
aporta información precisa, transmite la idea de que una de las principales características es la capacidad de
procesar cada vez mayor número de muestras en paralelo, en un tiempo cada vez menor. Los detalles de estas
nuevas aproximaciones están en ocasiones oscurecidos por los intereses comerciales y de patentes, así como
sometidos a continua evolución, por lo que se intentará proporcionar una descripción global de sus principios.

Web 16.7. Evolución de los métodos de secuenciación masiva.

16.4.4 Secuenciación del RNA

La secuenciación del RNA es, en general, más difícil que la del DNA, entre otras causas por su menor
estabilidad. Es posible deducirla a partir de la secuencia del DNA del que se transcribe, o también sintetizar
un cDNA a partir del RNA de interés y secuenciar aquél. Sin embargo, a veces es necesario secuenciar
directamente el RNA, sobre todo cuando se desea determinar las posiciones de nucleósidos modificados,
característicos de los tRNA y rRNA. Para ello, se ha desarrollado un procedimiento que emplea distintas
RNasas que cortan en el lado 3’ de nucleótidos específicos, con lo que se puede obtener una serie de fragmentos
que reflejan las posiciones de cada base. Siguiendo un planteamiento análogo al de la secuenciación química del
DNA se puede entonces deducir la secuencia del RNA.

16:18
Asimismo, al menos en teoría, es posible aplicar el método de secuenciación didesoxi a RNA. Lógicamente,
en lugar de la DNA polimerasa usada para secuenciar el DNA, se precisa una transcriptasa inversa, capaz de
emplear el RNA de interés como molde para sintetizar una hebra de DNA complementario (pág. 207),
partiendo de la misma mezcla de cuatro dNTP y de un ddNTP distinto en cada tubo.

16.5 EL PROYECTO GENOMA

La consecución del mapa completo del genoma humano comenzó en la segunda mitad del siglo XX con la intro-
ducción de los mapas genéticos y físicos. A mediados de los años 1980 se concibió el Proyecto Genoma Humano
(PGH), un enorme esfuerzo internacional de investigación dirigido a conseguir la secuencia de todo el DNA del
genoma humano (los 3.200 millones de pares de bases del genoma haploide). El proyecto comenzó en 1990 y se
planteó con una duración de 15 años, pero los avances tecnológicos permitieron culminarlo en poco más de 10.
El desarrollo experimental del PGH consta, a grandes rasgos, de las siguientes etapas:

1. Obtención de las muestras de DNA (comúnmente a partir de los leucocitos de muestras de sangre).
258 I I . TR A N SMI S IÓ N D E L A IN FOR M AC I ÓN G EN ÉTIC A Y TEC NO LO GÍ A S R ELA C IO NA DA S

2. a) En la aproximación del PGH de fondos públicos, escisión del DNA de forma controlada en fragmentos,
empleando enzimas de restricción. Al principio se originan fragmentos relativamente grandes, de unos
150 kb, y luego, a partir de ellos, una segunda escisión produce fragmentos más pequeños. (Esta doble
etapa facilita la ordenación posterior de los datos y la reconstrucción de la secuencia completa.)
b) En la aproximación del proyecto privado (Celera Genomics), la metodología bautizada como shotgun
sequencing (que algunos traducen como ‘‘en tiro de escopeta’’) consiste en la fragmentación del DNA al
azar, con una repetición mucho mayor de los fragmentos. El orden de éstos, desconocido por completo,
se deduce mediante algoritmos de cálculo basados en el múltiple solapamiento de sus secuencias.
3. Clonación de los fragmentos, mediante la inserción de cada uno en un vector (plásmido, BAC, YAC, etc.) e
incorporación a una célula anfitriona.
4. Aislamiento del DNA a partir de cada clon y, en su caso, amplificación por PCR para obtener suficiente
cantidad de cada fragmento.
5. Secuenciación completa de cada fragmento de DNA (repetida en promedio unas 7 veces), mediante los
métodos automatizados derivados del de Sanger.
6. Ordenación de los fragmentos secuenciados para establecer su posición original en el genoma.

A finales del año 2000, justo antes de publicarse los resultados del PGH, se disponía de la secuencia
genómica de 42 especies, todas con genomas relativamente pequeños y simples. Diez años después, el
número de genomas secuenciados supera los 4.000, con un total de 125 109 pares de bases.

Genomas con secuencia completa


Finales de 2000 Febrero de 2001 Finales de 2010
38 bacterias 4.000 bacterias y virus
(5 Gb en total)
1 hongo (la levadura Saccharomyces cerevisiae) Proyecto
Genoma
2 invertebrados (Caenorhabditis elegans y Humano 250 eucariotas (120 Gb en total)
Drosophila melanogaster)
1 planta (Arabidopsis thaliana)
Gb = 109 pares de bases
Saccharomyces cerevisiae es la levadura de la cerveza y del pan
Caenorhabditis elegans es un gusano nematodo de 1 mm de longitud
Drosophila melanogaster es la mosca de la fruta o del vinagre
Arabidopsis thaliana es una planta herbácea con flor, con una altura de 10 a 30 cm

En junio de 2000 la Casa Blanca anunció la consecución (anticipada casi 5 años sobre lo previsto inicial-
mente) de la secuencia completa del genoma humano. A principios de 2001 se publicaron los resultados de lo
que se llamó el ‘‘borrador’’ de la secuencia –‘‘secuenciación y análisis iniciales’’ del genoma–, que cubría
alrededor del 90% de las regiones de eucromatina (pág. 88), aún con 250.000 brechas y numerosos errores.
Poco después se abordó la secuenciación de otros vertebrados, como ratón, perro, rata, chimpancé y vaca, así
como algunos marsupiales, monotremas y aves. Hoy día se dispone de muchos más, e incluso de secuencias
parciales de especies extintas como el mamut lanudo y el Neandertal.
En 2004 se publicó la secuencia ‘‘final’’ o ‘‘casi completa’’ del genoma humano, de alta calidad: cubre
aproximadamente el 99,7% de las regiones de eucromatina, con sólo 300 brechas y un error en cada 105
nucleótidos. Además de una mejor definición de la secuencia, en este período se produjo la anotación,
principalmente gracias a la genómica comparada. Las publicaciones oficiales en revistas científicas se exten-
dieron hasta el año 2006. Las brechas, que no se han conseguido secuenciar, comprenden 28 Mb de eucro-
matina con secuencias repetitivas y 200 Mb de heterocromatina (centrómeros grandes y brazos cortos de los
cromosomas acrocéntricos, pág. 89).
Toda la secuencia obtenida y la información relacionada (conocida como anotaciones, que incluyen
identificación de genes, secuencias expresadas, polimorfismos y mutaciones conocidos, etc.) está disponible
pública y gratuitamente a través de las bases de datos del proyecto en internet.
Actualmente el mayor énfasis se está dedicando a completar la identificación de genes y al estudio de las
pequeñas diferencias del genoma en cada persona (polimorfismo genético, Capítulo 24). Por ejemplo, en enero de
2008 se puso en marcha el ‘‘Proyecto de los 1.000 Genomas’’, que pretende establecer un catálogo de variación
genética de los seres humanos secuenciando el genoma de, al menos, mil individuos de distintos grupos étnicos.

También podría gustarte