Genómica y Metagenómica Microbiana
Genómica y Metagenómica Microbiana
1. CONCEPTOS.
• GENOMA: moléculas que guardan y transportan la información genética (DNA en todas las células, DNA
y/o RNA en virus). En procariotas (y algunos eucariotas), el genoma puede estar formado por el/los
cromosomas y plásmidos.
• GEN: unidad básica de información genética. Fragmento de DNA o RNA que codifica la información para
la síntesis de una proteína o un RNA, incluyendo sus zonas reguladoras.
- La expresión de un gen puede suponer únicamente su transcripción (el producto génico es una molécula de
rRNA o tRNA) o su transcripción y traducción (el producto génico es una proteína y existe un mRNA
intermediario).
2. HISTORIA:
El avance en la ciencia se produce por dos motivos: el avance
tecnológico y pensar. Sin alguna de ambas no hay ciencia.
▪ 1920: GENe-ChromosOME.
▪ 1995: primer genoma bacteriano secuenciado: Haemophilus influenzae. Esta bacteria es un patógeno
respiratorio. Se secuenció mediante la técnica “whole-genome shotgun and assembly”.
DESARROLLO DE LA BIOINFORMÁTICA.
-1-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La gráfica es un ejemplo de cómo han ido aumentando el número
de genomas a lo largo de los años.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
investigaciones de genomas entre otras cosas.
¿Qué es clonar? Una copia de algo. En términos moleculares se utilizan plásmidos para clonar.
-2-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
2. Se extrae su DNA.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
3. Se rompe su DNA (distintas estrategias).
8. Se secuencia el inserto.
ASSEMBLY: ensamblaje.
READS: secuencias de lectura, suelen ser cortas.
CONTIGS: secuencias contiguas.
¿Cómo sabes la orientación de los contigs? Se realiza mediante la PCR, la cual amplifica un fragmento de ADN cuya
secuencia nos interesa. Poniendo los cebadores para que se amplifique, si está al revés no se amplificaría, pero si está
bien sí. Si secuencias perfecto un genoma solo saldría un contig.
-3-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
¿cuántas ORFs puede tener una secuencia?
6, porque, por ejemplo, tienes AGCTGCATT, lo primero
que se tendría que buscar es el codón de inicio, pero en este caso nos lo
saltamos, en la primera hebra se podría empezar desde la A, o desde la G, o
desde la C. Es decir, existen 3 posibilidades de comienzo de lectura, en la hebra
de bajo sucede lo mismo (3 posibilidades de la hebra de arriba más 3 de la abajo
= 6), pero en distinta dirección, es decir, la primera hebra se lee en orientación
3’→5’, y la de bajo se lee
5’→3’, esto sucede en la
fase de la secuencia y
finaliza cuando llega al
codón de parada. Una
vez hecho esto se pasa a
aminoácidos. ¿Cómo? Con el código genético, éste te dice
las combinaciones de nucleótidos posibles y qué
aminoácidos obtendrás.
-4-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
asociados, por ejemplo [Link]. por último, se muestra en verde los microorganismos de vida libre. En rojo una bacteria
libre que es la más abundante del océano Pelagibacter ubique.
INTERPRETACIÓN: hay una proporcionalidad entre el tamaño del genoma y la cantidad de genes. Es decir, cuanto más
grande, más genes. ¿Esto siempre es así? No porque por ejemplo en eucariotas no todo el genoma es codificante,
pero en bacterias sí. Lo que se observa en la figura es que las bacterias de vida libre tienen genomas más grandes y las
que viven obligadas en un hospedador, su genoma es más pequeño. Las de vida libre es porque tendrán que sobrevivir
a ambientes más cambiantes y las otras pues con mayor normalidad de sucesos.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Cuando se secuencia un genoma la gran mayoría de secuencias son
codificantes de proteínas (87%), codificantes de RNA (0.8%) y también
encontramos secuencias reguladoras (esenciales) no codificantes (11%) y
secuencias no codificantes directamente (0.7%).
La figura muestra en el eje de coordenadas el porcentaje de genes en distintas categorías funcionales que marca la
leyenda (genes implicados en la replicación del ADN, en la transcripción, etc.) y en el eje de abscisas el tamaño del
genoma.
Se observa que el genoma más grande tiene menos porcentaje de genes de traducción, que los genomas más pequeños,
por ejemplo.
-6-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
porcentaje de genes se encargará de esas funciones y cuanto menor sea el
tamaño de genes en el genoma, mayor porcentaje de genes se encargará
de esas funciones.
¿Una vez que tienes tu genoma que esperas encontrar ahí? ¿Qué
cosas tiene que tener para que tu sepas que lo has hecho bien? Por
ejemplo, deberíamos encontrar genes que se dediquen a la síntesis de
lípidos, de aminoácidos, de transporte, cosas esenciales para la
bacteria, si la bacteria tiene un flagelo lo normal es que tenga genes
que se dediquen a producir proteínas para producir ese flagelo. Luego
se pueden hacer más cosas como saber de dónde vienen esos genes o
compararlos con otras bacterias…
Haces el trabajo y ya tienes el genoma anotado y secuenciado y lo quieres publicar, ¿qué tienes que mirar para que
esté bien? pues miras a ver si tiene las cosas esenciales, como genes que se encarguen de la respiración, si tiene
flagelo, que tenga genes que lo produzcan. Qué tienen todos los seres vivos, membrana, un sistema productor de
energía…
La imagen que se muestra es el genoma de la primera bacteria extremófila que se secuenció y que se reconstruyó,
reconstruyeron las rutas metabólicas y los genes que lo producían.
Una pregunta interesante es ¿Cuántos genes hacen falta para una célula procariota? ¿Cuál es la dotación genética
mínima? Interesados en conocer cuál es la dotación genética mínima
para que una célula funcione, ¿cómo harías para conseguirlo? cogemos
distintos microorganismos y vemos lo que tienen en común todos ellos
y entonces lo que tengan en común es lo esencial. Esa idea tiene un fallo,
porque por ejemplo lo común entre gusanos y humanos puede ser
esencial, pero a lo mejor no es lo suficiente. Lo común es necesario,
pero no lo suficiente.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
estar disponible, sino no crece. Esta bacteria será muy buena en
ese entorno, pero fuera de él no. ¿En un ambiente marino hay
muchos o pocos nutrientes? La respuesta es pocos nutrientes,
normalmente son lugares oligotróficos.
Intentaron crear una célula sintética, crearon un genoma para meterlo en una célula.
5. PAN-GENOMA:
COSA SUPER IMPOTANTE Y QUE PUEDE ENTRAR EN EL
EXAMEN:
¿Tiene sentido hablar del genoma de la especie? Lo que no tienen sentido es decir que las especies bacterianas tienen
el mismo tamaño porque no es así, dentro de una especie procariota hay diferencias en el tamaño del genoma.
-8-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
• ¿QUÉ ES UNA ESPECIE? Son un conjunto de microorganismos, que tienen uno origen común y unos parecidos
fenotípicos y que a nivel del RNA 16 S tienen un porcentaje de similitud del 98,7%. Es decir, no está constituidos
por individuos idénticos.
Cuando se mide el tamaño del genoma de las distintas cepas de [Link], se puede observar que la cepa más pequeña
tienen un tamaño de 4,3 Mb y que la más grande es de 6,2 Mb. Puede haber hasta casi un 30% de diferencia de
tamaño del genoma entre ellas. Dentro de una especie procariota hay cambios en el tamaño del genoma.
Tenemos dos bacterias que son de la misma especie, tendremos
un conjunto de genes que son comunes en ambas, esos genes son
los que le dan a esa bacteria la característica de ser [Link]. Y hay
una parte del genoma que es distinta.
• PAN-GENOMA: CORE GENOMA + GENOMA ACCESORIO O FLEXIBLE. Lo podríamos definir como el conjunto
de todos los genes de una especie.
Imaginaos que tenemos dos bacterias, una cepa de [Link] que tiene una serie de genes y la otra que tiene otro genes
pero, hay un alto porcentaje de ellos que son lo mismo. A esta parte común es a lo que se le llama CORE GENOMA: la
parte común de las distintas cepas.
¿Qué pasaría si a las dos bacterias que teníamos le añadiéramos otra que comparte genes con una de las dos
anteriores, pero con la otra no? El core genoma va a depender de qué cepas estemos comparando, de forma que si
añadimos una cepa que no comparte genes con alguna de las otras dos cepas, el core genoma disminuirá ¿Qué
sucedería con el core genoma, se estabilizaría, disminuiría…? Al aumentar el número de cepas, el core genoma no
puede aumentar, disminuye o se estabiliza, si siguiera disminuyendo, no tendríamos al final nada en común.
Disminuye hasta que llega un momento en el que se estabiliza.
En la figura se muestras cepas de [Link], en rojo (línea inferior) se
muestra el core genoma y en azul, (la línea superior) se muestra el Pan-
genoma. El core disminuye hasta que se estabiliza, pero el pan genoma
aumenta. Es decir, que el core genoma disminuye porque cuantas más
cepas introduzcas, menor parte común poseerán, en cambio, respecto
al Pan-genoma: éste aumentará porque hay mayor cantidad de genes
totales.
¿De dónde salen esos genes que hacen que aumente el Pan-genoma?
Por ejemplo, desde los virus, o desde genes que se van incorporando
del medioambiente o de otros microorganismos.
-9-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Se muestran más gráficos como el anterior de distintas
especies los colores significan lo mismo, pero no todos
tienen la misma forma, no todos los Pan-genomas se
comportan igual. ¿De qué depende? Del número de cepas y
de lo bueno que sea el muestreo.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
En el ejemplo que se ha puesto antes de la bacteria
metilotrofa que era muy específica del ambiente donde vive,
¿Qué se espera que cada vez haya más genes distintos o
que no cambien mucho? que no cambien mucho.
• PAN-GENOMA CERRADO: el tamaño del pan genoma de las especies se satura rápidamente. En la figura se
muestra como la línea que permanece recta.
El tamaño del pan genoma de las especies crece con el número de cepas secuenciadas.
¿Como afectaría el añadir un genoma no acabado o de mala calidad al tamaño del core genoma? ¿Si yo en este
análisis le meto un genoma que no es bueno, que le pasa al core y al pan-genoma? El core disminuiría porque ese
gen saldría del core y el pan genoma aumentaría porque aumenta el número de genes.
-10-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Si nos vamos a los procariotas y comparamos cepas
de [Link] y siendo del mismo lugar, al irse a otro, ya
no son iguales siendo de la misma cepa inicial.
Miembros de la misma especie, pueden compartir
una parte del genoma pequeña, tienen contenido genético distinto.
• ECOTIPO: una especie que hay en dos sitios ecológicamente distinguible, subpoblaciones que están mas
especializadas en unas condiciones específicas de forma que si les cambio de sitio no sobrevivirían.
ARTÍCULO DE 1995:
Que hicieron: cogieron muestras De dos sitios (Sargazo y Golfo), en ambos sitios de
muestreo, hicieron un perfil oceánico y midieron varios parámetros, además cogieron
una muestra de mar a 100 metros en ambos sitios.
-11-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Entonces piensan: a lo mejor estos son ecotipos, pero
no lo sé. Tienen la suerte que están bacterias se
pueden cultivar y tienen una colección de
aislados de ambos sitios, seleccionan 4, dos
de cada lugar. Tienen dos de alta luz cada
una de un sitio y dos aislados de baja luz de
ambos sitios.
Tenemos dos cepas de alta luz (las dos de arriba) y varias de baja (las cuatro
de bajo) luz, cuando veo amarillo es alta luz al igual que el verde, pero son
cepas distintas.
-12-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Que es lo que se observa: la cepa de color rojo y la azul (cepas de baja luz)
a altas profundidades hay muy poca cantidad de células y conforme
disminuye en profundidad hay un pico y luego la cantidad disminuye, pero
no bruscamente. A 48° la cantidad de la cepa roja se mantiene
relativamente igual y la cepa azul no hace pico y conforme aumentamos en
profundidad desciende un poco.
En cuanto a las cepas de alta luz (la de color verde y amarillo) se observa
que, a menor profundidad, hay mayor cantidad de células/mL en ambos
casos, pero conforme aumentamos en profundidad el número de células
desciende.
-13-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
PREGUNTA DE EXAMEN: DESCRIBE LA FIGURA:
En la figura se observa una comparación del genoma de dos cepas de Prochlorococcus, cada una en un eje: en el de
coordenadas se muestra el genoma de MIT9312 y en el de abscisas el de MED4, esto nos permite ver en qué posición
se encuentra un gen en ambos genomas. Si el gen es el mismo y se encuentra en la misma posición, ese gen caerá en
la diagonal, es decir, se representa en la DIAGONAL.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
ambas cepas y, además, en la misma posición.
- SINTENIA: se produce cuando dos cepas tienen dispuestos los genes en el mismo orden, es decir, tienen la
misma posición relativa en ambos genomas. Dos genomas distintos presentan el mismo orden relativo=
genomas sintónicos. ¿La sintenia es síntoma de microorganismos cercanos entre sí o lejanos? Cercanos.
- INVERSIÓN: son genes que en una cepa están en un sentido y en la otra cepa están en el otro. ¿Por qué sé
que la cruz, o la línea perpendicular es una inversión? En la parte de bajo se muestra un ejemplo de inversión,
en la primera fila mostramos la posición de los genes, en la segunda fila mostramos como sería el orden del
genoma habitual, en la tercera fila muestra una inversión, que es un cambio en el sentido (orden de los
genomas), esta inversión puede ser de un fragmento del genoma o incluso todo entero.
1, 2, 3, 4, 5, 6, 7 → POSICIÓN.
A, B, C, D, E, F, G → GENOMA.
A, B, G, F, E, D, C → INVERSIÓN.
¿Qué diríamos como conclusión? Los genomas de estas dos bacterias son muy parecidos en tamaño y en posición, la
mayoría son singénicos y algunos son específicos de cepa. ¿Esos genes específicos de cepa están distribuidos por todo
el genoma? Pues no porque hay zonas del genoma donde se acumulan las diferencias, estas zonas se denominan ISLAS
GENÓMICAS O ZONAS HIPERVARIABLES.
- ISLAS GENÓMICAS O ZONAS HIPERVARIABLES: son las zonas del genoma donde se acumulan las diferencias
entre las cepas.
COMENTA ESTA GRÁFICA Y RELACIONALA CON EL PANGENOMA, GENOMA ACCESORIO… (PUEDE PREGUNTARLO ASÍ
EN UN EXAMEN):
GENOMA CORE: son los genes comunes son los que se encuentran dentro de los ejes.
-14-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Si se observa la leyenda vemos que el porcentaje de identidad entre las dos cepas mediante la técnica de medir el ARN
16S es muy alto, un 99,2%.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
porque se ve una estructura en cruz que está
formada a causa de las inversiones. El
tamaño de los genomas de las cepas es
distinto y el material genético también en
parte a causa de la diferencia de tamaño, se
observa que la sintenia se pierde.
-15-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
genes que se presentan en la cepa M8, pero no se
presentan en la cepa M13.
También es importante ver qué hay en las islas genómicas de las que hablamos. En
las islas hay genes que son distintos, muchos genes tienen que ver con componentes
de la pared celular, con virus, con transportadores de membrana, en las islas suele
haber genes que nos indican cómo interaccionan los virus con las bacterias (porque los
virus reconocen a las bacterias por los componentes de la pared de estas) y cómo se
relaciona la bacteria con el ambiente. En las islas no hay genes esenciales, porque esos
genes pertenecen al genoma core. Por lo tanto, los elementos que hay en las regiones
hipervariables son los que se presentan en la tabla de al lado. ESTUDIARLO →
Además de estudiar los genes que hay y que hacen esos genes, hay otras formas, que
nos indican que existen diferencias entre genomas de cepas.
En la siguiente figura se muestra una comparación del genoma de dos cepas de la misma especie, se muestra a la cepa
M8 en el eje de abscisas y a la cepa M13 en el eje de coordenadas, además, en este último eje, se comparan una serie
de características: el uso de codones y el contenido en GC en cada gen.
- CONTENIDO EN GC: (sólo miras el genoma de M8 en ese plot, es decir, solo te indica el uso de codones que
posee la cepa del eje de abscisas) se realiza cogiendo un gen y mirando su contenido (G= guanina y C=
-16-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Dentro de los genomas procariotas, tenemos los orgánulos que tiene las
células eucariotas que derivan de las células procariotas, ambos todavía
conservan sus genomas de cuando eran procariotas.
-17-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
7. -ÓMICAS:
- GENÓMICA: es el estudio de los genomas, estudio del DNA (Orna-
VIRUS). La genómica te dice lo que podría hacer el
microorganismo, cuáles son sus posibilidades, pero no te dice
que hace en un momento determinado. Para saber lo que hace en
un momento determinado se hace uso de la GENÓMICA
FUNCIONAL. Dentro de la genómica funcional existen las
siguientes:
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
- TRANSCRIPTÓMICA: es el estudio de la transcripción, es decir, el
estudio del RNA.
- PROTEÓMICA: es el estudio de la traducción, es decir, de las
proteínas.
- METABOLÓMICA: es el estudio de las reacciones
enzimáticas, es decir, de los metabolitos.
• RNAseq: que realmente es DNAseq porque secuencias DNAc, hace años se utilizaban microarrays. ¿Qué es un
microarray? Es un sporte físico con agujeros en los que en su interior tienes en cada uno moléculas, es decir,
en cada punto tienes fijadas moléculas que quieres comprobar si hibridan con tu DNAc. Los chips pueden están
hechos a mano, o lo puede hacer un robot que hace miles más. En los microarrays puedes hacer muchas
hibridaciones ahí. Es un sistema de miniaturización.
-18-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
METABOLOMA: es el estudio de los metabolitos, se realiza con espectrofotometría de
masas (se explica en TEF) que te permite ver todos los compuestos que produce un determinado
organismo.
8. METAGENÓMICA:
MUY IMPORTANTE. La metagenómica ha
permitido avanzar en el estudio de los
organismos in vivo. Sabemos que hay un
problema a la hora de cultivar microorganimos,
este problema se denomina: LA GRAN
ANOMALÍA DEL RECUENTO EN PLACA. Lo que
sucede es que cuando tú miras microorganismos
en el microscopio obtienes un número y que
cuando los cultivas y luego los cuentas, obtienes
otro que es menor que el primero.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
¿En el caso de los virus que haríamos? primero quitas las demás
células y luego concentras tus virus porque te interesa el
metaviroma. Secuenciamos todos los genomas víricos de una
muestra. Para concentrar hay máquinas que concentran los virus.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Luego puedes hacer una ultracentrifugacion, ultra es a mucha
velocidad, extraes el DNA de los virus y lo secuencias, pero puede
ser que haya alguna bacteria que se haya roto y haya
contaminado la muestra con su DNA, ¿qué haríamos? Lo mismo
que antes, tratarlo con DNAsas.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
-21-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
• EJEMPLOS DE PROYECTOS METAGENÓMICOS
IMPORTANTES:
En 2004 se colapsaron las bases de datos de
metagenómica, fue a partir de este artículo y
con él incluido. Se hizo en el mar de los
Sargazos, se cogieron muestras de agua de
superficie y se analizaron.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Luego se hicieron más
trabajos del mismo tipo,
es decir, coger el agua de
superficie del mar, pero a
nivel global.
• FRAGMENT RECRUITMENT:
- Fragment recruitment: es el cruzamiento de fragmentos, es una
forma de obtener información del metagenoma. En la imagen
se coge una muestra natural, por ejemplo, agua de mar, se
SECUENCIA y se obtienen reads de Pelagibacter sp. y hay otros
reads, que pueden ser de otros organismos, o de virus, etc. Con
esos reads puedes hacer dos cosas: una es ensamblar y la otra
es buscar reads que pertenezcan o se parezcan a organismos
cultivados. ¿para qué? Para ver si son abundantes en la
muestra, para ver microdiversidad,etc.
-22-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
-23-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
secuenciando cada una de ellas. ¿Para qué sirve
esto? Es una forma de sacar genomas casi
completos de muestras naturales, y digo casi
porque puede haber fallos subtécnicos del
aparato.
-24-
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4621176