UNIVERSIDAD PERUANA CAYETANO HEREDIA
FACULTAD DE CIENCIAS E INGENIERÍA
TBL4 - BIOINFORMÁTICA
Identificación por 16S rRNA y análisis filogenético en bacterias
Curso:
Microbiología y Cultivo Celular
Integrantes:
Diego Sebastian Rojas Godoy
Nadira Abigail Oviedo del Águila
Grupo:
Mesa N°4
Fecha:
09 / 06 / 2023
Lima - Perú
I. IDENTIFICACIÓN DE SECUENCIAS
Ejercicio 1: Secuencia de 16S rRNA de un habitante de los pulmones
1.1.¿De qué organismo se trata?
Organismo: Mycobacterium tuberculosis
1.2.¿Qué número de acceso tiene el organismo?
Sequence ID: CP054014.1
1.3.¿Qué significa el gráfico de líneas que acompaña a los resultados?
Representa a los pares de bases que coinciden entre secuencias, en este caso, todos son
iguales.
1.4.¿Qué porcentaje de identidad y query cover tiene con la primera secuencia que
aparece en el blast?
● Porcentaje de identidad = 100%
Query cover: 100%
1.5. Un concepto de similitud y homología puede extenderse al ADN. ¿Es posible
encontrar secuencias de ADN con una alta similitud (~66%), pero que no sean
homólogas?
Cabe la posibilidad de que no exista homología entre secuencias con alto porcentaje de
similitud, ya que al existir diferencias significativas entre sus longitudes, pueda que no
tengan las mismas funciones. En este ejercicio podemos observar que la longitud de la
secuencia de Mycobacterium tuberculosis está conformada por 4414577bp, mientras que la
longitud de nuestro query tiene solo 1532. Este hecho podría confirmar nuestra hipótesis.
Ejercicio 2: Secuencia de 16S rRNA de un habitante de los estanques
1.1.¿De qué organismo se trata?
Organismo: Chromatium okenii
1.2.¿Qué número de acceso tiene el organismo?
Número de acceso: Y12376.1
1.3.¿Qué significa el gráfico de líneas que acompaña a los resultados?
Representa a los pares de base que coinciden entre secuencias, en este caso, todos son
iguales.
1.4.¿Qué porcentaje de identidad y query cover tiene con la primera secuencia que
aparece en el blast?
Porcentaje de identidad: 100%
Query cover: 100%
1.5. Un concepto de similitud y homología puede extenderse al ADN. ¿Es posible
encontrar secuencias de ADN con una alta similitud (~66%), pero que no sean
homólogas?
A comparación del ejercicio anterior, en este podemos observar que tanto la longitud de
query como la longitud de la secuencia elegida tienen la misma cantidad de pares de base,
por lo que no cabe la posibilidad de que no sean homólogas.
Ejercicio 3: Secuencia de 16S rRNA de un huésped de nuestros intestinos
1.1.¿De qué organismo se trata? (screenshots)
Organismo: Escherichia coli
1.2.¿Qué número de acceso tiene el organismo?
Sequence ID: MT263026.1
1.3.¿Qué significa el gráfico de líneas que acompaña a los resultados?
Representa a los pares de bases que coinciden entre secuencias, en este caso, todos son
iguales.
1.4.¿Qué porcentaje de identidad y query cover tiene con la primera secuencia que
aparece en el blast?
Porcentaje de identidad: 100%
Query cover: 100%
1.5. Un concepto de similitud y homología puede extenderse al ADN. ¿Es posible
encontrar secuencias de ADN con una alta similitud (~66%), pero que no sean
homólogas?
En este ejercicio podemos observar que la longitud de la secuencia de Escherichia coli está
conformada por 1450 bp, mientras que la longitud de nuestro query tiene solo 774, lo que
puede indicar que las secuencias analizadas no son necesariamente homólogas.
II. Construcción de árboles fIlogenéticos
Método por alineamiento:
En la pestaña “Alignments” podemos observar los resultados de la alineación múltiple de las
secuencias de nucleótidos en estudio.Las secuencias se alinean verticalmente y existen
algunos espacios vacíos (gaps) que son indicados con guiones, estos son un indicador de
que las secuencias tienen longitudes variables o secuencias de evolución como deleciones
o inserciones. Por otro lado, las columnas alineadas en su totalidad tienen una anotación
denotada con un asterisco (*), en el fragmento elegido observamos 11 columnas similares.
Figura 1. Pestaña Alignments
El “result summary” brinda detalles de las secuencias alineadas en el software, como las
secuencias ingresadas. el alineamiento realizado con el número de residuos. el árbol guía,
el árbol filogenético, entre otros.
Figura 2. Result summary
En la pestaña “Guide Tree” podemos encontrar el árbol que representa las relaciones
evolutivas entre las secuencias alineadas. Algunas características a considerar son las
ramas y nodos, el agrupamiento de las secuencias y el alineamiento de las secuencias.
En nuestro caso, observamos que el ancestro común es el Pyrococcus-furiosus, vemos
muchas secuencias agrupadas, lo que significa que tiene un alto porcentaje de similitud
evolutiva.
Figura 3. Guide Tree
En la pestaña “Submission Details” podemos observar el número de secuencias alineadas
(37 en nuestro caso), el programa utilizado para realizar dicho alineamiento y la fechas de
ingreso de datos y obtención de resultados.
Figura 4. Submission Details
Método por distancias:
En el presente árbol filogenético existen 68 nodos (Figura 5), cada uno de estos representa
los ancestros comunes de los grupos de las secuencias que están conectadas con las
ramas. Las ramas representan las líneas de descendencia y las relaciones evolutivas entre
las secuencias; la longitud de estas es un indicador del tiempo o la cantidad de cambios
evolutivos que les podrían haber afectado. En nuestro caso, el Pyrococcus-furiosus es el
que se encuentra más alejado, por lo que se puede deducir que este es el ancestro del
resto de secuencias. También podemos observar una gran cantidad de clados, que son
aquellas agrupaciones que cuentan con un ancestro común propio. Finalmente, la
estructura del árbol filogenético nos brinda información sobre las relaciones evolutivas y la
divergencia entre las diferentes secuencias estudiadas. La disposición de los nodos y las
ramas indican las ramificaciones y las conexiones entre los grupos.
Figura 5. Cantidad de nodos
Figura 6. Árbol Filogenético
Responda las siguientes preguntas:
2.1. Escoge el mejor árbol y discute si los clústeres que se han formado eran predecibles.
Para poder elaborar el árbol filogenético se tiene como base el árbol guía, por esta razón
podría ser considerado el mejor árbol. A partir del alineamiento realizado sí se pudo ir
conociendo los clústeres formados, cuyas columnas estaban marcadas con un *.
2.2. Busca atributos fenotípicos de los organismos involucrados y describe si el análisis ha
logrado agruparlos en base a esas características.
Figura 7. Ejemplo usado para responder la pregunta.
Tabla 1. Semejanzas entre las especies elegidas (Madigan, 2012).
Forma y estructura celular Las especies usadas son bacterias Gram-positivas; sin
embargo difieren en sus formas.
Aerobias facultativas Las 3 bacterias son aerobias facultativas.
Capacidad de formar colonias Las 3 bacterias tienen la capacidad de formar colonias
en medios adecuados.
Patógenos oportunistas Las bacterias son patógenos oportunistas.
Producción de enzimas Todas tienen la capacidad de producir enzimas, lo que
les permite adaptarse al medio para sobrevivir y
causar enfermedades.
Con las características descritas en la tabla podemos deducir que la agrupación sí fue
realizada en base a estas.
Bibliografía
Madigan. (2012). Brock biology of microorganisms (13th ed.). Benjamin Cummings.