0% encontró este documento útil (0 votos)

114 vistas5 páginas

Ensamblaje de Mycobacterium bovis en Galaxy

Este documento describe los pasos para ensamblar de novo el genoma de una cepa de Mycobacterium bovis a partir de datos de secuenciación. Inicialmente se realiza un control de calidad de los reads con FASTQC. Luego se ensambla el genoma con Velvet Optimizer y se analizan las estadísticas del ensamblaje. Finalmente, se identifican contigs con alto coverage, como genes ribosomales, mediante BLAST.

Cargado por

Carlos Jovanny Moreno Peña

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

114 vistas5 páginas

Ensamblaje de Mycobacterium bovis en Galaxy

Cargado por

Carlos Jovanny Moreno Peña

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Práctico prueba de ensamblaje con Galaxy

taller de Herramientas para el Análisis de Secuenias y proteı́nas

26 de octubre de 2016

1 Introducción

La tuberculosis bovina es causada por la bacteria Mycobacterium bovis que

además de afectar al ganado, puede infectar otras especies de mamı́feros,
incluyendo al ser humano y animales salvajes que actúan como reservorios
de la enfermedad, haciendo más difı́cil su erradicación. M. bovis es miembro
del Complejo Mycobacterium tuberculosis (MTBC), un grupo de especies
que presentan diferencias epidemiolgicas (distribución geográfica, preferen-
cias de hospedero, virulencia y susceptibilidad ante drogas) pero comparten
un 99.9% de identidad genética. Aun ası́, presentan regiones altamente
polimórficas debido a variaciones en la cantidad de copias y/o posición en
el genoma que han sido recientemente detectadas gracias a las nuevas tec-
nologı́as de secuenciación. En efecto, se ha demostrado la importancia de
la secuenciación genómica en el aumento de la resolución obtenida en el
genotipado por polimorfismos.

2 Objetivos

Ensambaldo de novo de una cepa de Mycobacterium bovis

3 Obtención de datos

Entra a tu usuario en [Link] donde

tienes los datos cargados o cargalos si aun no lo has hecho ( archivos Tb164 [Link]

1
y Tb164 [Link]).

4 Control de Calidad con FASTQC

Siempre el primer paso es controlar la calidad de los reads. Eso nos per-
mite tener información necesaria para configurar los siguientes programas
de nuestro pipeline (en este caso el ensamblador) y por otro lado tener la
oportunidad de filtrar las secuencias de baja calidad que nos pueden llevar
a errores. Ver figure 1

busca la herramienta fastqc

• selecciona el boton de dos hojitas (multiple dataset)

• selecciona ambos archivos fastq (Tb164 [Link] y Tb164 [Link])

• execute

Para visualizar los resultados puedes ver los items 3 y 5 generados con el
botón de visualizar.

Cómo es la calidad de los reads? Es necesario filtrar o trimmear

los reads?

Qué herramienta nos sirve para trimmear los datos? ver en el

menú: NGS: QC and manipulation

5 Ensamblado de Novo

Vamos a utilizar la herramienta Velvet optimiser que toma los reads y genera
varios ensamblados para evaluar el mejor

Mayor información sobre el ensamblado con velvet: [Link]

com/document/pub?id=1B05Znc4rtwbYhKLQjPDOYVKCtm_E7Q5dg2aU9Nln6Fo#
h.tvk14o9ksltw

Busca la herramienta Velvet Optimiser

2
Figure 1: fastqc

• Start k-mer size 51

• End k-mer size 63

• select files (Tb164 [Link] y Tb164 [Link])

5.1 Mirar los resultados

Una vez que finaliza el proceso, debemos tener dos nuevos objetos:
7 VelvetOptimiser on data 1 and data 2: Contigs
8 VelvetOptimiser on data 1 and data 2: Contig Stats

Contigs: Se puede visualizar el primer MB del file. Los contigs tienen un

ID con la forma: NODE XX length XXXX cov [Link] con información
sobre el largo del contig (in k-mer length) y el coverage.

Contig stats: Es una tabla que muestra los contigs y el coverage de k-mers
y que librerı́a contribuyó al coverage. Contigs que tengan un coverage muy
alto (mucho más alto que la media) seguramente corresponan a secuencias
repetidas (i.e. genes ribosomales, familias multigénicas)

3
Si observamos el quinto contig, veremos que hay secuencias con NNN,
por qué existen esas secuencias? Te das una idea de como se
definen (largo)?

6 Estadı́sticas del ensamblaje

Para generar algunas estadı́sticas del ensamblaje podemos utilizar la her-

ramienta FASTA Manipulation − > Fasta Statistics

• Seleccionon los contigs (el objeto 7)

• execute

Observa y discute las estadı́sticas de nuestro primer ensamblado

Que es el N50?
Cuál es largo total?

7 Análisis del coverage

En las estadı́sticas de los resultados del velvet 8 VelvetOptimiser on data

1 and data 2: Contig Stats se puede observar algunos contigs que son
muy cortos. Vamos a filtrar los contigs cortos Para esto vamos a usar la
herramienta: Filter and Sort − > Filter tool

• With following condition ”c2 > 100”

• Execute

Por qué filtramos los contigs cortos?

El nuevo objeto tendrá las estadı́sticas de los contigs mayores a 100 pb. Si
observamos la columna 6 podemos ver variabilidad en el coverage. Si un
contig tiene el doble de covarge que la media, suponemos que esta secuencia
está al menos dos veces en nuestro genoma. Tratemos de identificar algún
contig con un coverage muy alto, y veamos a que corresponde.

4
7.1 Extrar secuencias especı́ficas

Podemos extraer la secuencia fasta de algún contig con un coverage > a 100,
para esto vamos a utilizar la herramienta:
Fasta manipulation − > Fasta Extract Sequence
En mi caso es el contig NODE 39

• Fasta or multifasta file: 7: VevetOptimiser on data 1 and data2:

Contigs

• Sequence ID (or partial): NODE 39

• Execute

El nuevo objeto nuevo tendrá una secuencia fasta

7.2 Identificación mediante Blast

Para identificar de que se trata esta secuencia que parece estar repetida en
el genoma, podemos hacer un blast (fuera de Galaxy)

Selecciona el botón con el ojo para visualizar la secuencia y luego la copias

y vas a la página de blast [Link]

Prueba de realizar un blastn y si los resultados no te ayudan puedes probar

a realizar un blastx

Discutir las herramientas blastn y blastx

A que secuencia corresponde?
Tiene sentido su alto coverage?
Puedes decir a que secuencia corresponde un contig con un cov-
erage mayor a 50, (ejemplo ”NODE 59 ”) ?

También podría gustarte

Ensamblaje del genoma de E. coli O104:H4
Aún no hay calificaciones
Ensamblaje del genoma de E. coli O104:H4
12 páginas
2 Wgs
Aún no hay calificaciones
2 Wgs
54 páginas
Biotecnología INFORME MEGA
Aún no hay calificaciones
Biotecnología INFORME MEGA
9 páginas
Ensamblaje de Novo de Genomas Microbianos
Aún no hay calificaciones
Ensamblaje de Novo de Genomas Microbianos
5 páginas
Introducción a la Bioinformática Genómica
Aún no hay calificaciones
Introducción a la Bioinformática Genómica
92 páginas
Alineamiento de Secuencias con BLAST y Herramientas Genómicas
Aún no hay calificaciones
Alineamiento de Secuencias con BLAST y Herramientas Genómicas
26 páginas
Introducción a la Secuenciación NGS
Aún no hay calificaciones
Introducción a la Secuenciación NGS
63 páginas
Codigo de Procesamiento-1
Aún no hay calificaciones
Codigo de Procesamiento-1
3 páginas
Sesion 13
Aún no hay calificaciones
Sesion 13
19 páginas
Ensamblaje de Genomas: Métodos y Evaluación
Aún no hay calificaciones
Ensamblaje de Genomas: Métodos y Evaluación
4 páginas
Análisis Bioinformático Metagenómico
Aún no hay calificaciones
Análisis Bioinformático Metagenómico
49 páginas
Guia
Aún no hay calificaciones
Guia
11 páginas
Resumen Clase 9 TM
Aún no hay calificaciones
Resumen Clase 9 TM
9 páginas
Prueba de Ensamble de Genomas 2022
Aún no hay calificaciones
Prueba de Ensamble de Genomas 2022
3 páginas
Análisis de diversidad con QIIME 2
Aún no hay calificaciones
Análisis de diversidad con QIIME 2
23 páginas
Metagenómica
Aún no hay calificaciones
Metagenómica
36 páginas
Metagenómica: Enzimas Glicósido Hidrolasas
Aún no hay calificaciones
Metagenómica: Enzimas Glicósido Hidrolasas
6 páginas
Análisis de ADN con BioEdit y BLAST
Aún no hay calificaciones
Análisis de ADN con BioEdit y BLAST
17 páginas
Clase Ensamblado 2023
Aún no hay calificaciones
Clase Ensamblado 2023
56 páginas
Guia para El Diseno de Primers
Aún no hay calificaciones
Guia para El Diseno de Primers
20 páginas
Guía de Uso de PyMOL para PDB
Aún no hay calificaciones
Guía de Uso de PyMOL para PDB
9 páginas
Análisis de "Mycoplasma Pneumoniae" en Simulador
Aún no hay calificaciones
Análisis de "Mycoplasma Pneumoniae" en Simulador
7 páginas
Secuenciación y Bioinformática en PCR
Aún no hay calificaciones
Secuenciación y Bioinformática en PCR
73 páginas
Bioinformática - II Nov 2017
Aún no hay calificaciones
Bioinformática - II Nov 2017
82 páginas
Ejercicio RNA Seq 2025
Aún no hay calificaciones
Ejercicio RNA Seq 2025
6 páginas
Análisis de Secuencias con BioEdit y RDP
Aún no hay calificaciones
Análisis de Secuencias con BioEdit y RDP
8 páginas
Estrategias de ensamblado de genomas
Aún no hay calificaciones
Estrategias de ensamblado de genomas
35 páginas
Pymol PDF
Aún no hay calificaciones
Pymol PDF
22 páginas
5 - Blast 2025-1
Aún no hay calificaciones
5 - Blast 2025-1
26 páginas
Análisis ChIP-Seq en Biomedicina
Aún no hay calificaciones
Análisis ChIP-Seq en Biomedicina
70 páginas
Analisis Bioinformatico de Bacillus Subtilis
Aún no hay calificaciones
Analisis Bioinformatico de Bacillus Subtilis
10 páginas
Sesiones Mega
Aún no hay calificaciones
Sesiones Mega
5 páginas
Taller de Bioinformática: Comandos y Análisis
Aún no hay calificaciones
Taller de Bioinformática: Comandos y Análisis
4 páginas
Taller de Mutaciones para Grado Noveno
Aún no hay calificaciones
Taller de Mutaciones para Grado Noveno
61 páginas
Anotación de Genomas Procariotas
Aún no hay calificaciones
Anotación de Genomas Procariotas
10 páginas
Procedimiento para Análisis de Secuencias Genómicas
Aún no hay calificaciones
Procedimiento para Análisis de Secuencias Genómicas
17 páginas
Igpet Manual
Aún no hay calificaciones
Igpet Manual
46 páginas
Algoritmos y Formatos en Bioinformática
Aún no hay calificaciones
Algoritmos y Formatos en Bioinformática
16 páginas
Curso de Bioinformática
Aún no hay calificaciones
Curso de Bioinformática
6 páginas
Homodímeros en Andesiops peruvianus
Aún no hay calificaciones
Homodímeros en Andesiops peruvianus
14 páginas
2 GentEvolMol Lab Sesion 3 - BDD y BLAST Parte II
Aún no hay calificaciones
2 GentEvolMol Lab Sesion 3 - BDD y BLAST Parte II
9 páginas
Visualización de Estructuras Proteicas
Aún no hay calificaciones
Visualización de Estructuras Proteicas
4 páginas
Herramientas Bioinformáticas y Análisis Genómico
Aún no hay calificaciones
Herramientas Bioinformáticas y Análisis Genómico
7 páginas
Estudio de Docking en ADN-Girasa
Aún no hay calificaciones
Estudio de Docking en ADN-Girasa
13 páginas
Análisis de Estructura de Proteínas con BLAST
Aún no hay calificaciones
Análisis de Estructura de Proteínas con BLAST
31 páginas
Escalante Lopez - Alineamientos
Aún no hay calificaciones
Escalante Lopez - Alineamientos
19 páginas
Blast Comandos
Aún no hay calificaciones
Blast Comandos
3 páginas
Análisis de Estructuras de Proteínas 3D
0% (1)
Análisis de Estructuras de Proteínas 3D
8 páginas
Redes Neuronales Convolucionales para Grafos
Aún no hay calificaciones
Redes Neuronales Convolucionales para Grafos
2 páginas
5 Analisis de Datos de Secuenciacion
Aún no hay calificaciones
5 Analisis de Datos de Secuenciacion
18 páginas
2 Illumina Sequencing Overview 15045845 D
Aún no hay calificaciones
2 Illumina Sequencing Overview 15045845 D
41 páginas
Guía de Análisis de Secuencias ADN
Aún no hay calificaciones
Guía de Análisis de Secuencias ADN
8 páginas
Guía Usuario NGS Illumina
Aún no hay calificaciones
Guía Usuario NGS Illumina
9 páginas
Tecnología de Clonación Del ADN Bioinformatica
Aún no hay calificaciones
Tecnología de Clonación Del ADN Bioinformatica
9 páginas
Bioinformática Estadística
100% (1)
Bioinformática Estadística
545 páginas
Modelado por Homología de Proteasa VIH-1
Aún no hay calificaciones
Modelado por Homología de Proteasa VIH-1
5 páginas
Bioinformatica Estadistica Con R
100% (1)
Bioinformatica Estadistica Con R
379 páginas
Bioinformática y Clonación en Microbiología
Aún no hay calificaciones
Bioinformática y Clonación en Microbiología
6 páginas
Semana 12
Aún no hay calificaciones
Semana 12
23 páginas
Dalgiet: Usos y Efectos Secundarios
Aún no hay calificaciones
Dalgiet: Usos y Efectos Secundarios
1 página
Das Entulinea
Aún no hay calificaciones
Das Entulinea
20 páginas
Higiene Postural y Manipulación de Cargas
Aún no hay calificaciones
Higiene Postural y Manipulación de Cargas
34 páginas
Guía COVENIN 4004: SGSHO en Venezuela
Aún no hay calificaciones
Guía COVENIN 4004: SGSHO en Venezuela
30 páginas
1 Generalidades Conceptos
100% (3)
1 Generalidades Conceptos
38 páginas
Feminicidios
33% (3)
Feminicidios
7 páginas
Heladas Triptico
78% (9)
Heladas Triptico
2 páginas
2022 06 13 Primer Ejer Aux Edu Especial
Aún no hay calificaciones
2022 06 13 Primer Ejer Aux Edu Especial
21 páginas
Manejo Seguro de Residuos Peligrosos
Aún no hay calificaciones
Manejo Seguro de Residuos Peligrosos
11 páginas
Copia de Regidores
Aún no hay calificaciones
Copia de Regidores
11 páginas
Caso clínico: Síndrome de Down en niño
Aún no hay calificaciones
Caso clínico: Síndrome de Down en niño
2 páginas
TANA
Aún no hay calificaciones
TANA
102 páginas
Mejora del Agua y Saneamiento en Tunzo
Aún no hay calificaciones
Mejora del Agua y Saneamiento en Tunzo
35 páginas
Informe Psicologico
Aún no hay calificaciones
Informe Psicologico
3 páginas
Micropropagación Sandia
Aún no hay calificaciones
Micropropagación Sandia
3 páginas
Efecto Roseto: Salud y Relaciones Sociales
Aún no hay calificaciones
Efecto Roseto: Salud y Relaciones Sociales
1 página
Lectura Crítica
Aún no hay calificaciones
Lectura Crítica
5 páginas
Introduccion A La Tecnologia de Alimentos PDF
100% (2)
Introduccion A La Tecnologia de Alimentos PDF
214 páginas
Riesgos Laborales para Bodegueros
Aún no hay calificaciones
Riesgos Laborales para Bodegueros
2 páginas
Enfermedad de Gaucher: Tipos y Tratamientos
Aún no hay calificaciones
Enfermedad de Gaucher: Tipos y Tratamientos
11 páginas
Autoestima Habilidades Blandas
Aún no hay calificaciones
Autoestima Habilidades Blandas
4 páginas
Salud Mental
Aún no hay calificaciones
Salud Mental
3 páginas
Procesos de la Nutrición en Seres Vivos
Aún no hay calificaciones
Procesos de la Nutrición en Seres Vivos
13 páginas
Proyectos - Programa Fonie
Aún no hay calificaciones
Proyectos - Programa Fonie
182 páginas
Diabetes Dr. Cattoni 24/04/15: Diagnóstico
Aún no hay calificaciones
Diabetes Dr. Cattoni 24/04/15: Diagnóstico
4 páginas
Sesion Educativa Autoexamen de Mama
Aún no hay calificaciones
Sesion Educativa Autoexamen de Mama
6 páginas
Procesos de Potabilización del Agua
Aún no hay calificaciones
Procesos de Potabilización del Agua
8 páginas
Actividad 1
Aún no hay calificaciones
Actividad 1
3 páginas