Curso Electivo Bioinformática: Conceptos y herramientas web
Guía de actividad práctica 3 y Pauta de Informe
Estimadas/os estudiantes
La actividad práctica 3 es para reforzar lo aprendido sobre ensamble de secuencias.
Para lograr los objetivos de este práctico vamos a utilizar distintas secuencias las cuales
analizaremos en herramientas online. Los resultados deben quedar registrados en un informe
que prepararán en sus casas para ser entregado en formato PDF el domingo 23 de julio.
La siguiente guía representa un esquema de actividades
que deben ser resueltos a modo de informe.
Las respuestas deben ser breves y apoyadas de
imágenes (capturas de pantalla) según corresponda.
Sección 1: Identificación del estudiante.
Escribir su nombre, carrera y su email institucional
Sección 2: Introducción (máx. 200 palabras).
En esta sección deben desarrollar una breve explicación de la actividad utilizando los
conceptos entregados en la clase y/o complementando con información que obtenga desde la
bibliografía recomendada.
Sección 3: Secuencias no deseadas.
Durante el análisis de resultados de secuenciación debe retirar toda secuencia que haya sido
añadida de forma artificial por el proceso (ejemplo: secuencias adaptadoras).
Como fue comentado en clases, la secuenciación Sanger sigue usándose pues es una forma
costo/efectiva para secuenciar DNA amplificado por PCR. Dado que en la técnica PCR no
siempre se obtiene un amplicón único, un protocolo para secuenciar el “amplicón correcto”
es ligar todos los amplicones de un mismo “tubo” o reacción PCR en un vector de
clonación/secuenciación (ejemplo pGEM-T). Estos vectores son clonados en E. coli y luego
seleccionados como colonias bacterianas únicas desde las cuales se realiza la secuenciación.
Este protocolo nos asegura dos cosas: aumentar la probabilidad de obtener el fragmento
correcto y, dado que el vector de clonación es conocido, podemos usar un primer que
reconoce la secuencia del vector. Recordemos que para iniciar el proceso de secuenciación
necesitamos contar con un partidor, es decir, “una zona con secuencia conocida”.
Dado que en este protocolo se utiliza como intermediario un vector de clonamiento, el
resultado de la secuenciación puede contener segmentos del vector al inicio y al final de
nuestra secuencia deseada, los cuales debemos remover. Para la detección de estos
fragmentos de vector podemos usar la herramienta VecScreen de NCBI la cual realiza un
alineamiento local con las bases de datos de vectores de Genbank.
En la presente actividad Ud. encontrará las zonas de vector que delimitan una secuencia
obtenida mediante Sanger, a la cual anteriormente se le aplicó el protocolo de clonación en
vector de secuenciación.
Ingrese la secuencia entregada en el archivo seq1.txt al formulario del sitio web
https://www.ncbi.nlm.nih.gov/tools/vecscreen, luego presionar “Run VecScreen” y en la
siguiente ventana presionar “View report”. El reporte le mostrará una representación gráfica
de su secuencia y, con diferentes colores según la intensidad de match, se demarcarán las
zonas que la herramienta detectó como parte de secuencias de vector.
3.1 ¿Qué regiones son detectadas?
3.2 ¿Cuál es el nombre del vector de clonamiento que se utilizó en este amplicón de PCR
(strong match)?
Sección 4: Ensamble de lecturas.
En el siguiente ejercicio realizaremos un ensamble de cinco lecturas o “reads” obtenidas
desde una secuenciación Sanger. Ingrese a http://doua.prabi.fr/software/cap3 y pegue en el
formulario las secuencias del archivo seq2.txt. Luego presione “submit”.
4.1 ¿Cuántas secuencias contíguas (contigs) se forman? (Revise el link “Contigs”)
4.2 ¿Existen reads que no se ensamblaron (singletons)? Indique cuáles son las secuencias.
(Revise el link “Single sequences”).
4.3 ¿Cómo se formó el contig? Componga una representación gráfica sencilla del ensamble
(esquema) indicando los identificadores de las secuencias involucradas. (Revise el link
“Assembly details” y vea dónde comienza y termina cada uno de los reads que fueron
ensamblados).
Conclusiones (máx. 200 palabras):
Desarrolle sus conclusiones de la actividad.
Dr. Jonathan Maldonado
Profesor responsable del curso Bioinformática I
Departamento de Biología
Facultad de Química y Biología
USACH
Santiago, 12 de julio de 2023