PRACTICA N°8
EJERCICIOS
INTRODUCTORIOS A LA
BIOINFORMÁ TICA
Ingeniería Genética
Dra. Elith Valencia Villalvazo
*Alumna de la cátedra de Ingeniería Genética, del departamento de Biología Celular
Molecular, del Centro Universitario de Ciencias Biológicas y Agropecuarias de la
Universidad de Guadalajara.
*
Guadalajara - 2020
Fig. 1. Bioinfomática
INTRODUCCIÓN
La bioinformática es una ciencia multi e interdisciplinaria basada en el uso de
herramientas computacionales, matemáticas y estadísticas para el análisis,
interpretación y generación de datos biológicos. En el área de la IG la bioinformática
permite comprender e interpretar los datos experimentales de forma rápida y precisa,
por ejemplo, con base en la disponibilidad de secuencias nucleotídicas y de amino
ácidos se puede comparar (alinear) varias secuencias y en algunos casos predecir la
función de genes y de proteínas. En general, cuando mejor conocemos un sistema,
más rápido y de manera eficiente lo modificamos, por lo tanto la bioinformática se
ocupa también de analizar una enorme cantidad de resultados que se obtienen en
forma de secuencias de DNA, de interpretarlos y obtener conclusiones sobre la
regulación de la expresión de los distintos productos génicos, además de encontrar la
función de proteínas desconocidas y de generar modelos que permitan estudiar
mutaciones puntuales con rapidez y eficacia, incluso sin fase experimental (Medina et
al., 2012; Serrano, 2014).
La bioinformática es clave para el desarrollo de las ciencias ómicas (genómica,
proteómica, transcriptómica y la metabolómica) las cuales aportan al análisis de la
funcionalidad celular y en sus aplicaciones biotecnológicas, por lo que ahora es
sencillo llevar a cabo procesamientos de datos de genomas enteros (genómica:
contenido de DNA que tiene un organismo), transcriptomas (refleja los niveles de
expresión de todos los genes de un genoma en un momento dado), metabolomas
(conjunto dinámico de moléculas y elementos químicos presentes en un organismo
vivo), proteomas (conjunto de proteínas que un organismo sintetiza a partir de los
genes que contiene) (Ciencias Omicas, 2011).
Existen diversas bases de datos y paquetes de programas para los análisis
bioinformáticos, tanto de uso y acceso libre en internet como comerciales. Entre los de
acceso libre se pueden mencionar, las bases de datos de NCBI (National Center for
Biotechnology Information) y ENSENBL y las herramientas Primer3 (diseño de
cebadores para PCR), Primer blast (PCR in silico) y NEBcutter (mapa de restricción y
digestión in silico), los cuales son útiles para analizar y comparar secuencias
nucleotídicas, estandarizar un experimento de PCR, realizar restricciones enzimáticas,
lo que facilita indudablemente la planeación de un experimento y el análisis de datos
recabados. Cabe mencionar que cada programa cuenta con soporte técnico (tutoriales
o videos en Youtube.com) que agilizan su manejo.
NEB cutter Proporciona con rapidez el conocimiento de sitios de restricción enzimática
en una secuencia específica y muestra de forma práctica los fragmentos obtenidos
después de la digestión con endonucleasas. Este programa es utilizado para preparar
estrategias de clonación y expresión de genes en vectores (Vincze et al., 2003).
NCBI (The National Center for Biotechnology Information) proporciona información
biomédica y genética, en este sitio se encuentra la mayor base de datos genéticos
(Genbank) que favorece a las comunidades científicas y médicas. Esta organización
además soporta diferentes programas informáticos de acceso libre; de estos se puede
se puede obtener diversa información sobre secuencias, de cartografía genética,
taxonomía y datos estructurales que favorecen a los avances de la ciencia y la salud
(NCBI, 2016).
ENSEMBL al igual que NCBI es un banco de datos genéticos y genómicos para los
vertebrados y otras especies eucariotas (Ensembl, 2016).
Primer3 es un programa computacional para el diseño de oligonucleótidos para PCR y
una variedad de aplicaciones como STSs 1 (sequence tagged site) o para la
amplificación de secuencias polimórficas (Untergasser et al., 2007).
Primer-BLAST tiene la función de diseñar cebadores específicos para PCR de una
secuencia de DNA de interés. Primer-BLAST en conjunto con Primer 3 permite
búsqueda y diseño de cebadores de manera sencilla, específica y eficiente. También
dentro de este programa se realizan PCR in silico, las cuales consisten en simular una
PCR con los oligonucleótidos seleccionados y corroborar con la base de datos de
Genbank la especificidad del fragmento amplificado (Ye et al., 2012).
A lo largo de la presente práctica el alumno practicara con algunos programas
bioinformáticos disponibles en la red. La práctica del estudiante permitirá rápidamente
superar rápidamente la guía proporcionada aquí.
OBJETIVO GENERAL
Practicar algunos programas bioinformáticos utilizados en Ingeniería Genética
OBJETIVOS PARTICULARES
1) Relacionados con digestión enzimática
Conocer la herramienta NEB cutter para la consulta de mapas de restricción de
secuencias conocidas. Realizar digestión enzimática electrónica con
endonucleasas.
2) Relacionados con la PCR
Obtener una secuencia nucleotídica de interés de bases de datos NCBI
(GenBank) o Ensembl
Diseñar oligonucleótidos (cebadores) para PCR con Primer3
Realizar una PCR electrónica (in silico) con Primer blast
MATERIALES Y MÉTODOS
Cuadro 1. Reactivos y materiales necesarios para la realización de la práctica
REACTIVOS MATERIALES
Paciencia Computadora
Acceso a Internet
Bases de datos bioinformáticos
Primer ejercicio: Análisis de restricción enzimática desde la página de New England
Biolabs, con NEBcutter.
1. Se entró a la página de “NEBcutter”.
2. Si trabaja con una secuencia común (precargada en la página), puede seleccionarla
bajo la opción “Standard sequences”. Se seleccionó el plásmido pUC19. Se seleccionó
el botón “NEB enzymes”.
3. Se dio click en “Submit”.
En un primer tiempo el programa muestra las diversas enzimas que cortan pUC19 (Fig.
1.2).
4. En la ventana “Main options” (Fig 1.2) se utilizó la opción “Custom digest”. Aparece
un listado alfabético de las enzimas de restricción comercialmente disponibles, su sitio
de restricción, el número de cortes para la secuencia en proceso de análisis y una
propuesta de amortiguadores 10X (útil para doble digestiones). Se seleccionó la
enzima de restricción EcoRI y se hizo click en “Digest” (Fig. 1.3).
5. Se dio click en la opción “View gel” para observar la separación de los fragmentos de
restricción de su secuencia de DNA, así como un cuadro con los mismos (Fig. 4).
6. Alternativamente, si la secuencia nucleotídica no es estándar, puede usar las
siguientes opciones:
1) cargar la secuencia de su interés a partir de un archivo guardado en la computadora
(“local sequence file”),
2) teclar (o buscar) el número de acceso de la secuencia de interés (“GenBank
number”),
3) copiar la secuencia nucleotídica de interés (de preferencia en formato FASTA) en la
ventana en blanco (“paste in your sequence”), y realizar el procedimiento descrito
arriba (Fig. 1.5).
7. Se realizó la opción alternativa del punto 3.
Aparecerán las diversas enzimas que cortan la secuencia nucleotídica (Fig. 1.6).
Segundo ejercicio: Consulta de las bases de datos de GenBank/NCBI para la
obtención de secuencias génicas de interés.
1. Se buscó Genbank o NCBI (National Center for Biotechnology Information) en el
buscador (Fig. 2.1).
2. En la barra de búsqueda de NCBI, se seleccionó la opción de “Nucleotide” y se
escribió el nombre del gen de interés y la especie que se busca (ornitina descarboxilasa
de ratón), se dio click en “Search” (Fig. 2.2).
3. De los resultados de la búsqueda, se seleccionó la opción que más se acercó a la
secuencia de interés (Fig. 2.3). Se eligió el transcrito del gen ODC el cual presenta un
total de 2,547 bases, con ID de acceso: NM_0136142.
4. Se corroboró que sea del gen y la especie de interés (mRNA de ODC y Mus musculus)
(Fig. 2.4). Se leyó la información que provee esta página: organismo de estudio,
referencia de los autores y de la publicación etc.
5. Se dio clik en “gene” (Fig. 2.5) aparece la secuencia nucleotídica completa (Fig 2.6)
6. La opción “CDS” (coding sequence) muestra la proteína codificada por el gen (Fig.
2.7).
7. Se visualizó la opción “FASTA”; esta opción proporciona la secuencia nucleotídica en
un formato fácil de copiar a un “bloc de notas” para uso de otros programas (Fig. 2.8
a).
8. Con estos datos se puede trabajar para el diseño de oligonucleótidos específicos.
Tercer ejercicio: Consulta de las bases de datos de ENSEMBL para la obtención de
secuencias génicas de interés.
1. Se buscó Ensembl en el buscador (http://www.ensembl.org/index.html)
2. En la barra de búsqueda de Ensembl se escribió el nombre de la especie (Mus
musculus) y del gen de interés (ODC), se dio click en la barra izquierda (GO) (Fig. 3.1).
Alternativamente se puede teclar el ID de la base de ncbi.
3. De los resultados de la búsqueda, se seleccionó la opción que más se acercó al gen
de interés (Fig. 3.2).
4. La base de datos proporciona mucha información sobre, el organismo, localización
cromosomal, Gen y transcrito (Fig. 3.3). Se exploraron las opciones.
5. Al visualizar el gen, en la barra de opciones del lado izquierdo se seleccionó
“Sequence” (Fig. 3.3). La secuencia del gen se muestra en dos colores: negro y rojo, la
secuencia en rojo es la codificante (Fig. 3.4).
6. En la barra de opciones de la izquierda se seleccionó la opción: “configure this page”
7. Para visualizar SNP (single nucleotide polimorphisms), en la opción: “show variation”
se seleccionó la opción “Yes” y “Hide variations longer tan 10 pb” seleccione “No” (Fig.
3.5).
8. Se abrió un documento en bloc de notas y se copió la secuencia del gen que se
muestra en rojo (exones) (Fig. 3.6) para luego diseñar cebadores para una PCR.
9. Se regresó a la página que corresponde a la fig. 3.1 y se seleccionó la opción
transcript y luego “show transcript” (Fig. 3.7). Esta opción permite visualizar los exones
(la parte codificante en azul, comenzando con codón atg), intrones (solamente
primeros y últimos pb) etc. Esta información permite diseñar cebadores para RT-qPCR
(cebador F en un exón, cebador R en otro exon), que discriminen DNA y RNA (también
existe la posibilidad de diseñar cebadores EPIC).
Cuarto ejercicio: Diseño de cebadores (primers) para PCR
1. Se entró a la página Genbank de NCBI (Fig. 4.1).
2. Se buscó la secuencia de interés en el organismo de específico (ODC mus musculus)
y se seleccionó la liga “Pick Primers” (Fig. 4.2) que lleva a la página de Primer BLAST, en
la cual aparece el número de accesión del gen de interés.
3. Se especificó el rango (primer y último nucleotido) de la secuencia a amplificar (para
qPCR entre 50 y 150; óptimo 100 bp), el tamaño del producto de PCR y la temperatura
óptima de cada uno de los cebadores (60 para qPCR) y se dio click en “Get Primers”
(Fig. 4.3).
El programa da diversas opciones de cebadores con base en las características que se
seleccionaron anteriormente. Se seleccionaron los pares de oligonucleótidos que
mejor convengan para amplificar el fragmento de PCR (Fig. 4.4 y 4.5).
Alternativamente (y entre muchas otras opciones) se puede utilizar el programa
Primer3 plus (http://www.bioinformatics.nl/cgi-bin/primer3plus/primer3plus.cgi )
4. Se entró a la página de Primer3 plus y se pegó la secuencia de interés en la sección
“Paste source sequence below” (Fig. 4.6).
5. Se definió en “General Settings” las características deseadas de los cebadores y
Se dio click “Pick Primers” (Fig. 4.7).
En la página aparecerán propuestas de secuencias de oligonucleótidos específicos del
gen de interés y su ubicación en la misma en colores azul y amarillo (Fig. 4.8).
6. Se evaluó por medio de PCR electrónica (Primer BLAST) la eficiencia y especificidad
de cada par de cebadores y se seleccionaron los que mejor se adecuen al gen de
interés.
Quinto ejercicio: PCR electrónica para la evaluación de oligonucleótidos diseñado.
De los oligonucleótidos diseñados anteriormente se evaluaran en el software Primer
BLAST para corroborar que estos se alinean correctamente al gen de interés.
1. Se entró a la página de Primer blast (http://www.ncbi.nlm.nih.gov/tools/primer-
blast/), en la sección de “Primer parameters” en los espacios en blanco se colocaron
las secuencias de cada uno de los cebadores a analizar (Fig. 5.1).
2. En la sección “Primer Pair Specificity Checking Parameters” donde dice “Database”
se puso la opción “Refseq mRNA” y al mismo tiempo en el apartado “Organism” se
puso el nombre científico de la especie cuya secuencia es la analizada (mus musculus)
(Fig. 5.2).
3. Se observaron los resultados y se determinó la especificidad de los cebadores
elaborados (Fig. 5.3).
RESULTADOS
Primer ejercicio: Análisis de restricción enzimática desde la página de New England
Biolabs, con NEBcutter.
Fig. 1.1. Parámetros para la restricción enzimática de pUC19 en NEBcutter
Fig. 1.2. Resultado de la restricción enzimática de pUC19 con diversas enzimas
Fig. 1.3. Listado alfabético parcial de enzimas de restricción
Fig. 1.4. Visualización de los fragmentos de restricción esperados luego de la digestión.
Fig. 1.5. Prueba de restricción enzimática con una secuencia lineal
Fig. 1.6. Resultados de la restricción enzimática de una secuencia de DNA lineal.
Segundo ejercicio: Consulta de las bases de datos de GenBank/NCBI para la
obtención de secuencias génicas de interés.
Fig. 2.1. Búsqueda de NCBI en Google.
Fig. 2.2. Búsqueda de una secuencia de interés en ncbi.
Fig. 2.3. Resultados de la búsqueda de “ODC en Mus musculus”.
Fig. 2.4. Información general de la secuencia de interés (ej. del transcrito de ODC de ratón).
Fig. 2.5. Opción "gene" para observar la secuencia del gen de interés.
Fig. 2.6. Secuencia nucleotídica completa
Fig. 2.7. La opción “CDS” (coding sequence) señala la proteína codificada por el gen.
Fig. 2.8. Secuencia nucleotídica en formato FASTA.
Tercer ejercicio: Consulta de las bases de datos de ENSEMBL para la obtención de
secuencias génicas de interés.
Fig. 3.1. Página principal de Ensembl (selección de la especie y gen de interés).
Fig. 3.2. Gen y transcrito de interés.
Fig. 3.3. Selección de secuencia del gen de interés.
Fig. 3.4. Secuencia del gen (intrón y exón).
Fig. 3.5. Configuración de la página.
Fig. 3.6. Visualización de la parte codificante y la no codificante de un gen y de los sitios polimórficos (SNP).
Fig. 3.7. Visualización de la parte codificante y la no codificante de un gen (su transcrito) y de los sitios
polimórficos (SNP).
Cuarto ejercicio: Diseño de cebadores (primers) para PCR
Fig. 4.1. Búsqueda de NCBI en Google.
Fig. 4.2. Selección de "Pick Primers".
Fig. 4.3. Descripción de los datos para generar los oligonucleótidos en Pick Primer/Primer Blast.
Fig. 4.4. Cebadores generados para secuencia del gen que codifica para la proteína ODC.
Fig. 4.5. Secuencias de los oligonucleotidos generados en Primer-BLAST.
Fig. 4.6. Diseño de cebadores en Primer 3 Plus.
Fig. 4.7. Definir las características deseadas para el diseño de los cebadores.
Fig. 4.8. Secuencias de oligonucleótidos generados por Primer3 Plus.
Quinto ejercicio: PCR electrónica para la evaluación de oligonucleótidos diseñado.
Fig. 5.1. Prueba de los cebadores diseñados.
Fig.5.2. Selección de los parámetros para el análisis.
Fig. 5.3. Resultados de la PCR electrónica.
CONCLUSIÓN
Mediante estas prácticas se logró adquirir conocimiento y habilidades en la utilización
de distintos programas bioinformáticos relacionados a la ingeniería genética. Entre
ellos, la herramienta NEBcutter fue utilizada para realizar con éxito una digestión
enzimática in silico. Asimismo, se logró utilizar diversas herramientas del GenBank,
Ensembl y Primer3 para diseñar primers y realizar una PCR electrónica.
BIBLIOGRAFÍA
Ciencias Omicas. 2011. Ciencias Omicas. Disponible:
https://cienciasomicas.wordpress.com/2011/05/12/hello-world/ (Cosultado 13 de
marzo del 2016).
Medina J., F. Garzón P. Tafurth y J. Barbosa. 2012. Recopilación bioinformática.
Universidad Distrital Francisco José de Caldas.
Serrano J. 2014. Bioinformática y genética. Ciencia UANL. Universidad Autonoma de
Nuevo Leon13 (65).
Vincze T., J. Posfai y R. Roberts. 2003. NEBcutter: a program to cleave DNA with
restriction enzyme Nucleic Acids Res. 31:3688-3691.
Ye J., G. Coulouris I. Zaretskaya S. Rozen y T. Madden. 2012. Primer-BLAST: A tool to
design target specific primers for polymerase chain reaction. BMC Bioinformatics.
13:134.
Untergasser A., H. Nijveen, X. Rao, T. Bisseling, R. Geurts y J. Leunissen. 2007. Primer 3
plus, an enhanced web interface to Primer3. Nucleic Acid.
National Center for Biotechnology Information. 2016. Us National Library of Medicine.
Disponible: www.ncbi.nlm.nih.gov
Ensembl. 2016. Disponible: www.ensembl.org/index.html