Departamento Académico de Ingeniería.
Biología (C0726) 2021-1
Práctica de Bioinformática Nro. 03 – Herramientas básicas para el estudio del
ADN y proteínas. Genómica y Proteómica, uso de BLAST queries/Genbank.
Nombre:Carlos Andre Rodriguez Lopez
OBJETIVOS DE LA PRÁCTICA:
• Uso de software bioinformáticos: herramienta BLAST, CLUSTAL W.
• Aplicar lo aprendido en un caso práctico: Paciente con tos crónica
dolorosa.
INTRODUCCIÓN
Durante la práctica integraremos los conceptos con los que nos hemos familiarizado en
las sesiones previas. Es necesario recordar las diferentes bases dedatos con las cuales
interactuamos:
1) GENBANK, donde encontraremos las secuencias de DNA disponibles
públicamente, con anotaciones, que constantemente están siendo actualizadas. Las
anotaciones incluyen la identificación de los genes, los productos de los genes (si se
conocen), y conexiones a información sobre el gen en otras bases de datos.
2) PDB, contiene todos los modelos estructurales de proteínas y de ácidos nucleicos,
experimentalmente resueltos (por cristalografía de Rayos X y por RMN) y que están
disponibles públicamente. No contiene modelos derivados por homología u otros tipos
de modelos teóricos.
3) UniProt, contiene la mayor parte de las secuencias de proteínas disponibles
públicamente (no se especializa en DNA o ARN). Las secuencias se anotan
manualmente, y tienen un vínculo directo a toda la información publicada sobre una
secuencia dada.
Las herramientas bioinformáticas con las que nos familiarizaremos en esta práctica son:
BLAST (Basic Local Alignment Search Tool, herramienta básica de búsqueda por
alineamiento local), que nos servirá para encontrar genes o proteínas con secuencias
similares en las bases de datos de secuencias (GENBANK, UniProt).
1) ClustalW, para comparar mediante el alineamiento la secuencia de interés con otras,
o muchas secuencias unas con otras.
2) Swiss PDB Viewer o RasMol, para ver y explorar modelos macromoleculares en tres
dimensiones, y para el modelado por homología manual y semiautomatizado.
Durante la primera parte de la práctica aprenderás a buscar secuencias, explorando los
vínculos a la extensa información disponible sobre genes específicos. A continuación,
aprenderás a obtener la información de las secuencias de ácidos nucleicos y/o de
proteínas en formato FASTA (secuencia denucleótidos del gen y/o la secuencia de
aminoácidos del gen), que es un formatosencillo y muy útil para iniciar consultas con las
herramientas bioinformáticas. De dichos genes, explorarás el contexto en el que se
encuentra, el medio que lo rodea,entre otras informaciones de utilidad.
Posteriormente, iniciaremos el uso de BLAST, utilizando una secuencia FASTA como
query (términos de consulta). BLAST, es un algoritmo para comparar secuencias de
información, busca en las bases de datos secuencias de nucleótidos y aminoácidos
comparables (hits o correspondencias). Estos resultados deben juzgarse, debemos
conocer si una correspondencia se presentapor casualidad o por un ancestro común.
Esto es posible a partir de los valores de expectativa (Expect o Evalue) y los puntajes de
BLAST (BLAST Score “bits”).
Departamento Académico de Ingeniería. Biología (C0726) 2021-1
Cuanto más alto es el Score, mejor es la alineación. Los bits son reducidos por las
correspondencias inadecuadas y los espacios vacíos (gaps) en lo que podría ser la
mejor alineación. El Evalue nos dice si es probable que un hit sea resultado del
alineamiento azaroso entre el hit y la secuencia de consulta (query), o de la existencia
de un ancestro común entre el hit y el query. Valores muy pequeños deE significan que
el hit es biológicamente significativo; es decir, la correspondencia entre el query y el hit
debe ser consecuencia de la ancestría común de ambas secuencias, porque las
probabilidades son demasiado bajas de que el hit pueda presentarse por casualidad.
Adentrándonos a UniProt exploraremos las herramientas para alineamiento múltiple de
secuencias de manera rápida. UniProt proporciona un fácil acceso a ClustalW. Para el
ejercicio se utilizará la proteína opsina (constituye la parte proteica de los foto-pigmentos
para la visión en color de los animales, acompaña alcromóforo retinal acoplado a una
proteína G), alineando los resultados que se obtendrán de la búsqueda. ClustalW
alineará las secuencias que seleccionemos, en este alineamiento se observarán
símbolos que indican que tan bien se emparejan los residuos de las secuencias
seleccionadas.
1. “*” significa que las proteínas alineadas tienen el mismo residuo de
aminoácido en esta posición (residuos completamente conservados,
dentro de este grupo).
2. “:” significa que todos los residuos en esta posición son muysimilares
de tamaño, carga, y polaridad (los reemplazos son muy conservadores).
3. “.” significa que los residuos son aminoácidos similares (los reemplazos son algo
conservadores).
4. La ausencia de símbolo significa que los residuos en esa posición varían
grandemente en las características (residuos no conservados).
Podrá observarse que los resultados muestran un árbol de ClustalW. Este árbol no es
un árbol filogenético verdadero; es un árbol simple que demuestra el orden en que
ClustalW realizo las alineaciones pareadas mientras que construía la alineación múltiple
de secuencias, mostrando cuales son más estrechamente vinculados el uno al otro.
Recuerde que durante la práctica utilizaremos una lista de genes de opsinas o genes
relacionados con opsinas en el genoma humano. A partir de ello responderemos una
serie de interrogantes utilizando la bioinformática.
Finalmente, deberás poner a prueba las habilidades desarrolladas. Se plantea un caso
real, a partir de una muestra de esputo de un paciente, a la que se le realizandiferentes
procedimientos. En el desarrollo del caso encontraremos algunostérminos con los que
debemos familiarizarnos:
1) PCR: reacción en cadena de la polimerasa, es una técnica de biología molecularque
busca obtener un gran número de copias de un fragmento de ADN particular partiendo
de un mínimo. Esta técnica se fundamenta en la propiedad natural de los ADN
polimerasas para replicar hebras de ADN, para lo cual se emplean ciclosde altas y bajas
temperaturas alternadas para separar las hebras de ADN recién formadas entre sí tras
cada fase de replicación y, a continuación, dejar que las hebras de ADN vuelvan a unirse
para poder duplicarlas nuevamente.
2) Primers: son oligonucleótidos de hasta 40 nucleótidos (mínimo 6) que permitenque la
polimerasa inicie la reacción, delimitando la zona de ADN a amplificar. Definen los
extremos 3’ y 5’ de la secuencia que se desea replicar.
3) ORF: Marco de lectura abierto, secuencia de ARN comprendida entre un codónde
inicio (AUG) de la traducción y un codón de terminación, descontando las secuencias
Departamento Académico de Ingeniería. Biología (C0726) 2021-1
que corresponden a los intrones. Los marcos abiertos de lectura se denominan
+1, +2, +3, -1, -2 y -3.
MATERIALES
- Ordenador con conexión a Internet.
PROCEDIMIENTOS
1. BUSQUEDA DE GENES
1.1. ¿Dónde ubicamos los genes de opsinas en el genoma humano?
Ingresa en el navegador a https://www.ncbi.nlm.nih.gov/genome/gdv/, encontraremos
allí una lista de organismos para los cuales la información de sus genomas está
disponible. Haz click en la barra verde sobre el buscador. En la casilla de búsqueda
donde aparecen los cromosomas, buscar opsin. Concentrémonos por ahora en el gen
OPN1LW. Para acceder a toda la información conocida sobre el gen ingresar al
GeneID. Revisa rápidamente la página de arriba abajo.
¿Crees que es necesario aplicar filtros? ¿Se están mostrando resultados
específicos?
Es necesario aplicar filtros, para lo cual se utilizó la “especie” y “familia” de genes a
la que pertenecen, “longitud de onda”, “intervalo cromosómico de nucleótidos”. Se
presentan resultados específicos, donde tenemos información detallada como las
ubicaciones y secuencias de intrones y exones.
¿Están estos genes asociados al sexo?
- La oxina de longitud de onda larga y la oxina de longitud de onda media están
asociadas al cromosoma X.
1.2. Secuencia de nucleótidos del gen OPN1LW
Recuerda que ahora estás viendo la información sobre el gen para la opsina sensible al
rojo en la visión humana, y que este está situado cerca de la extremidad inferior del
cromosoma X.
Dirígete a la sección NCBI Reference Sequences (RefSeq). Note las diferencias enla
nomenclatura (NG, NM y NP). ¿A QUÉ SE REFIERE CADA UNA?
- NG: Si se quiere comparar el material genético de organismos completos.
Proporciona la secuencia total
- NM: Relacionado con la secuencia del RNA mensajero. Comparar genes de
importancia, que se van a traducir.
- NP: Corresponde de la secuencia de aminoácidos.
Ingresa a NM_020061.6, dirígete a la parte más baja del documento, encontrarás la
secuencia de mRNA (ORIGIN). ¿Por qué no se observan uracilos?
-Cuando queremos estudiar el ARN mensajero, es muy difícil porque es una molécula
inestable; Por lo tanto, la transcripción inversa se usa para generar ADN
complementario. Este no contiene uracilo y es fácil de estudiar; La secuencia de ARN
observada se refiere a la secuencia de ADN complementaria.
En la parte superior de la página, al lado del botón Display, selecciona en el menú
plegable FASTA (nota que también están disponibles varias otras opciones de
visualización). La línea descriptiva comienza con el “>”, seguida por la secuenciade
nucleótidos.
Guarde la secuencia FASTA en un archivo *.txt (de preferencia como mrnaroja.txt)
Departamento Académico de Ingeniería. Biología (C0726) 2021-1
Ingresa a NP_064445.2 y repite el procedimiento realizado para el mRNA. En esta
ocasión observarás la secuencia traducida, los aminoácidos.
Guarde la secuencia FASTA en un archivo *.txt (de preferencia como protroja.txt)
1.3. CONTEXTO DEL GEN OPN1LW
UBÍCATE EN LA SECCIÓN GENOMIC CONTEXT. ENCONTRARÁ UN DIAGRAMA.
¿ENTRE QUÉ PARESDE BASES SE ENCUENTRA EL GEN? ¿DE QUÉ TAMAÑO ES
EL SEGMENTO, EN PARES DE BASES,DEL GEN DE LA OPSINA ROJA EN EL
CROMOSOMA X?
- Se encuentra entre los pares de bases: 154,144,243 - 154,159,032.
- El tamaño de la secuencia es: 21782 bp
2. BÚSQUEDA CON BLAST.
Ingrese a la herramienta BLAST del NCBI (Resources > DNA&RNA > BLAST (BasicLocal
Alignment Search Tool).
Copia los datos FASTA del archivo mrnaroja.txt y pégalos en la caja de captura detexto
de BLAST, sobre la cual dice, “Enter an accession...”. Recuerde seleccionar “Homo
sapiens” en la sección de Organismo.
Departamento Académico de Ingeniería. Biología (C0726) 2021-1
Observa el resumen gráfico, una caja que contiene porciones de líneas coloreadas.
Cada línea representa una correspondencia (hit) de tu búsqueda BLAST. Intenta el
alineamiento usando la secuencia FASTA protroja.txt. ¿QUÉ SIGNIFICAN EL
EVALUE Y EL BLASTSCORE?
- AlineMax Score: Determina la calidad del alineamiento. Cuanto mayor sea el
alineamiento o coincidencias perfectas entre secuencias encontradas, el max score
aumenta. Si encuentro coincidencias imperfectas o no coincidencias (diferencias
entre nucleótidos), el max score disminuye.
- E value: Representa la probabilidad de encontrar coincidencias. Cuanto menor y más
cercano a 0 se encuentre, la probabilidad es muy pequeña. Es decir, la coincidencia
encontrada se debe a una no ancestralidad y que no es común encontrar
coincidencias similares.
3. amiento múltiple de secuencias con ClustalW.
Ingrese a la base de datos de proteínas UniProt (https://www.uniprot.org/). Recuerde el
primer laboratorio y realice una búsqueda avanzada para especificar la búsqueda de la
proteína opsina en humanos. ¿CÓMO QUEDARÍA EL QUERY DE NUESTRA
BÚSQUEDA?
- opsin AND organism:"Homo sapiens (Human) [9606]"
Los resultados de la búsqueda nos dan 52 hits, incluyendo la rhodopsina del pigmento
de las células de bastones (OPSD), junto con los tres pigmentos del cono (OPSB,
OPSG, OPSR). Hay también un “receptor de peropsina similar a pigmentos visuales”
(visual pigment-like receptor peropsin) OPSX. ¿CÓMO ESTAS PROTEÍNAS SE
RELACIONAN EVOLUTIVAMENTE?
-Estas proteínas actúan como receptores transmembrana y tienen una gran cantidad
de aminoácidos hidrofóbicos. Todos ellos están estrechamente relacionados porque
están en ramas sucesivas de evolución. Esto significa que algunos se presentan
primero y otros se desarrollan mucho más tarde.
UniProt proporciona un fácil acceso a ClustalW (también pueden acceder y utilizar el
portal https://www.ebi.ac.uk/Tools/msa/clustalo/), un programa que hace las
alineaciones múltiples de secuencias de forma rápida, permite además generar un árbol
guía “filogenético” a partir de la información de la alineación. Realice el alineamiento
múltiple seleccionando las 5 secuencias proteicas que creemos relacionadas (OPSB,
OPSD, OPSG, OPSR y OPSX) de los 52 hits iniciales.
Si lo deseas, puedes cambiar la etiqueta de los códigos por los colores relacionados a
cada secuencia proteica para una mejor visualización:
- Cambia P03999 a azul (OPSB)
- Cambia P08100 a Rhodopsina
- Cambia P04001 a verde (OPSG)
- Cambia P04000 a rojo (OPSR)
- Cambia O14718 a Peropsina (OPSX)
4. Observación de la estructura de una opsina RasMol o Swiss PDB Viewer.
En el laboratorio anterior aprendimos a descargar archivos en formato .pdb. Ingresa al
Protein Data Bank y busca el modelo para la Rhodopsina 3CAP. ¿Qué estructuras
presenta? ¿Tiene subunidades? Identifica a la molécula retinal que acompaña la
Departamento Académico de Ingeniería. Biología (C0726) 2021-1
estructura. ¿Por qué el retinal es importante para la rodopsina? (Puedes usar la siguiente
referencia para responder PMID: 11385047)
RHODOPSINA 6OF
Tiene dos cadenas (A y B) y una longitud de 348 aminoácidos. Tiene 32 alfas
hélices y 8 hojas beta en total. Tiene 2 subunidades.
5. tus habilidades.
EJERCICIO 1:
Se plantea el siguiente caso, indicar como procederían para llegar a la conclusióncorrecta
utilizando las herramientas bioinformáticas desarrolladas.
Contexto del caso:
Un paciente potencialmente infeccioso ingresó a sala de emergencias quejándosede una
tos crónica dolorosa, fiebre, fatiga, sudoración nocturna y apenas esta mañana estuvo
tosiendo sangre. Se obtuvieron muestras de esputo del paciente.El cultivo de colonias
bacterianas está en proceso, y se te ha enviado una muestraal laboratorio de diagnóstico
molecular para su evaluación. El paciente se encuentra en cuarentena hasta conocer el
diagnóstico completo y se inicie con el protocolo de tratamiento.
Departamento Académico de Ingeniería. Biología (C0726) 2021-1
Estrategia utilizada:
Utilizando una placa de 96 pocillos para PCR, tu técnico laboratorista corrió algunas
reacciones (con sus respectivos controles) con un grupo de primers paraevaluar los
cultivos bacterianos. Un producto de amplificación fue identificado enlos pocillos con los
primers:
Forward 5’-GTTCGGGGAGATGGAGTGCT-3’
Reverse 5’- CGTTGCGGGACAGATTGATT-3’
1. Realice un BLASTn con los primers utilizados para este PCR para identificar a
cuál de los organismos en GenBank le pertenece el producto obtenido.
Por ejemplo:
GTTCGGGGAGATGGAGTGCT
CGTTGCGGGACAGATTGATT
Debajo del botón BLAST, se puede identificar un filtro para limitar la secuencia de
búsqueda (query), buscando únicamente en la información de ciertos grupos
taxonómicos u organismos. Selecciona “Bacteria” del menú que se mostrará. También
puedes excluir a Homo sapiens.
¿CUÁL ES EL ORGANISMO DEL CUÁL SE SOSPECHA?
- Se sospecha que se trata de una micobacteria de tuberculosis ya que el
Forward y Reverse están amplificando una sección de esta bacteria
¿PUEDES IDENTIFICAR EL GEN BLANCO DE LA BACTERIA QUE FUE
AMPLIFICADA? ¿CUÁL DE SUSGENESCREES QUE FUE AMPLIFICADO?
- No, porque no se sabe que sección de genes están amplificando.
- Se puede sospechar que se están amplificando aquellos genes que son
fármaco-resistentes
2. SE OBTUVO LA SECUENCIA DEL GEN BLANCO DE LA MUESTRA
BACTERIANA (MIRAR
>SECUENCIA DEL GEN BLANCO).
¿SON LOS PRIMERSCAPACES DE RECONOCERESTA SECUENCIA? ¿CUÁL ES LA
SECUENCIA RECONOCIDA?
- Sí, hay un reconocimiento de 1 secuencia con un E Value muy cercano a
0.
¿ES EFECTIVAMENTE ESTA SECUENCIA PERTENECIENTE A ALGÚN GEN
DE LA BACTERIA BAJOSOSPECHA?
- Sí, resultó ser el gen rpoB resistente a la rifampicina.
Departamento Académico de Ingeniería. Biología (C0726) 2021-1
¿CUÁL ES EL GEN? ¿DE QUÉ TAMAÑO EN PARES DE BASES ES EL GEN? ¿POR QUÉ
ES IMPORTANTE ESTEGEN QUE INCLUSO SE USA COMO UN BLANCO DE
DIAGNÓSTICO?
>Secuencia del gen blanco
TTGGCAGATTCCCGCCAGAGCAAAACAGCCGCTAGTCCTAGTCCGAGTCGCCCGCAA
AGTTCCTCGAATAACTCCGTACCCGGAGCGCCAAACCGGGTCTCCTTCGCTAAGCTGC
GCGAACCACTTGACGTTGCGGGACAGATTGATTCGTCCAGACCGATTCGTTCGAGTGG
CTGATCGGTTCGCCGCGCTGGCGCGAATCCGCCGCCGAGCGGGGTGATGTCAACCC
AGTGGGTGGCCTGGAAGAGGTGCTCTACGAGCTGTCTCCGATCGAGGACTTCTCCGG
GTCGATGTCGTTGTCGTTCTCTTGACCCTCGTTTCGACGATGTCAAGGCACCCGTCGA
CGAGTGCAAAGACAAGGACATGACGTACGCGGCTCCACTGTTCGTCACCGCCGAGTT
Departamento Académico de Ingeniería. Biología (C0726) 2021-1
CATCAACAACAACACCGGTGAGATCAAGAGTCAGACGGTGTTCATGGGTGACTTCCCG
ATGATGACCGAGAAGGGCACGTTCATCATCAACGGGACCGAGCGTGTGGTGGTCAGC
CAGCTGGTGCGGTCGCCCGGGGTGTACTTCGACGAGACCATTGACAAGTCCACCGAC
AAGACGCTGCACAGCGTCAAGGTGATCCCGAGCCGCGGCGCGTGGCTCGAGTTTGAC
GTCGACAAGCGCGACACCGTCGGCGTGCGCATCGACCGCAAACGCCGGCAACCGGT
CACCGTGCTGCTCAAGGCGCTGGGCTGGACCAGCGAGCAGATTGTCGAGCGGTTCG
GGTTCTCCGAGATCATGCGATCGACGCTGGAGAAGGACAACACCGTCGGCACCGACG
AGGCGCTGTTGGACATCTACCGCAAGCTGCGTCCGGGCGAGCCCCCGACCAAAGAGT
CAGCGCAGACGCTGTTGGAAAACTTGTTCTTCAAGGAGAAGCGCTACGACCTGGCCC
GCGTCGGTCGCTATAAGGTCAACAAGAAGCTCGGGCTGCATGTCGGCGAGCCCATCA
CGTCGTCGACGCTGACCGAAGAAGACGTCGTGGCCACCATCGAATATTCTGGTCCGC
TTGCACCGAGGGTCAGACCACGATGACCGTTCCGGGCGGCGTCGAGGTGCCGGTGG
AAACCGACGACATCGACCATTCGGCAACCGCCTGCCTGCGTACGGTCGGCGAGCTGA
TCCAAAACCAGATCCGGGTCGGCATGTCGCGGATGGAGCGGGTGGTCCGGGAGCGG
ATGACCACCCAGGACGTGGAGGCGATCACACCGCAGACGTTGATCAACATCCGGCCG
GTGGTCGCCGCGATCAAGGAGTTCTTCGGCACCAGCCAGCTGAGCCAATTCATGGAC
CAGAACAACCCGCTGTCGGGGTTGACCCAGAAGCGCCGACTGCAGGCGCTGGGGCC
CGGCGGTCTGTCACGTGAGCGTGCCGGGCTGGAGGTCCGCGACGTGCACCCGTCGC
ACTGCGGCCGGATGTGCCCGATCGAAACCCCTGAGGGGCCCAACATCGGTCTGATCG
GCTCGCTGTCGGTGTACGCGCGGGTCAACCCGTTCGGGTTCATCGAAACGCCGTACC
GCAAGGTGGTCGACGGCGTGGTTAGCGACGAGATCGTGTACCTGACCGCCGACGAG
GAGGACCGCCACGTGGTGGCACAGGCCAATTCGCCGATCGATGCGGACGGTCGCTTC
GTCGAGCCGCGCGTGCTGGTCCGCCGCAAGGCGGGCGAGGTGGAGTACGTGCCCTC
GTCTGAGGTGGACTACATGGACGTCTCGCCCCGCCAGATGGTGTCGGTGGCCACCGC
GATGATTCCCTTCCTGGAGCACGACGACGCCAACCGTGCCCTCATGGGGGAAACATG
CAGCGCCAGGCGGTGCCGCTGGTCCGTAGCGAGGCCCCGCTGGTGGGCACCGGGAT
GGAGCTGCGCGCGGCGATCGACGCCGGCGACGTCGTCGTCGCCGAAGAAAGCGGCG
TCATCGAGGAGGTGTCGGCCGACTACATCACTGTGATGCACGACAACGGCACCCGGC
GTACCTACCGGATGCGCAAGTTTGCCCGGTCCAACCACGGCACTTGCGCCAACCAGT
GCCCCATCGTGGACGCGGGCGACCGAGTCGAGGCCGGTCAGGTGATCGCCCGACGG
TCCCTGTACTGACGACGGCGAGATGGCGCTGGGCAAGAACCTGCTGGTGGCCATCAT
GCCGTGGGAGGGCCACAACTACGAGGACGCGATCATCCTGTCCAACCGCCTGGTCGA
AGAGGACGTGCTCACCTCGATCCACATCGAGGAGCATGAGATCGATGCTCGCGACAC
CAAGCTGGGTGCGGAGGAGATCACCCGCGACATCCCGAACATCTCCGACGAGGTGCT
CGCCGACCTGGATGAGCGGGGCATCGTGCGCATCGGTGCCGAGGTTCGCGACGGGG
ACATCCTGGTCGGCAAGGTCACCCCGAAGGGTGAGACCGAGCTGACGCCGGAGGAG
CGGCTGCTGCGTGCCATCTTCGGTGAGAAGGCCCGCGAGGTGCGCGACACTTCGCTG
AAGGTGCCGCACGGCGAATCCGGCAAGGTGATCGGCATTCGGGTGTTTTCCCGCGAG
GACGAGGACGAGTTGCCGGCCGGTGTCAACGAGCTGGTGCGTGTGTATGTGGCTCAG
AAACGCAAGATCTCCGACGGTGACAAGCTGGCCGGCCGGGCACGGCAACAAGGGCG
TGATCGGCAAGATCCTGCCGGTTGAGGACATGCCGTTCCTTGCCGACGGCACCCCGG
TGGACATTATTTGAACACCCACGGCGTGCCGCGACGGATGAACATCGGCCAGATTTTG
GAGACCCACCTGGGTTGGTGTGCCCACAGCGGCTGGAAGGTCGACGCCGCCAAGGG
GTTCCGGACTGGGCCGCCAGGCTGCCCGACGAACTGCTCGAGGCGCAGCCGAACGC
CATTGTGTCGACGCCGGTGTTCGACGGCGCCCAGGAGGCCGAGCTGCAGGGCCTGT
TGTCGTGCACGCTGCCCAACCGCGACGGTGACGTGCTGGTCGACGCCGACGGCAAG
GCCATGCTCTTCGACGGGCGCAGCGGCGAGCCGTTCCCGTACCCGGTCACGGTTGG
CTACATGTACATCATGAAGCTGCACCACCTGGTGGACGACAAGATCCACGCCCGCTCC
ACCGGGCCGTACTCCGATGATCACCCAGCAGCCGCTGGGCGGTAAGGCGCAGTTCG
GTGGCCAGCGGTTCGGGGAGATGGAGTGCTGGGCCATGCAGGCCTACGGTGCTGCC
TACACCCTGCAGGAGCTGTTGACCATCAAGTCCGATGACACCGTCGGCCGCGTCAAG
GTGTACGAGGCGATCGTCAAGGGTGAGAACATCCCGGAGCCGGGCATCCCCGAGTC
GTTCAAGGTGCTGCTCAAAAGAACTGCAGTCGCTGTGCCTCAACGTCGAGGTGCTATC
GAGTGACGGTGCGGCGATCGAACTGCGCGAAGGTGAGGACGAGGACCTGGAGCGGG
CCGCGGCCAACCTGGGAATCAATCTGTCCCGCAACGCCTCCGCAAGTGTCGAGGATC
TTGCGTAA
Departamento Académico de Ingeniería. Biología (C0726) 2021-1
3. Usa el buscador de ORF (Open Reading Frame Finder) para ubicar todas las aperturas
de lectura en la secuencia del gen que amplifican los primers. Para ello debes identificar
la secuencia con la información del ejercicio 2. Copia esta secuencia en la caja de texto y
encuentra los ORF.
Utiliza este enlace. https://www.bioinformatics.org/sms2/orf_find.html.
Recuerda que hay 6 posibles posiciones de inicio (+3, +2, +1, -1, -2, -3) buscando como
sitio de iniciación estrictamente ATG. ¿Cuáles fueron los resultados?
Sin embargo, en el inicio de la traducción bacteriana existen sitios de iniciación
alternativos a ATG, por ejemplo, TTG (que usualmente codifica Leucina) pudiendoser
usado como codón de inicio. Para tener la traducción completa, incluye en la búsqueda
los codones alternativos a UTG. ¿Cambiaron los resultados?
EJERCICIO 2:
La vía de señalización Wingless/Int-1 (Wnt) reúne una serie de protoconcogenes que
participan en procesos relacionados al desarrollo embrionario, regeneración y proliferación
celular. Muchos de estos procesos son comunes entre distintos taxones por lo que se
presume que la vía de señalación estaría evolutivamente conservada.
PASO 1: Busca la secuencia de la proteína Wnt4 de Homo sapiens, Pan troglodytes, Mus
musculus, Danio renio, Xenopus tropicalis, Drosophila melanogaster, Gallus gallus, y
Chelonia mydas.
PASO 2: Realiza un alineamiento múltiple con Clustal Omega
(https://www.ebi.ac.uk/Tools/msa/clustalo/) y responde/completa lo siguiente:
REFERENCIAS
1. Manual del usuario para el uso de BLAST.
https://www.ncbi.nlm.nih.gov/books/NBK279690/