Universidad Autónoma de Querétaro
Facultad de Química
Ingeniería en Biotecnología
REPORTE 7
Alumno: Luis Ángel Cruz Hernández
Docente: Dra. Gabriela Hernández Puga
Materia: Laboratorio de Bioinformática
INTRODUCCIÓN:
En términos simples el alineamiento de secuencias es el proceso en el cual diferentes
secuencias son comparadas mediante la búsqueda de patrones de caracteres comunes y
el establecimiento de correspondencias residuo-residuo entre secuencias relacionadas.
El alineamiento de pares de secuencias es el proceso de alineamiento de dos secuencias
y es la base de diversas herramientas de análisis de secuencias: Alineamiento múltiple de
secuencias Desarrollo de modelos ocultos de Márkov (búsqueda de familias de proteínas)
Predicción de la estructura 3D de proteínas Análisis filogenético Búsqueda de similitud en
BD.
Un concepto importante en el análisis de secuencias es la homología de secuencias
Cuando dos secuencias descienden de un origen evolucionario común, se dice que tienen
una relación homóloga o que comparten una homología Por su parte la similitud de
secuencias mide el porcentaje de residuos alineados que son similares en cuanto a
propiedades fisicoquímicas tales como el tamaño, carga, e hidrofobicidad.
OBJETIVO:
Conocer la herramienta de alineación básica y múltiple de la
plataforma NCBI.
Realizar alineaciones básicas y múltiples de secuencias genéticas y
proteicas.
RESULTADOS:
Evidencia 1: Investigar los conceptos de homología e identidad de secuencias
nucleotídicas y proteicas. Reportar ambos conceptos y las diferencias entre ellos.
Homología: Es la relación que existe entre dos partes orgánicas diferentes de dos
organismos distintos cuando sus determinantes genéticos tienen el mismo origen evolutivo.
Existe homología entre órganos dados de dos especies diferentes, cuando ambos derivan
del órgano correspondiente de su antepasado común, con independencia de cuán dispares
puedan haber llegado a ser. Las cuatro extremidades pares de
los vertebrados con mandíbula (gnatóstomos), desde los tiburones hasta las aves o
los mamíferos, son homólogas. De la misma manera, el extremo de la pata de un caballo es
homólogo al dedo mediano de la mano y el pie humano.
Identidad de secuencias nucleotídicas y proteicas: La identidad de secuencias se
refiere al porcentaje de coincidencias de los mismos residuos de aminoácidos entre las dos
secuencias alineadas.
Evidencia 2: Investiga:
1. ¿Qué significa alineación de secuencias de nucleótidos o proteínas? Anexa
un ejemplo gráfico (imagen) para apoyar tu respuesta.
Un alineamiento de secuencias en bioinformática es una forma de representar y
comparar dos o más secuencias o cadenas de ADN, ARN, o estructuras
primarias proteicas para resaltar sus zonas de similitud, que podrían indicar relaciones
funcionales o evolutivas entre los genes o proteínas consultados. Las secuencias alineadas
se escriben con las letras (representando aminoácidos o nucleótidos) en filas de
una matriz en las que, si es necesario, se insertan espacios para que las zonas con idéntica
o similar estructura se alineen.
2. ¿Qué es la herramienta Basic Local Alignment Tool (BLAST) del NCBI y cuál
es su función?
La herramienta básica de búsqueda de alineación local (BLAST) encuentra regiones de
similitud local entre secuencias. El programa compara secuencias de nucleótidos o
proteínas con bases de datos de secuencias y calcula la importancia estadística de las
coincidencias. BLAST se puede utilizar para inferir relaciones funcionales y evolutivas
entre secuencias, así como para ayudar a identificar miembros de familias de genes.
3. ¿En qué algoritmo se basa BLAST-NCBI para su funcionamiento? Explícalo.
BLAST resulta el algoritmo a escoger en una búsqueda preliminar de similitud entre una
secuencia problema y las bases de datos disponibles. Provee como primer resultado una
medida cuantitativa de la similaridad de la secuencia problema contra cada una de las
secuencias de la bases de datos. Es una herramienta de alineamiento local por pares.
Consiste en hacer coincidir un par de secuencias. Es decir, sólo producen alineamientos
por pares de la secuencia problema con cada una de las secuencias de la base de datos
con las que muestra alta similitud.
Evidencia 3: Realiza un blastp de las siguientes proteínas: AAA61243.1 y AAA18208.1;
NP_036821.1 y AAA60743.1. Reportar en una tabla los resultados de Query Cover, E value,
Identity y responder ¿existen similitudes entre las proteínas? ¿Si las hay, en que porciones
se encuentran (posición de aa)?
Query Cover E value Identity
47% 5e-12 22.06%
Si bien existe una similitud en las proteínas esta no es muy grande, pues apenas es de
22%, estas similitudes se encuentran en:
DISCUSION:
Los resultados de la alineación de las dos proteínas proporcionadas fueron bajos, apenas
del 22%, aunque considero que puede ser un buen margen para trabajar. Probablemente
estas dos proteínas tengan más de un ancestro en común, lo que como biotecnólogos nos
amplía el panorama de investigación para poder encontrar una proteína que sea similar a
ambas secuencias.
Considero que esta herramienta está muy completa, puesto que arroja información clara y
precisa sobre lo que deseamos conocer.
CONCLUSIÓN:
Gracias a esta práctica logré aprender sobre el uso y aplicación de la herramienta
bioinformática BLAST realizando diversas alineaciones genéticas de nucleótidos y
proteínas.
REFERENCIAS:
Gilbert and Bolker (2001). Homologies of process and modular elements of embryonic
construction. Journal of Experimental Zoology (MOL DEV EVOL), 291:1–12.
Escobar, C. A. M., Murillo, L. V. R., & Soto, J. F. (2011). Tecnologías bioinformáticas para el análisis
de secuencias de ADN. Scientia et technica, 3(49), 116-121.
Miranda-Zaragoza, B., Ramírez-Carreto, S., & Rodríguez-Almazán, C. (2021). Ingeniería de
proteínas. función, 1, 3.