0% encontró este documento útil (0 votos)
26 vistas23 páginas

fORMULARIO FINAL P2

El alineamiento de secuencias permite identificar relaciones evolutivas a través de la comparación de ADN y proteínas, revelando conservación y variación en sus secuencias. Existen métodos de alineamiento global y local, así como algoritmos como Needleman-Wunsch y Smith-Waterman, que optimizan la coincidencia de secuencias. Además, el alineamiento múltiple de secuencias proporciona una visión más amplia de patrones conservados y es esencial para análisis filogenéticos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
26 vistas23 páginas

fORMULARIO FINAL P2

El alineamiento de secuencias permite identificar relaciones evolutivas a través de la comparación de ADN y proteínas, revelando conservación y variación en sus secuencias. Existen métodos de alineamiento global y local, así como algoritmos como Needleman-Wunsch y Smith-Waterman, que optimizan la coincidencia de secuencias. Además, el alineamiento múltiple de secuencias proporciona una visión más amplia de patrones conservados y es esencial para análisis filogenéticos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Alineamiento de Secuencias:

Evolución de secuencias
• El ADN y las proteínas son producto de la evolución.
• Una característica importante de estas moléculas es que codifican la historia de millones de años de
evolución.
• Durante este largo período de evolución las secuencias moleculares han sufrido cambios aleatorios
(mutaciones) que las hacen diferir.
• Sin embargo, algunos rastros de la evolución pueden quedar en ciertas porciones de las secuencias, lo
que permite identificar los ancestros comunes.
• La presencia de estos rastros se debe a que los residuos que realizan papeles importantes (funcionales o
estructurales) tienden a ser preservados por la selección natural.

• Por otra parte los residuos que son menos cruciales tienden a mutar más frecuentemente.
Ejemplo: los sitios activos de los residuos de una familia de enzimas tienden a ser conservados porque son
responsables de las funciones catalíticas.

• Gracias a la comparación de secuencias mediante alineamiento es posible identificar la conservación y


variación de patrones.

• El grado de conservación en el alineamiento revela las relaciones evolutivas de secuencias diferentes.

• La variación entre secuencias refleja los cambios que han ocurrido durante la evolución (substituciones,
inserciones y eliminaciones)
Alineamiento de pares de secuencias:
Coincidencia (match/ I): Observamos el mismo símbolo en ambas secuencias. Representa el máximo
parecido biológico. Denotado indistintamente con los caracteres "|" o "*".

Sustitución (mismatch/espacio en blanco): Observamos un símbolo diferente en ambas secuencias. Dado


que determinados nucleótidos o aminoácidos desempeñan un rol biológico similar, es factible permitir su
alineamiento. Denotado con el símbolo "||", o con los caracteres ":" o ".", si existen diferentes grados de
parecido.

Inserción/deleción (gap/ -): Observamos un símbolo en una secuencia que no ha podido ser alineado en la
otra. Evolutivamente hablando, un gap puede reflejar la inserción de un símbolo en la primera secuencia o
su deleción en la segunda. Denotado con el carácter "-" en la secuencia donde no hubo coincidencia.

Evaluación de la bondad de un alineamiento

• Similaridad: evalúa el parecido entre dos secuencias, recompensando las coincidencias y penalizando los
gaps.
• La distancia: es el mínimo número de cambios necesarios para transformar la primera secuencia en la
segunda. Únicamente las diferencias son penalizadas.

• Coincidencias: involucran nucleótidos/aminoácidos con un posible rol funcional dada su conservación.


• Sustituciones: equivalen a mutaciones puntuales que no afectan a la funcionalidad de las moléculas.
• Las inserciones/deleciones: representan cambios más drásticos en cada secuencia.

Homología y similitud de secuencias

• La homología: cuando dos secuencias descienden de un origen evolutivo común (secuencia ancestral
común).
• La homología no es cuantificable: dos secuencias son homólogas o no.
• La similitud: es la relación entre el número de aminoácidos o nucleótidos idénticos en una secuencia en
relación con el número total de aminoácidos o nucleótidos.
• Es un resultado directo de la observación del alineamiento de secuencias.
• La similitud se puede cuantificar usando porcentajes. • Si el nivel de similitud de secuencia es lo
suficientemente alto, se puede inferir una relación evolutiva común.

¿A qué nivel de similitud se pueden inferir relaciones homólogas?


Alineamiento global •
Se asume que las dos secuencias que se van a alinear son generalmente similares sobre sus longitudes
totales.
• Se lleva a cabo a todo lo largo de ambas secuencias para encontrar el mejor alineamiento posible.
• Es el método más aplicable para alinear dos secuencias estrechamente relacionadas de
aproximadamente la misma longitud.

Alineamiento local
• No asume que las dos secuencias en cuestión tienen similitud sobre la longitud total.

• Sólo encuentra regiones locales con el más alto nivel de similitud entre las dos secuencias y alinea estas
regiones sin preocuparse por el resto de la secuencia.

• Este enfoque es el más apropiado para alinear secuencias biológicas divergentes que contienen módulos
que son similares (dominios o motivos) y de esta forma encontrar patrones conservados en secuencias de
ADN o proteínas.
Programación dinámica: Es un método que determina la alineación óptima haciendo coincidir dos
secuencias para todos los posibles pares de caracteres entre las dos secuencias.
• También crea una matriz bidimensional.
• Convierte una matriz de puntos en una matriz de puntuación (alineación cuantitativa) que toma en
cuenta las coincidencias y las discrepancias entre secuencias
. • Busca el conjunto de puntajes más altos en la matriz para obtener con precisión la mejor alineación.

Algoritmo Needleman y Wunsch: Un algoritmo de programación dinámica para la alineación global de


secuencias biológicas.

Este algoritmo de programación compone de 3 pasos fundamentales:


1. Inicialización
2. Construcción de la matriz de puntajes
3. Rastreo del alineamiento
Las Longitud X es la secuencia mas larga mientras que la Y es la mas corta aunque pueden estar puestas
de manera vertical la tabla de datos

La formula para sacar en los valores es la siguiente

Mi,j= [MDiagonal+S;MArriba+w;MIzquierda+w]

Donde
Mi,j: Valor en la matriz
MDiagonal: Valor en diagonal
S: Valor de coincidencia o sustitución dependiendo el caso(Coincidencia cuando ambas letras coinciden;
Sustucion cuando no coinciden)
MArriba: Valor ubicado en la parte de arriba
w: valor de gap
MIzquierda: Valor ubicado en la izquierda

De sus suma se eligue e el valor mas alto y en parte final de alineamiento se relaiza calculo usando los
valores de ocinciencia, sustitución y gap dado el caso para que el valor que obtengamosea el mismo que
termina en la Diagonal de la Tabla
Los valores negativos aquí no se los reconoce por lo que si salen en vez de ponerlos se les ubicara un cero
Matrices de puntuación
• El algoritmo de programación dinámica tiene que hacer uso de un sistema de puntuación: conjunto de
valores para cuantificar la probabilidad de que un carácter sea sustituido por otro en una alineación.
• Secuencias de nucleótido: se otorga un valor positivo o una puntuación alta para una coincidencia y un
valor negativo o una puntuación baja para una no coincidencia.
• Secuencia de aminoácidos: la puntuación tiene que reflejar las propiedades fisicoquímicas de los residuos
de aminoácidos, así como la probabilidad de que ciertos residuos se sustituyan entre secuencias
homólogas verdaderas.
EMBOSS
- La suite de software abierta de biología molecular europea.
- Es un proyecto de código abierto para diferentes sistemas operativos UNIX.
- Contiene multitud de herramientas centradas en el análisis de ácidos nucleicos y proteínas, entre ellas:

EMBOSS Needle: Crea una alineación global óptima de dos secuencias utilizando el algoritmo de
Needleman-Wunsch. [Link]

EMBOSS Water: Usa el algoritmo de Smith-Waterman para calcular la alineación local de dos secuencias.
[Link]

Alineamiento múltiple de secuencias


• Consiste en alinear múltiples secuencias relacionadas para lograr una coincidencia óptima de las
secuencias.
• Las secuencias relacionadas se identifican a través de la búsqueda de similitud en distintas bases de
datos.
• Ventaja: revela más información biológica que muchas alineaciones por pares.
• Permite la identificación de motivos y patrones de secuencia conservados en toda la familia de
secuencias que no son evidentes en pares de secuencias.
• Requisito previo esencial para llevar a cabo el análisis filogenético de familias de secuencias, predicción
de estructuras secundarias y terciarias de proteínas.
Alineamiento múltiple global: Realiza la correspondencia entre todas las secuencias completas,
maximizando el número de caracteres coincidentes en cada posición de éstas.

Alineamiento múltiple local: Efectúa únicamente la correspondencia entre aquellos fragmentos de varias
secuencias que poseen una coincidencia relevante, descartando el resto de regiones a lo largo de todas las
cadenas de caracteres que no exhiben esta similaridad.

Colinearidad
• La disposición de los elementos coincidentes en los alineamientos debe preservar el orden original
establecido en las respectivas secuencias comparadas.
• Permite restringir la búsqueda a aquellos elementos comunes a dos o más secuencias cuyo orden relativo
se haya preservado también.
Algoritmos
• Existen enfoques exhaustivos y heurísticos utilizados en la alineación de secuencias múltiples.

• Exhaustivo: implica examinar todas las posiciones alineadas posibles simultáneamente. Para usar la
programación dinámica para la alineación de secuencias múltiples, se necesitan dimensiones adicionales
para tener en cuenta todas las formas posibles de coincidencia de secuencias. Esto significa establecer una
matriz de búsqueda multidimensional.

• Heurístico: Debido a que el uso de la programación dinámica no es factible para la alineación rutinaria de
secuencias múltiples, se han desarrollado algoritmos heurísticos más rápidos como la alineación progresiva
y la alineación iterativa.

Alineación progresiva: Reconstruye incrementalmente el mejor alineamiento múltiple posible utilizando un


árbol filogenético para guiar en qué orden deben incorporarse las restantes secuencias al resultado final.

• Acelera la alineación de múltiples secuencias a través de un proceso de varios pasos. • El programa de


alineación progresiva más conocido es Clustal ([Link]

• Clustal W: la versión de línea de comandos.


• Clustal X: la versión gráfica.

Pasos:
1. Se realizan todos los alineamientos de pares de secuencias y se registra las puntuaciones de similitud,
las cuales son convertidas en distancias evolutivas para generar una matriz de distancias.
2. Se realiza un análisis filogenético simple para agrupar secuencias, generando un árbol filogenético guía.

3. Se realinean las dos secuencias más estrechamente relacionadas por separado usando programación
dinámica.

4. Los alineamientos C,D y A,B se reducen a secuencias consenso las cuales se alinean entre ellas.
5. Se crea un nuevo consenso para C/D,A/B la cual se alinea con la siguiente secuencia más cercana (E)
basada en el árbol guía mediante programación dinámica con lo que se completa el alineamiento
múltiple.

Alineación iterativa • Este tipo de métodos se basan en la idea de que la solución óptima a un problema
puede ser encontrada mediante la modificación iterativa de soluciones subóptimas existentes.
• El proceso consiste en encontrar un alineamiento de “baja calidad” y mejorarlo gradualmente hasta que
ya no sea posible.
• En el servidor web del EBI tienen disponibles una serie de programas de alineamiento múltiple que
emplean métodos de iteración sutilmente diferentes, como, por ejemplo:
Clustal Omega ([Link] )
MUSCLE ([Link] ).

También podría gustarte