0% encontró este documento útil (0 votos)
218 vistas12 páginas

Alineamiento Múltiple de Secuencias Proteicas

Este documento describe los alineamientos múltiples de secuencias, los cuales alinean más de dos secuencias como ADN, ARN o proteínas que descienden de un antepasado común. Explica que las secuencias biológicas se agrupan en familias y que los alineamientos múltiples se usan para obtener información sobre función, estructura y evolución, así como para identificar familias de proteínas y generar árboles filogenéticos. Finalmente, detalla algunos algoritmos comunes para alineamientos
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
218 vistas12 páginas

Alineamiento Múltiple de Secuencias Proteicas

Este documento describe los alineamientos múltiples de secuencias, los cuales alinean más de dos secuencias como ADN, ARN o proteínas que descienden de un antepasado común. Explica que las secuencias biológicas se agrupan en familias y que los alineamientos múltiples se usan para obtener información sobre función, estructura y evolución, así como para identificar familias de proteínas y generar árboles filogenéticos. Finalmente, detalla algunos algoritmos comunes para alineamientos
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Alineamientos múltiples de secuencias

Un alineamiento múltiple de secuencias es aquel que se lleva a cabo con mas de


dos secuencias. Estas secuencias como en el caso de los alineamientos por pareja
pueden ser ADN, ARN, o proteína.

En todos los casos los algoritmos de alineamiento múltiple asumen que las
secuencias que estamos alineando descienden de un antepasado común y lo que
se intenta es alinear las posiciones homologas.
Generalidades

Las secuencias biológicas a menudo se agrupan en familias:


-Genes relacionados de un organismo (parálogos)
-Genes relacionados en distintas especies (ortólogos)
-Secuencias dentro de una población (variantes polimórficas)

Dos secuencias pueden tener un alineamiento no muy bueno entre ellas, pero
pueden alinearse vía una tercera
-Identificación de familias y regiones conservadas

Aplicaciones de los alineamientos múltiples de secuencias

-Obtener información acerca de la función, estructura y evolución de una


secuencia.
-Determinar si la secuencia de interés forma parte de una familia de proteínas.
-Generación de árboles filogenéticos.
Algoritmos utilizados para el alineamiento múltiple de secuencias:

1.- Métodos exactos


2.- Alineamiento progresivo
3.- Aproximaciones iterativas
4.- Métodos basados en la consistencia
5.- Métodos basados en la estructura

Actualmente se utilizan métodos de alineación iterativa. El servidor web del EBI


tienen disponibles una serie de métodos como son:
Clustal Omega
Kalign
MAFFT
MUSCLE
Práctica: En esta parte utilizaremos el programa MUSCLE para realizar un
alineamiento múltiple de las secuencias proteínicas que a continuación se
muestran:
En este caso, alinearemos 5 secuencias proteínicas de miembros de la familia ERF de Arabidopsis thaliana.

>OAP19535.1 ERF3
MRRGRGSSAVARPTVVAAINGSVKEIRFRGVRKRPWGRFAAEIRDPWKKARVWLGTFDSAEEAARAYDSA
ARNLRGPKAKTNFPIDSSSPPPPNLRFNQIRNQNQNQVDPFMDHRLFTDHQQQFPIVNRPTSSSMSSTVE
SFSGPRPTTMKPATTKRYPRTPPVVPEDCHSDCDSSSSVIDDDDDIASSSRRRNPPFQFDLNFPPLDCVD
LFNGADDLHCTDLRL
>OAO97037.1 ERF6
MATPNEVSALFLIKKYLLDELSPLPTTATTNRWMNDFTSFHQTGFEFSEFETKPEIIDLVTPKPEISDFE
VKSEISIESNDSFTFQSNPPRVTVQSNRKPPLKIAPPNRTKWIQFATGNPKPELPEPVVAAEEKRHYRGV
RMRPWGKFAAEIRDPTRRGTRVWLGTFETAIEAARAYDKEAFRLRGSKAILNFPLEVGKWNPRAEDVRGL
NNKRKRNGEEEEVTVVKKVLKKEESYAVSDGENVESGLTAIDDWDLTEFLSMPLLSPLSPHPPFGYPQLT
VV
>OAP18141.1 ERF10
MTTEKENVTTAVAVKDGGEKSKEVSDKGVKKRKNVTKALAVNDGGEKSKEVRYRGVRRRPWGRYAAEIRD
PVKKKRVWLGSFNTGEEAARAYDSAAIRFRGSKATTNFPLIGYYGISSATPVNNNLSETVSDGNANLPLV
GDDGNALASPVNNTLSETARDGTLPSDCHDMLSPGVAEAVAGFFLDLPEVIALKEELDRVCPDQFESIDM
GLTIGPQTAVEEPETSSAVDCKLRMEPDLDLNASP
>OAP11591.1 ERF13
MSSSDSVNNGVNSRMYFRNPSFSNVILNDNWSDLPLSVDDSQDMAIYNTLRDAVSSGWTPSVPPVTSPAE
EDKPPATKASGSHAPRQKGMQYRGVRRRPWGKFAAEIRDPKKNGARVWLGTYETPEDAAVAYDRAAFQLR
GSKAKLNFPHLIGSCKYEPVRIRPRRRSPEPSVSDQLTSEQKRESHVDDGESSLVVPELDFTVDQFYFDG
SLLMDQSECSYSDNRI
>OAP09341.1 ERF15
MEYSQSSMYSSPSSWSSSQESLLWNESCFLDQSSEPQAFFCPNYDYSDDFFSFESPEMMIKEEIQNGDVS
NSEEEEKVGIDEERSYRGVRKRPWGKFAAEIRDSTRNGIRVWLGTFDKAEEAALAYDQAAFATKGSLATL
NFPVEVVRESLKKMENVNLHDGGSPVMALKRKHSLRNRPRGKKRSSSSSSSSSSNSSSCSSSSSTSSTSR
SSSKQSVVKQESGTLVVFEDLGAEYLEQLLMSSC
Acceda al sitio web del EBI y seleccionamos la herramienta MUSCLE
https://www.ebi.ac.uk/Tools/msa/
Para hacer el alineamiento múltiple introduciremos las secuencias problema en el campo de entrada “STEP 1 - Enter your input
sequences”. Posteriormente, utilizando los parametros por defecto, ejecutamos el alineamiento haciendo clic en “Submit”.
Nota: Tengan cuidado al momento de pegar las secuencias, estas deben de estás deben de pegarse el nombre y la secuencia en párrafos
independientes. Como aparece en la foto. Por que de lo contrario, no les permitirá realizar el alineamiento.
Guarde en un archivo el alineamiento generado en el cuadro de resultados. Para ello pulsaremos “Download Alignment File”. Este archivo será el que utilicemos
en BioEdit, una herramienta muy interesante para visualizar y editar nuestros alineamientos múltiples.
Bioedit es un programa gratuito para edición de alineamientos y análisis de secuencias. Este programa cuenta con varias herramientas que van desde la
creación de alineamientos hasta la anotación de plásmidos. En este caso, utilizaremos esta herramienta para editar el alineamiento múltiple recién creado.

Guarde el archivo
para que lo ubique el
archivo
Una vez descargado el programa BioEdit, vaya al documento que guardo del alineamiento y ábralo con el programa BioEdit.
Nota. Posiblemente no les de opción de abrirlo con BioEdit. Para esto, deben darle click derecho al archivo que guardaron e irse a propiedades. Ahí les
aparecerá la opción de cambiar y deben de eligir BioEdit como opción para abrir ese tipo de archivos.
Una vez que logren abrir el archivo les debe de aparecer una ventana de este tipo

Para visualizar las regiones conservadas (aminoácidos


conservados), deben de deslizar el cursos hacia la derecha, por
toda la secuencia, hasta encontrar las regiones conservadas.
Esta es la ventana principal de BioEdit. El alineamiento de nuestras secuencias se
muestra en la parte central derecha de la pantalla y las secuencias correspondientes a
la izquierda. Por defecto cada aminoácido es resaltado en un color diferente, este
esquema de colores puede ser cambiado en cualquier momento mediante la utilización
de las diferentes opciones de la barra de herramientas.
Con el fin de visualizar mejor nuestro alineamiento, cambiaremos el esquema de colores presionando
los botones “Shade Identities and Similarities in alignment window” y “Monochrome”. El resultado
obtenido debe ser similar al de la imagen siguiente.

En esta región de las secuencias alineadas se muestran los aminoácidos conservados


entre las secuencias, esto se observa por sobras de diferente coloración

En la ultima linea del alineamiento, denominada “Clustal Consensus”, podemos


observar 3 tipos de caracteres o la ausencia de ellos, que significan:
• Asterisco (*), indica que en dicha posicion los residuos son 100% identicos.
• Dos puntos (:), indica posiciones en las que se han realizado sustituciones
conservativas.
• Punto (.), indica sustituciones menos conservativas.
• Ausencia de caracteres, indica que no existe un consenso en dicha posicion
Cuando hacemos un alineamiento múltiple lo que queremos evaluar es el nivel y lugar de conservación
de nuestras secuencias. Por tanto, analizar la secuencia consenso es una manera apropiada de conocer las características de
nuestro alineamiento.
Generalmente (no siempre), las regiones N y C terminal son poco conservadas, por esta razón encontramos en los dos alineamientos
mas gaps (huecos) y ausencia de similitudes en dichas regiones.
Por ahora, no tenemos métodos estadísticos para evaluar la validez de un alineamiento múltiple, como ocurre por ejemplo con el
valor E-value en BLAST. Si trabajamos con secuencias de ADN es fácil hacerse una idea de lo bueno que es el alineamiento puesto
que únicamente se valora positivamente la identidad de los residuos en cada posición. Con las secuencias de proteínas el asunto es
mas complejo
porque se valoran positivamente también los parecidos entre aminoácidos que no son idénticos,
pero que son químicamente similares y esto conduce a que los alineamientos de las secuencias al azar
puedan confundirse con alineamientos realmente significativos.
Tarea:

• Generar un archivo de texto con las secuencias en formato FASTA de las


proteínas PIN1, PIN2, PIN3, PIN4, y PIN5 de Arabidopsios thaliana
• Realizar un alineamiento múltiple de las proteínas problema en MUSCLE y editar
el alineamiento en BioEdit, mostrando en sombreado los aminoácidos conservados.

También podría gustarte