PRACTICAS DE BIOINFORMATICA E.P.
BIOLOGIA UNSA
UNIVERSIDAD NACIONAL DE SAN AGUSTÍN
FACULTAD DE CIENCIAS BIOLÓGICAS
ESCUELA PROFESIONAL DE BIOLOGÍA
ASIGNATURA:
Prácticas de Bioinformática
TEMA: Practica 5. Identificación de secuencias e identificación de especies.
ALUMNOS:
AGUILAR CAHUANA MIGUEL
ALVAREZ GONGORA MALHU
PALMA VILCA FERNANDA
SANCHEZ CASTRO FLOR LEONOR MAYTE
Arequipa, Perú
2021
PRACTICAS DE BIOINFORMATICA E.P. BIOLOGIA UNSA
PRACTICA 5. IDENTIFICACION DE SECUENCIAS E IDENTIFICACION DE
ESPECIES.
Objetivo:
Caracterizar los marcadores moleculares para identificación de especies
Usar Blastn para identificación de secuencias y Especies
Introducción:
Los organismos tienen secuencias que se conservan durante la evolución debido a su
función, sin embargo, hay secuencias que varían de acuerdo a la evolución, y pueden ser
utilizados como marcadores moleculares para identificación de especies, géneros o familia,
dependiendo su variación.
Para el caso de Procariontes el marcador molecular el el gen rRNA16S.
En el caso de eucariontes el marcador es el gen rRNA18S, también se utiliza el gen del
citocromo b y la secuencia ITS.
Actividades:
1. Caracterizar la secuencia del gen rRNA16S:
a. Secuencia
CCCGATTACGGGTATACATTCACGGAGAGTTTGATCCTGGCTCAGGACGAACGCTG
GCGGCGTGCTTAAC
ACATGCAAGTCGAACGATGAACCACTTCGGTGGGGATTAGTGGCGAACGGGTGAGT
AACACGTGGGCAAT
CTGCCCTTCACTCTGGGACAAGCCCTGGAAACGGGGTCTAATACCGGATACTGACC
CTCGCAGGCATCTG
CGAGGTTCGAAAGCTCCGGCGGTGAAGGATGAGCCCGCGGCCTATCAGCTTGTTGG
TGAGGTAATGGCTC
ACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGCGACCGGCCACACTGGGACTGA
GACACGGCCCAGAC
TCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGAAAGCCTGATGCAGC
GACGCCGCGTGAGG
GATGACGGCCTTCGGGTTGTAAACCTCTTTCAGCAGGGAAGAAGCGAAAGTGACGG
TACCTGCAGAAGAA
GCGCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGCGCAAGCGTTGTC
CGGAATTATTGGGC
GTAAAGAGCTCGTAGGCGGCTTGTCACGTCGGTTGTGAAAGCCCGGGGCTTAACCC
CGGGTCTGCAGTCG
ATACGGGCAGGCTAGAGTTCGGTAGGGGAGATCGGAATTCCTGGTGTAGCGGTGAA
ATGCGCAGATATCA
GGAGGAACACCGGTGGCGAAGGCGGATCTCTGGGCCGATACTGACGCTGAGGAGCG
AAAGCGTGGGGAGC
PRACTICAS DE BIOINFORMATICA E.P. BIOLOGIA UNSA
GAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGGTGGGCACTAGGTGTGG
GCAACATTCCACGT
TGTCCGTGCCGCAGCTAACGCATTAAGTGCCCCGCCTGGGGAGTACGGCCGCAAGG
CTAAAACTCAAAGG
AATTGACGGGGGCCCGCACAAGCGGCGGAGCATGTGGCTTAATTCGACGCAACGCG
AAGAACCTTACCAA
GGCTTGACATACACCGGAAAGCATCAGAGATGGTGCCCCCCTTGTGGTCGGTGTAC
AGGTGGTGCATGGC
TGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCT
TGTCCCGTGTTGCC
AGCAAGCCCTTCGGGGTGTTGGGGACTCACGGGAGACCGCCGGGGTCAACTCGGAG
GAAGGTGGGGACGA
CGTCAAGTCATCATGCCCCTTATGTCTTGGGCTGCACACGTGCTACAATGGCCGGT
ACAATGAGCTGCGA
TACCGCAAGGTGGAGCGAATCTCAAAAAGCCGGTCTCAGTTCGGATTGGGGTCTGC
AACTCGACCCCATG
AAGTCGGAGTCGCTAGTAATCGCAGATCAGCATTGCTGCGGTGAATACGTTCCCGG
GCCTTGTACACACC
GCCCGTCACGTCACGAAAGTCGGTAACACCCGAAGCCGGTGGCCCAACCCCTTGTG
GGAGGGAGCTGTCG
AAGGTGGGACTGGCGATTGGGACGAAGTCGTAACAAGGTAGCCGTACCGGAAGGTG
CG
a. Tamaño: 1528 bp
b. Escribir los primers universales más utilizados para su amplificación
Primer: AAGTGACGGTACCTGCAGAA
Reverse: TCACCGCTACACCAGGAATT
Primer: AGGCTTGACATACACCGGAA
Reverse: GTGCAGCCCAAGACATAAGG
Primer: GGGGAGCGAACAGGATTAGA
Reverse: TCCGGTGTATGTCAAGCCTT
Primer: GGCAGCAGTGGGGAATATTG
Reverse: TACGAGCTCTTTACGCCCAA
2. Caracterizar la secuencia del gen citb
a. Secuencia
ATGGCAAACGAGCAAAAAACTGCAGCAAAAGACGTTTTCCAAGCGAGAAAAACGTT
TACTACAAATGGGA
AAACATATCATTACTACTCTTTAAAAGCGTTAGAAGATTCAGGTATAGGAAAGGTT
TCGAAGCTTCCTTA
TTCCATCAAAGTTCTTTTAGAATCAGTATTGCGTCAAGTTGACGGCTTCGTTATCA
AAAAAGAACACGTG
GAAAATTTGGCAAAATGGGGAACTGCCGAATTAAAGGATATCGACGTTCCGTTCAA
ACCGTCTCGTGTTA
TTTTACAAGACTTCACAGGGGTTCCGGCAGTAGTAGATCTGGCTTCACTGCGTAAA
GCAATGGCAGCTGT
PRACTICAS DE BIOINFORMATICA E.P. BIOLOGIA UNSA
CGGCGGAGATCCTGATAAAATCAACCCTGAAATTCCTGTTGATCTCGTTATCGATC
ACTCTGTACAGGTA
GATAAAGCGGGTACAGAAGATGCATTAGCAGTAAATATGGACTTGGAATTCGAAAG
AAATGCAGAGCGCT
ACAAATTTTTAAGCTGGGCAAAGAAAGCGTTTAACAATTATCAGGCAGTACCGCCT
GCAACAGGTATTGT
GCACCAGGTCAACCTTGAGTTCTTGGCAAGTGTTGTCCATGCCATTGAAGAAGACG
GCGAGCTTGTAACG
TATCCTGATACGCTTGTCGGAACAGACTCACACACAACAATGATTAACGGTATCGG
TGTTCTCGGCTGGG
GTGTCGGTGGAATTGAAGCTGAAGCGGGAATGCTTGGACAGCCTTCTTACTTCCCA
GTTCCAGAGGTAAT
CGGCGCGAAACTTGTCGGCAAGCTTCCAAACGGAACAACAGCTACTGACTTGGCGT
TAAAAGTAACACAA
GTGCTGCGTGAAAAAGGCGTTGTCGGTAAATTTGTTGAATTCTTCGGACCGGGAAT
TGCTGAACTGCCGC
TTGCAGATCGCGCAACAATTGCGAATATGGCTCCGGAATACGGTGCTACATGCGGA
TTCTTCCCAGTAGA
TGAAGAAGCGCTTAACTACCTGCGCCTGACTGGCCGTGATCCTGAACATATTGATG
TTGTTGAAGCATAC
TGCAGAAGCAATGGCTTGTTCTACACTCCAGATGCGGAAGACCCTCAATTTACTGA
TGTGGTTGAAATTG
ACCTGTCTCAAATTGAAGCAAACTTATCGGGTCCAAAGCGTCCTCAGGATTTGATC
CCGCTATCTGCTAT
GCAGGAAACGTTTAAAAAGCAATTAGTCAGCCCTGCAGGTAACCAAGGATTCGGTT
TAAATGCTGAGGAA
GAAAATAAAGAAATTAAGTTTAAACTCCTTAACGGCGAAGAAACAGTTATGAAAAC
GGGTGCGATCGCCA
TTGCTGCGATTACAAGCTGTACAAATACATCAAACCCATACGTGCTGATCGGCGCC
GGACTGGTAGCGAA
AAAAGCGGTTGAGTTAGGGCTTAAGGTGCCTAATTACGTGAAAACGTCACTTGCAC
CGGGTTCTAAAGTT
GTTACAGGATATCTTGTGAATTCAGGCCTTCTTCCATACATGAAAGAGCTTGGCTT
TAACCTCGTTGGGT
ACGGCTGTACAACATGTATCGGGAACTCAGGTCCGCTTTCACCGGAAATCGAAGAA
GCGGTTGCGAAAAA
TGATCTTCTGATTACGTCTGTCCTTTCCGGAAACCGTAACTTTGAAGGACGTATTC
ACCCGCTTGTTAAA
GGCAACTATCTTGCTTCACCGCCGCTTGTTGTGGCATATGCGCTGGCTGGAACGGT
AAACATTAACTTAA
AAACCGATCCAATCGGTGTGGGCAAGGATGGTCAAAACGTATACTTTAATGATATT
TGGCCGTCAATGGA
CGAAATCAATGCACTTGTTAAGCAAACTGTTACGCCAGAGCTATTCCGCAAAGAGT
ATGAAACAGTATTT
GATGACAACAAGCGCTGGAACGAAATTGAAACAACAGATGAAGCTTTATATAAATG
GGATAACGATTCAA
PRACTICAS DE BIOINFORMATICA E.P. BIOLOGIA UNSA
CTTACATCCAAAACCCACCATTCTTTGAAGAGATGTCTGTTGAGCCAGGCAAGGTT
GAGCCATTAAAAGG
ACTGCGTGTTGTCGGTAAATTCGGCGATTCAGTCACAACTGACCATATTTCTCCTG
CGGGGGCAATCGGA
AAAGATACGCCTGCCGGAAAGTATTTGCAAGAAAAAGGTGTTTCACCTCGTGACTT
TAACTCCTACGGCT
CCCGCCGTGGAAACCATGAAGTCATGATGAGAGGAACATTTGCCAACATTCGCATC
AAAAACCAAATCGC
ACCGGGTACAGAAGGCGGATTTACGACGTACTGGCCGACTGGTGAAGTAACATCCA
TCTATGATGCATGC
ATGAAATACAAAGAAGATAAAACCGGTCTTGTCGTATTAGCAGGAAAAGACTATGG
TATGGGATCTTCAC
GTGACTGGGCTGCAAAAGGAACAAACCTTCTCGGCATCAGAACGGTCATTGCAGAG
AGCTTCGAAAGAAT
TCACAGAAGCAATCTTGTATTCATGGGTGTGCTGCCGCTTCAGTTTAAACAAGGTG
AAAATGCGGATACA
CTCGGCTTAACGGGTAAAGAAGTCATCGAGGTAGATGTTGATGAAACAGTTCGTCC
TCGTGACCTTGTGA
CTGTAAGAGCAATCAATGAAGACGGCAATGTAACAACTTTTGAAGCAGTCGTCCGC
TTTGATAGTGAAGT
TGAAATTGATTACTACCGCCATGGCGGCATCCTTCAAATGGTGCTTCGTGAAAAAA
TGAAGCAGTCCTGA
b. Tamaño: 2730 bp
c. Escribir los primers universales más utilizados para su amplificación
Primer GTCGGCGGAGATCCTGATAA
Reverse CGCTTTCTTTGCCCAGCTTA
Primer: AGCGGGTACAGAAGATGCAT
Reverse: CTCGCCGTCTTCTTCAATGG
Primer: GAACTCAGGTCCGCTTTCAC
Reverse: ACGTTTTGACCATCCTTGCC
Primer: TGAATTCTTCGGACCGGGAA
Reverse: TATGTTCAGGATCACGGCCA
3. Caracterizar el marcador ITS (opcional)
Utilización de marcadores ITS e ISSR para la caracterización molecular de cepas
híbridas de Pleurotus djamor
Para amplificar la región ITS-5.8-ITS2 del ADN de las cepas mediante la reacción
en cadena de la polimerasa (PCR) se utilizaron:
- Oligonucleótidos universales ITS1
(TCCGTAGGTGAACCTGCGG) e ITS4
(TCCTCCGCTTATTGATATGC)1,2,11,26,34.
La secuenciación de los productos amplificados fue realizada en el Instituto de
Biotecnología de la UNAM y cada muestra se secuenció en ambas direcciones.
Las secuencias obtenidas con los cebadores ITS fueron comparadas con las
secuencias de Pleurotus publicadas en la base de datos de ADN (GenBank)
PRACTICAS DE BIOINFORMATICA E.P. BIOLOGIA UNSA
mediante el programa Basic Local Alignment Search Tool (BLAST).
Posteriormente las secuencias fueron alineadas con BioEdit Sequence Alignment
Editor y el programa Mega 6.6 y se llevó a cabo un análisis taxonómico con el
algoritmo Neighbour-Joining. Finalmente, las secuencias quedaron depositadas en
el GenBank.
Figura 1: Productos amplificados del ADN de las cepas de Pleurotus mediante cebadores ITS. Calle
M: marcador molecular, calle 1: CC052, calle 2: CC051, calle 3: CC056, calle 4: CC054, calle 5:
CC053, calle 6: CC055, calle 7: CC050, calle 8: CC059. b) Productos amplificados mediante el
oligonucleótido UBC811 para las cepas de Pleurotus parentales, híbridas, reconstituidas y
neohaplontes. Marcadores moleculares M1 (100 pb) y M2 (1 Kb plus), calle 1: CC050, calle 2:
CC051, calle 3: R7B4, calle 4: R5B4, calle 5: R3B4, calle 6: R1B4, calle 7: R7R1, calle 8: B6B4,
calle 9: R7, calle 10: R5, calle 11: R3, calle 12: R1, calle 13: B6, calle 14: B4, calle 15: R1, calle 16:
Testigo (T).
PRACTICAS DE BIOINFORMATICA E.P. BIOLOGIA UNSA
Figura 2: Árbol filogenético generado por análisis de Neighbour-Joining a partir de las secuencias de
la región ITS de cepas de Pleurotus.
4. Utilzando Blastn, identificar las siguientes secuencias:
a. Usar una secuencia de una planta y usando el blastn identificar la
planta.
AAAACGGAGAGTTTGATCCTGGCTCAGGATGAACGCTGGCGGTATGCTTAA
CACATGCAAGTCGAACGGTGTCTTCGGACACAGTGGCGGA
b. A quien corresponde:
Corresponde a Nostoc spp.
Colonia de cianobacterias que puede estar en estado latente hasta que las primeras
lluvias la hidratan, formando esferas de 10 a 25 mm de diámetro, semejante a uvas.
Se encuentra en la precordillera andina, sobre 3000 m.
PRACTICAS DE BIOINFORMATICA E.P. BIOLOGIA UNSA
PRACTICAS DE BIOINFORMATICA E.P. BIOLOGIA UNSA
PRACTICAS DE BIOINFORMATICA E.P. BIOLOGIA UNSA
FASTA
>CP040094.1:218-319 Nostoc sp. TCL240-02 chromosome, complete genome
CTTCAAAACGGAGAGTTTGATCCTGGCTCAGGATGAACGCTGGCGGTATGCTTAACACATGCAAGTCGAA
CGGTGTCTTCGGACACAGTGGCGGACGGGTGA
c. Secuencia b:
GGTCTTATTACTTCTCTTacaCTTATGCAAGAGTTGATCAATATGGA TTT
ATTGAAACACCATATCGTGTTGTAAATAATGGAATTGCTACAAAGG ACAT
TGTTTATTTAACTGCTGATGAAGAAGATGAAGTTATTATCGCTCAA G
d. A quien corresponde:
corresponde a Parvimonas micra
Cocus anaeróbico grampositivo que a menudo se aísla de la placa dental en
pacientes con periodontitis crónica. Es la única especie en su género, y es un
componente común de infecciones anaeróbicas mixtas como el absceso
intraabdominal.
PRACTICAS DE BIOINFORMATICA E.P. BIOLOGIA UNSA
PRACTICAS DE BIOINFORMATICA E.P. BIOLOGIA UNSA
PRACTICAS DE BIOINFORMATICA E.P. BIOLOGIA UNSA
FASTA
>LR134472.1 Parvimonas micra strain NCTC11808 genome assembly,
chromosome: 1
Bibliografía:
Jemboss — Bioinformatics at COMAV 0.1 documentation ([Link])
[Link]
Alineamiento de secuencias ([Link])