1er cuatrimestre 2025
Godoy, Luz ; Martinez, Valentina
TRABAJO PRÁCTICO N° 1: Bases de datos Bioinformáticas
El objetivo de la actividad se centra en aprender a manipular las diferentes bases de
datos, como el NCBI y UniProt (Universal Protein Resource) mediante la obtención
de información sobre la globina beta humana (HBB).
[Link] de datos nucleotídicas
a) Longitud de la secuencia nucleotídica (ADN) es de 1608 nucleótidos
Longitud de la secuencia nucleotídica (mARN) es de 628 nucleótidos
Longitud de la secuencia proteica es de 147 aminoácido
b)
- formato fasta de la secuencia nucleotídica del ADN
>NC_000011.10:5225464-5227071 Homo sapiens chromosome 11, GRCh38.p14 Primary Assembly
TTGCAATGAAAATAAATGTTTTTTATTAGGCAGAATCCAGATGCTCAAGGCCCTTCATAATATCCCCCAG
TTTAGTAGTTGGACTTAGGGAACAAAGGAACCTTTAATAGAAATTGGACAGCAAGAAAGCGAGCTTAGTG
ATACTTGTGGGCCAGGGCATTAGCCACACCAGCCACCACTTTCTGATAGGCAGCCTGCACTGGTGGGGTG
AATTCTTTGCCAAAGTGATGGGCCAGCACACAGACCAGCACGTTGCCCAGGAGCTGTGGGAGGAAGATAA
GAGGTATGAACATGATTAGCAAAAGGGCCTAGCTTGGACTCAGAATAATCCAGCCTTATCCCAACCATAA
AATAAAAGCAGAATGGTAGCTGGATTGTAGCTGCTATTAGCAATATGAAACCTCTTACATCAGTTACAAT
TTATATGCAGAAATATTTATATGCAGAGATATTGCTATTGCCTTAACCCAGAAATTATCACTGTTATTCT
TTAGAATGGTGCAAAGAGGCATGATACATTGTATCATTATTGCCCTGAAAGAAAGAGATTAGGGAAAGTA
TTAGAAATAAGATAAACAAAAAAGTATATTAAAAGAAGAAAGCATTTTTTAAAATTACAAATGCAAAATT
ACCCTGATTTGGTCAATATGTGTACACATATTAAAACATTACACTTTAACCCATAAATATGTATAATGAT
TATGTATCAATTAAAAATAAAAGAAAATAAAGTAGGGAGATTATGAATATGCAAATAAGCACACATATAT
- formato fasta de la secuencia nucleotídica del mARN
>NM_000518.5 Homo sapiens hemoglobin subunit beta (HBB), mRNA
ACATTTGCTTCTGACACAACTGTGTTCACTAGCAACCTCAAACAGACACCATGGTGCATCTGACTCCTGA
GGAGAAGTCTGCCGTTACTGCCCTGTGGGGCAAGGTGAACGTGGATGAAGTTGGTGGTGAGGCCCTGGGC
AGGCTGCTGGTGGTCTACCCTTGGACCCAGAGGTTCTTTGAGTCCTTTGGGGATCTGTCCACTCCTGATG
CTGTTATGGGCAACCCTAAGGTGAAGGCTCATGGCAAGAAAGTGCTCGGTGCCTTTAGTGATGGCCTGGC
TCACCTGGACAACCTCAAGGGCACCTTTGCCACACTGAGTGAGCTGCACTGTGACAAGCTGCACGTGGAT
CCTGAGAACTTCAGGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTCA
CCCCACCAGTGCAGGCTGCCTATCAGAAAGTGGTGGCTGGTGTGGCTAATGCCCTGGCCCACAAGTATCA
CTAAGCTCGCTTTCTTGCTGTCCAATTTCTATTAAAGGTTCCTTTGTTCCCTAAGTCCAACTACTAAACT
GGGGGATATTATGAAGGGCCTTGAGCATCTGGATTCTGCCTAATAAAAAACATTTATTTTCATTGCAA
- formato fasta de la secuencia proteica
>NP_000509.1 hemoglobin subunit beta [Homo sapiens]
MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGNPKVKAHGKKVLG
AFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVAGVAN
ALAHKYH
c) citas de reviews sobre la hbb:
1. Cao A, Galanello R. Beta-talasemia. Genet Med. Febrero de 2010;12(2):61-
76. doi: 10.1097/GIM.0b013e3181cd68ed. PMID: 20098328.
2. Harteveld CL, Achour A, Arkesteijn SJG, Ter Huurne J, Verschuren M,
Bhagwandien-Bisoen S, Schaap R, Vijfhuizen L, El Idrissi H, Koopmann TT.
Las hemoglobinopatías, mecanismos moleculares de las enfermedades y
diagnóstico. Int J Lab Hematol. 2022 septiembre;44 Suplemento
1(Suplemento 1):28-36. doi: 10.1111/ijlh.13885. PMID: 36074711; PMCID:
PMC9542123.
3. Bender MA, Carlberg K. Sickle Cell Disease. 2003 Sep 15 [updated 2025 Feb
13]. In: Adam MP, Feldman J, Mirzaa GM, Pagon RA, Wallace SE, Amemiya
A, editors. GeneReviews® [Internet]. Seattle (WA): University of Washington,
Seattle; 1993–2025. PMID: 20301551.
d) Secuencias nucleotídicas y proteica abiertas desde Jalview con coloración :
Secuencia nucleotídica del ADN
Secuencia nucleotídica de ARNm
Secuencia proteica
e) La base de datos de secuencias de referencia ( RefSeq ) del NCBI es una
colección de secuencias taxonómicamente diversas, no redundantes y ricamente
anotadas que representan moléculas naturales de ADN , ARN y proteínas. Se
incluyen secuencias de plásmidos, orgánulos, virus, arqueas, bacterias y eucariotas.
Cada RefSeq se construye íntegramente a partir de datos de secuencias enviados a
la Colaboración Internacional de Bases de Datos de Secuencias de Nucleótidos
(INSDC). Los RefSeq proporcionan una base para unir datos de secuencias con
información genética y funcional. Se generan para proporcionar estándares de
referencia para múltiples propósitos que van desde la anotación del genoma hasta
informar ubicaciones de variación de secuencias en registros médicos.
2. Bases de datos aminoacídicas
a) Función de la proteína HBB: -Involved in oxygen transport from the lung to
the various peripheral tissues.
b) Molecular Function: metal ion binding, organic acid binding, oxygen binding
Biological Process: nitric oxide transport, oxygen transport, platelet
aggregation
Gene Ontology (GO) es un esfuerzo colaborativo para proporcionar
descripciones estructuradas y estandarizadas de productos genéticos
(proteínas o ARNnc) en bases de datos biológicas.
GO describe el conocimiento biológico con respecto a tres aspectos:
- Función molecular: actividades realizadas por productos genéticos (por
ejemplo, actividad enzimática).
- Proceso biológico: módulos o programas biológicos (por ejemplo, ciclo
celular o ciclo del ácido cítrico).
- Componente celular: ubicación dentro de las células (por ejemplo, núcleo o
ribosoma).
c)
Las partes amarillas son las regiones donde se encuentra la proteína
d) PTM: GLYCOSYLATION. N-linked (Glc) (glycation) lysine.
FUENTE: "Sites of nonenzymatic glycosylation of human hemoglobin
A."Shapiro R., McManus M.J., Zalut C., Bunn H.F.J. Biol. Chem. 255:3120-
312
PTM: FOSFORILACIÓN.
RESIDUO MODIFICADO: Phosphothreonine.
GENOMIC COORDINATES: 88.
FUENTE: “An enzyme assisted RP-RPLC approach for in-depth analysis of
human liver phosphoproteome.” Bian Y., Song C., Cheng K., Dong M., Wang
F., Huang J., Sun D., Wang L., Ye M., Zou H. J. Proteomics 96:253-262
(2014)