0% encontró este documento útil (0 votos)
9 vistas5 páginas

TP 1

El trabajo práctico se enfoca en la manipulación de bases de datos bioinformáticas, específicamente NCBI y UniProt, para obtener información sobre la globina beta humana (HBB). Se presentan detalles sobre las secuencias nucleotídicas y proteicas, así como su función biológica y modificaciones post-traduccionales. Además, se incluyen referencias bibliográficas relevantes sobre hemoglobinopatías y el papel de la base de datos RefSeq en la anotación genética.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
9 vistas5 páginas

TP 1

El trabajo práctico se enfoca en la manipulación de bases de datos bioinformáticas, específicamente NCBI y UniProt, para obtener información sobre la globina beta humana (HBB). Se presentan detalles sobre las secuencias nucleotídicas y proteicas, así como su función biológica y modificaciones post-traduccionales. Además, se incluyen referencias bibliográficas relevantes sobre hemoglobinopatías y el papel de la base de datos RefSeq en la anotación genética.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

1er cuatrimestre 2025

Godoy, Luz ; Martinez, Valentina

TRABAJO PRÁCTICO N° 1: Bases de datos Bioinformáticas

El objetivo de la actividad se centra en aprender a manipular las diferentes bases de


datos, como el NCBI y UniProt (Universal Protein Resource) mediante la obtención
de información sobre la globina beta humana (HBB).

[Link] de datos nucleotídicas

a) Longitud de la secuencia nucleotídica (ADN) es de 1608 nucleótidos

Longitud de la secuencia nucleotídica (mARN) es de 628 nucleótidos

Longitud de la secuencia proteica es de 147 aminoácido


b)

- formato fasta de la secuencia nucleotídica del ADN

>NC_000011.10:5225464-5227071 Homo sapiens chromosome 11, GRCh38.p14 Primary Assembly


TTGCAATGAAAATAAATGTTTTTTATTAGGCAGAATCCAGATGCTCAAGGCCCTTCATAATATCCCCCAG
TTTAGTAGTTGGACTTAGGGAACAAAGGAACCTTTAATAGAAATTGGACAGCAAGAAAGCGAGCTTAGTG
ATACTTGTGGGCCAGGGCATTAGCCACACCAGCCACCACTTTCTGATAGGCAGCCTGCACTGGTGGGGTG
AATTCTTTGCCAAAGTGATGGGCCAGCACACAGACCAGCACGTTGCCCAGGAGCTGTGGGAGGAAGATAA
GAGGTATGAACATGATTAGCAAAAGGGCCTAGCTTGGACTCAGAATAATCCAGCCTTATCCCAACCATAA
AATAAAAGCAGAATGGTAGCTGGATTGTAGCTGCTATTAGCAATATGAAACCTCTTACATCAGTTACAAT
TTATATGCAGAAATATTTATATGCAGAGATATTGCTATTGCCTTAACCCAGAAATTATCACTGTTATTCT
TTAGAATGGTGCAAAGAGGCATGATACATTGTATCATTATTGCCCTGAAAGAAAGAGATTAGGGAAAGTA
TTAGAAATAAGATAAACAAAAAAGTATATTAAAAGAAGAAAGCATTTTTTAAAATTACAAATGCAAAATT
ACCCTGATTTGGTCAATATGTGTACACATATTAAAACATTACACTTTAACCCATAAATATGTATAATGAT
TATGTATCAATTAAAAATAAAAGAAAATAAAGTAGGGAGATTATGAATATGCAAATAAGCACACATATAT

- formato fasta de la secuencia nucleotídica del mARN

>NM_000518.5 Homo sapiens hemoglobin subunit beta (HBB), mRNA


ACATTTGCTTCTGACACAACTGTGTTCACTAGCAACCTCAAACAGACACCATGGTGCATCTGACTCCTGA
GGAGAAGTCTGCCGTTACTGCCCTGTGGGGCAAGGTGAACGTGGATGAAGTTGGTGGTGAGGCCCTGGGC
AGGCTGCTGGTGGTCTACCCTTGGACCCAGAGGTTCTTTGAGTCCTTTGGGGATCTGTCCACTCCTGATG
CTGTTATGGGCAACCCTAAGGTGAAGGCTCATGGCAAGAAAGTGCTCGGTGCCTTTAGTGATGGCCTGGC
TCACCTGGACAACCTCAAGGGCACCTTTGCCACACTGAGTGAGCTGCACTGTGACAAGCTGCACGTGGAT
CCTGAGAACTTCAGGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTCA
CCCCACCAGTGCAGGCTGCCTATCAGAAAGTGGTGGCTGGTGTGGCTAATGCCCTGGCCCACAAGTATCA
CTAAGCTCGCTTTCTTGCTGTCCAATTTCTATTAAAGGTTCCTTTGTTCCCTAAGTCCAACTACTAAACT
GGGGGATATTATGAAGGGCCTTGAGCATCTGGATTCTGCCTAATAAAAAACATTTATTTTCATTGCAA

- formato fasta de la secuencia proteica


>NP_000509.1 hemoglobin subunit beta [Homo sapiens]
MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGNPKVKAHGKKVLG
AFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVAGVAN
ALAHKYH

c) citas de reviews sobre la hbb:

1. Cao A, Galanello R. Beta-talasemia. Genet Med. Febrero de 2010;12(2):61-


76. doi: 10.1097/GIM.0b013e3181cd68ed. PMID: 20098328.

2. Harteveld CL, Achour A, Arkesteijn SJG, Ter Huurne J, Verschuren M,


Bhagwandien-Bisoen S, Schaap R, Vijfhuizen L, El Idrissi H, Koopmann TT.
Las hemoglobinopatías, mecanismos moleculares de las enfermedades y
diagnóstico. Int J Lab Hematol. 2022 septiembre;44 Suplemento
1(Suplemento 1):28-36. doi: 10.1111/ijlh.13885. PMID: 36074711; PMCID:
PMC9542123.
3. Bender MA, Carlberg K. Sickle Cell Disease. 2003 Sep 15 [updated 2025 Feb
13]. In: Adam MP, Feldman J, Mirzaa GM, Pagon RA, Wallace SE, Amemiya
A, editors. GeneReviews® [Internet]. Seattle (WA): University of Washington,
Seattle; 1993–2025. PMID: 20301551.

d) Secuencias nucleotídicas y proteica abiertas desde Jalview con coloración :

Secuencia nucleotídica del ADN

Secuencia nucleotídica de ARNm


Secuencia proteica

e) La base de datos de secuencias de referencia ( RefSeq ) del NCBI es una


colección de secuencias taxonómicamente diversas, no redundantes y ricamente
anotadas que representan moléculas naturales de ADN , ARN y proteínas. Se
incluyen secuencias de plásmidos, orgánulos, virus, arqueas, bacterias y eucariotas.
Cada RefSeq se construye íntegramente a partir de datos de secuencias enviados a
la Colaboración Internacional de Bases de Datos de Secuencias de Nucleótidos
(INSDC). Los RefSeq proporcionan una base para unir datos de secuencias con
información genética y funcional. Se generan para proporcionar estándares de
referencia para múltiples propósitos que van desde la anotación del genoma hasta
informar ubicaciones de variación de secuencias en registros médicos.

2. Bases de datos aminoacídicas

a) Función de la proteína HBB: -Involved in oxygen transport from the lung to


the various peripheral tissues.

b) Molecular Function: metal ion binding, organic acid binding, oxygen binding
Biological Process: nitric oxide transport, oxygen transport, platelet
aggregation

Gene Ontology (GO) es un esfuerzo colaborativo para proporcionar


descripciones estructuradas y estandarizadas de productos genéticos
(proteínas o ARNnc) en bases de datos biológicas.
GO describe el conocimiento biológico con respecto a tres aspectos:
- Función molecular: actividades realizadas por productos genéticos (por
ejemplo, actividad enzimática).
- Proceso biológico: módulos o programas biológicos (por ejemplo, ciclo
celular o ciclo del ácido cítrico).
- Componente celular: ubicación dentro de las células (por ejemplo, núcleo o
ribosoma).

c)

Las partes amarillas son las regiones donde se encuentra la proteína

d) PTM: GLYCOSYLATION. N-linked (Glc) (glycation) lysine.


FUENTE: "Sites of nonenzymatic glycosylation of human hemoglobin
A."Shapiro R., McManus M.J., Zalut C., Bunn H.F.J. Biol. Chem. 255:3120-
312

PTM: FOSFORILACIÓN.
RESIDUO MODIFICADO: Phosphothreonine.
GENOMIC COORDINATES: 88.
FUENTE: “An enzyme assisted RP-RPLC approach for in-depth analysis of
human liver phosphoproteome.” Bian Y., Song C., Cheng K., Dong M., Wang
F., Huang J., Sun D., Wang L., Ye M., Zou H. J. Proteomics 96:253-262
(2014)

También podría gustarte