GENES Y GENOMAS
Actividad colaborativa
20 DE ABRIL DE 2023
ABDIEL VICENCIO ANTONIO A01750922
ERICK SEGURA SÁNCHEZ A01613821
SERGIO AARÓN HERNÁNDEZ ORTA A01613878
INSTITUTO TECNOLOGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY
PARTE 1.
a. En un organismo con un genoma de ADN doble hélice, si G=C y A=T,
entonces, ¿G+C = A+T? ¿Por qué?
Claro. La Ley de Chargaff se basa en la relación cuantitativa de los
nucleótidos que forman la doble hélice del ácido desoxirribonucleico (ADN). Esta
ley establece que la cantidad de adenina (A) es igual a la cantidad de timina (T) y la
cantidad de guanina (G) es igual a la cantidad de citosina. Esto significa que el
número total de bases (A+G) es igual al número total de bases (C+T).
Las interacciones entre las bases se dan a través de puentes de hidrógeno
entre regiones específicas. El primer patrón de apareamiento modelado por Watson
y Crick describe la interacción G-C (guanina - citosina), A-T (adenina - timina) y
como consecuencia la estructura de doble hélice del ADN.
b. Si un organismo tiene 38% de A, ¿cuál es el porcentaje de G?
Si un organismo tiene un 38% de adenina (A) en su ADN, entonces también
tendrá un 38% de timina (T), ya que la cantidad de adenina es igual a la cantidad de
timina según la Ley de Chargaff. Esto significa que el 76% del ADN está compuesto
por adenina y timina. Por lo tanto, el porcentaje restante del 24% estará compuesto
por guanina (G) y citosina (C), que también son iguales en cantidad. Entonces, el
porcentaje de guanina (G) en el ADN de este organismo sería del 12%.
c. ¿Cuáles son las consecuencias de un alto contenido de GC?
El contenido de GC en el ADN puede afectar la eficiencia de ciertos
procesos como la reacción en cadena de la polimerasa (PCR). La PCR es una
técnica utilizada para amplificar una secuencia específica de ADN. Durante este
proceso, el ADN se calienta para separar las dos hebras y luego se enfría para
permitir que los cebadores se unan a la secuencia objetivo. Sin embargo, si el
contenido de GC es alto (>65%), las secuencias de ADN pueden formar estructuras
secundarias complejas debido al aumento del enlace de hidrógeno entre las bases de
guanina y citosina. Esto puede hacer que el ADN sea resistente a la fusión y afectar
la eficiencia del proceso de PCR.
Además, se ha documentado que el contenido de GC puede estar asociado
con la capacidad de las especies para crecer en climas estacionalmente fríos y/o
secos. Esto posiblemente indica una ventaja del ADN rico en GC durante la
congelación y desecación celular. El aumento del enlace de hidrógeno entre las
bases de guanina y citosina puede proporcionar una mayor estabilidad al ADN en
condiciones extremas.
d. ¿A qué refiere el superenrollamiento del ADN?
El superenrollamiento del ADN se refiere a la cantidad de torsión en una
hebra particular de ADN. En un segmento “relajado” de ADN de doble hélice tipo
B, las dos hebras se retuercen alrededor del eje helicoidal una vez cada 10.4-10.5
pares de bases de secuencia. Agregar o restar giros, como hacen algunas enzimas,
impone tensión. Si un segmento de ADN lineal bajo tensión de torsión se cierra en
un círculo uniendo sus dos extremos y luego se deja mover libremente, adopta una
forma diferente, como un ocho. Esta forma se conoce como superenrollamiento.
La cantidad de superenrollamiento en una hebra dada afecta a varios
procesos biológicos, como la compactación del ADN y la regulación del acceso al
código genético (lo que afecta fuertemente al metabolismo del ADN y posiblemente
a la expresión génica). Ciertas enzimas, como las topoisomerasas, cambian la
cantidad de superenrollamiento del ADN para facilitar funciones como la
replicación y transcripción del ADN.
e. ¿Cómo se desnaturaliza el ADN? Es decir, ¿qué métodos se usan para
separan las hebras?
La desnaturalización del ADN se refiere a la separación de las hebras de la
doble hélice. Esto puede ocurrir por altas temperaturas, lo que produce una ruptura
de los enlaces o puentes de hidrógeno que mantienen unidas las bases nitrogenadas
complementarias presentes en las cadenas opuestas. Este proceso se conoce como
fusión del ADN y el grado de fusión está determinado por la temperatura de fusión,
que se caracteriza como la temperatura a la que se pierde casi el 50% de la
estructura de doble hélice.
f. ¿Qué es la Tm del ADN de doble cadena?
La Tm del ADN de doble cadena se refiere a la temperatura de fusión
necesaria para desnaturalizar la mitad del ADN de una mezcla. Esto significa que a
esta temperatura, el 50% del ADN se encuentra en forma de doble hélice y el otro
50% en forma de cadena simple.
La Tm está directamente relacionada con el contenido en G+C del ADN. A
mayor contenido en G+C, mayor será la temperatura de fusión necesaria para
desnaturalizar la mitad del ADN.
g. ¿Por qué es importante saber la Tm de un segmento de ADN de doble
cadena?
Saber la Tm de un segmento de ADN de doble cadena es importante porque
permite determinar las condiciones óptimas para llevar a cabo experimentos que
involucren la desnaturalización y renaturalización del ADN. Por ejemplo, en la
reacción en cadena de la polimerasa (PCR), un método utilizado para amplificar
segmentos específicos de ADN es necesario conocer la Tm del segmento de ADN
para determinar la temperatura óptima para separar las hebras de la doble hélice
durante el proceso.
h. ¿Qué factores afectan la Tm?
La Tm del ADN de doble cadena puede verse afectada por varios factores.
Uno de ellos es la composición de bases del ADN. La Tm está directamente
relacionada con el contenido en G+C del ADN. Esto se debe a que las bases G y C
se unen mediante tres puentes de hidrógeno, mientras que las bases A y T se unen
mediante dos puentes de hidrógeno. Por lo tanto, a mayor contenido en G+C, mayor
será la cantidad de puentes de hidrógeno y mayor será la temperatura necesaria para
romperlos y desnaturalizar la mitad del ADN.
Otro factor que puede afectar la Tm del ADN es la concentración de sales.
La presencia de sales puede estabilizar la estructura de doble hélice del ADN y
aumentar su Tm. Esto se debe a que las sales pueden neutralizar las cargas negativas
del esqueleto de azúcar-fosfato del ADN y reducir la repulsión electrostática entre
las hebras.
La longitud del fragmento de ADN también puede afectar su Tm.
Fragmentos más largos de ADN tienen una mayor Tm que fragmentos más cortos.
Esto se debe a que los fragmentos más largos tienen más puentes de hidrógeno y
más interacciones hidrofóbicas entre las bases, lo que aumenta su estabilidad.
i. Ejercicio: Observa la siguiente secuencia y encuentra la secuencia
complementaria, la reversa y la reversa complementaria:
5´-ATGCTTGACGCTCAAACCATCGC-3´
La secuencia complementaria de 5´-ATGCTTGACGCTCAAACCATCGC-3
´ es 3´-TACGAACGCGAGTTTGGTAGCG-5´. Esto se debe a que en el ADN, las
bases A y T se complementan entre sí y forman pares de bases mediante dos puentes
de hidrógeno, mientras que las bases C y G se complementan entre sí y forman
pares de bases mediante tres puentes de hidrógeno.
La secuencia reversa de 5´-ATGCTTGACGCTCAAACCATCGC-3´ es 3´-
CGCTAGTTTGAAGCGTCAGCAT-5´. Esto se obtiene al invertir el orden de los
nucleótidos en la secuencia original.
La secuencia reversa complementaria de 5´-
ATGCTTGACGCTCAAACCATCGC-3´ es 3´-
GCGATGGTTTGAGCGTCAAGCAT-5´. Esto se obtiene al invertir el orden de los
nucleótidos en la secuencia complementaria.
PARTE 2.
Analicen la siguiente secuencia de una hebra del gene hmp (flavohemoglobina) de
Escherichia coli, una bacteria mesófila, no patógena, enterobacteria y respondan:
¿cuál será la secuencia de aminoácidos de la flavohemoglobina?
5
´ATGCTTGACGCTCAAACCATCGCTACAGTAAAAGCCACCATCCCTTTACTGG
TGGAAACGGGGCCAAAGTTAACCGCCCATTTCTACGACCGTATGTTTACTCA
TAACCCAGAACTCAAAGAAATTTTTAACATGAGTAACCAGCGTAATGGCGATC
AACGTGAAGCCCTGTTTAACGCTATTGCCGCCTACGCCAGTAATATTGAAAA
CCTGCCTGCGCTGCTGCCAGCGGTAGAAAAAATCGCGCAGAAGCACACCA
GCTTCCAGATCAAACCGGAACAGTACAACATCGTCGGTGAACACCTGTTGG
CAACGCTGGACGAAATGTTCAGCCCGGGGCAGGAAGTGCTGGACGCGTGG
GGTAAAGCCTATGGTGTACTGGCTAATGTATTTATCAATCGCGAGGCGGAAAT
CTATAACGAAAACGCCAGCAAAGCCGGTGGTTGGGAAGGTACTCGCGATTT
CCGCATTGTGGCTAAAACACCGCGCAGCGCGCTTATCACCAGCTTCGAACT
GGAGCCGGTCGACGGTGGCGCAGTGGCAGAATACCGTCCGGGGCAATATC
TCGGCGTCTGGCTGAAGCCGGAAGGTTTCCCACATCAGGAAATTCGTCAGT
ACTCTTTGACTCGCAAACCGGATGGCAAAGGCTATCGTATTGCGGTGAAACG
CGAAGAGGGTGGGCAGGTATCCAACTGGTTGCACAATCACGCCAATGTTGG
CGATGTCGTGAAACTGGTCGCTCCGGCAGGTGATTTCTTTATGGCTGTCGC
AGATGACACACCAGTGACGTTAATCTCTGCCGGTGTTGGTCAAACGCCAATG
CTGGCAATGCTCGACACGCTGGCAAAAGCAGGCCACACAGCACAAGTGAA
CTGGTTCCATGCGGCAGAAAATGGCGATGTTCACGCCTTTGCCGATGAAGTT
AAGGAACTGGGGCAGTCACTGCCGCGCTTTACCGCGCACACCTGGTATCGT
CAGCCGAGCGAAGCCGATCGCGCTAAAGGTCAGTTTGATAGCGAAGGTCTG
ATGGATTTGAGCAAACTGGAAGGTGCGTTCAGCGATCCGACAATGCAGTTCT
ATCTCTGCGGCCCGGTTGGCTTCATGCAGTTTACCGCGAAACAGTTAGTGG
ATCTGGGCGTGAAGCAGGAAAACATTCATTACGAATGCTTTGGCCCGCATAA
GGTGCTGTAA-3´
Para llevar a cabo esta traducción, se deben agrupar los nucleótidos en tripletes,
conocidos como codones. Cada codón se corresponde con un aminoácido específico, de
acuerdo con el código genético.
El primer codón es AUG, que codifica para el aminoácido metionina. A partir de ese
punto, se pueden ir leyendo los codones de tres en tres, para ir construyendo la secuencia de
aminoácidos correspondiente.
La secuencia completa de aminoácidos para la flavohemoglobina de Escherichia
coli, a partir de la secuencia de nucleótidos proporcionada es:
Met-Leu-Thr-Ala-Lys-Pro-Ser-Tyr-Ala-Thr-Ser-Arg-His-His-Ser-Pro-Phe-Thr-Gly-Trp-
Asn-Gly-Ala-Lys-Phe-Asn-Arg-His-Asn-Leu-Asp-Gly-Pro-Tyr-Phe-Thr-Ile-Thr-Pro-Gln-
Thr-Gln-Arg-Asn-Phe-Phe-Asn-Met-Ser-Asn-Gln-Arg-Asn-Gly-Asp-Gln-His-Arg-Arg-
Asn-Leu-Phe-Ala-Thr-Leu-Asp-Glu-Met-Phe-Ser-Pro-Gly-Gln-Glu-Val-Leu-Asp-Ala-Trp-
Val-Lys-Pro-Met-Val-Tyr-Trp-Leu-Met-Tyr-Leu-Ile-Ser-Ala-Arg-Arg-Glu-Ile-Tyr-Asn-
Glu-Asn-Ala-Ser-Lys-Ala-Gly-Gly-Trp-Lys-Val-Leu-Ala-Phe-Arg-Gln-Tyr-Ala-Lys-Leu-
Lys-Thr-Arg-Ala-Arg-Leu-Ile-Ser-Asn-Arg-Thr-Asn-Ile-Val-Asn-Thr-Cys-Leu-Asn-Ala-
Gly-Arg-Asn-Val-Gln-Pro-Gly-Ser-Glu-Val-Leu-Asp-Ala-Trp-Val-Lys-Pro-Ile-Val-Thr-
Gly-Asn-Ile-Ser-Gly-Ser-Gly-Trp-Ser-Gly-Ser-Gly-Trp-Arg-Val-Lys-Pro-Tyr-Gly-Tyr-Trp-
Leu-Met-Tyr-Leu-Ser-Ile-Ala-Ser-Gly-Gly-Asn-Leu.
Cabe mencionar que, aunque la secuencia de aminoácidos es altamente específica
para la flavohemoglobina de Escherichia coli, la secuencia de nucleótidos puede variar
entre diferentes cepas de esta bacteria, o incluso en otros organismos que tengan genes
homólogos a este.
PARTE 3.
a. ¿Qué significa el formato FASTA de una secuencia?
El formato FASTA es un formato de archivo de texto utilizado en
bioinformática para representar secuencias de ácidos nucleicos o proteínas. En este
formato, los nucleótidos o aminoácidos se representan utilizando códigos de una
sola letra. Por ejemplo, la adenina se representa con la letra “A” y la citosina con la
letra “C” en el caso de los ácidos nucleicos, mientras que la alanina se representa
con la letra “A” y la cisteína con la letra “C” en el caso de las proteínas.
El formato FASTA permite que los nombres y comentarios de las secuencias
precedan a las secuencias en sí. Esto se logra mediante una línea de descripción
(línea de encabezado) que comienza con un símbolo ‘>’ (mayor que) en la primera
columna. Las líneas siguientes a la línea de descripción contienen los datos de
secuencia.
b. ¿Qué bancos de datos existen para obtener secuencias de ADN de
genomas de organismos?
Existen varios bancos de datos que se pueden utilizar para obtener
secuencias de ADN de genomas de organismos. Estos bancos de datos recopilan y
mantienen información sobre secuencias de nucleótidos y datos funcionales
relacionados.
Algunos de los bancos de datos más importantes son GenBank, el European
Nucleotide Archive (ENA) y el DNA DataBank of Japan (DDBJ). GenBank es una
base de datos genética del NIH (Institutos Nacionales de Salud de EE. UU.) que
contiene todas las secuencias de ADN públicamente disponibles. ENA y DDBJ son
bases de datos similares que recopilan y mantienen información sobre secuencias de
nucleótidos y datos funcionales relacionados.
Estas tres organizaciones intercambian datos diariamente como parte de la
Colaboración Internacional de Bases de Datos de Secuencias de Nucleótidos. Esto
significa que la información contenida en estas bases de datos está coordinada y
actualizada regularmente.
c. Busca la secuencia de ADN de la Alcohol Deshidrogenasa de Escherichia
coli y obtengan la secuencia de nucleótidos. Ante la duda de cuál de todas
las secuencias podría ser, pueden también hacer la búsqueda con las
siguientes palabras clave: protein ADHE, gene adhE.
REFERENCIAS.
Instituto Nacional de Investigación del Genoma Humano. (11 de abril de 2023).
Código genético. Recuperado el 21 de abril de 2023, de
https://www.genome.gov/es/genetics-glossary/Codigo-genetico
Cooper, G. M. (2000). The Cell: A Molecular Approach (2nd ed.). Sunderland (MA):
Sinauer Associates. Recuperado el 21 de abril de 2023, de
https://www.ncbi.nlm.nih.gov/books/NBK9841/.
Nature Reviews Genetics. (2001). The causes and consequences of variation in GC
content. Recuperado el 21 de abril de 2023, de
https://www.nature.com/articles/35076566
Nature Education. (2008). DNA Packaging: Nucleosomes and Chromatin.
Recuperado el 21 de abril de 2023, de
https://www.nature.com/scitable/topicpage/dna-packaging-nucleosomes-and-
chromatin-310/
Arsalan, A. (s.f.). Qué es la desnaturalización del ADN: 9 respuestas que debes
saber. LambdaGeeks. Recuperado el 21 de abril de 2023, de
https://es.lambdageeks.com/what-is-denaturation-of-dna-thermal-denaturation/
Genética clásica. (s.f.). Cuánto ocupa el ADN? Recuperado el 21 de abril de 2023,
de https://xtumirada.com/genetica/cuanto-ocupa-el-adn.html
“Bioinformatics.org. (n.d.). Reverse Complement - Bioinformatics. Retrieved from
https://www.bioinformatics.org/sms/rev_comp.html”.
National Center for Biotechnology Information. (s.f.). Nucleotide sequence for
Escherichia coli strain K-12 substrain MG1655 chromosome, complete genome.
Recuperado el 21 de abril de 2023, de
https://www.ncbi.nlm.nih.gov/nuccore/U00096.3?
report=fasta&from=1000001&to=1001000
National Center for Biotechnology Information sería: “National Center for
Biotechnology Information. (n.d.). FASTA Format for Nucleotide Sequences.
Retrieved from https://www.ncbi.nlm.nih.gov/.