Ácido desoxirribonucleico
Estructura de un segmento de una doble hélice de ADN
El ácido desoxirribonucleico, frecuentemente abreviado ADN (y también DNA, del
inglés DeoxyriboNucleic Acid), es un ácido nucleico que contiene las instrucciones
genéticas usadas en el desarrollo y el funcionamiento de todos los organismos vivos
conocidos y algunos virus. El papel principal de las moléculas de ADN es el de ser
portador y transmisor entre generaciones de información genética. El ADN a menudo
es comparado a un manual de instrucciones, ya que este contiene las instrucciones
para construir otros componentes de las células, como moléculas de ARN y proteína.
Los segmentos de ADN que llevan esta información genética se llaman genes, pero
otras secuencias de ADN tienen funciones estructurales, o están implicadas en la
regulación del empleo de esta información genética.
Químicamente, el ADN es un largo polímero de unidades simples llamadas
nucleótidos, con un armazón hecho de azúcares y grupos de fosfato unidos
alternativamente entre sí mediante enlaces de tipo éster. Conectado a cada azúcar
está cada uno de los cuatro tipos de moléculas llamadas bases nitrogenadas. La
disposición secuencial de estas cuatro bases a lo largo de la cadena es la que codifica
la información. Esta información es leída usando el código genético, que especifica la
secuencia de los aminoácidos de las proteínas. El código es interpretado copiando los
tramos de ADN en un ácido nucleico relacionado, el ácido ribonucleico (ARN), en un
proceso llamado transcripción.
Dentro de las células, el ADN está organizado en estructuras llamadas cromosomas.
Estos cromosomas se duplican antes de que las células se dividan, en un proceso
llamado replicación de ADN. Los organismos Eukaryota (animales, plantas, y hongos)
almacenan la inmensa mayoría de su ADN dentro del núcleo celular y una mínima
parte en los ornánulos celulares mitocondrias, y en los cloroplastos en caso de
tenerlos; mientras que en procarióticas (las bacterias y archaeas) se encuentra en el
citoplasma de la célula. Las proteínas cromáticas como las histonas comprimen y
organizan el ADN dentro de los cromosomas. Estas estructuras compactas dirigen las
interacciones entre el ADN y otras proteínas, ayudando al control de las partes del
ADN que son transcritas.
Historia
El ADN fue aislado por primera vez en 1869, a partir del pus de vendas quirúrgicas
desechadas, por el médico suizo Friedrich Miescher.1 2 Lo llamó "nucleína" debido a su
participación en el núcleo celular. Se necesitaron casi 70 años de investigación para
poder identificar los componentes y la estructura de los ácidos nucléicos.
En 1919 Phoebus Levene identificó que un nucleótido está formado por una base, un
azúcar y un fosfato.3 Levene sugirió que el ADN consistía de un muelle de unidades de
nucleótidos unidos a través de los grupos fosfato. Sin embargo, Levene pensaba que
la cadena era corta y que las bases se repetían en un orden fijo. En 1937 William
Astbury produjo el primer patrón de difracción de rayos X que mostraba que el ADN
tenía una estructura regular. 4
En 1928, Frederick Griffith descubrió, empleando la bacteria Pneumococcus como
modelo, que un «factor transformante» era capaz de conferir virulencia a cepas
avirulentas.5 Más adelante, en 1944, Oswald Avery, Colin MacLeod y Maclyn McCarty
identificaron dicho factor transformante como ADN. 6 Finalmente, el papel del ADN en
la heredabilidad fue desvelado en 1952 mediante los experimentos de Alfred Hershey
y Martha Chase, en los cuales comprobaron que el fago T2 transmitía su información
genética en su ADN, y no en su proteína.7
En cuanto a la caracterización química de la molécula, Chargaff realizó algunos
experimentos que le sirvieron para establecer las proporciones de las bases
nitrogenadas en el ADN. Descubrió que las proporciones de purinas eran idénticas a
las de pirimidinas. Junto con los datos de difracción de rayos X proporcionados por
Rosalind Franklin, James Watson y Francis Crick propusieron en 1953 el modelo de la
doble hélice de ADN para representar la estructura tridimensional del polímero.8 En
una serie de cinco artículos en el mismo número de Nature, se publicó evidencia
experimental que apoyaba el modelo de Watson y Crick.9 De éstos, el paper de
Franklin y Raymond Gosling fue la primera publicación con datos de difracción de
rayos X que apoyaba el modelo de Watson y Crick, 10 11 y en dicho número de Nature
también aparecía un artículo sobre la estructura del ADN de Maurice Wilkins y sus
colegas.12
Propiedades físicas y químicas
Estructura química del ADN. Los puentes de hidrógeno aparecen como líneas
punteadas.
El ADN es un largo polímero formado por unidades repetitivas, los nucleótidos.15 16
Una doble cadena de ADN mide de 22 a 26 Ångströms (2,2 a 2,6 nanómetros) de
ancho, y una unidad (un nucleótido) mide 3,3 Å (0,33 nm) de largo.17 Aunque cada
unidad individual que se repite es muy pequeña, los polímeros de ADN pueden ser
moléculas enormes que contienen millones de nucleótidos. Por ejemplo, el cromosoma
humano más largo, el cromosoma número 1, tiene aproximadamente 220 millones de
pares de bases.18
En los organismos vivos, el ADN no suele existir como una molécula individual, sino
como una pareja de moléculas estrechamente asociadas. Las dos cadenas de ADN se
enroscan sobre sí mismas formando una especie de escalera de caracol, denominada
doble hélice. El modelo de estructura en doble hélice fue propuesto en 1953 por
James Watson y Francis Crick (el artículo Molecular Structure of Nucleic Acids: A
Structure for Deoxyribose Nucleic Acid fue publicado el 25 de abril de 1953 en
Nature).19 El éxito de éste modelo radicaba en su consistencia con las propiedades
físicas y químicas del ADN. El estudio mostraba además que la complementariedad de
bases podía ser relevante en su replicación, y también la importancia de la secuencia
de bases como portador de información genética.20 21 22 Cada unidad que se repite, el
nucleótido, contiene un segmento de la estructura de soporte (azúcar + fosfato), que
mantiene la cadena unida, y una base, que interacciona con la otra cadena de ADN en
la hélice. En general, una base ligada a un azúcar se denomina nucleósido y una base
ligada a un azúcar y a uno o más grupos fosfatos recibe el nombre de nucleótido.
Cuando muchos nucleótidos se encuentran unidos, como ocurre en el ADN, el
polímero resultante se denomina polinucleótido.23
Componentes
Estructura de soporte:
La estructura de soporte de una hebra de ADN está formada por unidades
alternas de grupos fosfato y azúcar.24
• Ácido fosfórico:
Enlace fosfodiéster. El grupo fosfato une el carbono 5' del azúcar de un nucleósido con
el carbono 3' de otro
Su fórmula química es H3PO4. Cada nucleótido puede contener uno (monofosfato:
AMP), dos (difosfato: ADP) o tres (trifosfato: ATP) grupos de ácido fosfórico, aunque
como monómeros constituyentes de los ácidos nucléicos sólo aparecen en forma de
nucleósidos monofosfato.
Desoxirribosa:
Es un monosacárido de 5 átomos de carbono (una pentosa) derivado de la ribosa, que
forma parte de la estructura de nucleótidos del ADN. Su fórmula es C5H10O4. Una de
las principales diferencias entre el ADN y el ARN es el azúcar, pues en el ARN la 2-
desoxirribosa del ADN es reemplazada por una pentosa alternativa, la ribosa.22
Las moléculas de azúcar se unen entre sí a través de grupos fosfato, que forman
enlaces fosfodiéster entre los átomos de carbono tercero (3′, «tres prima») y quinto (5′,
«cinco prima») de dos anillos adyacentes de azúcar. La formación de enlaces
asimétricos implica que cada hebra de ADN tiene una dirección. En una doble hélice,
la dirección de los nucleótidos en una hebra (3′ → 5′) es opuesta a la dirección en la
otra hebra (5′ → 3′). Esta organización de las hebras de ADN se denomina
antiparalela; son cadenas paralelas, pero con direcciones opuestas. De la misma
manera, los extremos asimétricos de las hebras de ADN se denominan extremo 5′
(«cinco prima») y extremo 3′ («tres prima») respectivamente.
Bases nitrogenadas:
Las cuatro bases nitrogenadas mayoritarias que se encuentran en el ADN son la
adenina (abreviado A), citosina (C), guanina (G) y timina (T). Cada una de estas cuatro
bases está unida al armazón de azúcar-fosfato a través del azúcar para formar el
nucleótido completo (base-azúcar-fosfato). Las bases son compuestos heterocíclicos y
aromáticos con dos o más átomos de nitrógeno, y, dentro de las bases mayoritarias,
se clasifican en dos grupos: las bases púricas o purinas (adenina y guanina),
derivadas de la purina y formadas por dos anillos unidos entre sí, y las bases
pirimidínicas o pirimidinas (citosina y timina), derivadas de la pirimidina y con un solo
anillo .22 En los ácidos nucléicos existe una quinta base pirimidínica, denominada
uracilo (U), que normalmente ocupa el lugar de la timina en el ARN y difiere de ésta en
que carece de un grupo metilo en su anillo. El uracilo no se encuentra habitualmente
en el ADN, sólo aparece raramente como un producto residual de la degradación de la
citosina por procesos de desaminación oxidativa.
Timina: 2, 4-dioxo, 5-metilpirimidina
Timina:
En el código genético se representa con la letra T. Es un derivado pirimidínico con un
grupo oxo en las posiciones 2 y 4, y un grupo metil en la posición 5. Forma el
nucleósido timidina (siempre desoxitimidina ya que sólo aparece en el ADN) y el
nucleótido timidilato o timidina monofosfato (dTMP). En el ADN, la timina siempre se
empareja con la adenina de la cadena complementaria mediante 2 puentes de
hidrógeno, T=A. Su fórmula química es C5H6N2O2 y su nomenclatura 2, 4-dioxo, 5-
metilpirimidina.
Citosina: 2-oxo, 4-aminopirimidina
Citosina:
En el código genético se representa con la letra C. Es un derivado pirimidínico, con un
grupo amino en posición 4 y un grupo oxo en posición 2. Forma el nucleósido citidina
(desoxicitidina en el ADN) y el nucleótido citidilato o (desoxi)citidina monofosfato
(dCMP en el ADN, CMP en el ARN). La citosina siempre se empareja en el ADN con la
guanina de la cadena complementaria mediante un triple enlace, C≡G. Su fórmula
química es C4H5N3O y su nomenclatura 2-oxo, 4 aminopirimidina. Su masa molecular
es de 111,10 unidades de masa atómica. La citosina fue descubierta en 1894 cuando
fue aislada en tejido del timo de carnero.
Adenina: 6-aminopurina
Adenina:
En el código genético se representa con la letra A. Es un derivado de la purina con un
grupo amino en la posición 6. Forma el nucleósido adenosina (desoxiadenosina en el
ADN) y el nucleótido adenilato o (desoxi)adenosina monofosfato (dAMP, AMP). En el
ADN siempre se empareja con la timina de la cadena complementaria mediante 2
puentes de hidrógeno, A=T. Su fórmula química es C5H5N5 y su nomenclatura 6-
aminopurina. La adenina, junto con la timina, fue descubierta en 1885 por el médico
alemán Albrecht Kossel.
Guanina: 6-oxo, 2-aminopurina
Guanina:
En el código genético se representa con la letra G. Es un derivado púrico con un grupo
oxo en la posición 6 y un grupo amino en la posición 2. Forma el nucleósido
(desoxi)guanosina y el nucleótido guanilato o (desoxi)guanosina monofosfato (dGMP,
GMP). La guanina siempre se empareja en el ADN con la citosina de la cadena
complementaria mediante tres enlaces de hidrógeno, G≡C. Su fórmula química es
C5H5N5O y su nomenclatura 6-oxo, 2-aminopurina.
También existen otras bases nitrogenadas, las llamadas bases nitrogenadas
minoritarias, derivadas de forma natural o sintética de alguna otra base mayoritaria. Lo
son por ejemplo la hipoxantina, relativamente abundante en el tRNA, o la cafeína,
ambas derivadas de la adenina; otras, como el aciclovir, derivadas de la guanina , son
análogos sintéticos usados en terapia antiviral; otras, como una de las derivadas del
uracilo, son antitumorales.
Las bases nitrogenadas tienen una serie de características que les confieren unas
propiedades determinadas. Una característica importante es su carácter aromático,
consecuencia de la presencia en el anillo de dobles enlaces en posición conjugada.
Ello les confiere la capacidad de absorber luz en la zona ultravioleta del espectro en
torno a los 260 nm, lo cual puede ser aprovechado para determinar el coeficiente de
extinción del ADN y hallar la concentración existente de los ácidos nucléicos. Otra de
sus características es que presentan tautomería o isomería de grupos funcionales
debido a que un átomo de hidrógeno unido a otro átomo puede migrar a una posición
vecina; en las bases nitrogenadas se dan dos tipos de tautomerías: tautomería
lactama-lactima, donde el hidrógeno migra del nitrógeno al oxígeno del grupo oxo
(forma lactama) y viceversa (forma lactima), y tautomería imina-amina primaria, donde
el hidrógeno puede estar formando el grupo amina (forma amina primaria) o migrar al
nitrógeno adyacente (forma imina). La adenina sólo puede presentar tautomería amina
imina, la timina y el uracilo muestran tautomería doble lactama-lactima, y la guanina y
citosina pueden presentar ambas. Por otro lado, y aunque se trate de moléculas
apolares, las bases nitrogenadas presentan suficiente carácter polar como para
establecer puentes de hidrógeno, ya que tienen átomos muy electronegativos
(nitrógeno y oxígeno) presentando carga parcial negativa, y átomos de hidrógeno con
carga parcial positiva, de manera que se forman dipolos que permiten que se formen
estos enlaces débiles.
Se estima que el genoma humano haploide tiene alrededor de 3.000 millones de pares
de bases. Para indicar el tamaño de las moléculas de ADN se indica el número de
pares de bases, y como derivados hay dos unidades de medida muy utilizadas, la
kilobase (kb) que equivale a 1.000 pares de bases, y la megabase (Mb) que equivale a
un millón de pares de bases.
Apareamiento de bases
Un par de bases GC con tres puentes de hidrógeno.
Un par AT con dos puentes de hidrógeno. Los puentes de hidrógeno se muestran
como líneas discontinuas.
La dóble hélice de ADN se mantiene estable mediante la formación de puentes de
hidrógeno entre las bases asociadas a cada una de las dos hebras. Para la formación
de un enlace de hidrógeno una de las bases debe presentar un "donador" de
hidrógenos con un átomo de hidrógeno con carga parcial positiva (-NH2 o -NH) y la
otra base debe presentar un grupo "aceptor" de hidrógenos con un átomo cargado
electronegativamente (C=O o N). Los nucleótidos de cada una de las dos cadenas que
forman el ADN establecen una asociación específica mediante puentes de hidrógeno
con los correspondientes de la otra cadena. Cada tipo de base en una hebra forma un
enlace únicamente con un tipo de base en la otra hebra, lo que se denomina
"complementariedad de las bases". Según esto, las purinas forman enlaces con las
pirimidinas, de forma que A se enlaza sólo con T, y C sólo con G. La organización de
dos nucleótidos apareados a lo largo de la doble hélice se denomina apareamiento de
bases. Este emparejamiento corresponde a la observación ya realizada por Erwin
Chargaff (1905-2002),25 que mostró que la cantidad de adenina era muy similar a la
cantidad de timina, y que la cantidad de citosina era igual a la cantidad de guanina en
el ADN. Esta observación permitió establecer la hipótesis de que una purina siempre
mostraba afinidad con una pirimidina. La doble hélice se estabiliza además por el
efecto hidrofóbico y el apilamiento que no están influenciados por la secuencia de
bases del ADN.26 Como los puentes de hidrógeno no son enlaces covalentes, pueden
romperse y formarse de nuevo de forma relativamente sencilla. Por esta razón las dos
hebras de la doble hélice pueden separarse como una cremallera, bien por fuerza
mecánica o alta temperatura.27 Como resultado de esta complementariedad, toda la
información contenida en la secuencia de doble hebra de la hélice de ADN está
duplicada en cada hebra, lo cual es fundamental durante el proceso de replicación del
ADN. En efecto, esta interacción reversible y específica entre pares de bases
complementarias es crítica para todas las funciones del ADN en los organismos
vivos.15
Los dos tipos de pares de bases forman un número diferente de pares de hidrógeno:
AT forman dos puentes de hidrógeno, y GC forman tres puentes de hidrógeno (ver
imágenes). El par de bases GC es por tanto más fuerte que el par de bases AT. Como
consecuencia, tanto el porcentaje de pares de bases GC como la longitud total de la
doble hélice de ADN determinan la fuerza de la asociación entre las dos hebras de
ADN. Dobles hélices largas de ADN con alto contenido en GC tienen hebras que
interaccionan más fuerte que dobles hélices cortas con alto contenido en AT.28 En
biología, partes de la doble hélice de ADN que necesitan separarse fácilmente, como
la TATAAT Pribnow box en algunos promotores, tienden a tener un alto contenido en
AT, lo que permite que las hebras se separen más fácilmente.29 En el laboratorio, la
fuerza de esta interacción puede medirse, buscando la temperatura requerida para
romper los puentes de hidrógeno, la temperatura de fusión (también denominado valor
Tm, del inglés melting temperature). Cuando todas las pares de bases en una doble
hélice se funden, las hebras se separan en solución en dos hebras completamente
independientes. Estas moléculas de ADN de hebra simple no tienen una única forma
común, sino que algunas conformaciones son más estables que otras.30
Otros tipos de pares de bases
Par de bases A=T de tipo Watson-Crick. En azul el donador de hidrógenos y en rojo el
aceptor.
Par de bases A=T de tipo Watson-Crick reverso. En azul el donador de hidrógenos y
en rojo el aceptor. Nótese que la pirimidina ha sufrido un giro de 180º sobre el eje del
carbono 6.
Existen diferentes tipos de pares de bases que se pueden formar según cómo se
forman los puentes de hidrógeno. Los que se forman en la doble hélice de ADN son
los llamados pares de bases Watson-Crick, pero también existen otros posibles pares
de bases, como los denominados Hoogsteen y Wobble (oscilante) que pueden
aparecer en determinadas circunstancias. Además, para cada tipo existe a su vez el
mismo par reverso, es decir, el que se da si giramos la base pirimidínica 180º sobre su
eje.
Watson-Crick (pares de bases de la doble hélice): los grupos de la base púrica que
intervienen en el enlace de hidrógeno son los que corresponden a las posiciones 1 y 6
(N aceptor y -NH2 donador si la purina es una A) y los grupos de la base pirimidínica
los que se encuentran en las posiciones 3 y 4 (-NH donador y C=O aceptor si la
pirimidina es una T). En el par de bases Watson-Crick reverso participarían los grupos
de las posiciones 2 y 3 de la base pirimidínica (ver imágenes).
Hoogsteen: en este caso cambian los grupos de la base púrica, que ofrece una cara
diferente (posiciones 6 y 7) y que forman enlaces con los grupos de las pirimidinas de
las posiciones 3 y 4 (como en Watson-Crick). También puede haber Hoogsteen
reversos. Con este tipo de enlace pueden unirse A=U (Hoogsteen y Hoogsteen
reverso) y A=C (Hoogsteen reverso).
Wobble u oscilante: este tipo de enlace permite que se unan guanina y citosina con un
doble enlace (G=T). La base púrica (G) forma enlace con los grupos de las posiciones
1 y 6 (como en Watson-Crick) y la pirimidina (T) con los grupos de las posiciones 2 y 3.
Este tipo de enlace no funcionaría con A=C, ya que quedarían enfrentados los 2
aceptores y los 2 donadores, sólo se podría dar en el caso reverso. Encontramos
pares de bases de tipo oscilante en el ARN, durante el apareamiento de codón y
anticodón. Con este tipo de enlace pueden unirse G=U (oscilante y oscilante reverso)
y A=C (oscilante reverso).
En total, en su forma tautomérica mayoritaria, existen 28 posibles pares de bases
nitrogenadas: 10 posibles pares de bases purina-pirimidina (2 pares Watson-Crick y 2
Watson Crick reverso, 1 par Hoogsteen y 2 pares Hoogsteen reverso, 1 par oscilante y
2 pares oscilante reverso); 7 pares homo purina-purina (A=A, G=G); 4 pares A=G; 7
pares pirimidina-pirimidina. Sin contar con los pares de bases que pueden formarse si
también tenemos en cuenta las otras formas tautoméricas minoritarias de las bases
nitrogenadas; éstos, además, pueden ser responsables de mutaciones puntuales por
sustitución de tipo transición.
Puentes de hidrógeno
La adhesión de las dos hebras de ácido nucleico se debe a un tipo de unión química
conocido como enlace de hidrógeno o puente de hidrógeno. Los puentes de hidrógeno
son uniones más débiles que los típicos enlaces químicos covalentes, tales como los
que conectan los átomos en cada hebra de ADN, pero más fuertes que interacciones
hidrófobas individuales, enlaces de Van der Waals, etc... El hecho que las hebras de la
hélice de ADN estén unidas mediante puentes de hidrógeno hace que éstas puedan
separarse entre sí con relativa facilidad, por ejemplo mediante un incremento de la
temperatura, quedando intactas en sus componentes. La fortaleza relativa de la unión
entre las dos hebras del ADN reside en la suma de gran cantidad de enlaces de
hidrógeno a lo largo de las dos hebras paralelas. Se forman dos enlaces de hidrógeno
por cada unión A=T y tres por cada emparejamiento C≡G.
Estructura
El ADN es una molécula bicatenaria; es decir: está formada por dos cadenas
dispuestas de forma antiparalela y con las bases nitrogenadas enfrentadas. En su
estructura tridimensional, se distinguen distintos niveles:
Estructura primaria:
Secuencia de nucleótidos encadenados. Es en estas cadenas donde se encuentra la
información genética, y dado que el esqueleto es el mismo para todos, la diferencia de
la información radica en la distinta secuencia de bases nitrogenadas. Esta secuencia
presenta un código, que determina una información u otra, según el orden de las
bases.
Estructura secundaria:
Es una estructura en doble hélice. Permite explicar el almacenamiento de la
información genética y el mecanismo de duplicación del ADN. Fue postulada por
Watson y Crick, basándose en: primero, la difracción de rayos X que habían realizado
Franklin, Wilkins; y segundo,la equivalencia de bases de Chargaff, que dice que la
suma de adeninas más guaninas es igual a la suma de timinas más citosinas.
Es una cadena doble, dextrógira o levógira según el tipo de ADN. Ambas cadenas son
complementarias, pues la adenina de una se une a la timina de la otra, y la guanina de
una a la citosina de la otra. Ambas cadenas son antiparalelas, pues el extremo 3´ de
una se enfrenta al extremo 5´ de la otra.
Existen tres modelos de ADN. El ADN de tipo B es el más abundante y es el
descubierto por Watson y Crick.
Estructura terciaria
Se refiere a como se almacena el ADN en un volumen reducido. Varía según se trate
de organismos procariotas o eucariotas:
En procariotas: se pliega como una súper-hélice en forma, generalmente, circular y
asociada a una pequeña cantidad de proteínas. Lo mismo ocurre en la mitocondrias y
en los cloroplastos.
En eucariotas: el empaquetamiento ha de ser más complejo y compacto y para esto se
necesita la presencia de proteínas, como son las histonas y otras de naturaleza no
histónica (en los espermatozoides estas proteínas son las protaminas ).
Estructuras en doble hélice
De izquierda a derecha, las estructuras de ADN A, B y Z
El ADN existe en muchas conformaciones.24 Sin embargo, en organismos vivos sólo
se han observado las conformaciones ADN-A, ADN-B y ADN-Z. La conformación que
adopta el ADN depende de su secuencia, la cantidad y dirección de
superenrrollamiento que presenta, la presencia de modificaciones químicas en las
bases y las condiciones de la solución, tales como la concentración de iones de
metales y poliaminas.31 De las tres conformaciones, la forma "B" es la más común en
las condiciones existentes en las células.32 Las dos dobles hélices alternativas del
ADN difieren en su geometría y dimensiones.
La forma "A" es una espiral que gira hacia la derecha más amplia que la "B", con una
hendidura menor superficial y más amplia, y una hendidura mayor más estrecha y
profunda. La forma "A" ocurre en condiciones no fisiológicas en formas deshidratadas
de ADN, mientras que en la célula puede producirse en apareamientos híbridos de
hebras ADN-ARN, además de en complejos enzima-ADN.33 34
Segmentos de ADN en los que las bases han sido modificadas por metilación pueden
sufrir cambios conformacionales mayores y adoptar la forma "Z". En este caso, las
hebras giran alrededor del eje de la hélice en una espiral que gira a mano izquierda, lo
opuesto a la forma "B" más frecuente.35 Estas estructuras poco frecuentes pueden ser
reconocidas por proteínas específicas que se unen a ADN-Z y pueden estar
implicadas en la regulación de la transcripción.36
Estructuras en cuádruplex
Estructura de un ADN en cuádruplex formada por repeticiones en los telómeros. La
conformación de la estructura de soporte del ADN difiere significativamente de la típica
estructura en hélice.37
En los extremos de los cromosomas lineales existen regiones especializadas de ADN
denominadas telómeros. La función principal de estas regiones es permitir a la célula
replicar los extremos cromosómicos utilizando la enzima telomerasa, puesto que las
enzimas que replican el resto del ADN no pueden copiar los extremos 3' de los
cromosomas.38 Estas terminaciones cromosómicas especializadas también protegen
los extremos del ADN, y previenen que los sistemas de reparación del ADN en la
célula los procesen como ADN dañado que debe ser corregido.39 En las células
humanas, los telómeros son largas zonas de ADN de hebra sencilla que contienen
algunos miles de repeticiones de una única secuencia TTAGGG.40
Estas secuencias ricas en guanina pueden estabilizar los extremos cromosómicos
mediante la formación de estructuras de juegos apilados de unidades de cuatro bases,
en lugar de los pares de bases encontrados normalmente en otras estructuras de
ADN. En este caso, cuatro bases guanina forman unidades con superficie plana que
se apilan una sobre otra, para formar una estructura cuádruplex-G estable.41 Estas
estructuras se estabilizan formando puentes de hidrógeno entre los extremos de las
bases y la quelatación de un metal iónico en el centro de cada unidad de cuatro
bases.42 También se pueden formar otras estructuras, con el juego central de cuatro
bases procedente de bien una hebra sencilla plegada alrededor de las bases, o bien
de varias hebras paralelas diferentes, de forma que cada una contribuye una base a la
estructura central.
Además de estas estructuras apiladas, los telómeros también forman largas
estructuras en lazo, denominadas lazos teloméricos o lazos-T (T-loops en inglés). En
este caso, las hebras simples de ADN se enroscan sobre sí mismas en un amplio
círculo estabilizado por proteínas que se unen a telómeros.43 En el extremo del lazo-T,
el ADN telomérico de hebra sencilla se sujeta a una región de ADN de doble hebra
porque la hebra de ADN telomérico altera la doble hélice y se aparea a una de las dos
hebras. Esta estructura de triple hebra se denomina lazo de desplazamiento o lazo-D
(D-loop).41
Hendiduras mayor y menor
Animación de la estructura de una sección de ADN. Las bases se encuentran
horizontalmente entre las dos hebras en espiral. Versión ampliada44
Doble hélice: a) Dextrógira, b) Levógira
La doble hélice es una espiral dextrógira, esto es, cada una de las cadenas de
nucleótidos gira a derechas; esto puede verificarse si nos fijamos, yendo de abajo a
arriba, en la dirección que siguen los segmentos de las hebras que quedan en primer
plano. Si las dos hebras giran a derechas se dice que la doble hélice es dextrógira, y si
giran a izquierdas, levógira (esta forma puede aparecer en hélices alternativas debido
a cambios conformacionales en el ADN). Pero en la conformación más común que
adopta el ADN, la doble hélice es dextrógira, girando cada par de bases respecto al
anterior unos 36º.45
Cuando las dos hebras de ADN se enrollan una sobre la otra (sea a derechas o a
izquierdas), se forman huecos o hendiduras entre una hebra y la otra, dejando
expuestos los laterales de las bases nitrogenadas del interior (ver la animación). En la
conformación más común que adopta el ADN, aparecen, como consecuencia de los
ángulos formados entre los azúcares de ambas cadenas de cada par de bases
nitrogenadas, dos tipos de hendiduras alrededor de la superficie de la doble hélice:
una de ellas, la hendidura o surco mayor, que mide 22 Å (2,2 nm) de ancho, y la otra,
la hendidura o surco menor, que mide 12 Å (1,2 nm) de ancho.46 . Cada vuelta de
hélice, que es cuando ésta ha realizado un giro de 360º o lo que es lo mismo, de
principio de hendidura mayor a final de hendidura menor, medirá por tanto 34 Å, y en
cada una de esas vueltas hay unos 10,5 pb.
Hendiduras mayor y menor de la doble hélice.
La anchura de la hendidura mayor implica que los extremos de las bases son más
accesibles en ésta, de forma que la cantidad de grupos químicos expuestos también
es mayor lo cual facilita la diferenciación entre los pares de bases A-T, T-A, C-G, G-C.
Como consecuencia de ello, también se verá facilitado el reconocimiento de
secuencias de ADN por parte de diferentes proteínas sin la necesidad de abrir la doble
hélice. Así, proteínas como los factores de transcripción que pueden unirse a
secuencias específicas, frecuentemente contactan con los laterales de las bases
expuestos en la hendidura mayor.47 Por el contrario, los grupos químicos que quedan
expuestos en la hendidura menor son similares de forma que el reconocimiento de los
pares de bases es más difícil: por ello se dice que la hendidura mayor contiene mucha
información y la hendidura menor poca.45
Sense y antisense
Una secuencia de ADN se denomina sense (en español, sentido) si su secuencia es la
misma que la secuecia de un ARN mensajero que se traduce en una proteína. La
secuencia de la hebra de ADN complementaria se denomina antisense (antisentido).
En diferentes zonas de una hebra de ADN pueden existir tanto secuencias sense
como antisense (es decir, ambas hebras contienen secuencias sense y antisense).
Tanto en procariotas como en eucariotas se producen ARNs con secuencias
antisense, pero la función de esos ARNs no está completamente clara.48 Se ha
propuesto que los ARNs antisense están implicados en la regulación de la expresión
génica mediante apareamiento ARN-ARN.49
En unas pocas secuencias de ADN en procariotas y eucariotas (este hecho es más
frecuente en plásmidos y virus), la distinción entre hebras sense y antisense es más
difusa, debido a que tienen genes superpuestos.50 En estos casos, algunas
secuencias de ADN tienen una función doble, codificando una proteína cuando se lee
a lo largo de una hebra, y una segunda proteína cuando se lee en la dirección
contraria a lo largo de la otra hebra. En bacterias, esta superposición puede estar
involucrada en la regulación de la transcripción del gen,51 mientras que en virus, los
genes superpuestos aumentan la cantidad de información que puede codificarse en el
diminuto genoma viral.52
Superenrollamiento
El ADN puede retorcerse como una cuerda en un proceso que se denomina
superenrollamiento del ADN («supercoiling», en inglés). Cuando el ADN está en un
estado "relajado", una hebra normalmente gira alrededor del eje de la doble hélice una
vez cada 10.4 pares de bases, pero si el ADN está retorcido las hebras pueden estar
unidas bien más estrechamente o más relajadamente.53 Si el ADN está retorcido en la
dirección de la hélice, éste es un superenrollamiento positivo, y las bases se
mantienen juntas de forma más estrecha. Si el ADN se retuerce en la dirección
opuesta, éste es un superenrollamiento negativo, y las bases se alejan. En la
Naturaleza, la mayor parte del ADN tiene un ligero superenrollamiento negativo que es
producido por enzimas denominadas topoisomerasas.54 Estas enzimas también son
necesarias para liberar las fuerzas de torsión introducidas en las hebras de ADN
durante procesos como la transcripción y la replicación.55
Modificaciones químicas
citosina 5-metil-citosina timina
Estructura de la citosina con y sin el grupo metilo. Tras la des[amina]]ción, la 5-metil-
citosina tiene la misma estructura que la timina
Modificaciones de bases
La expresión de los genes está influenciada por la forma en la que el ADN está
empaquetado en cromosomas, en una estructura denominada cromatina. Las
modificaciones de bases pueden estar implicadas en el empaquetamiento del ADN: las
regiones que presentan una expresión génica baja o nula normalmente contienen
niveles altos de metilación de las bases citosina. Por ejemplo, la metilación de citosina
produce 5-metil-citosina, que es importante para la inactivación del cromosoma X.56 El
nivel medio de metilación varía entre organismos: el gusano Caenorhabditis elegans
carece de metilación de citosina, mientras que los vertebrados presentan un nivel alto -
hasta 1% de su ADN contiene 5-metil-citosina.57 A pesar de la importancia de la 5-
metil-citosina, ésta puede desaminarse para generar una base timina. Las citosinas
metiladas son por tanto particularmente sensibles a mutaciones.58 Otras
modificaciones de bases incluyen la mutilación de adenina en bacterias y la
glicosilación de uracilo para producir la "base-J" en kinetoplastos.59 60
Daño del ADN
Benzopireno, el mayor mutágeno del tabaco, unido al ADN61
El ADN puede resultar dañado por muchos tipos de mutágenos, que cambian la
secuencia del ADN: agentes alquilantes, además de radiación electromagnética de
alta energía, como luz ultravioleta y rayos X. El tipo de daño producido en el ADN
depende del tipo de mutágeno. Por ejemplo, la luz UV puede dañar al ADN
produciendo dímeros de timina, que se forman por ligamiento cruzado entre bases
pirimidínicas.62 Por otro lado, oxidantes tales como radicales libres o el peróxido de
hidrógeno producen múltiples daños, incluyendo modificaciones de bases, sobre todo
guanina, y roturas de doble hebra (double-strand breaks).63 En una célula humana
cualquiera, alrededor de 500 bases sufren daño oxidativo cada día.64 65 De estas
lesiones oxidativas, las más peligrosas son las roturas de doble hebra, ya que son
difíciles de reparar y pueden producir mutaciones puntuales, inserciones y deleciones
de la secuencia de ADN, así como translocaciones cromosómicas.66
Muchos mutágenos se posicionan entre dos pares de bases adyacentes, por lo que se
denominan agentes intercalantes. La mayoría de los agentes intercalantes son
moléculas aromáticas y planas, como el bromuro de etidio, la daunomicina, la
doxorubicina y la talidomida. Para que un agente intercalante pueda integrarse entre
dos pares de bases, éstas deben separarse, distorsionando las hebras de ADN y
abriendo la doble hélice. Esto inhibe la transcripción y la replicación del ADN,
causando toxicidad y mutaciones. Por ello, los agentes intercalantes del ADN son a
menudo carcinógenos: el benzopireno, las acridinas, la aflatoxina y el bromuro de
etidio son ejemplos bien conocidos.67 68 69 Sin embargo, debido a su capacidad para
inhibir la replicación y la transcripción del ADN, estas toxinas también se utilizan en
quimioterapia para inhibir la rápida expansión de las células cancerosas.70
Funciones biológicas
El ADN se puede considerar como un almacén de información (mensaje) que contiene
toda la información necesaria para construir y sostener el organismo en el que reside,
y que se transmite de generación en generación. El conjunto de información que
cumple esta función en un organismo dado se denomina genoma, y el ADN que lo
constituye, ADN genómico.
El ADN genómico (que se organiza en moléculas de cromatina que a su vez se
ensamblan en cromosomas) se encuentra en el núcleo celular de los eucariotas,
además de pequeñas cantidades en las mitocondrias y cloroplastos. En procariotas, el
ADN se encuentra en un cuerpo de forma irregular denominado nucleoide.71
- El ADN codificante
ARN polimerasa T7 (azul) produciendo un ARNm (verde) a partir de un molde de ADN
(naranja).72
Véase también: Gen
La información genética de un genoma está contenida en los genes, y al conjunto de
toda la información que corresponde a un organismo se le denomina su genotipo. Un
gen es una unidad de herencia y es una región de ADN que influye en una
característica particular de un organismo (como el color de ojos, por ejemplo). Los
genes contienen un "marco de lectura abierto" (open reading frame) que puede
transcribirse, además de secuencias reguladoras, tales como promotores y enhancers,
que controlan la transcripción del marco de lectura abierto.
Desde este punto de vista, las obreras de este mecanismo son las proteínas. Estas
pueden ser estructurales como las proteínas de los músculos, cartílagos, pelo, etc., o
bien funcionales como la hemoglobina, o las innumerables enzimas del organismo. La
función principal de la herencia es la especificación de las proteínas, siendo el ADN
una especie de plano o receta para producirlas. Unas veces la modificación del ADN
provoca la disfunción proteica, generando lo que llamamos enfermedad; otras veces,
las modificaciones darán lugar a cambios beneficiosos, lo que conocemos como
evolución.
Las alrededor de treinta mil proteínas diferentes en el cuerpo humano están
constituidas por veinte aminoácidos diferentes, y una molécula de ADN debe
especificar la secuencia en que se unen dichos aminoácidos.
En el proceso de elaborar una proteína, el ADN de un gen se lee y se transcribe a
ARN. Este ARN sirve como mensajero entre el ADN y la maquinaria que elaborará las
proteínas y por eso recibe el nombre de ARN mensajero o ARNm. El ARN mensajero
sirve de molde a la maquinaria que elabora las proteínas, para que ensamble los
aminoácidos en el orden preciso para armar la proteína.
El dogma central de la biología molecular establece que el flujo de actividad y de
información es: ADN → ARN → proteína.
En la actualidad se supone que este "dogma" debe ser ampliado, pues se han
encontrado otros flujos de información: en algunos organismos (virus de ARN) la
información fluye de ARN a ADN; este proceso se conoce como "transcripción inversa
o reversa", también llamada "retrotranscripción". Adicionalmente, se sabe que existen
secuencias de ADN que se transcriben a ARN y son funcionales como tales, sin llegar
a traducirse nunca a proteína: son los ARN no codificantes, como es el caso de los
ARN interferentes.
- El ADN no codificante ("ADN basura")
El ADN en el genoma de un organismo podría dividirse conceptualmente en dos, el
que codifica las proteínas (los genes) y el que no codifica. En muchas especies, sólo
una pequeña fracción del genoma codifica proteínas. Por ejemplo, sólo alrededor del
1.5% del genoma humano consiste de exones que codifican proteínas, mientras que
más del 50% consiste de ADN no codificante.73
El ADN no codificante (también denominado ADN basura o junk DNA) corresponde a
secuencias del genoma que no generan una proteína (procedentes de
transposiciones, duplicaciones, translocaciones y recombinaciones de virus, etc.),
incluyendo los intrones. Corresponde a más del 90% de nuestro genoma, que cuenta
con 20.000 ó 25.000 genes. Inicialmente se pensaba que el ADN no codificante no
tenía utilidad alguna, pero distintos estudios recientes apuntan a la inexactitud de esta
hipótesis. Entre otras funciones, se postula que el llamado "ADN basura" regula la
expresión diferencial de los genes.74 Por ejemplo, algunas secuencias tienen afinidad
hacia proteínas especiales que tienen la capacidad de unirse al ADN (como los
homeodominios, los complejos receptores de hormonas esteroides, etc.), con un papel
importante en el control de los mecanismos de trascripción y replicación. Estas
secuencias se llaman frecuentemente "secuencias reguladoras", y los investigadores
asumen que sólo se ha identificado una pequeña fracción de las que realmente
existen. La presencia de tanto ADN no codificante en genomas eucarióticos y las
diferencias en tamaño del genoma entre especies representan un misterio que es
conocido como el "enigma del valor de C".75
Por otro lado, algunas secuencias de ADN desempeñan un papel estructural en los
cromosomas: los telómeros y centrómeros contienen pocos o ningún gen codificante
de proteínas, pero son importantes para estabilizar la estructura de los cromosomas.
Algunos genes no codifican proteínas, pero sí se transcriben en ARN: ARN
ribosómico, ARN de transferencia, ARN de interferencia (ARNi, que son ARN que
bloquean la expresión de genes específicos). La estructura de intrones y exones de
algunos genes (como los de inmunoglobulinas y protocadherinas) son importantes por
permitir cortes y empalmes alternativos del pre-ARN mensajero que hacen posible la
síntesis de diferentes proteínas a partir de un mismo gen (sin esta capacidad no
existiría el sistema inmune, por ejemplo). Algunas secuencias de ADN no codificante
representan pseudogenes que tienen valor evolutivo ya que permiten la creación de
nuevos genes con nuevas funciones. Otros ADN no codificantes proceden de la
duplicación de pequeñas regiones del ADN; esto tiene mucha utilidad ya que el rastreo
de estas secuencias repetitivas permite estudios sobre el linaje humano.
Transcripción y traducción
En un gen, la secuencia de nucleótidos a lo largo de una hebra de ADN se transcribe a
un ARN mensajero (ARNm) y esta secuencia a su vez se traduce a una proteína que
un organismo es capaz de sintetizar o "expresar" en uno o varios momentos de su
vida, usando la información de dicha secuencia.
La relación entre la secuencia de nucleótidos y la secuencia de aminoácidos de la
proteína viene determinada por el código genético, que se utiliza durante el proceso de
traducción o síntesis de proteínas. La unidad codificadora del código genético es un
grupo de tres nucleótidos (triplete), representado por las tres letras iniciales de las
bases nitrogenadas (por ej., ACT, CAG, TTT). Los tripletes del ADN se transcriben en
sus bases complementarias en el ARN mensajero, y en este caso los tripletes se
denominan codones (para el ejemplo anterior, UGA, GUC, AAA). En el ribosoma cada
codón del ARN mensajero interacciona con una molécula de ARN de transferencia
(ARNt o tRNA) que contenga el triplete complementario, denominado anticodón. Cada
ARNt porta el aminoácido correspondiente al codón de acuerdo con el código
genético, de modo que el ribosoma va uniendo los aminoácidos para formar una nueva
proteína de acuerdo con las "instrucciones" de la secuencia del ARNm. Existen 64
codones posibles, por lo cual corresponde más de uno para cada aminoácido; algunos
codones indican la terminación de la síntesis, el fin de la secuencia codificante; estos
codones de terminación o codones de parada son UAA, UGA y UAG (en inglés,
nonsense codons o stop codons).
Replicación del ADN
Replicación ADN
El proceso de replicación de ADN es la base de la herencia del material genético. Se
basa en la duplicación de la información genética y su posterior división, ya que en
toda célula que va a dividirse la cromatina debe duplicarse para poder repartirse por
igual en cada una de las células hijas. Para ello las dos cadenas complementarias que
componen la doble hélice de ADN (molécula madre) deben separarse para poderse
formar dos nuevas cadenas, cada una de las cuales es complementaria a una de las
cadenas de la molécula madre.
Este tipo de duplicación de ADN se llama replicación semiconservativa, porque cada
una de las dos moléculas hijas contiene la mitad (una de las cadenas de ADN) de la
molécula madre. La duplicación semiconservativa tiene lugar precisamente por el
hecho de que la secuencia de las bases que la constituyen se conserva, de forma que
la secuencia de cada molécula madre sirve de molde para formar la secuencia de dos
moléculas hijas.
Así, la cromátida de ADN de cada célula forma una doble hélice que presenta una
cadena vieja procedente de la molécula madre y otra recién sintetizada. La replicación
es semiconservativa, bidireccional y semidiscontínua.
Interacciones ADN-proteínas
Todas las funciones del ADN dependen de sus interacciones con proteínas. Estas
interacciones pueden ser no-específicas, o bien la proteína puede unirse de forma
específica una única secuencia de ADN. También pueden unirse enzimas, y de éstas,
son particularmente importantes las polimerasas que copian las secuencia de bases
del ADN durante la transcripción y la replicación.
Proteínas de unión a ADN
Interacciones no-específicas
Interacción de ADN con histonas (en blanco, arriba). Los aminoácidos básicos de
estas proteínas (abajo a la izquierda, en azul) se unen a los grupos ácidos de los
fosfatos del ADN (abajo a la derecha, en rojo).
Las proteínas estructurales que se unen al ADN son ejemplos bien conocidos de
interacciones no-específicas ADN-proteínas. En los cromosomas, el ADN se mantiene
en complejos con proteínas estructurales. Estas proteínas organizan el ADN en una
estructura compacta denominada cromatina. En eucariotas esta estructura implica la
unión del ADN a un complejo formado por pequeñas proteínas básicas denominadas
histonas, mientras que en procariotas están implicadas una gran variedad de
proteínas. 76 77 Las histonas forman un complejo en forma de disco denominado
nucleosoma, que contiene dos vueltas completas de ADN de doble hélice enrolladas
alrededor de su superficie. Estas interacciones no-específicas están formadas a través
de residuos básicos en las histonas, que forman enlaces iónicos con el esqueleto de
azúcar-fosfato del ADN, y por tanto son en gran parte independientes de la secuencia
de bases.78 Modificaciones químicas de estos aminoácidos básicos incluyen
metilación, fosforilación y acetilación.79 Estos cambios químicos alteran la fuerza de la
interacción entre el ADN y las histonas, haciendo al ADN más o menos accesible a los
factores de transcripción y por tanto modificando la tasa de transcripción. 80
Otras proteínas que se unen a ADN de manera no-específica en la cromatina inlcuyen
las proteínas del grupo de alta movilidad (HMG, High-Mobility Group) que se unen a
ADN plegado o distorsionado.81 Estas proteínas son importantes durante el
plegamiento de los nucleosomas y organizándolos en estructuras más complejas para
constituir los cromosomas 82 durante el proceso de condensación cromosómica.
Durante el proceso de condensación, se ha propuesto que también intervienen otras
proteínas, que forman una especie de "andamio" sobre el cual se organiza la
cromatina; los principales componentes de esta estructura serían la enzima
topoisomerasa II α (topoIIalha) y la condensina 13S. 83 Sin embargo, el papel
estructural de topoIIalpha en la organización de los cromosomas permanece
controvertido, ya que otros grupos argumentan que esta enzima se intercambia
rápidamente tanto en los brazos cromosómicos como en los cinetocoros durante la
mitosis. 84
Interacciones específicas
Un grupo bien definido de proteínas de unión a ADN son las que se unen
específicamente a ADN de hebra simple (ssDNA). En humanos, la proteína A de
replicación es la mejor conocida de su familia y se utiliza en procesos en los que la
doble hélice se separa, como la replicación del ADN, la recombinación o la reparación
del ADN. 85 Estas proteínas parecen estabilizar el ADN de hebra simple, protegiéndolo
para evitar que formen estructuras en tallo-lazo (stem-loop) o que se degrade por
nucleasas.
El factor de transcripción represor de lambda con estructura hélice-giro-hélice (helix-
turn-helix) unido a su ADN diana86
Sin embargo, otras proteínas han evolucionado para unirse específicamente a
secuencias particulares de ADN. La especificidad de la interacción de las proteínas
con el ADN procede de los múltiples contactos con los extremos de las bases de ADN,
lo que les permite "leer" la secuencia del ADN. La mayoría de esas interacciones con
las bases occurren en la hendidura mayor, donde las bases son más accesibles. 87
Las que se han estudiado con mayor detalle son los diferentes factores de
transcripción, que son proteínas que regulan la transcripción. Cada factor de
transcripción se une a una secuencia concreta de ADN y activa o inhibe la
transcripción de los genes que presentan estas secuencias próximas a sus
promotores. Los factores de transcripción pueden efectuar ésto de dos formas:
en primer lugar, pueden unirse a la polimerasa de ARN responsable de la
transcripción, bien directamente o a través de otras proteínas mediadoras; esto
aproxima la polimerasa al promotor y permite el inicio de la transcripción.88
alternativamente, los factores de transcripción pueden unirse a enzimas que modifican
las histonas del promotor; esto modifica la accesibilidad del molde de ADN a la
polimerasa.89
Como los ADN diana pueden encontrarse por todo el genoma del organismo, cambios
en la actividad de un tipo de factor de transcripción puede afectar a miles de genes.90
En consecuencia, estas proteínas son frecuentemente las dianas de los procesos de
transducción de señales que controlan las respuestas a cambios ambientales o
diferenciación y desarrollo celular.
La enzima de restricción EcoRV (verde) formando un compleyo con su ADN sustrato91
Enzimas que modifican el ADN
Nucleasas y ligasas
Las Nucleasas son enzimas que cortan las hebras de ADN mediante la catálisis de la
hidrólisis de los enlaces fosfodiéster. Las nucleasas que hidrolizan nucleótidos a partir
de los extremos de las hebras de ADN se denominan exonucleasas, mientras que las
endonucleasas cortan en el interior de las hebras. Las nucleasas que se utilizan con
mayor frecuencia en biología molecular son las enzimas de restricción, endonucleasas
que cortan el ADN en secuencias específicas. Por ejemplo, la enzima EcoRV que se
muestra a la izquierda reconoce la secuencia de 6 bases 5′-GAT|ATC-3′ y hace un
corte en ambas hebras en la línea vertical indicada, generando dos moléculas de ADN
con los extremos romos. Otras enzimas de restricción generan sin embargo extremos
cohesivos, ya que cortan de forma diferente las dos hebras de ADN. En la naturaleza,
estas enzimas protegen las bacterias contra las infecciones de fagos, al digerir el ADN
del fago cuando entra a través de la pared bacteriana, actuando como un mecanismo
de defensa.92 En biotecnología, estas nucleasas específicas de la secuencias de ADN
se utilizan en la clonación molecular y en la técnica de Huella genética.
Las enzimas denominadas ADN ligasas pueden reunir hebras de ADN cortadas o
rotas.93 Las ligasas son particularmente importantes en la replicación de la hebra
rezagada de ADN, ya que unen los fragmentos cortos de ADN generados en la
horquilla de replicación para formar una copia completa del molde de ADN. También
se utilizan en la reparación del ADN y en la recombinación genética.93
Topoisomerasas y helicasas
Las topoisomerasas son enzimas que poseen a la vez actividad nucleasa y ligasa.
Estas proteínas cambian la cantidad de ADN superenrollado. Algunas de estas
enzimas funcionan cortando la hélice de ADN y permitiendo a una sección que rote, de
manera que reducen el grado de superenrollamiento; una vez hecho ésto, la enzima
vuelve a unir los fragmentos de ADN.54 Otros tipos de enzimas son capaces de cortar
una hélice de ADN y luego pasar la segunda hebra de ADN a través de la rotura, antes
de reunir las hélices.94 Las topoisomerasas son necesarias para muchos procesos en
los que interviene el ADN, como la replicación del ADN y la transcripción.55
Las helicasas son unas proteínas que pertenecen al grupo de los motores
moleculares. Utilizan energía química almacenada en los nucleósido trifosfatos,
fundamentalmente ATP, para romper puentes de hidrógeno entre bases y separar la
doble hélice de ADN en hebras simples.95 Estas enzimas son esenciales para la
mayoría de los procesos en los que las enzimas necesitan acceder a las bases del
ADN.
Polimerasas
Las polimerasas son enzimas que sintetizan cadenas de nucleótidos a partir de
nucleósido trifosfatos. La secuencia de sus productos son copias de cadenas de
polinucleótidos existentes, que se denominan moldes. Estas enzimas funcionan
añadiendo nucleótidos al grupo hidroxilo en 3' del nucleótido previo en una hebra de
ADN. En consecuencia, todas las polimerasas funcionan en dirección 5′ --> 3′ .96 En
los sitios activos de estas enzimas, el nucleósido trifosfato que se incorpora aparea su
base con la correspondiente en el molde: esto permite que la polimerasa sintentice de
forma precisa la hebra complementaria al molde.
Las polimerasas se clasifican de acuerdo al tipo de molde que utilizan:
• En la replicación del ADN, una ADN polimerasa dependiente de ADN realiza
una copia de ADN a partir de una secuencia de ADN. La precisión es vital en
este proceso, por ello muchas de estas polimerasas tienen una actividad de
verificación de la lectura (proofreading). Mediante esta actividad, la polimerasa
reconoce errores ocasionales en la reacción de síntesis, debido a la falta de
apareamiente entre el nucleótido erróneo y el molde, lo que genera un
desacoplamiento (mismatch). Si se detecta un desacoplamiento, se activa una
actividad exonucleasa en dirección 3′ --> 5′ y la base incorrecta se elimina.97 En
la mayoría de los organismos las ADN polimerasas funcionan en un gran
complejo denominado replisoma, que contiene múltiples unidades accesorias,
como helicasas.98
• Las ADN polimerasas dependientes de ARN son una clase especializada de
polimerasas que copian la secuencia de una hebra de ARN en ADN. Incluyen
la transcriptasa inversa, que es una enzima viral implicada en la infección de
células por retrovirus, y la telomerasa, que es necesaria para la replicación de
los telómeros.99 38 La telomerasa es una polimerasa inusual, porque contiene
su propio molde de ARN como parte de su estructura.39
• La transcripción se lleva a cabo por una ARN polimerasa dependiente de ADN
que copia la secuencia de una de las hebras de ADN en ARN. Para empezar a
transcribir un gen, la ARN polimerasa se une a una secuencia del ADN
denominada promotor, y separa las hebras del ADN. Entonces copia la
secuencia del gen en un tránscrito de ARN mensajero hasta que alcanza una
región de ADN denomimada terminador, donde se detiene y se separa del
ADN. Como ocurre con las ADN polimerasas dependientes de ADN en
humanos, la ARN polimerasa II (la enzima que transcribe la mayoría de los
genes del genoma humano) funciona como un gran complejo multiproteico que
contiene múltiples subunidades reguladoras y accesorias.100
Recombinación genética
Estructura de un intermedio en unión de Holliday en la recombinación genética. Las
cuatro hebras de ADN separadas están coloreadas en rojo, azul, verde y amarillo. 101
La recombinación implica la rotura y reunión de dos (M y F) para producir dos
cromosomas nuevos reorganizados (C1 y C2).
Una hélice de ADN normalmente no interacciona con otros segmentos de ADN, y en
las células humanas los diferentes cromosomas incluso ocupan áreas separadas en el
núcleo celular denominadas “territorios cromosómicos”.102 La separación físca de los
diferentes cromosomas es importante para que el ADN mantenga su capacidad de
funcionar como un almacén estable de información. Uno de los pocos momentos en
los que los cromosomas interaccionan es durante el sobrecruzamiento cromosómico
(chromosomal crossover), durante el cual se recombinan. El sobrecruzamiento
cromosómico ocurre cuando dos hélices de ADN se rompen, se intercambian y se
unen de nuevo.
La recombinación permite a los cromosomas intercambiar información genética y
produce nuevas combinaciones de genes, lo que aumenta la eficiencia de la selección
natural y puede ser importante en la evolución rápida de nuevas proteínas.103 Durante
la profase I de la meiosis, una vez que los cromosomas homólogos están
perfectamente apareados formando estructuras que se denominan bivalentes, se
produce el fenómeno de sobrecruzamiento o entrecruzamiento (crossing-over), en el
cual las cromátidas homólogas no hermanas (procedentes del padre y de la madre)
intercambian material genético. La recombinación genética resultante hace aumentar
en gran medida la variación genética entre la descendencia de progenitores que se
reproducen por vía sexual. La recombinación genética también puede estar implicada
en la reparación del ADN, en particular en la respuesta celular a las roturas de doble
hebra (double-strand breaks).104
La forma más frecuente de sobrecruzamiento cromosómico es la recombinación
homóloga, en la que los dos cromosomas implicados comparten secuencias muy
similares. La recombinación no-homóloga puede ser dañina para las células, ya que
puede producir translocaciones cromosómicas y anormalidades genéticas. La reacción
de recombinación está catalizada por enzimas conocidas recombinasas, tales como
RAD51.105 El primer paso en el proceso de recombinación es una rotura de doble
hebra, causada bien por una endonucleasa o por daño en el ADN.106 Posteriormente,
una serie de pasos catalizados en parte por la recombinasa conduce a la unión de las
dos hélices formando al menos una unión de Holliday, en la que un segmento de una
hebra simple es anillada con la hebra complementaria en la otra hélice. La unión de
Holliday es una estructura de unión tetrahédrica que puede moverse a lo largo del par
de cromosomas, intercambiando una hebra por otra. La reacción de recombinación se
detiene por el corte de la unión y la reunión de los segmentos de ADN liberados.107
Evolución del metabolismo de ADN
El ADN contiene la información genética que permite a la mayoría de los organismos
vivientes funcionar, crecer y reproducirse. Sin embargo, no está claro durante cuánto
tiempo ha ejercido esta función en los ~3000 millones de años de la historia de la vida,
ya que se ha propuesto que las formas de vida más tempranas podrían haber utilizado
ARN como material genético.96 108 El ARN podría haber funcionado como la parte
central de un metabolismo primigenio, ya que puede transmitir información genética y
simultáneamente actuar como catalizador formando parte de las ribozimas.109 Este
antiguo Mundo de ARN donde los ácidos nucléicos funcionarían como catalizadores y
como almacenes de información genética podría haber influido en la evolución del
código genético actual, basado en cuatro nucleótidos. Esto se debería a que el número
de bases únicas en un organismo es un compromiso entre un número pequeño de
bases (lo que aumentaría la precisión de la replicación) y un número grande de bases
(que a su vez aumentaría la eficiencia catalítica de las ribozimas).110
Desgraciadamente, no disponemos de evidencia directa de los sistemas genéticos
ancestrales, ya que la recuperación del ADN a partir de la mayor parte de los fósiles es
imposible. Esto se debe a que el ADN es capaz de sobrevivir en el medio ambiente
durante menos de un millón de años, y luego empieza a degradarse lentamente en
fragmentos de menor tamaño en solución.111 Algunas investigaciones pretenden que
se ha obtenido ADN más antiguo, por ejemplo un informe sobre el aislamiento de una
bacteria viable a partir de un cristal salino de 250 millones de años de antigüedad,112
pero estos datos son controvertidos.113 114
Sin embargo, pueden utilizarse herramientas de evolución molecular para inferir los
genomas de organismos ancestrales a partir de organismos contemporáneos.115 116 En
muchos casos, estas inferencias son suficientemente fiables, de manera que una
biomolécula codificada en un genoma ancestral puede resucitarse en el laboratorio
para ser estudiada hoy. 117 118 Una vez que la biomolécula ancestral se ha resucitado,
sus propiedades pueden ofrecer inferencias sobre ambientes y estilos de vida
primigenios. Este proceso se relaciona con el campo emergente de la Paleogenética
experimental. 119
A pesar de todo, el proceso de trabajo hacia atrás desde el presente tiene limitaciones
inherentes, razón por la cual otros investigadores tratan de elucidar el mecanismo
evolutivo trabajando desde el origen de la Tierra hacia delante en el tiempo. Dada
suficiente información sobre la química en el cosmos, la manera en la que las
sustancias cósmicas podrían haberse depositado en la Tierra, y las transformaciones
que podrían haber tenido lugar en la superficie terrestre primigenia, tal vez podríamos
ser capaces de aprender sobre los orígenes para desarrollar modelos de evolución de
la información genética hacia delante en el tiempo120 (ver también el artículo sobre el
origen de la vida).
Técnicas comunes
El conocimiento de la estructura del ADN ha permitido el desarrollo de multitud de
herramientas tecnológicas que explotan sus propiedades fisicoquímicas para analizar
su implicación en problemas y muestras concretos: por ejemplo, desde análisis
filogeńeticos para detectar similitudes entre taxa, a la caracterización de la variabilidad
individual de un paciente en su respuesta a un determininado fármaco, pasando por un
enfoque global, a nivel genómico, de cualquier característica específica en un grupo de
individuos de interés. 121
Podemos clasificar las metodologías de análisis del ADN en aquéllas que buscan su
multiplicación, ya in vivo, como la reacción en cadena de la polimerasa (PCR), ya in
vitro, como la clonación, de otras que explotan las propiedades específicas de
elementos concretos, o de genomas adecuadamente clonados, como son:
• La secuenciación del ADN
• La hibridación con sondas específicas
o Southern blot
o Chips de ADN
Tecnología del ADN recombinante
La tecnología del ADN recombinante, piedra angular de la ingeniería genética, permite
propagar grandes cantidades de un fragmento de ADN de interés, el cual se dice que
ha sido clonado. Para ello, debe introducirse dicho fragmento en otro elemento de
ADN, generalmente un plásmido, que posee en su secuencia los elementos
necesarios para que la maquinaria celular de un hospedador, tìpicamente Escherichia
coli, lo replique. De este modo, una vez transformada la cepa bacteriana, nuestro
fragmento de ADN clonado se reproduce cada vez que aquélla se divide.122
Para clonar la secuencia de ADN de interés, se emplean enzimas como herramientas
de corte y empalme del fragmento y del vector, el plásmido. Dichas enzimas
corresponden a dos grupos: primero, unas enzimas de restricción, que poseen la
capacidad de detectar secuencias específicas y de cortar de forma dirigida en ellas; y
después, una ADN ligasa, que permite el enlace covalente entre extremos de ADN
compatibles121 (ver sección Nucleasas y ligasas).
Secuenciación
La secuenciación del ADN consiste en dilucidar el orden de los nucleótidos de un
polímero de ADN de cualquier longitud, si bien suele dirigirse hacia la determinación
de genomas completos, debido a que las técnicas actuales permiten realizar esta
secuenciación a gran velocidad, lo cual ha sido de gran importancia para proyectos de
secuenciación a gran escala como el Proyecto Genoma Humano. Otros proyectos
relacionados, en ocasiones fruto de la colaboración de científicos a escala mundial,
han establecido la secuencia completa de ADN de muchos genomas de animales,
plantas y microorganismos.
El método más empleado durante las últimas dos décadas ha sido el de Sanger,
basado en la terminación de cadena a causa de la adición de unos nucleótidos
especiales, los dideoxinucleótidos, a la mezcla de polimerización convencional. Estos
dideoxinucleótidos, carentes de un grupo hidroxilo en el carbono 3' con el que
establecer un enlace fosfodiéster con el nucleótido siguiente, permiten truncar la
polimerización cuando son incorporados a la cadena creciente, lo que faculta, si se
añaden marcados diferencialmente (por ejemplo, marcando cada ddNTP con un
fluorocromo diferente), la lectura de la secuencia.123 124
Reacción en cadena de la polimerasa (PCR)
La reacción en cadena de la polimerasa, habitualmente conocida como PCR por sus
siglas en inglés, es una técnica de biología molecular descrita en 1986 por Kary
Mullis,125 cuyo objetivo es obtener un gran número de copias de un fragmento de ADN
dado, partiendo de una escasa cantidad de aquél. Para ello, se emplea una ADN
polimerasa termoestable que, en presencia de una mezcla de los cuatro
desoxinucleótidos, un tampón de la fuerza iónica adecuada y con los cationes precisos
para la actividad de la enzima, dos oligonucleótidos (denominados cebadores)
complementarios a parte de la secuencia (situados a distancia suficiente y en sentido
antiparalelo) y bajo unas condiciones de temperatura adecuadas, moduladas por un
aparato denominado termociclador, genera exponencialmente nuevos fragmentos de
ADN semejantes al original y acotados por los dos cebadores.122
La PCR puede efectuarse como una técnica de punto final, esto es, como una
herramienta de generación del ADN deseado, o como un método continuo, en el que
se evalúe dicha polimerización a tiempo real. Esta última variante es común en la PCR
cuantitativa.121
Southern blot
El método de «hibridación Southern» o« Southern blot» (el nombre original en el
idioma inglés) permite la detección de una secuencia de ADN en una muestra
compleja o no del ácido nucleico. Para ello, combina una separación mediante masa y
carga (efectuada mediante una electroforesis en gel) con una hibridación con una
sonda de ácido nucleico marcada de algún modo (ya con radiactividad, ya con un
compuesto químico) que, tras varias reacciones, dé lugar a la aparición de una señal
de color o fluorescencia. Dicha hibridación se realiza tras la transferencia del ADN
separado mediante la electroforesis a una membrana de filtro; una técnica semejante,
pero en la cual no se produce la mencionada separación electroforética se denomina
dot blot.
El método recibe su nombre en honor a su inventor, el biólogo inglés Edwin
Southern.126 Por analogía al método Southern, se han desarrollado técnicas
semejantes que permiten la detección de secuencias dadas de ARN (método
Northern, que emplea sondas de ARN o ADN marcadas)127 o de proteínas específicas
(técnica Western, basada en el uso de anticuerpos).128
Chips de ADN
Microarray con 37.500 oligos específicos; a la derecha, una ampliación de una
pequeña superficie, al detalle.
Son colecciones de oligonucleótidos de ADN complementario dispuestos en hileras
fijadas sobre un soporte, frecuentemente de cristal. Estos chips de ADN se usan para
el estudio de mutaciones genéticas de genes conocidos o para monitorizar la
expresión génica de una preparación de ARN.
Aplicaciones en tecnología
Ingeniería genética
La investigación sobre el ADN tiene un impacto significativo, especialmente en el
ámbito de la medicina, pero también en agricultura y ganadería (donde los objetivos
son los mismos que con las técnicas tradicionales que el hombre lleva utilizando desde
hace milenios - la domesticación, la selección y los cruces dirigidos - para obtener
razas de animales y plantas más productivos). La moderna biología y bioquímica
hacen uso intensivo de la tecnología del ADN recombinante, introduciendo genes de
interés en organismos, con el objetivo de expresar una proteína recombinante
concreta, que puede ser:
• aislada para su uso posterior: por ejemplo, se pueden transformar
microorganismos para convertirlos en auténticas fábricas que producen
grandes cantidades de sustancias útiles, como insulina o vacunas, que
posteriormente se aíslan y se utilizan en terapia.129 130 131
• necesaria para reemplazar la expresión de un gen endógeno dañado que ha
dado lugar a una patología, lo que permitiría el restablecimiento de la actividad
de la proteína perdida y eventualmente la recuperación del estado fisiológico
normal, no patológico. Este es el objetivo de la terapia génica, uno de los
campos en los que se está trabajando activamente en Medicina, analizando
ventajas e inconvenientes de diferentes sistemas de administración del gen
(virales y no virales) y los mecanismos de selección del punto de integración de
los elementos genéticos (distintos para los virus y los transposones) en el
genoma diana. 132 En este caso, antes de plantearse la posibilidad de realizar
una terapia génica en una determinada patología, es fundamental comprender
el impacto del gen de interés en el desarrollo de dicha patología, para lo cual
es necesario el desarrollo de un modelo animal, eliminando o modificando
dicho gen en un animal de laboratorio, mediante la técnica ‘’knockout’’. 133 Sólo
en el caso de que los resultados en el modelo animal sean satisfactorios se
procedería a analizar la posibilidad de restablecer el gen dañado mediante
terapia génica.
• utilizada para enriquecer un alimento: por ejemplo, la composición de la leche
(que es una importante fuente de proteínas para el consumo humano y animal)
puede modificarse mediante transgénesis, añadiendo genes exógenos e
inactivando genes endógenos para mejorar su valor nutricional, reducir
infecciones en las glándulas mamarias, proporcionar a los consumidores
proteínas antipatógenas y preparar proteínas recombinantes para su uso
farmacéutico. , 134 135
• útil para mejorar la resistencia del organismo transformado: por ejemplo en
plantas se pueden introducir genes que confieren resistencia a patógenos
(virus, insectos, hongos…), así como a agentes estresantes abióticos
(salinidad, sequedad, metales pesados…). 136 137 138
Medicina forense
Los médicos forenses pueden utilizar el ADN presente en la sangre, el semen, la piel,
la saliva o el pelo en la escena de un crimen para identificar al responsable. Esta
técnica se denomina huella genética, o también ‘’perfil de ADN’’. Al realizar la huella
genética, se compara la longitud de secciones altamente variables de ADN repetitivo,
como los microsatélites, entre personas diferentes. Este método es frecuentemente
muy fiable para identificar a un criminal.139 Sin embargo, la identificación puede
complicarse si la escena está contaminada con ADN de personas diferentes.140 La
técnica de la huella genética se desarrolló en 1984 por el geneticista británico Sir Alec
Jeffreys,141 y utilizada por primera vez en medicina forense para condenar a Colin
Pitchfork en los asesinatos de Narborough (UK) en 1983 y 1986.142 Se puede requerir
a las personas acusadas de ciertos tipos de crímenes que proporcionen una muestra
de ADN para introducirlos en una base de datos. Esto ha facilitado la labor de los
investigadores en la resolución de casos antiguos, donde sólo se obtuvo una muestra
de ADN de la escena del crimen, en algunos casos permitiendo exonerar a un
convicto. La huella genética también puede utilizarse para identificar víctimas de
accidentes en masa, 143 o para realizar pruebas de consanguinidad.144
Bioinformática
La bioinformática implica la manipulación, búsqueda y extracción de información de los
datos de la secuencia del ADN. El desarrollo de las técnicas para almacenar y buscar
secuencias de ADN ha generado avances en el desarrollo de software de los
ordenadores, para muchas aplicaciones, especialmente algoritmos de búsqueda de
frases, aprendizaje automático y teorías de bases de datos.145 La búsqueda de frases
o algoritmos de coincidencias, que buscan la ocurrencia de una secuencia de letras
dentro de una secuencia de letras mayor, se desarrolló para buscar secuencias
específicas de nucleótidos.146 En otras aplicaciones como editores de textos, incluso
algoritmos simples pueden funcionar, pero las secuencias de ADN pueden generar
que estos algoritmos presenten un comportamiento de casi-el-peor-caso, debido al
bajo número de caracteres. El problema relacionado del alineamiento de secuencias
persigue identificar secuencias homólogas y localizar mutaciones específicas que las
diferencian. Estas técnicas, fundamentalmente el alineamiento de secuencias múltiple,
se utilizan al estudiar las relaciones filogenéticas y la función de las proteínas.147 Las
colecciones de datos que representan secuencias de ADN del tamaño de un genoma,
tales como las producidas por el Proyecto Genoma Humano, son difíciles de usar sin
anotaciones, que marcan la localización de los genes y los elementos reguladores en
cada cromosoma. Las regiones de ADN que tienen patrones asociados con genes que
codifican proteínas – o ARN – pueden identificarse por algoritmos localización de
genes, lo que permite a los investigadores predecir la presencia de productos génicos
específicos en un organismo incluso antes de que haya sido aislado
experimentalmente.148
Nanotecnología de ADN
La estructura de ADN de la izquierda (mostrada de forma esquemática) se auto-
ensambla en la estructura visualizada por microscopía de fuerza atómica a la derecha.
La nanotecnología de ADN es el campo que busca diseñar estructuras a nanoescala
utilizando las propiedades de reconocimiento molecular de las moléculas de ADN.
Imagen de Strong, 2004. Plantilla:Doi-inline
La nanotecnología de ADN utiliza las propiedades únicas de reconocimiento molecular
del ADN y otros ácidos nucleicos para crear complejos ramificados auto-ensamblados
con propiedades útiles. En este caso, el ADN se utiliza como un material estructural,
más que como un portador de información biológica. Esto ha conducido a la creación
de láminas periódicas de dos dimensiones (ambas basadas en azulejos, así como
usando el método de "DNA origami" 149 ), además de estructuras en tres dimensiones
con forma de poliedros.
Historia y antropología
El ADN almacena mutaciones con el tiempo, que se heredan, y por tanto contiene
información histórica, de manera que comparando secuencias de ADN, los
geneticistas pueden inferir la historia evolutiva de los organismos, su filogenia.150 El
campo de la filogenia es una herramienta potente en la biología evolutiva. Si se
comparan las secuencias de ADN dentro de una especie, los geneticistas de
poblaciones pueden conocer la historia de poblaciones particulares. Esto se puede
utilizar en una amplia variedad de estudios, desde ecología hasta antropología; por
ejemplo, evidencia basada en el análisis de ADN se está utilizando para identificar las
Diez Tribus Perdidas de Israel.151 152 Por otro lado, el ADN también se utiliza para
estudiar relaciones familiares recientes.
Ácido ribonucleico
El ácido ribonucleico (ARN o RNA) es un ácido nucleico, que forma una linea de
nucleótidos, formando una larga cadena. Se ubica en las células de tipo procarionte y
las de tipo eucarionte. El ARN se define también como un material genético de ciertos
virus (virus ARN) y, en los organismos celulares, molécula que dirige las etapas
intermedias de la síntesis proteica. En los virus ARN, esta molécula dirige dos
procesos: la síntesis de proteínas (producción de las proteínas que forman la cápsula
del virus) y replicación (proceso mediante el cual el ARN forma una copia de sí
mismo). En los organismos celulares es otro tipo de material genético, llamado ácido
desoxirribonucleico (ADN), el que lleva la información que determina la estructura de
las proteínas. Pero el ADN no puede actuar solo, y se vale del ARN para transferir esta
información vital durante la síntesis de proteínas (producción de las proteínas que
necesita la célula para sus actividades y su desarrollo).
Como el ADN, el ARN está formado por una cadena de compuestos químicos
llamados nucleótidos. Cada uno está formado por una molécula de un azúcar llamado
ribosa, un grupo fosfato y uno de cuatro posibles compuestos nitrogenados llamados
bases: adenina, guanina, uracilo y citosina. Estos compuestos se unen igual que en el
ácido desoxirribonucleico (ADN). El ARN se diferencia químicamente del ADN por dos
cosas: la molécula de azúcar del ARN contiene un átomo de oxígeno que falta en el
ADN; y el ARN contiene la base uracilo en lugar de la timina del ADN.
El ARN es transcrito desde el ADN por enzimas llamadas ARN polimerasas y
procesado en el transcurso por muchas más proteínas. El uracilo, aunque es muy
diferente, puede formar puentes de hidrógeno con la adenina, lo mismo que la timina
lo hace en el ADN. El porqué el ARN contiene uracilo en vez de timina es actualmente
una pregunta sin respuesta.
Flujo de la información genética
El material genético de las células se encuentra en forma de ADN. Dentro de las
moléculas de ADN se encuentra la información necesaria para sintetizar las proteínas
que utiliza el organismo; pero el proceso no es lineal, es bastante complejo. El ADN no
se traduce directamente en proteínas.
En las células eucariotas el ADN se encuentra encerrado en el núcleo. La síntesis de
ADN se hace en el núcleo, así como también la síntesis de ARN, pero la síntesis de
proteínas ocurre en el citoplasma. El mecanismo por el cual la información se trasvasa
desde el núcleo celular al citoplasma es mediante la trascripción del ARN a partir del
ADN y de la traducción de proteínas a partir de ARN.
ARN, el mensajero
Parte del ADN se transcribe en ARN. El ARN va como un mensajero al citoplasma y
allí el ribosoma es el lugar físico para la traducción de los genes a proteínas.
ARN en otros organismos
El ARN es el material genético usado por los virus, y el ARN también es importante en
la producción de proteínas en otros organismos vivos. La mecánica del ARN en los
organismos eucarioticos es similar en los organismos procarióticos. El ARN puede
moverse dentro de las células de los organismos vivos y por consiguiente sirve como
una suerte de mensajero genético, transmitiendo la información guardada en el ADN
de la célula, desde el núcleo hacia otras partes de la célula donde se usa para ayudar
a producir proteínas. Una sola hebra de ADN se usa a la vez, el RNA polimerasa es la
enzima que cataliza el proceso y las bases nitrogenadas son las mismas. Solo que en
los procariotas, no existe el núcleo delimitado por membrana (carioteca).
Transcripción
El ARN se transcribe a partir de una de las dos cadenas del ADN. En caso contrario, al
transcribirse ambas al mismo tiempo, de una de las hélices saldría una proteína y de la
otra algo totalmente diferente.
Por ejemplo, si en una de las cadenas de ADN hubiera: GATACA, en la otra cadena, la
homóloga, debería haber: CTATGT.
La primera al transcribirse a ARN daría dos codones: GAU-ACA. La segunda CUA-
UGU.
La primera formaría la cadena de aminoácidos siguiente. En el primer caso: Ácido
Aspártico-Treonina y en el segundo caso: Leucina-Cisteína.
Que sólo se transcriba una hélice no significa que siempre sea la misma a lo largo de
todo el cromosoma. Puede transcribirse una hélice en un sitio y otra en otro.
En la traducción de codones a aminoácidos intervienen otras moléculas de ARN, las
llamadas ARN de transferencia.
Algunas moléculas de ARN presentan actividad catalítica, y son conocidas como
ribozimas. La mayoría de los ARN son autocatalíticos, ya que catalizan su propio
procesamiento. Su hallazgo es relativamente reciente, y antes se consideraba que
solo las proteínas eran las únicas macromoléculas capaces de poseer actividad
catalítica.
Bases Nitrogenadas y complemento
Están formadas por pares de bases, la unión de estas es semejante a la del ADN, pero
difiere en que la adenina (A) se une al uracilo (U), entonces su complemento es:
- Uracilo (U) con Adenina (A)
- Citosina (C) con Guanina (G)
U-A
C-G
Azúcar
El ARN contiene el glúcido pentosa (o sea de con 5 carbonos) llamada ribosa y sus
moléculas están formadas también por pares de bases, de ahí ribonucleico.
Función a la materia viva
La función principal del ARN es servir como intermediario a la información que le lleva
el ADN en forma de genes y la proteína final codificada por esos genes. El ARN es
transcrito desde el ADN por enzimas llamadas ARN polimerasas y procesado por
muchas más proteínas. El código genético de las células se encuentra en forma de
ADN. Dentro de las moléculas de ADN se encuentra la información necesaria para
sintetizar las proteínas que utiliza el organismo, pero el proceso no es lineal, es
bastante complejo.
ARN mensajero
El ARN mensajero es el ácido ribonucleico que contiene la información genética
procedente del ADN para utilizarse en la síntesis de proteínas, es decir, determina el
orden en que se unirán los aminoácidos.
El ARN mensajero es un ácido nucleico monocatenario, al contrario que el ADN que es
bicatenario.
Procesamiento del ARN mensajero en células eucariotas
Inicialmente el ARN mensajero se conoce como transcrito primario o ARN precursor
(pre-ARN), que en la mayoría de los casos no se libera del complejo de transcripción
en forma totalmente activa, sino que ha de sufrir modificaciones antes de ejercer su
función (procesamiento o maduración del ARN). Entre esas modificaciones se
encuentran la eliminación de fragmentos (splicing), la adición de otros no codificados
en el DNA y la modificación covalente de ciertas bases nitrogenadas. Concretamente,
el procesamiento del ARN en eucariotas comprende diferentes fases:
1. Adición al extremo 5' de la estructura denominada caperuza (o CAP, su nombre
en inglés) que es un nucleótido modificado de guanina, la 7-metilguanosina,
que se añade al extremo 5' de la cadena del ARNm transcrito primario (ubicado
aún en el núcleo celular). Esta caperuza es necesaria para el proceso normal
de traducción del ARN y para mantener su estabilidad; esto es crítico para el
reconocimiento y el acceso apropiado del ribosoma.
2. Poliadenilación: es la adición al extremo 3' de una cola poli-A, una secuencia
larga de poliadenilato, es decir, un tramo de RNA cuyas bases son todas
adenina. Su adición está mediada por una secuencia o señal de poliadenilación
(AAUAAA), situada unos 20-30 nucleótidos antes del extremo 3' original. Esta
cola protege al ARNm frente a la degradación, aumentando su vida media en el
citosol, de modo que se puede sintetizar mayor cantidad de proteína.
3. En la mayoría de los casos, el ARN mensajero sufre la eliminación de
secuencias internas, no codificantes, llamadas intrones. Esto no ocurre en
células procariontes, ya que estas no poseen intrones en su DNA. El proceso
de retirada de los intrones y conexión o empalme de los exones se llama
ayuste, o corte y empalme (en inglés, splicing). A veces un mismo transcrito
primario o pre-ARNm se puede ayustar de diversas maneras, permitiendo que
con un solo gen se obtengan varias proteínas diferentes; a este fenómeno se le
llama ayuste alternativo. Ciertas enzimas parecen estar involucrados en editar
el RNA antes de su exportación fuera del núcleo, intercambiando o eliminando
nucleótidos erróneos.
4. El ARN mensajero maduro es trasladado al citoplasma de la célula, en el caso
de los seres eucariontes, a través de poros de la membrana nuclear.
5. Al ARN mensajero en el citoplasma se acoplan los ribosomas, que son la
maquinaria encargada de la síntesis proteica. En procariontes, la unión de los
ribosomas ocurre mientras la cadena de ARNm esta siendo sintetizada.
6. Después de cierta cantidad de tiempo el ARNm se degrada en sus nucleótidos
componentes, generalmente con la ayuda de ribonucleasas.
ARN mensajero en células procariotas
El proceso de transcripción y el de traducción se realizan de manera similar que en las
células eucariotas. La diferencia fundamental está en que, en las procariotas, el ARN
mensajero no pasa por un proceso de maduración y, por lo tanto, no se le añade
caperuza ni cola, ni se le quitan intrones. Además no tiene que salir del núcleo como
en las eucariotas, porque en las células procariotas no hay un nucleo definido.
ARN de transferencia
El ARN de transferencia, ARN transferente o ARNt es un tipo de ácido ribonucleico
encargado de transportar los aminoácidos a los ribosomas para incorporarlos a las
proteínas, durante el proceso de síntesis proteica.
Características
Los ARN transferencia se reconocen del ARN mensajero por un aminoácido
determinado en la cadena de proteína que se está sintetizando. Según la información
del ARNm, los ARNt sitúan los distintos aminoácidos en el lugar adecuado para
sintetizar una cadena polipeptídica.
Un ARNt está formado por entre 73 y 90 nucleótidos, con un peso molecular de unos
25000 dalton, siendo el ácido ribonucleico más pequeño o de cadena más corta, pero
representando el 45% del total de ARN que existe en la célula. Se encuentra disuelto
en el citoplasma celular. Pueden presentar nucleótidos poco usuales como ácido
pseudouridílico, ácido inosílico e incluso bases características del ADN como la timina.
El ARNt presenta zonas de complementariedad intracatenaria, es decir, zonas
complementarias dentro de la misma cadena, lo que produce que se apareen dando
una estructura característica semejante a la de un trébol de tres hojas.
Tipos
Existen distintos ARNt dentro de la célula. La diferencia fundamental reside en dos
zonas de la molécula de ARNt que son:
1. El extremo 3' terminal, capaz de unir un determinado aminoácido.
2. La porción intermedia denominada anticodón que es la combinación de tres
nucleótidos complementaria de la del codón o triplete del ARNm.
Estructura
Estructura del ARN de transferencia
En la estructura secundaria de los ARNt se distinguen las siguientes características:
1. Brazo aceptor formado por el extremo 5' y el extremo 3', que en todos los ARNt
posee la secuencia CCA, cuyo grupo -OH terminal sirve de lugar de unión con
el aminoácido.
2. El bucle (o brazo)TΨC, que actúa como lugar de reconocimiento del ribosoma.
3. El bucle (o brazo)D, cuya secuencia es reconocida de manera específica por
una de las veinte enzimas, llamadas aminoacil-ARNt sintetasas, encargadas de
unir cada aminoácido con su correspondiente molécula de ARNt.
4. El bucle situado en el extremo del brazo largo del "bumerán", que contiene una
secuencia de tres bases llamada anticodón. Cada ARNt "cargado" con su
correspondiente aminoácido se une al ARNm, mediante la región del
anticodón, con tripletes de bases del ARNm (cada tres bases del ARNm
definen un triplete o codón) en el proceso de la traducción de la información
genética que conduce a la síntesis de las proteínas.
La molécula de ARNt se pliega sobre sí misma formando 5 regiones de unión tipo
pares de bases y 4 asas sin unión de sus pares de bases, con una zona con pares de
bases desparejada, donde pueden unirse, como si fuera una cola, los aminoácidos. En
el asa II hay un codón (triplete de 3 nucleótidos) llamado anticodón que va a unirse a
un codón específico del ARNm. Cada molécula de ARNt va a conseguir de esta forma
la adición de un aminoácido a una proteína.
Existen unos 20 ARNt, tantos como capaces de unirse a cada aminoácido, con la
particularidad de que cada ARNt reconoce un solo aminoácido. Otra característica de
los ARNt es que además de las cuatro bases fundamentales presentan otras bases
púricas y pirimídicas menos frecuentes. Las enzimas conocidas como aminoacil-ARNt
sintetasas catalizan la unión de cada aminoácido a su molécula de ARNt específica.
Cada aminoacil sintetasa tiene la capacidad de distinguir un aminoácido en particular
de los restantes 19, a pesar de que algunos de ellos son muy similares químicamente.
De igual modo, estas enzimas reconocen con precisión la molécula correcta de ARNt
para emparejarlo con el correspondiente aminoácido. La reacción que une al
aminoácido con su ARNt es la misma para cada aminoácido, el cual, una vez montado
en el ARNt tendrá la suficiente energía en el enlace aminoácido:ARNt para catalizar la
reacción que más adelante unirá dos aminoácidos en la formación de los polipéptidos.
Ejemplo de síntesis proteica
Veamos un ejemplo de la síntesis proteica. La leucina en ARNm se codifica como
CUA. El ARN de transferencia de la leucina tiene en uno de sus extremos el
complementario a CUA que es GAU. En el otro extremo se une la leucina.
Debemos recordar que G siempre se une a C y viceversa y que la U siempre se una a
la A.
El triplete, por ejemplo CUA, en ARNm se llama codón. El triplete complementario, en
ARNt, se llama anticodón.
El ARNt se encarga de suministrar los aminoácidos al ribosoma para que éste haga el
ensamblaje de la proteína. Una vez que el ribosoma ha utilizado el aminoácido que
estaba pegado al ARNt, éste se separa del ribosoma y se desplaza por el citoplasma
buscando nuevos aminoácidos. En el ejemplo, el ARNt de leucina, suministra la
leucina al ribosoma y cuando se queda sin él, se separa de él y va a buscar otra
leucina. Cuando encuentra el aminoácido leucina, se une a él y queda preparado para
suminitrarlo al ribosoma cuando éste lo necesite.
Notas
La proteína está codificada en un gen de ADN en el núcleo celular. El ADN nunca sale
del núcleo. Por lo que el ARN mensajero es el encargado de llevar esta información al
citoplasma para que pueda ser traducida a proteínas
La síntesis de proteínas corre a cargo de los ribosoma que se encuentran libres en el
citoplasma o adheridos a la cara externa de la membrana nuclear y el retículo
endoplásmico rugoso. Estos ribosomas descodifican la información del ARNm y lo
transforman en proteínas gracias a los aminoácidos que transportan los ARN
transferentes previamente activados (aminoacil-ARNt)
El ribosoma es un complejo molecular compuesto en parte por proteínas y por
moléculas de ARN ribosómico. Los ribosomas son formados en el nucleolo a partir de
proteínas citosólicas y ARN nucleolar
ARN ribosómico
El ARN ribosómico es el más abundante de la célula. Está formado por una sola
cadena de nucleótidos, aunque presenta zonas de doble hélice debido a su
conformación tridimensional.
Este tipo de ARN presenta las siguientes características:
• Forma parte de las subunidades del ribosoma junto con algunas proteínas.
• Participa en la síntesis de proteínas en el ribosoma.
• Existen varios tipos de ARNr, cada uno con un tamaño y estructura
característicos.
• En el doble hélice este cromosoma se encuentra libre sin ninguna membrana.
Los ARN ribosómicos se han venido clasificando tradicionalmente según su coeficiente
de sedimentación, medido en svedbergs (S). De esta manera podemos decir que en
organismos procariotas existen tres ARNr distintos (5S, 16S y 23S) y en organismos
eucariotas cuatro (5S, 5'8S, 18S, 28S).
En procariotas los ARNr 23S y 5S forman parte de la subunidad mayor de los
ribosomas, mientras que el ARNr 16S forma parte de la subunidad menor.
En eucariotas los ARNr 5S, 5'8S y 28S forman parte de la subunidad mayor de los
ribosomas, mientras que el ARNr 18S forma parte de la subunidad menor.
ARN nucleolar
El ARN nucleolar (abreviado como ARNn) es una pequeña molécula de ácido
ribonucleico, sintetizado y localizado en el nucléolo de las células eucariotas, a partir
de la transcripción del ADN, formado por una corta secuencia de entre 100 a 300
nucleótidos, y que es precursor e indispensable para la síntesis de parte del ARN
ribosómico.
El ARNn tiene un tamaño de 45 S (coeficiente de sedimentación), es precursor de
parte del ARNr (ARN ribosómico), concretamente del ARNr 28 S (de la subunidad
mayor), el ARNr 5,8 S (de la subunidad mayor) y el ARNr 18 S (de la subunidad
menor).
Los anticuerpos anti-ARN nucleolar aparecen en la esclerodermia y otras enfermedades
reumáticas.
Telomerasa
La telomerasa es una enzima formada por un complejo proteína-ácido ribonucleico con
actividad polimerasa que es producida en células germinales embrionarias que permite
el alargamiento de los telómeros. Encargada de restituir la longitud del telómero,
haciendo copias de la secuencia TTAGGG.
La telomerasa es reprimida en las células somáticas maduras después del nacimiento,
que producen un acortamiento del telómero después de cada división celular.
Puede desempeñar un papel en la formación, mantenimiento y renovación de los
telómeros y en los procesos tales como el envejecimiento y el cáncer, y a la cuestión
del uso de agentes antitelomerasa como fármacos antitumorales.
Actúa como transcriptasa inversa telomerasa; invierte el curso normal (ADN..>ARN) y
va del ARN al ADN, trascribiendo el ARN a ADN. Recientes estudios con esta enzima
han demostrado que celulas bañadas en una solución de esta sustancia tienen la
capacidad de seguir reproduciéndose indefinidamente. Es decir, anula el proceso de
envejecimiento y muerte celular.
Esto podría traducirse a tratamientos con telomerasa que evitarían por completo la
muerte, tanto celular como del individuo, es decir, sería el fármaco que otorgaría la
inmortalidad, salvo por un contratiempo: Al ser administrada telomerasa en seres
pluricelulares complejos como los humanos o animales, la célula empieza a dividirse
indefinidamente, es decir, crea un tumor maligno que se divide a gran velocidad, y,
teniendo en cuenta que evita el envejecimiento pero no los demás males, provocaría la
muerte por cáncer.
ARN interferente
La enzima Dicer corta ARN doble hebra y genera siRNAs o miRNAs. Estos ARN
pequeños se incorporan en el complejo RISC (RNA-induced silencing complex),
dirigiéndolo contra el ARNm complementario, y bien lo corta (siRNAs), bien inhibe su
traducción (miRNAs).1
El ARN interferente, abreviado ARNi (del inglés interfering RNA, iRNA), es una
molécula de ARN que suprime la expresión de genes específicos mediante
mecanismos conocidos globalmente como ribointerferencia o interferencia por ARN
(RNA interference, RNAi).
Tipos de ARN interferente
Los ARN interferentes son moléculas pequeñas (20-25 nucléotidos) que se generan
por fragmentación de precursores más largos. Se pueden clasificar en tres grandes
grupos2 :
siRNA
El acrónimo siRNA proviene el inglés small interference RNA: en español, ARN
interferente pequeño o ARNip. Son hebras de ARN doble banda perfectamente
complementarias de aproximadamente 20-21 nucleótidos (nt) con 2 nucleótidos libres
en cada extremo 3'. Cada hebra de ARN tiene un grupo fosfato 5' y un grupo hidroxilo
(-OH) 3'. Esta estructura proviene del procesamiento llevado a cabo por Dicer, una
enzima que corta hebras largas de ARN doble banda (dsRNA, double strand RNA) en
siRNAs3 . Una de las hebras del siRNA (la antisense) se ensambla en un complejo
proteico denominado RISC (RNA-induced silencing complex), que utiliza la hebra de
siRNA como guía para identificar el ARN mensajero complementario. El complejo
RISC cataliza el corte del ARNm complementario en dos mitades, que son degradadas
por la maquinaria celular, bloqueando así la expresión del gen. Los siRNAs pueden ser
también introducidos exógenamente en las células utilizando métodos de transfección
basándose en la secuencia complementaria de un gen en particular, con la finalidad de
reducir significativamente su expresión.
miRNA
Los microARNs (en inglés, miRNAs) son pequeños ARN interferentes que se generan
a partir de precursores específicos codificados en el genoma, que al transcribirse se
pliegan en horquillas (hairpins) intramoleculares que contienen segmentos de
complementariedad imperfecta. El procesamiento de los precursores ocurre
generalmente en dos etapas, catalizado por dos enzimas, Drosha en el núcleo y Dicer
en el citoplasma. Una de las hebras del miRNA (la antisense), como ocurre con los
siRNAs, se incorpora a un complejo similar al RISC. Dependiendo del grado de
complementariedad del miRNA con el ARNm, los miRNAs pueden bien inhibir la
traducción del ARNm o bien inducir su degradación. Sin embargo, a diferencia con la
vía de los siRNAs, la degradación de ARNm mediada por miRNAs se inicia con la
eliminación enzimática de la cola de poly-A del ARNm.
piRNA
(Piwi-interacting RNAs, ARNs asociados a Piwi): se generan a partir de precursores
largos, de una sola hebra, en un proceso que es independiente de Drosha y Dicer.
Estos ARN pequeños se asocian con una subfamilia de las proteínas Argonaute
denominadas proteínas Piwi. Se han identificado decenas de miles de piRNAs, pero su
función es desconocida (2008). Sin embargo, se sabe que conjuntamente con las
proteínas Piwi, son necesarios para el desarrollo de las células de la línea germinal.
Variación entre organismos
Ilustración de las principales diferencias entre el silenciamiento de genes entre plantas
y animales. Los microARNs endógenos o los siRNAs son procesados por Dicer e
integrados en el complejo RISC, que media el silenciamiento de genes4 .
Los organismos varían en su capacidad de aceptar dsRNA extraño y utilizarlo en la
ruta del RNAi. Los efectos de la interferencia de ARN pueden ser sistémicos y
heredables en plantas y C. elegans, pero no en Drosophila o mamíferos. En plantas,
se piensa que el RNAi se propaga por la transferencia de siRNAs entre las células, a
través de los plasmodesmos (canales en las paredes celulares que permiten la
comunicación y el transporte). La heredabilidad procede de la metilación de los
promotores dirigida por RNAi; el nuevo patrón de metilación se copia en cada nueva
generación de la célula 5 .
Entre plantas y animales se observa una distinción general amplia en la utilización de
los miRNAs endógenos; en plantas, los miRNAs son normalmente perfectamente (o
casi) complementarios a su gen diana, e inducen el corte directo del ARN a través de
RISC, mientras que los miRNA de animales tienden a ser más divergentes en la
secuencia e inducen represión a nivel de la traducción del ARNm diana 4 .
Algunos protozoos eucariotas tales como Leishmania major y Trypanosoma cruzi
carecen completamente de la ruta del RNAi6 7 . La mayoría de los componentes
también están ausentes en algunos hongos, notablemente en el organismo modelo
Saccharomyces cerevisiae8 . El hecho de que algunos ascomicetos y basidiomicetos
carezcan de rutas de RNAi indica que proteínas requeridas para la interferencia por
ARN se han perdido de forma independiente en muchos linajes de hongos,
posiblemente debido a la evolución de una nueva ruta con función similar, o a la falta
de ventaja selectiva en ciertos nichos 9 .
Evolución
En base a estudios filogenéticos computacionales basados en el principio de máxima
parsimonia, el ancestro común más reciente de todos los eucariotas probablemente ya
poseía una ruta primitiva de interferencia de ARN; se piensa que la ausencia de la ruta
en ciertos eucariotas es una característica derivada 10 . Este sistema de RNAi
ancestral probablemente contenía una proteína similar a Dicer, una proteína
Argonauta, una proteína PIWI, y una ARN polimerasa dependiente de ARN (RdRP)
que podría haber realizado otras funciones celulares. Un estudio a gran escala de
genómica comparativa también indica que el grupo corona (un grupo monofilético vivo,
o clado, que consiste del último ascendente común de todos los ejemplares vivos, más
todos sus descendientes) ya poseía estos componentes, que en aquel momento
podrían haber tenido asociaciones funcionales más estrechas con los sistemas
generales de degradación del ARN como el exosoma11 . Este estudio también sugiere
que la familia de proteínas "Argonauta" de unión a ARN, que es común entre los
eucariotas, la mayoría de los Archaea, y al menos algunas bacterias (tales como
Aquifex aeolicus), es homóloga y originalmente derivada de los componentes del
sistema de iniciación de la traducción.
Se piensa que la función ancestral del sistema de RNAi es la defensa inmune contra
elementos genéticos exógenos tales como transposones y genomas virales10 12 .
Funciones relacionadas como modificaciones de histonas podrían haber estado ya
presentes en el ancestro de los modernos eucariotas, aunque parece que otras
funciones como la regulación del desarrollo por los miRNAs habrían aparecido
posteriormente10 .
Los genes de la interferencia por ARN, como componentes del sistema inmune
antiviral en muchos eucariotas, están implicados en una "batalla evolutiva" con los
genes virales. Algunos virus han desarrollado mecanismos para suprimir la respuesta
de RNAi de sus células huésped, un efecto muy aparente sobre todo en los virus de
plantas13 . Estudios de las tasas evolutivas en Drosophila muestran que los genes de
la ruta del RNAi están sometidas una fuerte selección direccional y están entre los
genes con una tasa de evolución más rápida del genoma de Drosophila14 .
RNAi y pseudogenes
En 2008, varios estudios en moscas 15 16 17 18 y en ratones 19 20 , proporcionan nueva
información: en estos estudios, se sugiere una conexión entre RNAi y pseudogenes
que hace más difusa la distinción "tradicional" en tres clases de pequeños ARNs:
siRNAs, miRNAs y piRNAs (ver un resumen en Sasidharan et al., Nature 2008 21 ).
La definición clásica de pseudogén es un elemento genético heredable que es similar
a un gen, pero que es afuncional. Sin embargo, el término "afuncional" es ambigüo:
¿significa que no se transcribe, que no se traduce o que no está bajo el control de un
promotor?. Los pseudogenes son similares a genes que codifican proteínas porque
normalmente se han generado por copia de un gen ancestral, bien por duplicación
incorrecta o por retrotransposición (en la que el ADN es primero transcrito en ARN y
luego "retro-transcrito" en ADN e insertado en otro lugar del genoma). Como el
proceso de copiado no genera una proteína funcional, los pseudogenes se identifican
por 'disfunciones' en su secuencia, como cambios de marco de lectura (frameshifts), o
paradas prematuras. Son interesantes porque constituyen un resto de antiguas
moléculas codificadas por el genoma.
Los pseudogenes son por tanto fósiles de genes de antiguas proteínas, y aunque
muchos de ellos se transcriben, se han considerado como ADN basura, que consituye
en su conjunto alrededor del 99% del genoma en humanos. Una gran parte del ADN
"basura" (junk DNA) está constituida precisamente por pseudogenes; esta abundancia
de pseudogenes en el genoma (decenas de miles en humanos, casi la misma cantidad
de genes que codifican proteínas) hace improbable que sean afuncionales. Además,
una gran parte de ellos están sometidos a un proceso de selección natural 22 . Una de
las funciones propuesta para los pseudogenes es la regulación génica, y el
mecanismo propuesto para realizar esta función es el ARN de interferencia (RNAi).
Los seis manuscritos indicados anteriormente describen el descubrimiento de
pequeñas moléculas de siRNA naturales en moscas y en ratones, algunas de las
cuales son potencialmente transcritas a partir de pseudogenes.
Endo-siRNAs
En general, el proceso de RNAi implica varios tipos de pequeñas secuencias de ARN
"guía" que regulan los niveles de la proteína diana al direccionar para su degradación
el ARNm de ésta. En los seis estudios indicados, siRNAs procedentes de
pseudogenes generan dos de las cuatro categorías de siRNAs naturales (o endo-
siRNAs):
- la primera categoría de endo-siRNAs media el silenciamiento de transposones, que
es una característica de los piRNAs. A diferencia de los piRNAs, que constan de 24 a
30 nucleótidos y utilizan Piwi como proteína efectora, los endo-siRNAs de primera
categoría tienen de 21 a 22 nts, y utlilizan Ago2.
- la segunda categoría se genera mediante la transcripcion bidireccional de loci
parcialmente superpuestos en hebras opuestas de ADN 15 18 . Se han identificado unos
1000 endo-siRNAs de este tipo en moscas, y estudios en ratones muestran algunos
ejemplos. 19 20 Los genes diana de esta categoría de endo-siRNAs están relacionados
con funciones de los ácidos nucleicos, como actividad nucleasa o unión a factores de
transcripción.
- la tercera categoría de endo-siRNAs se ha detectado sólo en ratones 19 20 y son el
producto de la interacción de un mRNA transcrito a partir de un gen que codifica para
una proteína y un tránscrito anti-sense a partir del pseudogén correspondiente, que
puede estar localizado lejos del gen codificante, en el mismo cromosoma o en otro.
- los endo-siRNA de la cuarta categoría están muy relacionados con los de la tercera:
se generan a partir de secuencias en forma de horquilla (hairpin), que en ratón pueden
proceder de las estructuras en repetición invertida de los pseudogenes. En este caso,
el pseudogén también regula su gen codificante, pero el precursor de ARN en doble
hebra procede de la transcripción de una secuencia con repeticiones invertidas que
dan lugar a una horquilla.
Los manuscritos indicados muestran que las proteínas de ratón afectadas por las
categorías tercera y cuarta de endo-siRNAs están generalmente implicadas en
funciones específicas - como la regulación de la dinámica del citoesqueleto - lo que
indica que la regulación subyacente mediada por pseudogenes ha sido seleccionada
expresamente para ello, y no generada simplemente por el apareamiento al azar de
tránscritos de genes y pseudogenes.
También se han encontrado precursores en horquilla de endo-siRNAs en moscas,
pero hay pocas evidencias que los relacionen con pseudogenes. La mayor parte de los
endo-siRNAs asociados con pseudogenes, por tanto, se han detectado en ratones.
Una posible explicación es que el genoma de ratón contiene muchos más
pseudogenes que el genoma de la mosca 23 .
Sin embargo, para demostrar de forma concluyente la actividad de los pseudogenes,
son necesarios más experimentos (por ejemplo,eliminar un pseudogén y demostrar el
efecto sobre el gen codificante potencialmente regulado por el pseudogén).
Como se indicaba al principio, además de conectar pseudogenes y RNAi, estos
estudios también hacen más difusas las diferencias entre los tres tipos "tradicionales"
de ARN interferentes (siRNAs, miRNAs y piRNAs), que son distintos en su biogénesis
y en sus funciones celulares. Estos estudios indican que los endo-siRNAs regulan
transposones (como los piRNAs); que pueden generarse a partir de estructuras en
horquilla (como los miRNAs); y que, en moscas, su procesamiento implica un co-factor
similar al de los miRNAs.
El hecho de que las líneas de separación entre los distintos tipos de ARN interferente
sean más difusas, unido a las nuevas conexiones entre pseudogenes y siRNAs, tiene
interesantes consecuencias evolutivas. En plantas se ha propuesto que las
duplicaciones invertidas de un gen codificante podrían ser un mecanismo de
generación de nuevos miRNAs 24 . De esta forma, endo-siRNAs codificados por
pseudogenes podrían proporcionar una conexión intermedia para comprender la
evolución de la regulación génica mediada por miRNAs 25 . Aunque especulativa, un
estudio reciente del contexto genómico de más de 300 miRNA loci en humanos ha
identificado dos en pseudogenes 26 , lo que apoyaría dicha hipótesis.
Micro ARN
En biología, un micro ARN (miARN o miRNA por sus siglas en inglés) es un ARN
monocatenario, de una longitud de entre 21-25 nucleótidos, y que tiene la capacidad
de regular la expresión de otros genes mediante diversos procesos, utilizando para
ello la ruta de la interferencia de ARN (RNAi) 1 .
Fueron descritos inicialmente en 1993 por Lee y colaboradores en el laboratorio de
Victor Ambros 2 , sin embargo el término "microARN" sólo se acuñó en 2001 en un
conjunto de tres artículos publicados en Science (26 Octubre 2001)3 . A principios de
2008, análisis computacionales realizados por IBM sugerían la presencia de alrededor
de 50.000 (cincuenta mil) miRNAs diferentes en el genoma humano, cada uno tal vez
con alrededor de miles de ARNm dianas potenciales4 .
Definición
Una vez descubiertos los siRNAs y la existencia en las células de proteínas que
catalizan la degradación del ARNm, los investigadores se preguntaron si los siRNAs
también estaban codificados en el genoma, y empezaron a purificar pequeños ARNs
(19-25 nt) a partir de diferentes especies animales. Sin embargo, no encontraron
siRNAs, sino los denominados micro (mi) RNAs, que se habían identificado
anteriormente de forma independiente2 .
Ilustración de las principales diferencias entre el silenciamiento de genes entre plantas
y animales. Los microARNs endógenos o los siRNAs son procesados por Dicer e
integrados en el complejo RISC, que media el silenciamiento de genes5 .
Los miRNAs son moléculas de ARN transcritas a partir de genes de ADN, pero no son
traducidas a proteínas. Se expresan en una amplia variedad de organismos, desde
plantas hasta gusanos y humanos. Muchos miRNAs están bien conservados entre
especies 6 , y muchos componentes de la maquinaria de los miRNAs se han
encontrado incluso en Archaea y eubacteria, lo que revela que su origen es muy
antiguo. Algunos recuentos de miRNAs en humanos identificaba hasta 800, lo que
implicaría que los miRNAs podrían representar como mínimo >3% de todos los genes
humanos 7 .
La secuencia de ADN que codifica para un gen de miRNA tiene una longitud que
supera al tamaño final del propio miRNA e incluye la región miRNA y una región que
es complementaria a la anterior, lo que permite su apareamiento. Esto conlleva que,
durante la transcripción de esta secuencia de ADN, se forman regiones que tienen la
capacidad de formar una horquilla y generar un ARN bicatenario primario largo
conocido como pri-miRNA. Posteriormente, un enzima nuclear llamado Drosha corta
las bases de la horquilla, formando lo que se denomina pre-miRNA. Este pre-miRNA
es transportado desde el núcleo al citoplasma por la Exportina 5. Una vez que el pre-
miRNA está en el citoplasma es fragmentado por la enzima Dicer, que lo corta hasta la
longitud final de 20-25 nucleotidos5 .
La función de los miRNAs esta relacionada con la regulación de la expresión génica.
De esta forma un miRNA es complementario de una parte de uno o más ARN
mensajeros (ARNm). Los miRNA de animales suelen mostrar complementariedad
imperfecta con la región 3' UTR, y generalmente inhiben la traducción del ARNm,
mientras que los de plantas suelen mostrar complementariedad perfecta con regiones
codificantes e inducen el corte y la posterior degradación del ARNm diana (como
ocurre con los siRNAs en animales)5 .
Antes de clasificarlos como parte de la ruta del RNAi, los miRNAs fueron identificados
inicialmente en gusanos, en los que regulan las fases del desarrollo 8 , pero en la
actualidad se sabe que están implicados en una amplia variedad de procesos del
desarrollo y podrían tener una función en el establecimiento de redes y en el ajuste
fino de la expresión génica en la célula 9 6 . Dado que el número de dianas potenciales
de los miRNAs aumenta al número de miles (alrededor del 30% de los genes
humanos), los miRNAs podrían constituir otra capa del circuito regulatorio que existe
en las células 10 . Según esto, cualquier desregulación de los miRNAs podría conllevar
grandes problemas regulatorios en la célula, induciendo quizá fenotipos cancerosos.
De hecho, se ha mostrado que los perfiles de expresión de los miRNAs están
modificados en un gran número de tipos de cáncer11 y que la sobreexpresión forzada
de los miRNAs podría conducir al desarrollo de tumores 12 .
Características de los miRNAs
Los miRNAs se transcriben a partir de diferentes localizaciones genómicas como
largos tránscritos primarios (pri-miRNA) por la ARN-polimerasa II 13 .
Los miRNAs pueden encontrarse en muchos tipos de loci en el genoma14 :
• La transcripción de los miRNAs puede estar regulada independientemente por
promotores específicos, como ocurre con miR-1–1 y miR-133a-2, que están
regulados por los factores de transcripción SRF (Serum Response Factor) [38]
y MyoD [39] 15 (ver el apartado "Funciones durante el desarrollo" para más
detalles). Tales miRNAs pueden de todas maneras estar localizados en
intrones pero a menudo con una orientación antisense.
• La mayoría de los precursores de miRNAs presentes en intrones tienen la
misma orientación que el gen en el que se alojan y son inicialmente transcritos
como parte de su ARN precursor 6 . Por ejemplo, miR-208, que se expresa
específicamente en el corazón de humano y ratón, reside en el intrón 28 de la
cadena pesada de la α-miosina cardiaca. Los pri-miRNAs intrónicos pueden
producirse por corte del intrón por la endonucleasa Drosha, después de que se
haya producido el proceso de splicing.
• Con pocas excepciones, los miRNAs que están integrados o se superponen
con exones de tránscritos conocidos, están siempre en la misma orientación, y
la mayoría se encuentran en las regiones no-codificantes UTRs 5′ o 3′ (por
ejemplo, miR-198 en follistatin-like 1).
Aproximadamente el 50% de los miRNAs están en clusters de miRNAs que están
inicialmente codificados como un tránscrito policistrónico (que incluye varios genes)16 ,
que posteriormente se fragmenta en múltiples miRNAs. En la mayoría de los casos,
los miRNAs policistrónicos comparten el mismo patrón de expresión. Sin embargo, los
niveles relativos de los miRNAs dentro del cluster parecen estar regulados de una
manera dependiente del desarrollo y la homeostasis, lo que sugiere una complejidad
aún no definida en la regulación de la expresión génica.
Biogénesis y procesamiento
Los microRNAs (miRNAs) se producen a partir de un microARN precursor (pre-
miRNA), que a su vez se forma a partir de un tránscrito de microARN primario (pri-
miRNA).
Los genes que codifican miRNAs son mucho más largos que los miRNAs procesados
maduros; los miRNAs se transcriben inicialmente como tránscritos primarios o pri-
miRNAs con una caperuza en 5' y una cola de poli-adeninas (poly-A) en 3' y se
procesan en el núcleo celular en estructuras cortas de 70-nucleótidos en forma de
tallo-lazo (stem-loop) conocidas como pre-miRNAs. En animales este procesamiento
se realiza por un complejo proteico llamado Microprocesador, que consta de la
nucleasa Drosha [40] y la proteína de unión a ARN de doble hélice Pasha [41] 17 .
Estos pre-miRNAs son luego procesados a miRNAs maduros en el citoplasma
mediante la interacción con la endonucleasa Dicer, que también inicia la formación del
complejo RISC (RNA-induced silencing complex)18 . Este complejo es el responsable
del silenciamiento de genes que se observa debido a la expresión de los miRNAs y a
la interferencia de ARN mediada por siRNAs. La ruta varía ligeramente en plantas,
debido a que carecen de homólogos de Drosha; en su lugar, sólo homólogos de Dicer
realizan algunos de los pasos del procesamiento19 . La ruta también es diferente para
los miRNAs derivados de tallos-lazos (stem-loops) procedentes de secuencias
intrónicas; en este caso se procesan por Dicer pero no por Drosha20 . Tanto la hebra
sense como la antisense del ADN pueden funcionar como molde para producir
miRNAs21 .
Drosha 22 (RNASEN en humanos) [42] es una proteína nuclear de un tamaño entre
130 y 160 kDa (kiloDalton). Contiene los dominios siguientes:
• dos dominios ARNasa III (los dominios catalíticos)
• un dominio dsRBD (double-strand RNA-binding domain, de unión al ARN doble
hebra)
• dominios conservados (en la parte N-terminal), de los que no se conoce la
función.
Drosha funciona en un complejo (Microprocesador), conjuntamente con una proteína
de unión a ARN (denominada Pasha en Drosophila o DGCR8 en mamíferos).
DGCR823 [43] es una proteína de unión a ADN que reconoce la zona de unión
dsRNA–ssRNA (ARN doble hebra-simple hebra) y posiciona a la ribonucleasa Drosha
a una distancia de 11 nucleótidos (que corresponde a una vuelta de hélice) desde la
zona de unión. Por tanto, la función de DGCR8 en el complejo Microprocesador es
análoga al dominio PAZ de Dicer; DGCR8 proporciona especificidad de sustrato y
posiciona adecuadamente el centro de la ribonucleasa Drosha. Sin embargo, en el
caso de Drosha-DGCR8, el dominio de especificidad está localizado en una cadena
polipeptídica separada de los dominios ARNasa III. Se ha propuesto que el dominio
WW de unión a prolinas de DGCR8 interacciona con el extremo N-terminal de Drosha,
rico en prolinas. Es posible que Drosha tenga otras posibles proteínas asociadas que
presenten dominios WW que aporten especificidades de sustrato alternativas y
funciones biológicas adicionales de Drosha.
El procesamiento eficiente de los pre-miRNAs por Drosha requiere la presencia de
largas colas de ARN de hebra simple tanto en el extremo 3' como 5' de la molécula en
horquilla24 . Estos motivos de ARN de hebra simple (ssRNA) pueden variar en
composicion, mientras que su longitud es de gran importancia para que el
procesamiento tenga lugar. Un análisis bioinformático de pri-miRNAs en humanos y
moscas identificó regiones estructurales similares, denominadas 'segmentos basales
(basal segments)', 'tallos inferiores (lower stems)', 'tallos superiores (upper stems)' y
'lazos terminales (terminal loops)'; basándose en estas estructuras conservadas, se
han determinado perfiles termodinámicos de los pri-miRNAs 25 . El complejo de Drosha
(Microprocesador) corta la molécula de ARN ~2 vueltas de hélice a partir del lazo
terminal y ~1 vuelta de hélice a partir de los segmentos basales. En la mayoría de las
moléculas analizadas esta región contiene nucleótidos no apareados y la energía libre
del duplex es relativamente alta en comparación con las regiones tallo superior e
inferior [cita requerida]. La mayor parte de los pre-miRNAs no presentan una estructura de
ARN doble hebra (dsRNA) perfecta con un lazo terminal final. Existen algunas
explicaciones posibles para esta selectividad. Una podría ser que dsRNAs más largos
de 21 pares de bases activan la respuesta de interferón y la maquinaria antiviral de la
célula. Otra explicación plausible podría ser que el perfil termodinámico del pre-miRNA
determina qué hebra será incorporada en el complejo Dicer. De hecho, se han
detectado claras similitudes entre pri-miRNAs codificados bien en hebras 5' o 3' 25 .
Una vez generado el pre-miRNA, Dicer corta el tallo-lazo (stem-loop) y se forman dos
moléculas complementarias cortas, pero sólo una se integra en el complejo RISC (la
antisense), como ocurre con los siRNAs. Esta hebra se conoce como la hebra guía,
que es seleccionada por la proteína Argonauta, la ARNasa catalíticamente activa en el
complejo RISC, en función de la estabilidad del extremo 5'26 . La otra hebra (la sense),
conocida como anti-guía o hebra pasajera, es degradada por el complejo RISC 27 .
Después de su integración en el complejo RISC, ahora activado (ver las notas sobre el
complejo RISC en siRNAs), los miRNAs se aparean de acuerdo con su secuencia de
bases con la molécula de ARNm complementaria, y en animales, a diferencia con los
siRNAs, en la mayoría de los casos inducen la inhibición de la traducción de dicho
ARNm .
Como se indica en el caso de los siRNAs, todavía no está claro cómo el complejo
RISC activado localiza los ARNm complementarios en el interior celular. Las proteínas
Argonauta, los componentes catalíticos de RISC, están localizadas en regiones
específicas del citoplasma denominadas P-bodies (cuerpos-P, también cuerpos
citoplásmicos o cuerpos GW, porque contienen la proteína GW182), los cuales son
regiones con altas tasas de degradación de ARNm28 ; también se ha detectado
actividad miRNA en los P-bodies29 . Alteración de los P-bodies disminuye la eficiencia
del proceso de RNAi, lo que sugería que los P-bodies podrían ser un lugar crítico para
el proceso de RNAi 30 . Sin embargo, estudios posteriores han demostrado que los P-
bodies no son imprescindibles para el proceso de RNAi, ya que células sin P-bodies
pueden producir silenciamiento tanto con siRNAs como con miRNAs 31 .
Modo de funcionamiento
A pesar del importante progreso realizado en la comprensión de la biogénesis y la
función de los miRNAs, los mecanismos utilizados por los miRNAs para regular la
expresión génica permanecen bajo un intenso debate 32 . En efecto, existen trabajos
publicados que indican que los miRNAs en células animales reprimen la expresión
génica de cuatro formas diferentes:
• degradación de la proteína durante la traducción
• inhibición de la elongación de la traducción
• terminación prematura de la traducción (disgregación de los ribosomas)
• inhibición de la iniciación de la traducción
Además, los miRNAs en animales pueden inducir una degradación significativa de los
ARNm diana (como los miRNAs de plantas), a pesar del apareamiento imperfecto
ARNm-miRNA. Sin embargo, el mecanismo de degradación suele ser diferente: los
miRNAs inducen la degradación de los ARNm diana mediante la eliminación de la
caperuza (en el extremo 5') y de la cola de poliadeninas (poly-A, en el extremo 3') 33 .
Finalmente, los microARNs podrían también silenciar sus ARNm dianas
secuestrándolos en foci (sitios) citoplásmicos discretos, los cuerpos de procesamiento
de ARNm o P bodies, que carecen de maquinaria de traducción. Sin embargo, a pesar
de las discrepancias existentes entre los diferentes mecanismos propuestos, los
apoyos experimentales para cada mecanismo son variados, y son el objeto actual de
intensos estudios, para tratar de elucidarlas.
Por último, en estudios recientes se ha detectado que en determinadas condiciones,
los miRNAs pueden también activar la síntesis proteica 34 .
Características generales de los miRNAs 32 :
• se asocian a la región 3’ UTR de los ARNm diana.
• hacen falta muchos sitios de unión para activar la respuesta de los miRNAs (la
unión de uno solo no produce efectos significativos).
• un ARNm puede estar regulado por differentes miRNAs.
• un único miRNA puede controlar la actividad de cientos de ARNm diferentes. 35
Los primeros estudios a gran escala publicados en Nature en 2008, que utilizan
una variante de la técnica de espectrometría de masas denominada SILAC
(marcado estable de aminoácidos con isótopos pesados en cultivo celular,
Stable Isotope Labelling with Amino acids in Cell culture) para detectar las
proteínas afectadas al reducir o aumentar los niveles de un miRNA concreto,
muestran que en efecto, un único miRNA puede reducir los niveles de cientos
de proteínas mediante el bloqueo de su traducción, no sólo degradando sus
ARNm.36 37 El descubrimiento más llamativo de estos estudios es que los
efectos de los miRNAs sobre las proteínas son habitualmente bastante
modestos, modificando sus niveles de expresión tan sólo en un factor 2. Sin
embargo, a pesar de que los efectos de los miRNAs pueden ser sutiles,
también pueden ser potentes: los miRNAs parecen intervenir en la regulación
de la expresión génica realizando un ajuste fino, de forma compleja e
interconectada.
• la especificidad y la función de los miRNAs están determinados por los
nucleótidos 2 a 7 de la parte 5' de los miRNAs maduros (la llamada región
"semilla" del miRNA): dichos nts deben ser obligatoriamente complementarios
al ARNm diana.38
• un miRNA puede ser funcional aunque no haya sido sintetizado en el núcleo:
un miRNA introducido en la célula por transfección puede inhibir eficazmente la
síntesis de proteínas.
• el miRNA es el responsable de la especificiad de sustrato (el ARNm diana) del
miRNP (complejo micro-ribo-nucleo-proteico, el miRNA unido al complejo
RISC).
Función biológica
Función en la infección viral y la respuesta inmune
• Función anti-viral: el miRNA miR-32 tiene como diana una secuencia presente
en la UTR del extremo 3’ de tpdps los ARNm retrovirales 39
• Función pro-viral: el miRNA miR-122, que se expresa específicamente en el
hígado, es necesario para que el virus de la hepatitis C se exprese de manera
eficiente. 40
• Muchos miRNAs que están regulados diferencialmente en líneas celulares
hematopoyéticas tienen funciones importantes en la regulación del desarrollo y
la función de las células del sistema inmune, y en las interacciones huésped-
patógeno. 41
Función en cáncer
Los miRNAs pueden funcionar como supresores de tumores o como oncogenes;
queda por demostrar su influencia concreta en cada tipo de cáncer. 42 De hecho, un
estudio mostró que cerca del 50% de los miRNAs anotados en humanos están
localizados en áreas del genoma conocidas como sitios frágiles,43 que están asociadas
con el desarrollo de cáncer.
La expresión de ciertos miRNAs está correlacionada con varios tipos de cáncer, por lo
que funcionarían como oncogenes. Por ejemplo, un informe de Sonoki y colaboradores
44
relacionó el gen mir-125b-1 con leucemia, y describió un paciente con leucemia
linfoblástica aguda de precursores de células B que portaba una inserción del pre-
miRNA en el locus de la cadena pesada de la inmunoglobulina. Aunque los
investigadores no pudieron determinar cómo se modulaba la expresión de mir-125b-1
en las células tumorales, este estudio apoya el papel de este gen como un oncomir.
La primera indicación de que los miRNAs podrían funcionar como supresores de
tumores proceden de un informe de Calin y colaboradores 45 que mostraba que
pacientes diagnosticados con una forma frecuente de leucemia en adultos (leucemia
linfoide crónica de las células B o LLC), presentan a menudo deleciones o sub-
regulación (downregulation) de dos genes de miRNAS presentes en un cluster, mir-
15a y mir-16-1. Deleciones dentro del locus 13q14 ocurren en más del 65% de los
casos de LLC, y en más del 50% de los linfomas de las células del manto, el 16–40%
de los mielomas múltiples y el 60% de los cánceres de próstata. Por tanto, se predijo
que un gen supresor de tumores debía residir en esta región de 30-kb. Es interesante
notar que mir-15a y mir-16-1 mapean dentro del intrón de un gen de ARN no-
codificante para proteína, de función desconocida, denominado LEU2. Por otro lado,
algunos estudios establecen una conexión entre la reducción de la expresión de let-7
(que regula la proliferación y diferenciación celular en C. elegans) y el incremento de la
tumorigénesis y el pronóstico grave de los pacientes afectados. 46 Además, durante el
desarrollo normal, LIN28 (un promotor de pluripotencia) puede prevenir la acumulación
de let-7. De acuerdo con estos resultados, se ha propuesto que let-7 regularía la
capacidad pluripotente (stemness) de las células, reprimiendo la auto-renovación y
promoviendo la diferenciación, tanto durante el desarrollo normal como en cáncer.
Por otro lado, se ha observado además que los microRNAs contribuyen a la
progresión maligna del cáncer, específicamente mediando la invasión tumoral y la
formación de metástasis. 47
Función durante el desarrollo
Por ejemplo, en C. elegans, los miRNAs permiten un paso rápido a través de las
diferentes fases del desarrollo: 48 los miRNAs lin-4 [44] </ref> y let-7 [45] controlan el
momento en los que se define el destino de las células neuronales e hipodérmicas
durante el desarrollo larvario. 49 lin-4, let-7 y otros genes de miRNA están consevados
en mamíferos, y su función potencial en el desarrollo embrionario de mamíferos están
bajo estudio activo. En C. elegans, los niveles de expresión de LIN-14 [46] y LIN-28
[47] disminuyen debido a la expresión del ARN de lin-4 al final del primer estadío
larvario, para permitir la progresión a estadíos laravarios posteriores. En los estadíos
larvarios finales, la expresión de LIN-41 [48] y otros genes podría verse reducida por la
expresión del ARN de let-7, liberando la represión de la expresión de la proteína LIN-
29 [49] y permitiendo la progresión al estadío adulto. Dado que el ARNm de lin-29 no
posee sitios complementarios al ARN de let-7, probablemente lin-29 no es una diana
directa de let-7.
Por otro lado, en miocitos de mamíferos, la activación del factor de transcripción SRF
[50] induce la expresión de miR-1–1 [51] y miR-1–2 [52], que a su vez reprime la
expresión del factor de transcripción Hand2 [53] y el ligando de Notch [54], Delta,
afectando por tanto la expansión de las células progenitoras o su diferenciación. 14
SRF también induce la expresión de miR-133a-1 [55] y miR-133a-2 [56], lo que inhibe
a su vez SRF en un lazo de retroalimentación (feedback loop). En músculo opera una
ruta similar, excepto que la inhibición por retroalimentación de Mef2[57] y MyoD[58]
ocurre cuando la expresión de HDAC4[59] está reducida debido al silenciamiento
ejercido por miR-1–1 y miR-1–2.
Uno de los primeros miRNAs detectados con una función en el desarrollo del sistema
inmune 41 fue miR-181a [60]; este miRNA se expresa en altos niveles en las células
del timo y en niveles menores en las células del corazón, los nódulos linfáticos y la
médula ósea. En la médula ósea, miR-181a se expresa en niveles mayores por células
B B220+ B que por células T CD3+. Específicamente, la expresión de miR-181a en
células B derivadas de la médula ósea disminuye durante la maduración de las células
B desde el estadío del desarrollo de pro-célula-B al estadío pre-célula-B. Además, la
expresión ectópica de miR-181a en células enriquecidas en células madre y
progenitoras hematopoyéticas resultó en un incremento en el porcentaje de células B
CD19+ y un descenso en el porcentaje de células T CD8+ en ensayos de
reconstitución de la médula ósea a corto plazo en ratones, demostrando que la
especificidad de líneas celulares de los miRNAs podría tener una función en la
regulación del desarrollo de los linfocitos.
Por otro lado, también se ha detectado una distribución espacial de los miRNAs: en
embriones del pez cebra (zebrafish), los patrones de localización de miRNAs
individuales indican que su actividad podría estar limitada a los tejidos y órganos en
los que se expresan. Por ejemplo, miR-206 [61] se expresa sobre todo en el músculo,
miR-126 [62] en los vasos sanguíneos y el corazón, miR-200a [63] en el sistema de la
línea lateral (un sistema mecanosensorial que detecta el movimiento del agua) y
órganos sensoriales, y miR-30c [64] en el precursor de los riñones. 50
Nuevas funciones: efecto materno
Dos estudios independientes en 2007 en ratones 51 52 indican que una cantidad
significativa de miRNAs maternos se heredan por los zigotos, y que dichos miRNAs
maternos podrían tener un papel importante en las etapas tempranas del desarrollo
embrionario (efecto materno).
NUCLEASAS
El ADN es el depositario y transmisor de la información genética organizada en genes
que codifican productos génicos (proteínas o ARNs). Las nucleasas son enzimas que
producen la rotura de los enlaces fosfodiester de la cadena polinucleotídica de los
ácidos nucleicos. La vida media para el enlace fosfodiester en el ADN a pH 7 y 24 ˚C
se ha estimado en 130.000 años. En las mismas condiciones, la vida media del ARN
es de solamente 4 años.
Las enzimas de restricción son endonucleasas que reconocen, con una alta
especificidad, una secuencia, normalmente palindrómica corta (4-8 pb) de ADN de
doble hebra, produciendo la rotura hidrolítica de cada hebra en secuencias concretas
del ADN denominados sitios de restricción. En las enzimas de restricción no naturales
se trata de aumentar la secuencia de reconocimiento hasta 15 pares de bases.
Aplicaciones bioquímicas de las nucleasas.
Las nucleasas se pueden utilizar para la determinación estructural de ácidos
nucleicos mediante el diseño de nucleasas que puedan reconocer ciertas
conformaciones de los ácidos nucleicos (cruciformes, por ejemplo), regiones de hebra
sencilla o de hélices levógiras y para el estudio del mecanismo de acción de las
nucleasas naturales.
Aplicaciones terapéuticas.
Las nucleasas se pueden emplear en el tratamiento de enfermedades producidas por
virus, hongos, bacterias y algunos tipos de cáncer. Si el grupo catalítico está unido a
un oligonucleótido antisentido pueden producir la rotura del ARNm lo cual impide la
síntesis de la proteína codificada por el gen respectivo
Genoma
El genoma es todo el material genético contenido en las células de un organismo en
particular. Por lo general, al hablar de genoma en los seres eucarióticos nos referimos
sólo al ADN contenido en el núcleo, organizado en cromosomas. Pero no debemos
olvidar que también la mitocondria contiene genes (véase genoma mitocondrial). El
término fue acuñado en 1920 por Hans Winkler, profesor de Botánica en la
Universidad de Hamburgo, Alemania, como un acrónimo de las palabras gene y
chromosoma.1
En el caso de los seres humanos, el genoma nuclear tiene 6.000 millones de pares de
bases, lo que incluye dos copias muy similares del genoma haploide de 3.000 millones
de pb. El término diploide indica que un organismo tiene dos copias del genoma en
sus células, debido a la presencia de pares de cromosomas homólogos.
El genoma no analiza la diversidad genética o el polimorfismo de los genes de una
especie. Por ejemplo, en el genoma humano la secuencia en principio podría ser
determinada con sólo la mitad del ADN de una célula de un individuo. Para conocer
una variación particular o en enfermedades se requiere la comparación entre
individuos.
Hitos en la historia del genoma
• 1866 Se publican las Leyes de la herencia de Gregor Mendel en Proceedings
of the Natural History Society of Brunn.
• 1868 Friedrich Miescher, biólogo suizo, identifica el ADN nuclear, nucleína.
• 1901-1903 Se publica Mutationstheorie de Hugo de Vries.
• Albrecht Kossel descubrió los ácidos nucleicos. A este bioquímico alemán le
fue otorgado el Premio Nobel de Fisiología o Medicina en 1910 por sus
contribuciones en el desciframiento de la química de ácidos nucleicos y
proteínas, descubriendo los ácidos nucleicos, bases en la molécula de ADN,
• 1950 Alfred Hershey y Marta Chase usan virus para confirmar que el ADN es el
material genético.
• 1951 Primera proteína secuenciada: insulina.
• 1953 James Watson y Francis Crick desentrañaron la estructura en doble
hélice de la molécula del ácido desoxirribonucleico (ADN).
• 1956 Se descubre el número total de cromosomas en el ser humano, por los
investigadores Albert Levan y Joe Hin Tjio.
• 1958 Los franceses Jerome Lajeune, M. Gautier y R. Turpin, descubren la
trisomía del par 21 como causante del síndrome de Down.
• 1960 Determinación del código genético.
• 1970 Nathans y Smith descubren las enzimas de restricción, enzima que puede
cortar el ADN en lugares específicos.
• 1973 Los investigadores Stanley Cohen y Herbert Boyer producen el primer
organismo recombinando partes de su ADN en lo que se considera el
comienzo de la ingeniería genética.
• 1977 Secuenciación del ADN.
• 1978 Publicación en la revista Science de la primera secuenciación de un
genoma, el del virus del simio 40 (SV40) con 5.226 nucleótidos.
• 1975-1979 Primeros genes humanos aislados.
• 1982 Fabricación del primer fármaco basado en tecnología de ADN-
recombinante.
• 1985 Kay Mullis inventa la reacción en cadena de la polimerasa.
• 1988 Se crea la Organización del Genoma Humano Human Genome
Organisation (HUGO).
• 1995 Primer genoma completo: Haemophilus Influenzae.
• 1999 Primer cromosoma completo: el 22.
• 2000 Marzo - Publicación del genoma completo de la Drosophila melanogaster
gracias al consorcio público y la compañía Celera Genomics. Alberga alrededor
de 13.600 genes.
• 24 de abril 2003 Se completa la secuencia del genoma humano.
Algunos datos que se van conociendo
• El genoma humano contiene alrededor de 3.000 millones de pares de bases
(A, C, T y G).
• Por término medio los genes contienen 3.000 pares de bases, pero el tamaño
varía mucho, el más grande conocido en el humano es el de la distrofina, con
2,4 millones de pares de bases.
• Se desconoce la función de más del 50% de los genes descubiertos.
• La secuencia del genoma humano es casi (99,9%) exactamente la misma en
todas las personas.
• Alrededor del 2% del genoma codifica instrucciones para la síntesis de
proteínas.
• Las secuencias repetidas que no codifican proteínas forman alrededor del 50%
del genoma humano.
• Se cree que las secuencias repetidas no tienen una función directa, pero
mantienen la estructura y el dinamismo de los cromosomas.
• El cromosoma 1 (el cromosoma humano más grande) tiene la mayor cantidad
de genes (2.968), y el cromosoma Y la menor (231).
• Se han identificado alrededor de 3 millones de localizaciones en el genoma
donde existen diferencias de una base entre distintos humanos. Esta
información promete revolucionar el proceso de hallazgo de secuencias de
ADN relacionadas con enfermedades del tipo : cardiopatías, diabetes, artritis y
cánceres.
Complejidad del genoma
Tamaño de algunos tipos de genomas
Tamaño Genoma
Organismo
(pares de bases)
Fago λ 5×104
Escherichia coli 4×106
Levadura 2×107
Caenorhabditis elegans 8×107
Drosophila melanogaster 2×108
Humano 3×109
Nota: El ADN de una simple célula tiene una longitud aproximada de 1,8A.
Las investigaciones llevadas a cabo hasta ahora sugieren que la complejidad del
genoma humano no radica ya en el número de genes, sino en cómo parte de estos
genes son usados para construir diferentes productos en un proceso que es llamado
[[ayuste alternativo]] (alternative splicing). Otra importante razón de esta complejidad
radica en el hecho de que existan miles de modificaciones químicas para fabricar
proteínas así como del repertorio de mecanismos que regulan este proceso.
¿Qué beneficios puede traer el estudio del genoma?
• Diagnóstico y prevención de enfermedades
Prueba genética: las pruebas basadas en el ADN son casi el primer uso
comercial y de aplicación médica de los nuevos descubrimientos en genética.
Estos ensayos se pueden usar para el diagnóstico de enfermedades, la
confirmación diagnostica, la información del pronóstico así como del curso de
la enfermedad, para confirmar la presencia de enfermedad en pacientes
asintomáticos y, con variados grados de certeza, para predecir el riesgo de
enfermedades futuras en personas sanas y en su descendencia.
• Estudio de susceptibilidad en las enfermedades
• Intervención (tratamiento) sobre la enfermedad: posibilidades de desarrollo de
técnicas o para tratar enfermedades hereditarias. El procedimiento implica
reemplazar, manipular o suplementar los genes no funcionales con genes
funcionales. En esencia, la terapia génica es la introducción de genes en el
ADN de una persona para tratar enfermedades. La posible creación de
fármacos a medida del enfermo Terapia génica y Farmacogenómica.
Otros posibles beneficios de la investigación genética
• Medicina molecular
• Genómica microbiana
• Valoraciones de riesgo
• Bioarqueología, antropología, evolución y estudio de migraciones humanas,
paleogenética principalmente a partir del ADN fósil
• Identificación ADN
• Agricultura y bioprocesamiento
Otros proyectos de genoma
• Genoma del ratón
• Genoma del arroz
• Genoma de la planta Arabidopsis
• Genoma del pez globo
• Genoma de bacterias del tipo Escherichia coli
Plásmido
Los plásmidos (también llamados plasmidios) son moléculas de ADN
extracromosómico circular o lineal que se replican y transcriben independientes del
ADN cromosómico. Están presentes normalmente en bacterias, y en algunas
ocasiones en organismos eucariotas como las levaduras. Su tamaño varía desde 1 a
250 kb. El número de plásmidos puede variar, dependiendo de su tipo, desde una sola
copia hasta algunos cientos por célula. El término plásmido fue presentado por primera
vez por el biologo molecular norteamericano Joshua Lederberg en 1952.1
Las moléculas de ADN plásmidico, adoptan una conformación tipo doble hélice al igual
que el ADN de los cromosomas, aunque, por definición, se encuentran fuera de los
mismos. Se han encontrado plásmidos en casi todas las bacterias. A diferencia del
ADN cromosomal, los plásmidos no tienen proteínas asociadas.
En la mayoría de los casos se considera genético dispensable. Sin embargo, posee
información genética importante para las bacterias. Por ejemplo,los genes que
codifican para las proteínas que las hace resistentes a los antibióticos están,
frecuentemente, en los plásmidos.
Hay algunos plásmidos integrativos, vale decir tienen la capacidad de insertarse en el
cromosoma bacteriano. Digamos que rompe el cromosoma y se sitúa en medio, con lo
cual, automáticamente la maquinaria celular también reproduce el plásmido. Cuando
ese plásmido se ha insertado se les da el nombre de episoma.
Los plásmidos se utilizan en ingeniería genética por su capacidad de reproducirse de
manera independiente del ADN cromosomal como así también por que es
relativamente fácil manipularlos e insertar nuevas secuencias genéticas.
Los plásmidos usados en Ingeniería Genética suelen contener uno o dos genes que
les confieren resistencia a antibióticos y permiten seleccionar clones recombinantes.
Hay otros métodos de selección además de la resistencia a antibióticos, como los
basados en fluorescencia o en proteínas que destruyen las células sin uso de
antibióticos. Estos nuevos métodos de selección de plásmidos son de uso frecuente
en agrobiotecnologia, debido a la fuerte crítica de grupos ecologistas contra la
posibilidad de presencia de antibioticos en los organismos modificados genéticamente.
Resistencia a los antibióticos
Los plásmidos a menudo contienen genes o paquetes de genes que le confieren una
ventaja selectiva lo cual les da la habilidad de hacer a la bacteria, resistente a los
antibióticos.
Cada plásmido contiene al menos una secuencia de ADN que sirve como un origen de
replicación u ORI (un punto inicial para la replicación del ADN), lo cual habilita al ADN
para ser duplicado independientemente del ADN cromosomal. Los plásmidos de la
mayoría de las bacterias son circulares, pero también se conocen algunos lineales, los
cuales reensamblan superficialmente los cromosomas de la mayoría de eucariotes.
Epísomas
Un epísoma es un plásmido que puede integrarse por sí mismo al ADN cromosomal
del organismo huésped. Por esta razón, puede mantenerse en contacto por un largo
tiempo, ser duplicado en cada división celular del huésped y volverse parte básica de
su mapa genético. Este término no se usa más en plásmidos, debido a que ahora está
claro que una región homologa con el cromosoma elabora un plásmido dentro de un
epísoma.
Los plásmidos usados en ingeniería genética son llamados “vectores”. Estos son
usados para transferir genes desde un organismo a otro y típicamente contienen un
marcador genético confiriendo un fenotipo el cual puede ser seleccionado a favor o en
contra. La mayoría también contienen un polivinculador o sitio de clonado múltiple
(MCS), el cual es una pequeña región que contiene los sitios de restricción más
comúnmente usados, permitiendo una fácil inserción de fragmentos de ADN en ese
lugar.
Tipos
Una forma de agrupar plásmidos es por su habilidad de transferirse a otra bacteria.
Los plásmidos conjugativos contienen “tra-genes”, los cuales ejecutan complejos
procesos de conjugación, como la transferencia sexual de plásmidos a otra bacteria.
Los plásmidos no-conjugativos, son incapaces de iniciar una conjugación, de allí que
ellos pueden transferirse únicamente con la asistencia de los plásmidos conjugativos y
lo hacen “por accidente”. Una clase intermedia de plásmidos son los “mobilizables” los
cuales llevan solo un subtipo de genes requeridos para la transferencia. Ellos pueden
“parasitar” un plásmido conjugativo, transfiriéndose a una alta frecuencia solo en su
presencia.
Es posible para plásmidos de diferentes tipos el coexistir en una celular simple.
Siete tipos diferentes de plásmidos han sido encontrados en la E. Coli. Pero
normalmente plásmidos relacionados son incompatibles, en el sentido de que solo una
de ellos sobrevive en la línea celular, debido a la regulación de las funciones vitales de
los plásmidos. Por lo tanto, los plásmidos pueden ser diferenciados de acuerdo a
grupos de compatibilidad.
Otra forma de clasificar plásmidos es por función. Hay 5 clases principales:
• Plásmidos de fertilidad: los cuales contienen tra-genes, ellos son capaces de
conjugarse.
• Plásmidos de resistencia: los cuales contienen genes que pueden constituir
resistencia contra antibióticos o venenos. Históricamente conocidos como
Factores R, antes de que se entendiera la naturaleza de los plásmidos.
• Col-plásmidos: los cuales contienen genes que codifican (determinan la
producción de) colinas y proteínas que pueden matar a otra bacteria.
• Plásmidos degradativos: los cuales habilitan la digestión de sustancias
inusuales como tolueno o ácido salicílico.
• Plásmidos virulentos: los cuales convierten la bacteria en un patógeno.
Los plásmidos pueden pertenecer a más de uno de estos grupos funcionales.
Los plásmidos solo pueden coexistir como una o más copias en cada bacteria, debido
a la división celular pueden perderse en una de las bacterias segregadas.
Algunos plásmidos incluyen un sistema de adición o “Sistema de Muerte
Postsegregacional” (PSK: Postsegregational Killing System). Ellos producen en
conjunto un veneno de larga vida y un antídoto de vida corta. Las células hija que
retienen una copia del plásmido sobreviven, mientras que una célula hija que falla al
integrar el plásmido muere o sufre una reducida tasa de crecimiento debido al veneno
que obtuvo de la célula padre. Este es un ejemplo de plásmidos como el ADN
replicante.
Aplicaciones
Los plásmidos sirven como una importante herramienta en laboratorios de genética e
ingeniería bioquímica, donde son comúnmente usados para multiplicar (hacer muchas
copias de) o como genes particulares expresos. Muchos plásmidos están disponibles
comercialmente para dichos usos.
El gen a ser replicado se inserta en copias de un plásmido el cual contiene genes que
hacen células resistentes a un antibiótico en particular. En el paso siguiente el
plásmido es insertado en la bacteria por medio de un proceso llamado transformación.
Luego, la bacteria es expuesta a un antibiótico particular. Solo la bacteria que toma
copias del plásmido sobrevive al antibiótico debido a que el plásmido lo hace
resistente. En particular, los genes protectores son expresados (usados para hacer
proteína) y la proteína expresada evita la acción del antibiótico. De esta forma, los
antibióticos actúan como un filtro que seleccionan únicamente la bacteria modificada.
Ahora, estas bacterias pueden ser cultivadas en largas cantidades, cosechadas y el
plásmido de interés puede ser aislado.
Otro uso importante de los plásmidos es fabricar grandes cantidades de proteínas.. En
este se deja crecer la bacteria que contiene el plásmido que encierra al gen de interés.
Solo como la bacteria produce la proteína que le confiere si resistencia a los
antibióticos, este también puede ser usado para producir proteínas en grandes
cantidades desde el gen insertado. Esta es una forma barata y fácil de producir genes
o proteínas que este codifica de forma masiva, como por ejemplo insulina, o inclusive
antibióticos.
Extracción del ADN plasmídico
Como se comentaba anteriormente, los plásmidos son usados a menudo para purificar
una secuencia específica, debido a que ellos pueden ser fácilmente purificados del
resto del genoma. Para su uso como vectores y como clonadores moleculares, a
menudo los plásmidos necesitan ser aislados.
Hay muchos métodos de aislar ADN plasmídico de una bacteria, los arquetipos de los
cuales son el miniprep y el maxiprep. El miniprep se suele usar desde una perspectiva
analítica. El resultado es una cantidad de ADN plasmídico (10-30µg), el cual es
suficiente para análisis usando digestión restrictiva, para secuenciación o para algunas
técnicas de ingeniería genética.
En el maxiprep, se cultivan volúmenes mucho más grandes de bacterias en
suspensión. Esencialmente este es un escalado de la preparación mini-prep, el cual es
seguido por una purificación adicional. Esto resulta en una cantidad relativamente
grande (0,5 -1 mg) de ADN plásmido muy puro.
En los últimos tiempos muchos kits comerciales han sido creados para realizar la
extracción plasmídica a varias escalas, pureza y niveles de automatización.
Conformaciones
El ADN plásmido puede aparecer en uno de cinco conformaciones, las cuales (para un
tamaño dado) corren a diferentes velocidades en un gel durante electroforesis. Las
conformaciones se muestran abajo en orden de movilidad electroforética (velocidad
para un voltaje dado), del más lento al más rápido:
• Mellado abierto circular: el ADN tiene un solo corte filamentario.
• Lineal: ADN tiene terminales libres, ya sea porque los filamentos fueron
cortados o porque el ADN era linear in vivo. Usted puede modelar este como
un cordón que no se ha conectado así mismo.
• circular relajado: ADN que interactúa completamente con ambos filamentos sin
cortar, pero que ha sido enzimáticamente “relajado”. Usted puede modelar este
dejando un cordón relajado y luego conectándolo a sí mismo.
• superespiral desnaturalizado: ADN como el ADN superespiral o superenrollado
(ver más abajo), pero que tiene regiones sin unir que lo hacen ligeramente
menos compacto; esto resulta de una excesiva alcalinidad durante la
preparación del plásmido.
• ADN superespiral: Es un ADN totalmente intacto con los filamentos sin cortar, y
con forma de remolino, resultando en una forma compacta.
La tasa de migración de pequeños fragmentos lineales es directamente proporcional al
voltaje aplicado (en el caso de voltajes bajos). En el caso de altos voltajes, grandes
fragmentos migran continuamente a diferentes tasas. Por lo tanto, la resolución del gel
decrece con el incremento del voltaje.
A un bajo voltaje determinado, la migración de un pequeño fragmento lineal de ADN
esta en función de su longitud. Fragmentos lineales largos (de 20kb) migran a cierta
tasa sin importar la longitud. Esto es debido a que las moléculas “reptan” desde el
centro de la molécula siguiendo el sentido de la matriz de gel.
La digestión restrictiva se usa frecuentemente para analizar fragmentos purificados de
plásmidos. Estas enzimas rompen específicamente el ADN en ciertas secuencias
cortas.
Plásmidos en la cultura popular
En el videojuego Bioshock, los jugadores pueden darle poderes a su personaje al
inyectarse plásmidos en su cuerpo. También se hace referencia a la recombinación
como concepto de inyectar distintos plásmidos y cambiar así la propia estructura
genética, obteniendo nuevas habilidades físicas especiales.