Structure et fonction de l’ARN
Fonctions cellulaires de l’ARN
● ARN messagers
● ARN de transfert Fonctions génétiques
● génomes viraux à ARN
● ARN régulateurs: micro ARN
● autoépissage d'ARN viraux Fonctions enzymatiques
● maturation ARNt par la = ribozymes
ribonucléase P (Altman, Cech, 1983)
● épissosome (snRNA)
● le ribosome
Hypothèse du «monde ARN»
?
Ribonuclease P:tRNA Self-splicing group II intron
Reiter et al, Nature 2010 Toor et al, Science 2008
Le ribosome est un «ribozyme»
Nature (2000) 407:327 50% de la masse bactérienne...
Ramakrishnan Steitz Yonath
Prix Nobel de
Chimie, 2009
“Interférence” par l'ARN
MicroARN: petits ARN régulateurs
chez les eucaryotes
Mello
Fire
Prix Nobel de
Médecine, 2006 Coupure/inactivation de l'ARNm
Poly “Biologie moléculaire, pg 217
L’ARN peut adopter une structure 3D complexe
Cette structure 3D lui permet d’accomplir des
fonctions catalytiques ou biologiques complexes
Des molécules peuvent cibler ces structures d’ARN :
antibactériennes, antivirales, antimitotiques
Antiobiotiques ciblant l’ARN (le ribosome)
Antiobiotiques ciblant l’ARN
La richesse des structures de l’ARN lui permet de
reconnaître des ligands variés de manière spécifique
Un ARN obtenu par évolution dirigée ou “Selex”
Structure de l’ARN
Nature chimique de l’ARN
O O
O- NH O- NH
O P O O P O
N O N O
O- O O- O
NH2 NH2
O N O OH N
O P O O P O
N O N O
O- O O- O
O O
O N O OH N
NH NH
O P O O P O
N N N NH2
N NH2 O- O
O- O
NH2 NH2
O N O OH N
N
N
O P O O P O
N N N
N O- O
O- O
OH OH OH
ADN ARN
Les ARN contiennent aussi des bases non-standards
Pseudouridine Dihydrouridine
Inosine 7-methyl guanosine
… et beaucoup d'autres
Différences ARN-ADN
● Présence d’un groupement 2’-OH sur le sucre
(au lieu du 2’-H): plus polaire
● Remplacement de la thymine par l’uracile
= suppression du groupement 5-CH3
Petites modifications grands effets
Modification de la géométrie locale
notion de “plissement” du ribose
C2' endo C3' endo
Impact sur la géométrie globale
Forme A
préférée
2’ OH par l'ARN
Forme B
préférée
par l'ADN
La modification de géométrie
affecte la taille des sillons
Le petit sillon est
peu marqué
Le grand sillon est
très profond et pincé
Interactions ARN:protéines ADN:protéines
ADN: insertion élément de structure secondaire
(hélice, boucle) dans le grand sillon
ADN
Interaction ARN:protéine
La reconnaissance spécifique d’un
ARN s’effectue souvent via les
zones de structure moins régulière
UC
U G
C–G La protéine se lie dans
A–U
C–G
G–C
une irrégularité de
C–G l’hélice
G G
U
G A
G–C
U–A
C–G
U•G
G–C
G–C
La présence du 2’ hydroxyle rend
la molécule d’ARN chimiquement labile
L’ARN s’autolyse en conditions alcalines
N
O NH
O
N N
NH N NH2
O
O
N N NH2
O
O O
P
3’-phosphate cyclique
O O H -O H O O-
H P OH
O-
O H O O CH2 B
O
CH2
5’-hydroxyle
O OH
Le groupement 2’OH permet la catalyse de réactions
chimiques
Auto-coupure
A U
A C
YGA
C
PAG
U A U
G
Ribozyme en tête de marteau
Avocado Sunblotch Virus
Martick, Scott Cell '06
Nature chimique de l’ARN
O O
O- NH O- NH
O P O O P O
N O N O
O- O O- O
NH2 NH2
O N O OH N
O P O O P O
N O N O
O- O O- O
O O
O N O OH N
NH NH
O P O O P O
N N N NH2
N NH2 O- O
O- O
NH2 NH2
O N O OH N
N
N
O P O O P O
N N N
N O- O
O- O
OH OH OH
ADN ARN
L’ARN est produit par transcription à partir de l’ADN
● ARN = molécule linéaire courte
ADN long ARN court
● la plupart des ARN sont monobrins
ADN double brin ARN simple brin
● «turnover» plus ou moins rapide
ADN pérenne ARN labile
ARNm procaryotes: ½ vie moyenne de 3'
ARNm eucaryotes: ½ vie plus longue et variable;
Goldman et al protéines régulatrices quelques minutes; globines 10h!
Nature '13
Appariements de bases
En plus des 2
appariements
canoniques,
l’ARN tolère
fréquemment des
appariements G-U, dits
«bancals» (wobble)
A-U et G-C sont
«isostères», tandis que
l’appariement G-U
provoque une légère
distortion du squelette
ribose phosphate
Appariements de bases
En plus des 2
appariements
canoniques,
l’ARN tolère
fréquemment des
appariements G-U, dits
«bancals» (wobble)
A-U et G-C sont
«isostères», tandis que
l’appariement G-U
provoque une légère
distortion du squelette
ribose phosphate
Appariements de bases
En plus des 2
appariements
canoniques,
l’ARN tolère
fréquemment des
appariements G-U, dits
«bancals» (wobble)
A-U et G-C sont
«isostères», tandis que
l’appariement G-U
provoque une légère
distortion du squelette
ribose phosphate
Structure secondaire et tertiaire
● Structure primaire : séquence des nucléotides
● Structure secondaire : identification des régions appariées
● Structure tertiaire : repliement en 3D et contacts correspondants
En 1ère approximation, le repliement de l'ARN est “hiérarchique”:
formation puis assemblage des éléments de structure secondaire
Structures secondaires-type
boucle terminale
boucle
interne
boucle boucle
multiple terminale
“enflement”
ou “bulge” –––AGGACUU–––––AAGUCCU–––
5' 3'
Séquences répétées inversées
Structures secondairestype
Séquences répétées inversées
boucle terminale
boucle
interne
boucle boucle Dans les prédictions de
multiple terminale
structure secondaire, les
“enflement”
ou “bulge” interactions boucle-boucle
seront négligées
Pseudonœuds
pseudonoeud «vrai» noeud
Lorsqu’une boucle forme un appariement avec une région située à l'extérieur de
la tige, on dit que la structure forme un pseudo-nœud
La longueur de la région appariée dans la boucle ne peut dépasser
10 à 11 nucléotides.
Sinon, formation d’un nœud topologique
Pseudonœuds
On trouve localement quelques pseudo-nœuds dans de nombreux ARN naturels
ex : Turnip Yellow Mosaic Virus
En général, les deux hélices sont empilées et coaxiales
Stabilité des structures
● Liaisons hydrogène (électrostatique)
● Empilement des plateaux de bases : van der Waals
● Empilement des plateaux de bases : «effet hydrophobe»
(masquage des bases hydrophobes vis à vis du solvant)
● Solvatation des phosphates (électrostatique)
Fonction d'énergie: mécanique moléculaire
U = liaisons kb (bb0)2 + angles ka (aa0)2 + torsions kt [1 + cos(nt)]
+ ij [ Aij/rij12 Bij/rij6 + qiqj/rij ]
.35 H H H
N-.30
.3
H
CH2
-.55
.3 -.6
CH2 H N O
CH2 C .55
-.55
CH2 O CH2 O CH3
-.35
N CH C N CH C N CH
.55
.25
H H H
Evaluation expérimentale de la stabilité
L'absorption UV des bases à 260 nM est plus importante lorsque l’ARN est
sous-forme de simple-brin dénaturé (« hypochromicité » de la double-hélice)
On peut suivre la fusion d'un duplex par spectrophotométrie
Evaluation des paramètres de stabilité thermodynamique
[Duplex]
5’
AGAUAUCU3’ 2 [Brin] [Duplex] K=
3’UCUAUAGA5’
[Brin]2
Enthalpie libre standard
de formation du duplex Go = – RT logK = Ho – T So
A la température de fusion,
2 [Duplex] = [Brin] +R Tfus log(2 [Brin]) = Ho – Tfus So
la moitié de l’ARN est sous
forme de duplex
Conservation de la
2 [Duplex] + [Brin] = ARNtotal
quantité d’ARN totale
Mesures pour 2 Tfus =
Ho On néglige la variation
valeurs de ARNtotal So + R log(ARNtotal ) de H° et S° avec T
?
Modèle des premiers voisins
L’énergie pour former une paire de bases ne dépend que des interactions
entre celle-ci et les deux paires adjacentes (empilement + liaisons H)
Pas d’effets à longue portée
Ghélice ≈ Gempilements individuels
Gn Gn+1
5' A 5' AG
3' U 3' UC
G( AG
UC
) = Gn+1 Gn
Modèle des premiers voisins
L’énergie pour former une paire de bases ne dépend que des interactions
entre celle-ci et les deux paires adjacentes (empilement + liaisons H)
Pas d’effets à longue portée séquence-dépendants
Ghélice ≈ Gempilements individuels
Gn Gn+1
5' A 5' AG
3' U 3' UC
G( AG
UC
) = Gn+1 Gn + constante
Modèle des premiers voisins
L’énergie pour former une paire de bases ne dépend que des interactions
entre celle-ci et les deux paires adjacentes (empilement + liaisons H)
Pas d’effets à longue portée séquence-dépendants
Ghélice ≈ Gempilements individuels
Gn Gn+1
5' X X' 5' X A X'
3' Y Y' 3' Y B Y'
Gn+1 Gn = G( XA ) + G(AX') G ( XX') + constante
YB BY' YY'
Tables de Freier-Turner
G ( XX')
YY' paire de base en 5' (XY)
(kcal/mol) GU UG AU UA CG GC
GU -0.5 -0.6 -0.5 -0.7 -1.5 -1.3
UG -0.5 -0.5 -0.7 -0.5 -1.5 -1.9
paire de AU -0.5 -0.7 -0.9 -1.1 -1.8 -2.3
base en 3' UA -0.7 -0.5 -0.9 -0.9 -1.7 -2.1
(X'Y')
CG -1.9 -1.3 -2.1 -2.3 -2.9 -3.4
GC -1.5 -1.5 -1.7 -1.8 -2.0 -2.9
Freier et al (1986) Proc Nat Acad Sci (USA) 83:9373 ;
Turner et al (1987) Cold Spring Harb Symp Quant Biol, 52:123
Turner (2000) in Nucleic Acids, U. Science Books
Les règles d’empilement sont asymétriques
5’-CG-3’ 5’-GC-3’
3’-GC-5’ 3’-CG-5’
Les règles d’empilement sont asymétriques
C G
G C
5’-CG-3’ 5’-GC-3’
3’-GC-5’ 3’-CG-5’
G = -2.0 kcal/mol G = -3.4 kcal/mol
Tables de Freier-Turner
paire de base en 5'
GU UG AU UA CG GC
GU -0.5 -0.6 -0.5 -0.7 -1.5 -1.3
UG -0.5 -0.5 -0.7 -0.5 -1.5 -1.9
paire de AU -0.5 -0.7 -0.9 -1.1 -1.8 -2.3
base en 3' kcal/mol
UA -0.7 -0.5 -0.9 -0.9 -1.7 -2.1
CG -1.9 -1.3 -2.1 -2.3 -2.9 -3.4
GC -1.5 -1.5 -1.7 -1.8 -2.0 -2.9
Taille de boucle 1 2 3 4 5 6 7 8 9 10 20
Enflements 3 5 6 7 7 8 9 10 10 11 14
Boucles terminales - - 7 6 4 4 4 4 4 4 7
Boucles internes - 1 1 2 2 2 3 3 3 4 7
Freier et al (1986) Proc Nat Acad Sci (USA) 83:9373 ;
Turner et al (1987) Cold Spring Harb Symp Quant Biol, 52:123
Turner (2000) in Nucleic Acids, U. Science Books
Tétraboucles hyperstables
GNRA
Tétraboucles hyperstables
Les ARNs de structures
connues contiennent un
nombre anormalement
élevé de boucles de 4
nucléotides (tetraboucles)
Ces boucles appartiennent
pour la majorité à 2 classes:
GNRA
UNCG
Recherche de structure secondaire optimale
Recherche de structure secondaire optimale
● Méthode exhaustive de type force brute impraticable
● Méthodes par programmation dynamique
● Nussinov, R. and Jacobson, A.B. (1980) Fast algorithm for predicting the secondary
structure of single- stranded RNA. Proc Natl Acad Sci U S A, 77, 6903-6913.
● Zuker, M. and Stiegler, P. (1981) Optimal computer folding of large RNA sequences
using thermodynamics and auxiliary information. Nucleic Acids Res, 9, 133-148.
Algorithme de Nussinov
On adopte une fonction d'énergie E qui ne prend
en compte que les appariements, pas l'empilement.
Principe :
Pour chaque paire i,j de nucléotides, on tabule l’énergie E(i,j) de la
structure la plus stable, S(i,j), pour la sous-séquence allant de i à j
Algorithme de Nussinov
Principe :
Pour chaque paire i,j de nucléotides, on tabule l’énergie E(i,j) de la
structure la plus stable, S(i,j), pour la sous-séquence allant de i à j
4 façons d'obtenir S(i,j):
1) ajouter i,j, appariés, à S(i+1,j-1)
i+1 j-1
i j
2) ajouter i, non-apparié, à S(i+1,j)
3) ajouter j, non-apparié, à S(i,j-1)
4) réunir deux sous-structures optimales, S(i,k) et S(k+1,j)
Algorithme de Nussinov
On adopte une fonction d'énergie E qui ne prend
en compte que les appariements, pas l'empilement
1 2 3 4
i+1 j-1
i j i+1 j i j-1 i j
i j k k+1
i,j appariés i seul j seul union de
sousstructures
Algorithme de Nussinov
i+1 j-1
i j i+1 j i j-1 i j
i j k k+1
L'énergie E ne prend en compte que les appariements, pas l'empilement
Relation de récursion:
E(i+1,j-1) + e(i,j)
E(i+1,j)
E(i,j) = Min
E(i,j-1)
Min (E(i,k) + E(k+1,j))
i<k< j-1
Algorithme de Nussinov E(1,N)
j
i 0
0
Je epl
Je
re ie l
0
pl
r
ie e s s
le éq
0
s s ue
éq n c
Relation de récursion: 0
ue es
nc de
es
0
de long
E(i,j) =
lo ue
0
ng u r
ue 2
E(i+1,j-1) + e(i,j)
ur
0
3
E(i+1,j)
Min E(i,j-1)
Min (E(i,k) + E(k+1,j))
i<k< j-1
Algorithme de Nussinov
j k
i 0
x 0
x 0 3,7 3,11
x 0
x 0 +
Relation de récursion:
x 0
E(i,j) =
x 0
E(i+1,j-1) + e(i,j) x 0 8,11 k+1
E(i+1,j) x
Min E(i,j-1)
Min (E(i,k) + E(k+1,j))
i<k< j-1
Algorithme de Zuker
L'énergie E prend en compte les appariements et l'empilement.
E(i+1,j)
E(i,j-1) E(i,j) : energie de la meilleure
E(i,j) = Min V(i,j) structure sur le segment [i,j]
Min(E(i,k)+E(k+1,j))
i<k<j-1
Boucle terminale(i,j) V(i,j) : energie de la meilleure
V(i+i,j-1) + e(i,j) structure sur le segment [i,j] où
V(i,j) = Min
Boucle interne(i,j) l’appariement (i,j) est formé
Boucle multiple(i,j)
Programmation dynamique avec deux tableaux
Zuker (1981, 2003) Nucleic Acids Research
Algorithme de Zuker
[Link]
Zuker, Nucl Acids Res, 2003
Programmation dynamique sans pseudonoeuds O(N 3) Nussinov, Zuker
Programmation dynamique avec pseudonoeuds O(N 6) Rivas, Eddy (1999) J Mol Biol
Programmation dynamique avec pseudonoeuds O(N 5) Condon et al (2004) Theor Comp Sci
Les méthodes récentes fournissent toutes les structures (secondaires) ayant
une énergie dans un intervalle donné au dessus du minimum global:
structures “sous-optimales”
J. Mol. Biol. (2006) 359:526
Current Opin. Struct. Biology 2007, 17:157
Validation des prédictions
● Etudes phylogénétiques: mutations “compensatoires”
● Sondage chimique et enzymatique de l’ARN
Mutations compensatoires
Hypothèse : la structure 2D d'ARN homologues est conservée
Corollaire : la présence d’un appariement est conservée mais pas
nécessairement la nature des bases impliquées
C-G G-C
Espèce 1 Espèce 2
Mutations compensatoires
Thermus thermophilus Escherichia coli
ARN ribosomal 5S
(120 nt, grande sous-unité)
Etudes phylogénétiques
1) Alignement des séquences (difficile...)
2) Etude des covariations de nucléotides
fb,b'
Information mutuelle: M(i,j) = b,b' fb,b' log f f
b b'
i j
x x C x x x x G x x
fb (resp. fb') = fréquence de
x x A x x x x U x x
b (b') dans la colonne i (j)
x x G x x x x C x x
b b'
M(i,j) = fCG log fCG/fCfG + fAU log fAU/fAfU + fGC log fGC/fGfC
+ 13 x zéro
= log 3
Sondes enzymatiques
L’activité de certaines ribonucléases
dépend de la structure de l’ARN substrat
Ribonucléase S1
Clive préférentiellement les régions simple-brin
Ribonucléase V1
Clive préférentiellement entre les bases appariées et empilées
Ribonucléase T1
Clive après les guanosines
Sondes enzymatiques
Ribonucléase S1
Sondes chimiques
sonde chimique
Les modifications sont révélées par transcription inverse
à partir d’une amorce marquée
La polymérisation est bloquée par la base modifiée
Sondes chimiques
O O
S
CH3 O O CH3
diméthyl sulfate
O NH 2
N N
NH N
N N NH2 N N
Alkyle la position N7 des G et N1 des A
Structure 3D:
tout ce que nous avons négligé...
Interactions noncanoniques
En plus des interactions Watson-Crick et G-U wobble, il est possible
de former des appariements «non-canoniques» entre bases
Watson-Crick Hoogsteen Reverse-
(brins //) Hoogsteen
(brins anti-//)
Interactions noncanoniques
X .
. X X X
Il existe une grande variété d’interactions non-canoniques
Plusieurs dizaines d’appariements non-
canoniques ont été observés dans les
structures 3D d’ARN.
Ceux-ci peuvent être classés en fonction
des faces d’interaction sur les bases, de
l’orientation de la base par rapport au
sucre (syn/anti) et du sens du squelette
ribose- phosphate
Leontis, Stombaugh & Westhof (2002)
Nucleic Acids Res. 30: 3497-3531
Il existe une grande variété d’interactions non-canoniques
Plusieurs dizaines d’appariements non-
canoniques ont été observés dans les
structures 3D d’ARN.
Ceux-ci peuvent être classés en fonctions des
faces d’interaction sur les bases, de
l’orientation de la base par rapport au sucre
(syn/anti) et du sens du squelette ribose-
phosphate
Leontis, Stombaugh & Westhof (2002)
Nucleic Acids Res. 30: 3497-3531
Paire
bancale;
exemple
du rôle
de l'eau
Un concentré d’interactions noncanoniques:
la boucle E de l’ARN ribosomal 5S
| |
C-G
C-G
A•G
A•A
AA parallèle A•U•G
G•A
G-C
G•U GA en cisaille
| |
Triplet de bases
Escherichia coli
Haloarcula marismortui
La «boucle» E de l’ARN 5S est complètement résistante aux nucléases
Elle est fortement structurée par des interactions non-canoniques
Structure de la boucle E
| |
C-G
C-G
A•G
A•A
A•U•G
G•A
G-C
G•U
| | A•G A•A triple G•A
Triplets de bases
U•A•U U•A•U
C•G•G
Hoogsteen Reverse Hoogsteen
Les purines peuvent s’apparier simultanément avec 2 autres bases
Triplets de bases
On peut former un triplex continu le long d’une séquence homopurine
Interactions «à longue portée»
Intéraction Pseudonoeuds
tétraboucle-récepteur
Triples hélices
Interaction tétrabouclerécepteur
C-G
C-G
U U A
A A
A A AG
G U
Costa & Michel (1997) Rules for RNA recognition of GNRA tetraloops deduced by
in vitro selection: comparison with in vivo evolution. EMBO J. 16, 3289-3302
Prédiction de structure 3D
● Prédiction de structure 2D (Zuker, Eddy, ...)
● Validation
phylogénie
sondes chimiques et enzymatiques
● Recherche d’interactions 3D
covariations de séquence
pontages chimiques ou UV
● Construction d’un modèle compatible
● Affinement par des simulations de
dynamique moléculaire
Simulation du repliement in silico
Voir le chapitre sur les protéines...
Repliement
RNA (2008) 14:1164