Étude de l'Organisation et Transcription des Gènes d'ADN Ribosomiques
Étude de l'Organisation et Transcription des Gènes d'ADN Ribosomiques
%0$503"5%&-6/*7&34*5²
%0$503"5%& -6/*7&34*5²%&506-064&
%&506-064&
$ÏLIVRÏ PAR
Université Toulouse III Paul Sabatier (UT3 Paul Sabatier)
$ISCIPLINE OU SPÏCIALITÏ
Biologie cellulaire et moléculaire
%COLE DOCTORALE
Biologie, Santé, Biotechnologies (BSB)
5NITÏ DE RECHERCHE
UMR5099
$IRECTEURS DE 4HÒSE
Olivier Gadal
2APPORTEURS
Cosmin Saveanu (Chercheur à l'institut Pasteur)
Patrick Heun (Max Planck Institute of Immunobiology and Epigenetics, Freiburg)
MEMBRES DU JURY :
Michel Werner (Directeur de Recherche CEA)
Christophe Lavelle ( Chercheur au Museum National d'Histoire Naturelle, Paris)
Pierre-Emmanuel Gleizes (Professeur UPS, Toulouse)
Olivier Gadal (Chercheur Laboratoire de Biologie Moléculaire Eucaryote, Toulouse)
REMERCIEMENTS
!
"""
&
Le travail que j’ai effectué dans le laboratoire d’Olivier n’aurait aucun sens si je
n’évoquais pas les personnes qui ont fait mon quotidien pendant ces quatre
années. Ils furent la raison, la cause et la conséquence de l’aboutissement de ma
thèse. Il serait stupide de réduire ces années à la compréhension du
fonctionnement de l’ARN polymérase I, cette thèse fut avant tout une aventure
humaine animée par le seul fait de la curiosité et du plaisir de travailler
ensemble. Je ne pense pas être capable d’avoir les mots à la hauteur des
remerciements que je voudrais adresser à chacun ni de dresser une liste
exhaustive de l’ensemble des personnes que j’ai apprécié croiser, je m’excuse par
avance pour les mots ou les personnes oubliées que je n’oublierai pas.
D'une façon générale cette thèse est dédicacée à tous ceux qui ont supportés
quotidienement le claquement de mes tongues, mes blagues, mes discussions
politiques, mon obsession pour l’UMP, la musique trop forte, avec qui mes
rapports furent aussi divers qu'enrichissants.
« Un génie, deux associés, une cloche » (Film Italien 1975, Sergio leone)
Je ne peux évidemment que remercier mon équipe et tous les gens qui en ont fait
partie. Olivier tu as fait le choix (ou le non choix) d’un étudiant qui s’est défini
comme une personne incompétente, je t’en remercie et j’espère t’avoir rendu la
confiance que tu m’as accordé. Je te remercie également pour le chef que tu as
été et l’ami que tu es. Enfin, je te remercie d’avoir construit une équipe, qui je le
crains, ne me laissera que des regrets. Merci, à vous les deux Christophes, du 16
eme arrondissement à l’Ariège, du col de la chtouille à Jean Emmanuelle, des
jalons bien placés à ma dent déplacé… Merci pour tout, j’espère vous rendre un
jour ce que vous m’avez donné parce « qu’à la base, j’étais pas fait pour ça » (le
rocker).
« Un génie, deux associés, une cloche »… et la fille. (Film de charme Savoyard 2008)
Merci à toi Isabelle, j’ai véritablement apprécié travailler avec toi mais j’ai
surtout adoré la personne que tu es, et même si nous nous sommes pas promener
le long du canal avec un carton sur la tête je ne pense pas que tu aies besoin de
cela pour savoir tout le bien que je pense de toi. Merci beaucoup.
Merci à tous les membres de l’équipe Gadal, présents, futurs, passés, Céline,
Hicham, Mathieu, Adrien, Sylvain, merci Elodie pour ton attention culinaire lors
de ma thèse, je ne serai probablement pas à la hauteur pour la tienne. Merci à toi
Jorge, ta rencontre fut un réel plaisir et je te souhaite à toi et ta petite famille
que du bien.
Je remercie Odile (et son petit Ricard) pour tous ces verres d’eau (ou de whisky)
et ces cafés que nous avons fumés ensemble sur les marches, et que nous
continuerons, j’espère, à partager autre part que sur un escalier. J’en profite
ainsi pour remercier les fumeurs du bâtiments avec qui j’ai adoré ne pas fumer.
Merci aux travailleurs du RDC, Isabelle, Imen j’ai appris à vous apprécier
pendant ma thèse et je ne regretterai pas ces moments que nous avons passé les
cheveux au vents en train de gratter du champignon. Merci aussi à Hicham qui
s’est malheureusement converti au cours de sa thèse mais qui reste mon libanais
préféré, à Franck avec qui j’ai trouvé un partenaire pour m’adonner à certains
vice, à Lucas pour sa gentillesse et ses promenades bucoliques entourées de CRS,
et merci aux autres bystrickettes Mathieu, Sylvia, Anne Claire.
Merci à Magalie et Thomas, je ne perd pas espoir que l’on puisse partir un jour
sur l’autre continent…
Je remercie Michou à qui je souhaite une heureuse retraite, à Safi, Cathy pour
votre patience à devoir gérer l’inconséquence administrative de chacun et
surtout pour votre gentillesse. Merci à David, qui en plus d’être un grand
footballeur, est aussi capable de cadrer les photos. Merci aussi à tout les
« tecnikciens » qui rendent la vie plus facile avec le sourire.
Je n‘oublierai pas tous les gens qui n’ont pas de noyau du LMGM avec qui j’ai
partagé de très bon moments; Pascal, Philou, Mimi, Delphine, JC (et Anita), le
petit Stouch avec qui j’ai adoré travailler et à qui je souhaite que ses problèmes
d’alcool se règlent au plus vite, sans évidemment oublier miss Nolivos (qui ne m’a
pas remercié dans sa thèse mais que j’aime bien quand même).
Merci à Mathieu et à Elodie, vous êtes des personnes d’une simplicité reposante,
merci pour tout.
Je remercie évidemment les gens qui ont fait partie de l’association du « dernier
verre » dont le président Stéphane labialle est ce que le Rag time est aux nuits
toulousaines, c’est à dire unique. Merci Stéphane et Claire pour tout ces bons
moments, ces discussions avec ou sans alcool. Merci aussi à toi Gaelle pour le
lavage de cerveau de Christophe, le macumba, ta bonne humeur et plus
généralement le plaisir que l’on prend à passer du temps ensemble.
Un grand Merci à une certaine Vanessa Khemici de m’avoir prouvé que le
syndrome de Stockholm existe, en espérant que ma séquestration se poursuive le
plus longtemps possible.
Et enfin, un grand merci à mes trois camarades qui ont été là « depuis le début »,
Ambre, Alan et Romain et leurs moitiés respectives, je serai court mais je n’en
pense pas moins. Je vous remercie sincèrement…
Merci….
Préambule
La production des ARN ribosomaux (ARNr) est une étape fondamentale dans la
biogenèse des ribosomes et représente près de 60% de l’activité transcriptionnelle.
Cette activité a lieu au sein du nucléole qui est une structure dynamique variant de
volume selon la croissance, et conservée dans le monde eucaryote. La production
des ARNr et la formation du nucléole sont entièrement dépendantes de l’activité d’un
unique complexe multiprotéique : l’ARN polymérase I (ARN pol I). Au cours de ma
thèse nous avons étudié le fonctionnement de l’ARN pol I chez la levure de bière S.
cerevisiae à différents niveaux allant du rôle des sous unités composant ce complexe
multiprotéique, à sa matrice d’ADN jusqu'aux rôles des gènes d’ADNr dans
l’organisation tridimensionnelle du génome.
Cette introduction de thèse se déclinera donc en trois parties traitant chacun de ces
aspects. Nous commencerons par décrire les constituants et le fonctionnement de la
machinerie de transcription de l’ARN polymérase I, dans une deuxième partie nous
parlerons de mécanismes permettant de réguler sa transcription. Enfin nous
discuterons de l’organisation spatiale des génomes eucaryotes et plus
particulièrement celui de S. cerevisiae.
C hapitre I :
Préambule………………………………………..……………………………………..…..1
III-Fonction des deux sous-unités spécifiques de l’ARN Pol I………38
C HAPITRE II:
polymérase I
Préambule………..……………..……………..…….………..……………..……..…….45
I-Régulation de l’initiation………..……………..……………..…….….……..…45
III-Régulation Chromatinienne..……..…..…..……..…..…..……..…..…………64
III-2-Composition chromatinienne des gènes actifs. ..……..…..…..……..…..…70
C HAPITRE III:
Préambule..…….……..…..…..……..…...……..…..….…..…….………..…..……..….93
I-1-b- Histones, variant d’histones et protéines HMG…..…..……..…...…………97
I-2-Compaction de la chromatine. ..…….……..…..…..……..…...……..…..….……99
I-2-a-Nucléosome et la fibre de 10nm…..…..……..…...……..…..……..…99
I-2-b-Compaction sans histones…..…..……..…...……..…..……..…...…100
I-2-c-De la fibre de 30nm à l’organisation de la chromatine…..…..…….101
I-3-Organisation nucléaire des chromosomes. …..…..……..…...……..…..…….104
I-3-a-Euchromatine et hétérochromatine. …..…..……..…...……..…..….104
I-3-b-territoire chromosomique …..…..……..…...……..…..……..…...…..106
I-3-c-Territoire chromosomique chez S. cerevisiae…..…..……..…...…..112
I-4- Dynamique de la chromatine…..…..……..…...……..…..……..…...……..……115
I-4-a-Variation de la composition protéique de la fibre d’ADN…..…..….115
I-4-b-Mouvement de la fibre chromatinienne ..…..………………..…..….115
II-4-b-Régulation péri-nucléolaire..…...……..…...…...……..…...…...…..136
P artie expérimentale
II-2 publication..…….……..…..…..……..…...……..…..….…..…….…….…...……..149
III-3-discussion de la publication..…….……..…..…..……..…...……..…..….…….151
IV-Organisation tri dimensionnelle des gènes d’ADNr..…….………153
IV-2-résultats..…….……..…..…..……..…...……..…..….…..…….…………………157
Discussion et perspectives
II-3-Organisation de l’ADNr…..…..……..…...……..…..……..…...……..…..……...172
Références
Annexe
A bréviation
35S : Précurseurs des ARNr 25S, 18S et 5,8 chez S. cerevisiae
aa : Acides aminés
ADN : Acide désoxyribonucléique
ARN : Acide ribonucléique
ARNm : ARN messager
ARNr : ARN ribosomique
ARNt : ARN de transfert
ADNr : Locus d’ADN ribosomique
Rpa : « RNA polymerase A »
CTD : « Carboxy Terminal Domain »
UTP : « U three protéins »
FC : Centre fibrillaire
DFC : Composant Fibrillaire Dense
GC : Composant Granulaire
ETS : « external transcribed sequence »
ITS : « internal transcribed sequence »
ARS : « autonomously replicating sequence »
RFB : «réplication fork barrier
IGS : « Intergenic Spacer »
E-Pro : « Enhancer Promoter »
Fob1 : « FOrk Blocking »
TIF : « transcription intermediary Factor »
CAST : « CD3e-associated signal transducer »
PAF : « Polymerase Associated Factor »
TOR : « Target Of Rapamycine »
Spt : « Supressor of Ty »
CF : « Core Facto r »
Kb : Kilo base
kDa : Kilo Dalton
NTS : « Non-Transcribe Spacer »
ORF : : « Open Reading Frame »
PAF : « Pol I Associated Factor »
PCR : « Protein Chain Reaction
UAF : « Upstream Activating Factor »
UBF : « Upstream Binding Factor »
TTF-I : « Transcription Terminaison Factor »
TAF : « TBP associated Factor »
TBP : « TATA Binding Protein »
TFIIB : « Transcription Factor of RNA polymerase II, B »
TFIID : « Transcription Factor of RNA polymerase II, D »
TFIIS : « Transcription Factor of RNA polymerase II, S »
TFB : « Archeal Transcription Factor homologous to TFIID »
SL1 : « Selectivity factor 1 »
UV : Ultra Violet
TCR : « Transcription Coupled Repair »
ChEC : « Chromatin Endogenous Cleavage »
NER : « Nucleotide Exision Repair »
ChIP : « Immuno-Précipitation Chromatinienne »
ChIP on chip : « Immuno-Précipitation Chromatinienne sur puces à ADN »
3C : « Chromosomal Conformation Capture »
5C : « Chromosomal Conformation Capture Carbon Copy »
Hi-C : « Genome wide Chromosomal Conformation Capture »
C HAPITRE I:
Préambule
Dans les années soixante, les travaux menés sur la bactérie Escherichia coli ont
permis de dévoiler les premières ébauches structurales d’une ARN pol. Cette
enzyme est alors décrite comme un complexe de grande taille (0.5 MDa) formant
une structure catalytique appelée « core enzyme » se combinant avec une famille de
facteurs σ assurant la reconnaissance des promoteurs des gènes (Chamberlin and
Berg, 1962; Zhang et al., 1997). Il s’avérera par la suite que cette structure
« simplifiée » constituée de 5 sous-unités αNββ’ω est à la base de l’ensemble des
ARN pol ADN dépendantes multimériques du monde du vivant (Figure 1A). Depuis, il
a été établi que chez les archaebactéries, une enzyme unique est responsable de la
synthèse de l’ensemble des ARN cellulaires.
M
A-
B-
Plate-forme
d'assemblage
tige
pince
Machoire supérieure
Canal ADN
Machoire inférieure
Centre catalytique
Figure1: A- Structure générale des ARN pol bactériennes, archées, et eucaryotes. En bleu est
représenté "le core enzyme" commun aux trois ARN pol bactérienne, archée, et eucaryote. Les sous
unités supplémentaires communes retrouvées chez les Archées et les eucaryotes sont représentées en
violet. B- Structure générale de l'ARN pol eucaryote. Les domaines indiqués dans cette figure repré-
sentent les différentes régions conservées entre les ARN pol eucaryotes. (adaptée de Finn Werner et
DinaGrohmann, 2010)
Les travaux menés chez les eucaryotes ont mis à jour une situation plus complexe.
L’activité ARN pol n’est pas portée par un complexe enzymatique unique mais par
plusieurs. Chez les eucaryotes, la séparation de l’activité de transcription nucléaire
dans trois fractions protéiques distinctes et les travaux de Kedinger révélant une
sensibilité à l’α-amanytine différentielle selon les fractions testées, ont permis de
révéler l’existence de trois ARN pol nucléaires (Kedinger et al., 1970; Roeder and
Rutter, 1970).
Les ARN pol sont retrouvées dans des organismes évolutivement distants expliquant
certains phénomènes de spéciation; cependant leurs modes de fonctionnement se
basent sur des processus hautement conservés au cours de l’évolution. Les
similitudes structurales et mécanistiques des ARN pol multimériques suggèrent que
le dernier ancêtre commun aux archées, bactéries et eucaryotes, avait une structure
proche de l’ARN pol trouvée actuellement chez la bactérie (Werner and Grohmann,
2011) (Figure 1A).
Les études biochimiques, génétiques et structurales sur S. cerevisiae ont fait que
l’ARN pol II de cet organisme est aujourd’hui la mieux caractérisée des ARN pol
eucaryotes. Pour cette raison, nous nous appuierons essentiellement dans cette
partie, sur des données concernant l’ARN Pol II de levure S. cerevisiae lorsque nous
parlerons des ARN pol eucaryotes. Cependant, étant donné la conservation des
différentes sous-unités des trois ARN pol eucaryotes, on pourra croiser les
différentes informations structurales d’une ARN pol à l’autre (Voir tableau 1).
O
Bactéries Archées S. cerevisiae
Q
et al., 2008; Korkhin et al., 2009). Ces mâchoires interagiraient avec l’ADN et
participeraient aux changements de conformations de l’ARN pol entre la phase
d’initiation et l’élongation (Bartlett et al., 2004; Cramer et al., 2001).
Les ARN pol des trois royaumes bactériens, archéens et eucaryotes sont constituées
autour d’un ensemble de motifs conservés. L’ARN pol de bactérie permettant de
définir une ARN pol minimale correspondant à environ 25% de la masse totale de
l’enzyme eucaryote et archéenne. L’établissement des structures cristallographiques
de ces complexes enzymatiques a permis d’illustrer à quel point ils étaient
structurellement conservés. Dans ce sens, les trois ARN pol eucaryotes partagent
des structures très proches, et ne diffèrent que par un certain nombre de motifs
spécifiques de leurs fonctions. (tableau1)
Chacune des 3 ARN pol nucléaires eucaryotes est dédiée à une fonction particulière.
L’ARN pol I est responsable de la transcription d’un gène unique codant pour le
transcrit précurseur des grands ARN ribosomiques (ARNr). Cette spécialisation de
l’ARN pol I semble être partagée chez tous les eucaryotes même si dans le cas du
trypanosome, l’ARN Pol I transcrit aussi des gènes codant pour des protéines de
surfaces (Gunzl et al., 2003). Contrairement à l’ARN pol I, l’ARN pol II se distingue
par la multiplicité des gènes dont elle assure la transcription (près de 90% du
génome). Ces transcrits sont sous la forme d’ARN messagers (ARNm), de petits
ARN nucléaires (snARN) et nucléolaires (snoARN). Il est maintenant clairement
établi que l’ARN pol II assure également la transcription de régions intergéniques
donnant naissances à des ARN cryptiques (Wyers et al., 2005). Enfin, l’ARN pol III
synthétise l’ARNr 5S, les ARN de transferts (ARNt) et un certains nombre de petits
ARN nucléaires non traduits (pour revue (Chédin et al., 1998)).
R
l’indique, sont spécifiques de chacune des trois ARN pol eucaryotes.
L’ARN pol II se distingue des autres ARN pol par la présence sur la plus grande de
ses sous-unités d’une extension de la partie C terminal appelée « queue CTD ». Elle
est composée d’une structure peptidique très particulière constituée de répétions (27
chez la levure, 52 chez l’humain) d’une séquence consensus YSPTSPS (Allison et
al., 1988; Corden et al., 1985). De manière prévisible au regard de la structure des
autres ARN pol, cette structure n’est pas nécessaire à l’activité catalytique.
Cependant, la queue CTD est requise pour la croissance in vivo (Allison et al., 1988;
Zehring et al., 1988). Le rôle principal de la queue CTD est de constituer une plate-
forme de recrutement ou de stabilisation des facteurs nécessaires à la transcription
par l’ARN Pol II et à la maturation de ses transcrits. Ce rôle est régulé par des
activités kinases ayant pour cibles les répétitions des sérines de l’heptatide
consensus. La phosphorylation différentielle de la queue CTD est un mécanisme
spécifique de régulation de l’ARN pol II (Buratowski, 2003).
L’ARN pol III contient cinq sous-unités spécifiques partagées en deux groupes.
Rpc31/ Rpc34/ Rpc82 forment un complexe proche du « clamp » de l’ARN pol II
(Proshkina et al., 2006). En leur absence l’ARN pol III peut transcrire de manière non
spécifique, mais la transcription promoteur-dépendante est abolie (Wang and
Roeder, 1997; Werner et al., 1992). Elles semblent être importantes pour l’initiation
de la transcription (Thuillier et al., 1995). Le second groupe est composé des sous-
unités Rpc53 et Rpc37. Ces sous-unités spécifiques interagissent avec Rpc11 et
seraient impliquées dans la terminaison afin d’assurer un système de recyclage
efficace de l’ARN pol III entre la terminaison et l’initiation (Landrieux et al., 2006;
Proshkina et al., 2006).
L’ARN pol I contient deux sous-unités spécifiques Rpa34 et Rpa49 (Gadal et al.,
1997; Huet et al., 1975; Liljelund et al., 1992). La délétion de RPA34 n’entraine
quasiment aucun défaut de croissance ; a contrario, l’absence de Rpa49 confère un
phénotype de cryosensibilité et une croissance lente à 30°C. L’étude du rôle de ces
deux sous-unités spécifiques est un des axes de recherche détaillés dans cette
thèse. Dans le but de comprendre quels peuvent être leurs rôles spécifiques dans la
S
transcription, nous allons nous efforcer de décrire dans la partie suivante la structure
et le fonctionnement de l’ARN pol I.
Préambule
L’ARN pol II transcrit la majorité du génome, alors que l’ARN pol I est spécifique
produit un seul type de transcrits, l’ARNr. Paradoxalement, en considérant le
pourcentage d’ARN produit dans la cellule, la tendance est inversée. En effet, l’ARN
pol I est la plus active en transcription et représente à elle seule, près de 60% de
l’activité transcriptionnelle de levures S. cerevisiae en croissance (Warner, 1999)
(Figure 2).
Pour assurer cette fonction essentielle, la transcription par l’ARN pol I présente
certaines spécificités. La transcription par l’ARN pol I se déroule dans une structure
nucléaire particulière : le nucléole (Figure 3A). De plus chacun de ces gènes peut
être transcrit de manière simultanée par plus d’une centaine d’ARN Pol I. Ces
propriétés permettent de visualiser les régions transcrites par l’ARN pol I en
microscopie électronique après étalement de la chromatine où l’on distingue les ARN
pol actives en transcription à la suite l’une de l’autre et flanquées d’un ARN néo
synthétisé (Miller and Beatty, 1969). Ces structures particulières ont été nommées
« arbre de Miller » (Figure 3B). Ces caractéristiques impliquent des mécanismes
d’initiation, d’élongation, de terminaison qui sont propres à la transcription par l’ARN
pol I.
T
Activité
Génome
transcriptionnelle
0,5%
100% 100%
14%
26%
ARN POL III
ARN POL II 89%
60%
10% 10%
10%
Ribosomes
Nu
clé
ole
Nucléoplasme
Enveloppe
nucléaire
Cytoplasme
500nm
B-
5' 3'
Pre-ARNr naissant ARN pol I Boules terminales 400nm
30°C 37°C
C-
300nm 300nm
MM
précomplexe va être ensuite converti en précurseurs des sous-unités de 40S et 60S
(Udem and Warner, 1972).
MN
précise de sa morphologie. Le nucléole apparaît comme une structure nucléaire
proéminente dense aux électrons après l’utilisation de contrastant comme le citrate
de plomb ou l’acétate d’uranyl (Figure 3A). Sur cette coupe de levure, on peut noter
le grand nombre de ribosomes dans le cytoplasme qui illustre parfaitement l’énorme
besoin en ribosomes de la cellule (Figure 3A).
II-2-b-Structure du nucléole
MO
exacte de l’ARN pol I active en transcription est une controverse scientifique. Pour
Mais et ses collaborateurs la transcription aurait lieu uniquement dans le FC alors
que les travaux de Koberna et al. proposent qu’elle ait lieu dans le DFC, le FC serait
occupé par l’ADNr non transcrit (Koberna et al., 2002; Mais and Scheer, 2001). De
manière consensuelle, il paraît raisonnable de postuler que l’interphase FC/DFC est
le lieu de synthèse de l’ARNr dans le nucléole.
Enfin, en poursuivant cette description morphologique dans le sens de la progression
des étapes de biogenèse des ribosomes, on retrouve le DFC en contact avec le
composant granulaire (GC) (Cmarko et al., 2000). Dans cette région le pre-ARN,
sous forme de pré-ribosome, poursuit sa maturation par une série de clivage endo et
exo-nucléotidique et des modifications telles que des pseudo-uridinylations. L’ARNr
va alors poursuivre son assemblage avec les protéines ribosomiques responsables
de la formation de la grande et de la petite sous-unité. Au-delà du GC, les particules
pré-ribosomiques néosynthétisées sont libérées du nucléole, où elles sont retenues
(Gadal and Nehrbass, 2002). Elles sont ensuite exportées par le pore nucléaire. On
peut d’ailleurs noter la fréquence élevée de contact entre le nucléole et l’enveloppe
nucléaire chez la levure comme chez les mammifères (Geraud et al., 1989) (Figure
3A). Cette proximité pourrait favoriser les intenses échanges nucléo-cytoplasmiques
nécessaires à la synthèse des ribosomes, à la fois pour l’import des protéines
ribosomiques néosynthetisées et pour le recyclage des facteurs d’assemblage et
l’export des pre-ribosome tardifs (Lechertier et al., 2007). Les pré-ribosomes finissent
leur maturation dans le cytoplasme (clivage du 5.8s pour la 60S, modification de 20S
à 18S chez la levure ou 18S-E à 18S chez les mammifères).
II-2-c-Dynamique nucléolaire
MP
nucléole n’est pas une structure stable mais une structure dynamique qui change de
taille et de morphologie selon les conditions de croissance. Ces changements de
morphologie sont le reflet de l’activité de cette « usine à transcription » (pour revue
(Hadjiolov, 1985; Schwarzacher and Wachtler, 1993). Des souches de S. cerevisiae
où l’ADNr génomique a été supprimé et inséré sur un plasmide transcrit par l’ARN
Pol II présente un nucléole désorganisé (Oakes et al., 1993; Trumtel et al., 2000). De
la même manière, le nucléole est désorganisé lorsque une souche contenant un
allèle thermosensible de la plus grande sous unité de l’ARN pol I est observée dans
des conditions restrictives (Figure 3C). Ce compartiment est donc spécifique et
révélateur de l’activité transcription de l’ARN pol I (Sirri et al., 2008).
Outre les changements de morphologie globaux du nucléole, les approches de
FRAP (Fluorescence Recovery After Photobleaching) ont aussi permis de souligner
la dynamique moléculaire au sein du nucléole (Phair and Misteli, 2000). Il a ainsi pu
être montré que le nucléole est soumis à un flux constant d’échange de protéines
avec le nucléoplasme. De plus, il est important de noter que le nucléole n’est pas
seulement impliqué dans les étapes précoces de la biogenèse des ribosomes. Les
expériences de spectrométrie de masse ont montré que le nucléole contient une
multitude de facteurs impliqués dans de nombreuses fonctions telles que la
réparation, la réplication, l’épissage (Andersen et al., 2005; Andersen et al., 2002).
Le nucléole par cette concentration interne de facteurs va servir à l’accomplissement
de certaines fonctions telles que la transcription de gènes codant pour des ARN de
transfert (Bertrand et al., 1998) ou la séquestration de kinases du cycle cellulaire
(Shou et al., 1999). A ce titre une dérégulation de l’activité de transcription de l’ARN
pol I entrainera une déstructuration du nucléole et aura un effet délétère sur la
biogenèse des ribosomes mais aussi des conséquences sur une pléiotropie de
fonctions cellulaires (Boisvert et al., 2007).
II-3-L’unité de transcription
Les gènes d’ADNr furent parmi les premiers gènes eucaryotes étudiés. Les gènes
d’ADNr de Xénope sont les premiers qui furent isolés (Birnstiel et al., 1966) et clonés
(Morrow et al., 1974). La structure générale des gènes ribosomiques peut être
divisée en deux régions : la région codant pour le précurseur des grands ARN
ribosomiques et les espaces intergéniques (IGS1 et IGS2) (Figure 4).
MQ
A- S. cerevisiae
9,1kb 9,1kb
IGS1 IGS2
ADNr35S ADNr35S
RFB 5S ARS
E-PRO UAS CE
B-
-148 -50 -28 +8
Homo sapiens
43kb 43kb
ADNr45S ADNr45S
UCE CE
-156 -107 -45 +18
Figure 4: Organisation du locus d'ADNr. A- Représentation d'un tandem de gène d'ADNr de S. cerevi-
siae. La région entre les deux gènes d'ADNr contient les séquences d'initiation de la transcription. RFB:
Barriere de fourche réplication. E-PRO: promoteur bi-directionnel ARN pol II. UAS: Upstream activating
sequence. CE: « Control Element ». ARS: « autonomous replication sequence ». B- 2 Unités d'ADNr
d'Homo sapiens sont représentées. UCE: « Upstream Control Element ». « CE: Control élément ».
La taille des transcrits générés à partir de l’ADNr varie; il est d’environ 6 kb chez la
levure et de 13 kb chez les mammifères. Cette différence est essentiellement due à
la différence de taille des espaceurs externes (ETS) et internes (ITS) des régions
transcrites. Une fois transcrit, le précurseur est maturé pour aboutir aux formes
d’ARNr mature (28S, 18S et 5.8S chez les mammifères).
Les régions intergéniques contiennent les séquences responsables de la réplication
et de la transcription. Ainsi, on retrouve une origine de réplication et des régions
promotrices et terminatrices de la transcription par l’ARN pol I. Tout comme la région
transcrite, cette séquence intergénique a une taille variable allant de moins de 5 kb
chez la levure à plus de 30 kb chez l’Homme (Figure 4).
Chez la levure S. cerevisiae et chez les mammifères, par des approches de délétion
au niveau de la région intergénique, les domaines nécessaires à la transcription ont
été identifiés. La région de -148 à +8 semble suffisante pour la transcription et fut
donc définie comme la région promotrice chez la levure S. cerevisiae (Musters et al.,
1989). Des analyses supplémentaires par mutagénèse ont permis de révéler deux
domaines distincts : de -148 au nucléotide -50 et de -28 au nucléotide +8 (Figure 4).
Le domaine en aval est strictement requis pour la transcription promoteur spécifique
et a été nommé Core Element (CE), la seconde zone appelée UAS (Upstream
Activating Sequence) a, comme son nom l’indique, un effet stimulateur.
Chez les mammifères, l’organisation du promoteur est également bipartite et
conservée (Figure 4B). On retrouve le Core Element, il est essentiel et s’étend des
régions -45 à +18, tandis que le domaine amont nommé « Upstream Control
Sequence » (UCS) correspond aux régions des nucléotides -156 à -107 (Figure 4)
(Jones et al., 1988; Learned et al., 1985; Learned et al., 1986). Malgré la
conservation organisationnelle apparente, on n’observe aucune conservation de
séquence de la levure à l’Homme, si ce n’est une forte proportion de
déoxynucléotides A/T dans la région +1. Il est d’ailleurs intéressant de noter que le
principal complexe d’initiation mammifère SL1 n’est ni interchangeable de l’Homme à
la levure, ni de l’Homme à la souris. Les séquences d’initiation et les protéines
impliquées dans ce processus semblent être en partie « espèce spécifique »
(Learned et al., 1985) (Voir chapitre I, II-6).
MS
II-4-Le locus d’ADNr
Dans la levure S. cerevisiae, environ 10% du génome est représenté par les
répétitions des gènes d’ADN ribosomiques organisées en tandem sur le
chromosome XII. Bien que la plupart des eucaryotes contiennent ces répétitions, leur
nombre varie selon les espèces. Ainsi, dans le monde eucaryote le nombre de
répétitions peut varier de 100 à 10 000 (Hadjiolov, 1985; Long and Dawid, 1980).
Dans un génome de cellules de mammifères, leur nombre est évalué à 400 mais,
contrairement à S. cerevisiae, ces répétitions sont réparties sur cinq paires de
chromosomes (XIII, XIV, XVV, XXI, XXII). Chez l’humain, des études s’appuyant
notamment sur la technique de peignage de l’ADN ont permis de démontrer qu’une
partie des répétitions d’ADNr était non canonique, et probablement non fonctionnelle
(Caburet et al., 2005). De plus, il est important de noter que ces gènes d’ADNr ne
sont pas tous actifs en transcription aussi bien chez la levure que chez les
métazoaires. On estime que seulement 50% des gènes sont actifs en transcription
(Conconi et al., 1989). Nous reviendrons sur cette spécificité en détail dans un
chapitre ultérieur de cette thèse (Chapitre II, III-1)
MT
transcription de l’ARNr 35S sous contrôle d’un promoteur fort par l’ARN Pol II), on
observe une diminution drastique du nombre de répétitions de gènes d’ADNr, la
réintroduction de la sous-unité manquante induit alors une restauration du nombre
initial de copies (Kobayashi et al., 1998). Cette restauration n’est possible qu’en
présence de Fob1 qui semble donc jouer un rôle primordial dans ce mécanisme.
L’amplification se ferait de la manière suivante ; la fourche de réplication se propage
jusqu’au RFB où une cassure double brin va apparaitre au niveau du site de fixation
de Fob1. La réparation de cette cassure pourra se faire par recombinaison
symétrique entre chromatides sœurs ou par recombinaison asymétrique ; cette
dernière entraine une variation de la taille du locus d’ADNr (Figure 5). Une région
particulière située dans l’IGS1 est directement impliquée dans la régulation de ce
mécanisme. Il s’agit du promoteur bi-directionnel E-PRO qui selon son activité va
favoriser l’un ou l’autre de ces processus. En absence de répression par Sir2, ce
promoteur est activé, on observe alors une activité de transcription par l’ARN pol II.
Sur son passage, l’ARN pol II va déplacer les cohésines présentes dans cette région.
Le complexe cohésine forme un anneau autour des chromatides soeurs afin
d’assurer leur cohésion (pour revue (Nasmyth and Haering, 2009)). Chez la levure, la
cohésine est localisée exclusivement entre les gènes transcrits dans des directions
divergentes : c’est la transcription active qui positionne la cohésine à ces sites et non
la séquence d’ADN (Lengronne et al., 2004). La conséquence de l’activation du
promoteur E-Pro sera alors un appauvrissement local en cohésine qui va favoriser
les recombinaisons asymétriques et donc la variation du nombre de copies d’ADNr
(Figure 5) (Kobayashi and Ganley, 2005).
MU
La réplication est bloquée et une cassure
double brin apparait au niveau du site de
fixation de FOB1.
Recombinaison symétrique des chromatides soeurs Recombinaison asymétrique des chromatides soeurs
L’ARN pol I, tout comme les autres ARN pol, ne peut se lier directement à l’ADN des
séquences promotrice. Seul la reconnaissance du complexe de pré-initiation par
l’ARN pol I permettra sa fixation et la transcription spécifique. La compréhension du
mécanisme d’initiation ne pouvait donc se faire sans une caractérisation préalable
des facteurs impliqués dans l’assemblage du complexe de pre-initiation. Dans le cas
des cellules de mammifères, l’identification de ces facteurs a été menée en
fractionnant des extraits cellulaires et en testant leur activité ARN polymérase sur
une matrice d’ADNr (Grummt, 1981; Zomerdijk et al., 1994a). Chez la levure, des
approches génétiques ont été d’avantage utilisées (Nogi et al., 1991) permettant
d’identifier une kyrielle de mutants défectifs pour la transcription de l’ADNr (mutant
rrn pour « rRNA synthesis défective »). Par cette approche de nombreux gènes
codant pour des protéines directement impliquées dans l’initiation de l’ARN pol I ont
été caractérisés (Nogi et al., 1991). On peut citer entre autres les protéines Rrn3,
Rrn6, Rrn9, Rrn10, Rrn11 impliquées dans l’initiation ou les sous-unités de l’ARN pol
I Rpa135, Rpa12, Rpa43. La combinaison des approches génétiques et
biochimiques a donc permis d’identifier chez la levure S. cerevisiae et chez les
mammifères la majeure partie des facteurs impliqués dans l’initiation de la
transcription par l’ARN pol I. On peut néanmoins noter que chez la levure, ce crible
ne permet d’identifier que les protéines ayant pour seul rôle la production de l’ARNr
et exclut les protéines possédant une autre fonction essentielle.
NM
complexes d’initiation qui lui sont spécifiques, le Core Factor (CF) et l’Upstream
Activating Factor (UAF). Le CF est composé des protéines identifiées par Nogi en
1991, Rrn6, Rrn7 et Rrn11 (Keys et al., 1994; Lalo et al., 1996). On retrouve dans
UAF les protéines Rrn5, Rrn9, Rrn10, les autres membres de ce complexe sont les
deux histones H3-H4 et le facteur Uaf30 (Keener et al., 1997b; Keys et al., 1996;
Siddiqi et al., 2001). Ces deux complexes UAF et CF vont assurer la reconnaissance
de la région promotrice aboutissant ainsi à la formation du complexe de pré-initiation.
UAF et le CF se fixeront respectivement sur les régions UAS et CE. L’effet
stimulateur de l’UAF est fortement dépendant de la présence de TBP, même si cette
protéine ne semble pas associée de manière stable avec ce complexe (Steffan et al.,
1998). TBP, par ses capacités d’interactions avec le complexe UAF et le CF pourrait
permettre de relier ces deux complexes (Lalo et al., 1996; Steffan et al., 1998).
Ce complexe composé alors d’UAF, du CF et de TBP est alors reconnu
spécifiquement par l’ARN pol I qui se doit d’être associée au facteur d’initiation Rrn3
pour avoir la capacité d’être recrutée au niveau du PIC (Complexe de Pré initiation)
(Figure 6). On peut noter que la sous-unité Uaf30 contenue dans UAF est nécessaire
pour la répression de la transcription de l’ADNr par l’ARN Pol II.
In vitro, les complexes recombinants ne permettent pas la production efficace
d’ARNr. Il est possible que des facteurs activateurs restent à identifier ou que la
purification des facteurs transcriptionnels ne soit pas optimale (Keener et al., 1998).
NN
A-
Upstream POL I
Activating factor Core Factor
Rrn3
Rrn10
Rrn5 Rrn11
Rrn9 Rrn7
H3 H4 Uaf30 TBP Rrn6
UAS CE
o1
o1
o1
o1
Hm
Hm
Hm
Hm
B-
POL I
SL1 Rrn3/TIF1A
TBP TAF110
TAF41
TAF48 TAF63
UCE CE
F
F
UB
F
UB
UB
UB
UB
Figure 6: Complexe d'initiation de l'ARN pol I. A-Chez S. cerevisiae l'ARN pol I est recrutée après son
association avec Rrn3 et la formation du complexe d'initiation comprenant TBP, le complexe UAF
(Upstream Activating Factor), et le CF (Core Factor). La protéine Hmo1 ne semble pas être requise pour
l'initiation mais est localisée sur toute la séquence transcrite dont la région promotrice. B- Chez Homo
Sapiens, on retrouve le complexe SL1 essentiel à la formation du PIC et au recrutement de l'ARN pol I.
UBF joue un rôle stimulateur dans l'initiation et est localisé sur les régions promotrices et les séquences
transcrites.
II-6- b- Recrutement de l’ARN polymérase I
Seulement une minorité d’ARN pol I contenue dans un noyau est active en
transcription (Milkereit et al., 1997). Il existe donc au sein des cellules différentes
formes d’ARN pol I. Les ARN pol I compétentes pour l’initiation sont associées à
Rrn3.
La protéine Rrn3 fut découverte à partir du crible génétique mené dans l’équipe du
Dr Nomura en 1991 (Nogi et al., 1991). Cette protéine essentielle est très conservée
puisqu’on la retrouve chez les mammifères (Bodem et al., 2000), chez la levure S.
pombe (Imazawa et al., 2002), et chez S. cerevisiae. La létalité due à la délétion du
gène RRN3 chez la levure S. cerevisiae est d’ailleurs partiellement supprimée par
l’expression de son équivalent humain TIF1-A (Moorefield et al., 2000). Rrn3 est
recrutée sur l’ARN pol I via une interaction avec Rpa43 (Peyroche et al., 2000). Elle
pourrait ensuite servir de point d’ancrage entre l’ARN pol I et le Core Factor (par une
interaction avec Rrn6) ou le complexe SL1 (Selectivity factor) respectivement chez S.
cerevisiae et chez les mammifères (Miller et al., 2001; Schnapp et al., 1993). La
fonction de Rrn3 est donc bien établie mais un débat persiste quant à la capacité de
l’ARN pol I à se fixer sur le promoteur en absence de Rrn3.
Chez les mammifères, Shnapp et al ont montré que l’ARN Pol I pourrait être recrutée
en absence de Rrn3 (Schnapp et al., 1993), mais sans permettre l’initiation de la
transcription, alors que les résultats du laboratoire de Zomerdijk infèrent vers
l’impossibilité de l’ARN Pol I seule de s’associer aux régions promotrices (Miller et
al., 2001). Dans le cas de la levure, il a été publié que l’ARN Pol I ne pouvait être
recrutée au promoteur en absence de Rrn3 aussi bien in vivo qu’in vitro (Milkereit
and Tschochner, 1998; Yamamoto et al., 1996). Aprikian et al. en 2001, ont pourtant
montré qu’un recrutement était possible sans rrn3 mais formerait un complexe non
compétent pour la transcription ; cette donnée fut confortée chez les mammifères par
Cavanaugh en 2008 (Aprikian et al., 2001; Cavanaugh et al., 2008). L’ensemble de
ces résultats implique donc que Rrn3 est essentielle à la formation d’un complexe
d’initiation compétent pour assumer une activité de transcription. L’association avec
une ARN Pol I sans rrn3 formerait un complexe inactif pour la transcription,
potentiellement inhibiteur.
Le recrutement de l’ARN pol I associée à Rrn3 est suivi du démarrage de la
NP
transcription avec l’ouverture de la double hélice d’ADN. L’ARN pol I est alors
capable de catalyser la formation des premiers nucléotides mais sans aucun
déplacement du complexe le long de l’ADN. Il s’agit de la phase de transcription
abortive. Ces étapes nécessitent des arrangements structuraux de l’ARN pol I et le
relargage du facteur Rrn3 (Beckouet et al., 2008; Milkereit and Tschochner, 1998).
NQ
transcription (Heix et al., 1997). Ce résultat négatif peut s’expliquer par l’existence de
facteurs supplémentaires requis pour l’activité de transcription de l’ARN Pol I. La
découverte dix ans plus tard dans les cellules humaines d’une quatrième TAF,
TAFI41, par l’équipe de Zomerdijk illustre cette possibilité (Gorski et al., 2007).
UBF est une protéine à cinq boites HMGB retrouvée au niveau des séquences
promotrices des gènes d’ADNr. UBF coopérerait avec SL1 pour organiser le
complexe d’initiation (Bell et al., 1988; Learned et al., 1986). Cette protéine a été
purifiée sur la base de son affinité pour la séquence activatrice (UCE) et sa capacité
à stimuler l’ARN pol I in vitro (Bell et al., 1990; Pikaard et al., 1989). Par sa capacité
à structurer l’ADN, la fixation d’UBF entrainerait la formation d’une boucle sur l’ADN,
ou enhanceosome, générant une structure favorable à l’assemblage du PIC (Bazett-
Jones et al., 1994). Le rôle stimulateur d’UBF sur l’initiation semble unanimement
reconnu mais le mécanisme d’action prête encore à débat. Nous reviendrons
spécifiquement sur le rôle d’UBF dans la deuxième partie de l’introduction (Chapitre
II, IV-3).
Il est tentant de faire le parallèle entre le système de transcription humain et de
levure S. cerevisiae. SL1 semble être l’équivalent fonctionnel du Core Factor en dépit
d’une homologie de séquence très faible, ils sont tous deux requis pour la
transcription basale (Keener et al., 1998; Lin et al., 1996; Schnapp and Grummt,
1991). Seule la sous-unité Rrn7 semble partager une homologie de séquence avec
TAFI68 (Boukhgalter et al., 2002). Il a récemment été montré que les protéines Rrn7
et TAF163 partagent des homologies structurales et sont fonctionnellement
équivalentes aux facteurs TFIIB (Knutson and S, 2011; Naidu et al., 2011). Les deux
systèmes d’initiation partagent donc d’importantes similarités fonctionnelles (Rrn3 et
Tif1A, CF et SL1, TBP humaine et de levure) même si le rôle d’UBF chez l’homme et
d’UAF chez la levure semble différent.
NR
sont ces mécanismes généraux de l’élongation.
Au cours du cycle de transcription, le phénomène de translocation délimite la fin de
l’initiation et le début du processus d’élongation. Ce changement d’activité se traduit
par la synthèse des premiers nucléotides et implique une séparation de l’ARN pol I
du complexe d’initiation.
L’élongation de la transcription est un processus discontinu, l’ARN pol ne se déplace
pas à vitesse constante. En fonction de contraintes physiques (chromatine, topologie
de l’ADN) elle peut moduler ou arrêter transitoirement sa progression. Pour évaluer
l’élongation, deux paramètres sont à prendre en compte ; la vitesse d’élongation (le
nombre de nucléotides polymérisés par seconde) et la processivité, c’est-à-dire le
nombre de nucléotides polymérisés par évènement d’initiation.
Pour assumer cette fonction d’élongation, impliquant l’apparition d’un complexe ARN
pol-ARN-ADN, des changements de conformation sont requis. L’ARN pol I interagit à
la fois avec l’ADN matrice, l’hybride ADN_ARN et le transcrit naissant (Brueckner et
al., 2009).
Chez les archées et les eucaryotes le « stalk » (Figure1) peut interagir avec l’ARN
mais du fait de la dynamique de cette interaction, il est difficile d’obtenir des données
structurales permettant une modélisation exacte de cette interaction. Cette région
n’est pas conservée chez les procaryotes mais dans ce cas la protéine NusA permet
l’interaction avec l’ARN (Ha et al. 2010).
Le rôle du « stalk » présent sur les ARN pol eucaryotes semble particulièrement
important pour l’élongation. En effet, dans le cas de l’ARN pol Archée, l’absence du
« stalk » diminue in vitro la processivité (Hirtreiter et al., 2009) et l’efficacité de
transcription des grands gènes. Le « stalk » faciliterait l’interaction avec les transcrits
naissants et repositionnerait le « clamp » dans une position favorable à l’élongation
(Armache et al., 2005). De même chez S. cerevisiae, l’absence de Rpb4 diminue la
présence de l’ARN pol II sur la partie 3’ des gènes les plus grands (Runner et al.,
2008). Le « stalk » est donc requis pour l’élongation des grands gènes. Au vu de la
taille des gènes d’ADNr, le « stalk » constitué dans l’ARN Pol I de Rpa43 et Rpa14
pourrait avoir un rôle déterminant dans la phase d’élongation. Les données
cristallographiques apportées par l’équipe de P. Cramer en 2007 ont d’ailleurs
permis de montrer que le « stalk » de l’ARN pol I a une structure particulière se
distinguant de l’ARN Pol II (Kuhn et al., 2007). Enfin, le facteur Rrn3 se fixe chez
l’ARN Pol I sur le « stalk », et serait impliqué dans la structure de ce dernier. De ce
NS
fait, il a été suggéré un rôle de Rrn3 dans l’élongation. La structure de Rrn3 associé
au « stalk » n’a pas encore été caractérisé structuralement en complexe avec Pol I
(Grohmann and Werner).
En résumé, l’élongation est un processus central qui fait intervenir des mécanismes
conservés. Son étude semble particulièrement pertinente sur un gène de grande
taille telle que l’ADNr, puisque à une vitesse de transcription estimée à 50
nucléotides par seconde, la transcription d’un gène d’ADNr de S. cerevisiae prendrait
environ 2 min durant lesquelles l’ARN pol peut accélérer, s’arrêter ou encore se
dissocier de la matrice ADN (Cavanaugh and Thompson, 1985; Dundr et al., 2002;
French et al., 2003).
Préambule
II-8-a-les topoisomérases.
En 1970, James Wang caractérise pour la première fois chez E. coli une enzyme
capable de relaxer les supertours négatifs de la double hélice d’ADN (Pour revue
(Kyrpides et al., 1996). Cette découverte est fondamentale puisqu’elle permet de
valider l’existence de processus tel que la réplication qui sans topoisomérase sont
théoriquement impossibles. Cette découverte fut suivie par la caractérisation dans
des cellules de souris d’une activité enzymatique relaxant les super tours positifs et
négatifs. Ces enzymes sont en fait présentes chez tous les organismes vivants:
procaryotes, archaebactéries, eucaryotes et virus, elles assurent le maintien du
degré d’enroulement, empêchent la formation de nœud et permettent la séparation
des chromosomes (Goto and Wang, 1985; Holm et al., 1985; Wang, 2002). Ces
protéines appelées topoisomérase sont essentielles à la viabilité de la cellule. Au
NT
sein d’un même organisme, l’évolution a fait apparaître des variations de séquences
entre différentes topoisomérases entraînant des modifications de la fonction de ces
enzymes. L’action simultanée de ces différentes enzymes assure le maintien du
degré de superenroulement, la séparation des chromatides en mitose et empêche la
formation des nœuds. Il existe plusieurs classes de topoisomérases avec parfois des
rôles antagonistes(Roca, 1995).
La topoisomérase de type I, divisée elle même en deux sous type IA et IB, agit sous
forme de monomères et effectue des coupures simples brin dans l’ADN permettant le
passage de l’autre brin à travers la coupure simple brin (Type IA) ou la libre rotation
autour de l’autre simple brin (Type IB). La topoisomérase II se présente ,elle, sous
forme d’homodimères et va assurer une coupure double pour relâcher des stress de
torsions ou permettre la séparation des chromatides notamment pendant la mitose.
Le dimère se lie à l’ADN sur un segment nommé « G » et capture un autre segment
nommé T après la captation de deux molécules d’ATP (Roca, 1995). L’hydrolyse
d’un ATP permet le passage du brin T à travers le segment G, ce dernier ayant été
clivé. L’hydrolyse du second ATP permettra au complexe topoisomérase de relâcher
le segment T et de pouvoir potentiellement réinitier un cycle.
NU
en double hybride (Beckouet et al., 2011). Bien que la nécessité d’une activité
topoisomérase pour l’activité ARN Pol I soit évidente, l’implication exacte de ces
protéines est encore peu comprise. Brill a tenté d’élucider l’implication des Top1 et
Top2 sur la transcription de l’ADNr. En utilisant des constructions génétiques dont la
transcription dépend par l’ARN Pol I, il a montré que les topoisomérases sont
principalement requises pour l’élongation de l’ARN Pol I sur des grands gènes,
l’initiation étant moins affectée. En effet, l’accumulation de supertours négatifs
générés par l’ARN Pol I facilite l’ouverture des régions promotrices et donc l’initiation,
a contrario, les super tour positifs s’accumulant devant l’ARN Pol I empêchent sa
progression (Brill et al., 1987a; Brill et al., 1987b). L’action des topoisomérases
permet de lever ce point de blocage. Ce rôle des topoisomérases dans la
transcription ARN Pol I a été confirmé récemment par deux publications du groupe
de D. Tollervey et de A. Beyer(El Hage et al., 2010; French et al., 2010). Dans ces
études, les auteurs montrent que la Top1 interviendrait principalement pour corriger
les torsions négatives après le passage de l’ARN Pol I. En absence de la Top1, on
aurait alors l’apparition de larges bulles d’ADN simple brin générées par l’ARN Pol I
en élongation (Figure 7) (French et al., 2010). De plus l’absence de Top1 favoriserait
un phénomène caractérisé chez E. coli qu’est la formation des R-Loop (Drolet,
2006). Les R-loop correspondent à la formation d’hybrides ARN-ADN hors de la bulle
de transcription. Ces hybrides ARN-ADN sont très stables et bloquent l’élongation
(Tous and Aguilera, 2007). L’absence de Top1 conduit à la formation de telles
structures dans l’ADNr chez S. cerevisiae (Figure 7). Ce phénomène délétère pour la
transcription est logiquement amplifié en absence de l’activité RNase H qui permet
de dégrader les hybrides ARN-ADN (El Hage et al., 2010). Concernant Top2, son
rôle semble d’avantage lié aux relâchements des supertours positifs en amont de
l’ARN Pol I, son absence entraine un ralentissement de l’élongation de l’ARN Pol I
(French et al., 2010). Ces études et les travaux de Lavelle concernant la topologie de
l’ADN suggèrent que Top1 et Top2 peuvent tous deux agir sur les supertours
négatifs et positifs pendant l’élongation de l’ARN Pol I. Cependant les matrices
d’ADN présentes derrière et devant l’ARN Pol I constituent des substrats plus
accessibles respectivement pour la Top 1 et la Top 2(Salceda et al., 2006). Ainsi, la
Top1 serait requise pendant l’élongation par l’ARN Pol I pour éviter la formation de
« R-loop » et la Top2 résoudrait l’accumulation de super tours positifs rencontrés par
l’ARN Pol I (El Hage et al., 2010; French et al., 2010; Lavelle, 2008).
OL
A-
1
1000 nm
1 2
B-
Figure 7: Rôle des topoisomérases 1 et 2 dans la transcription ARN pol I. A-Photographie d'un gène
d'ADNr transcrit par l'ARN pol I en absence de Top1, observé en microscopie électronique. Les photo-
graphies 1 et 2 correspondent à des grossissements des régions correspondantes indiquées par une
flèche (1) et (2). B- Schematisation des conséquences de l'absence de Top1 (4), Top2 (2) et de la
RNase H (5). En absence de la Top2, on observerait une accumulation de stress torsionnel positif en
amont de l'ARN pol I. Au contraire l'absence de la Top1 provoque du stress torsionnel négatif après le
passage de l'ARN pol I se traduisant par l'apparition de "R-loop" et de "topo-bubble" (4). L'absence de
la RNase H combinée à celle de la Top1 augmente l'apparition des "R-loop"(5)(Adaptée de French et al.
2010).
II-9- Terminaison de la transcription
ON
Ainsi, de manière co-transcriptionnelle, Rnt1 va cliver en 3’ le transcrit dans l’ETS
libérant le précurseur des ARNr (Kufel et al., 1999). Une exonucléase (Rat1) va
ensuite intervenir en association avec l’hélicase Sen1 pour assurer la dégradation de
la région 5’, résultant du clivage de Rnt1, jusqu’à la dégradation complète de l’ARN
restant associé à l’ARN Pol I. Cette dégradation entrainera une déstabilisation de
l’ARN pol provoquant son décrochage (Figure 8-A) (El Hage et al., 2008; Kawauchi
et al., 2008). Récemment, il a été suggéré que la kinase Gcr3 prendrait part à ce
processus en maintenant la phosphorylation sur le produit de clivage de Rnt1. Cette
phosphorylation permettrait l’action de Rat1 pour conclure efficacement le processus
de terminaison (Braglia et al., 2011).
OO
A-
Reb1 FOB1
1) 25S T1 I T2
POL
25S
Reb1 FOB1
2) 25S T1 I T2
POL
25S
Clivage Rrnt1
Reb1 FOB1
3) 25S T1 T2
I
POL
Pause en T1
Second clivage en T1 (Braglia et al. 2010)
B-
WT
rpa12Δ
Enfin, il est à noter que la délétion de REB1 ou de RNT1 chez S. cerevisiae cause un
défaut de terminaison moins important que celui observé dans le cas de la délétion
du gène RPA12 (Kawauchi et al., 2008; Prescott et al., 2004). Rpa12 est impliquée
dans la terminaison puisqu’en son absence, on observe sur des arbres de Miller des
ARN pol I dans les espaces intergéniques (Figure 8-B). Ce débordement de l’ARN
pol I hors des séquences transcrites illustre un défaut de terminaison et semble
responsable d’un défaut de croissance chez S. cerevisiae et chez S. pombe
(Imazawa et al., 2001; Nogi et al., 1993). Rpa12 est une sous-unité de l’ARN pol I
composée de deux parties : le domaine N-Terminal permet l’accrochage aux autres
sous unité de l’ARN pol I alors que le domaine C-terminal de Rpa12 contient une
homologie de séquence avec TFIIS (Van Mullem et al., 2002). TFIIS est un facteur
de transcription de l’ARN pol II permettant le clivage du transcrit (Wind and Reines,
2000). L’équivalence avec TFIIS a été confirmée par l’équipe de Cramer en montrant
que cette sous-unité Rpa12 était capable de promouvoir le clivage du transcrit sur un
complexe d’élongation en pause (Kuhn et al., 2007). Conséquemment, l’ARN Pol I
possède en son sein une activité intrinsèque de clivage médiée par Rpa12, et ne
semble pas nécessiter comme l’ARN pol II un facteur supplémentaire tel que TFIIS
(Tschochner, 1996). Cette activité de clivage serait une actrice majeure du
processus de terminaison, mais pas seulement. Elle pourrait s’avérer utile dans le
cas d’un blocage d’une ARN pol I en cours d’élongation permettant son décrochage.
Ce phénomène, dans lequel TFIIS est un acteur clef, a été caractérisé pour le
moment uniquement dans le cas de l’ARN Pol II (Saeki and Svejstrup, 2009).
OQ
Nous venons de décrire le rôle de TTF1 et de Reb1 dans la terminaison. Cependant
la littérature suggère que TTF1 et Reb1 pourraient avoir d’autres fonctions,
notamment dans le recyclage de l’ARN pol I permettant une ré-initiation plus efficace.
En effet, ces protéines se fixent non seulement sur le terminateur mais aussi sur une
séquence d’environ 200 pb située en amont du promoteur, et nommée terminateur
proximal T0 (Vogelauer et al., 1998). Chez les mammifères, tout comme chez S.
cerevisiae, cette séquence influe sur l’initiation de la transcription par l’ARN pol I
(Grummt et al., 1986); (Kulkens et al., 1992). Reb1 serait capable de s’oligomériser
et de se fixer à la fois sur le terminateur et la séquence T0 ce qui conduirait à
l’apparition d’une boucle permettant de mettre en contact les régions terminatrices et
initiatrices. Ainsi les ARN pol I finissant un cycle de transcription pourraient être
directement engagées dans un nouveau processus d’initiation (Kulkens et al., 1992).
Chez les mammifères, il est maintenant admis qu’il existe un contact entre les
régions promotrices et terminatrices des gènes d’ADNr ; TTF1 a été décrit comme
capable d’organiser de tel repliement (Nemeth et al., 2008). Les facteurs TTF1 et
Reb1 seraient alors des facteurs organisateurs qui structurent les unités d’ADNr afin
de faciliter la transcription (Figure 9).
OR
Reb1 Reb1 Reb1 Reb1 Reb1 Reb1
T0 T1 T0 T1 T0 T1
35S 5S 35S 5S 35S
35S
Reb1 T1
T0
T0
T1
T0
T1
5S
5S
35S
35S
Figure 9: Modèle d'action de la protéine Reb1 dans le mécanisme de recyclage de l'ARN pol I.
La protéine Reb1 peut se fixer à la fois sur la séquence de terminaison T1 et au niveau du terminateur
proximal T0. L'oligomérisation de Reb1 au niveau de ces sites permettrait un rapprochement du
promoteur des sites de terminaison. La promiscuité de ces deux régions aux rôles antagonistes favori-
serait la réinitiation de la transcription par l'ARN pol I. 3 unités de transcription sont représentées en
rouge, en vert et en noir sur chacune d'entre elles, est indiquée la zone d'accrochage de Reb1. Le
schéma du bas représente l'organisation de ces deux unités en cas d'oligomérisation de Reb1.
(D'après Kulkens et al. 1992).
III-Fonction des deux sous-unités spécifiques de l’ARN Pol I
Nous avons vu dans l’introduction que l’ARN pol I de S. cerevisiae est formée de 14
sous-unités. Dix de ses sous-unités forment le core catalytique commun avec l’ARN
pol archéenne. Les quatre sous-unités restantes Rpa14, Rpa34, Rpa43 et Rpa49 ne
sont pas requises pour l’activité catalytique. Ces sous-unités sont impliquées dans le
fonctionnement spécifique de l’ARN pol I.
Rpa43 et Rpa14 forment un hétérodimère spécialisé dans le recrutement du facteur
Rrn3. Cette interaction est requise pour la spécificité de l’initiation de la transcription
par l’ARN pol I et ne peut avoir lieu avec les autres ARN pol. D’ailleurs, la structure
de la « tige » (« stalk ») formée par Rpa43 et Rpa14 est un attribut structural
spécifique de l’ARN Pol I (Kuhn et al., 2007).
Les sous-unités Rpa34 et Rpa49 ont été découvertes il y a plus de 30 ans et n’ont
pas d’équivalent dans les autres ARN pol eucaryotes et archéennes, nous allons
décrire ici les informations sur la fonction de ces deux sous-unités.
Ces deux polypeptides ont été caractérisés comme étant des composants de la
polymérase I chez la levure dès 1975 par Huet (Huet et al., 1975). Dans cette
publication, Huet avait décrit une forme de polymérase, obtenue après certaines
conditions de purification, appelé Pol A* où Rpa34 et Rpa49 étaient absents. In vitro,
il s’avère que cette forme Pol A* et l’enzyme complète ont une transcription non
spécifique équivalente sur matrice d’ADN double brin.
Ces deux sous-unités ont alors été définies comme faiblement associées à l’ARN
pol I et n’intervenant pas dans l’activité catalytique de l’ARN pol I. Les études qui ont
suivi ont montré que ces sous-unités n’étaient pas essentielles à la survie, même si
l’invalidation de RPA49 provoque un phénotype de cryosensibilité (Gadal et al.,
1997; Liljelund et al., 1992).
OT
Chez la levure de fission S. pombe ou chez les mammifères, la plupart des sous-
unités composant l’ARN pol I semblent conservées avec celles retrouvées chez S.
cerevisiae (tableau 2). Cependant, la conservation des sous-unités spécifiques
Rpa34 et Rpa49 apparait moins évidente.
Chez la levure S. pombe, un équivalent de Rpa49 de S. cerevisiae a été identifié en
2003 ; il s’agit de la protéine Rpa51. Elle a été définie comme une sous-unité non
essentielle à l’activité catalytique mais nécessaire à l’ARN pol I pour assurer un haut
taux de transcription (Nakagawa et al., 2003). Concernant Rpa34, aucun équivalent
n’a été identifié dans chez l’Homme et chez S. pombe.
Chez les mammifères, il a été suggéré que Rpa34 et Rpa49 soient respectivement
équivalentes aux protéines humaines CAST (CD3 -associated signal transducer)
(PAF49 chez la souris) et PAF53 (polymerase associated factor 53Kda) (Panov et
al., 2006b). Ces deux polypeptides sont en effet décrits comme associés à l’ARN pol
I chez l’Homme et présentent des homologies de séquences avec Rpa34 et Rpa49
(Figure 10). Chez la souris, ces deux sous-unités sont retrouvées et peuvent être
séparées de la polymérase sous certaines conditions chromatographiques donnant
une polymérase Pol A, qui comme Pol A* de levure est capable d’assurer une
transcription non spécifique (Hanada et al., 1996; Yamamoto et al., 2004). Il est
intéressant de noter que ces deux protéines CAST et PAF53 ont toutes deux été
décrites comme capables d’interagir avec le facteur UBF et d’influer directement sur
l’initiation de la transcription (Hanada et al., 1996; Seither et al., 1997) ,(Panov et al.,
2006). De plus, il a été proposé que ces deux facteurs faiblement associés à l’ARN
pol I pourraient participer directement à la régulation de la transcription étant donné
que leur localisation nucléolaire est corrélée à la croissance. En effet, PAF53 et
CAST chez la souris sont délocalisées du nucléole dans un milieu de croissance
cellulaire pauvre en nutriment (Hanada et al., 1996; Yamamoto et al., 2004), même si
cette relocalisation n’est pas toujours observée dans le cas de Paf53 (Seither et al.,
1997).
OU
S. cerevisiae Homo. sapiens S. pom e
Tableau 2: Conservation évolutive des sous unités d'ARN pol d'humain, de S. pom e, et de S. cere-
visiae. Les sous unités spécifiques sont indiquées en rouge. ? signifie qu'aucune protéine n'a encore
été identifiée. () signifie que l'équivalence reste à confirmer.
A- B-
4
7 8:Rpb8
1:Rpa190
6 9:Rpa12
2:Rpa135
8 1 3:Rpc40 10:Rpb10
11 5
4:Rpa14 11:Rpc19
3 12 5:Rpb5 12:Rpb12
10 2 6:Rpb6
49 9 49:Rpa49
7:Rpa43 34:Rpa34
34
Figure 10: Structure de l'ARN pol I. A- Représentation de l'ARN pol II, le cercle rouge montre la locali-
sation probable de l'hétérodimère Rpa34-Rpa49 d'après Khun et al.2007. Les données cristallographi-
que à partir de l'ARN pol II ne font apparaitre aucune densité dans cette région, contrairement à l'ARN
pol I. B- Schéma de l'agencement des différentes sous unités au sein de l'ARN pol I. En gris foncé est
représenté le core enzyme, en gris clair les sous unités communes entre les 3 ARN pol eucaryotes et
archéennes et en rouge les sous unités spécifiques.
Enfin, des tests de complémentation hétérospécifiques par CAST et PAF53 ont été
menés chez la levure S. cerevisiae pour conclure quant à leur conservation
fonctionnelle. Aucune des complémentations par CAST ou PAF53 n’a pu corriger un
phénotype provoqué par l’absence respective de Rpa34 ou Rpa49 (Nakagawa et al.,
2003; Panov et al., 2006). Ce résultat négatif, additionné à la faible homologie de
séquence entre ces différentes protéines (Figure 11), empêche de trancher quant à
la conservation de la fonction de ces deux sous-unités humaines avec leurs
équivalents putatifs chez S. cerevisiae. La partie résultat de cette thèse traitera, entre
autre, de la conservation ce ces sous unités spécifiques.
PM
A-
[Link]
[Link]
[Link]
[Link]
[Link]
B-
domaine I domaine II
[Link] [Link]
[Link] [Link]
[Link] [Link]
[Link] [Link]
[Link] [Link]
C- domaine III
[Link]
200 (50a.a) 100
[Link] (345a.a)
200 300
A A A A
B B B B
D-
Domaine I Domaine II Domaine III
[Link]
E- Domaine I
[Link]
[Link]
[Link]
68 107 a.a
Domaine II
[Link]
[Link]
[Link]
Chez la levure S. cerevisiae, les rôles de ces deux sous-unités Rpa34 et Rpa49 ont
rapidement été liés. Une interaction entre ces deux protéines a en effet été suggérée
dès 1997, l’absence de l’une provoquant la déstabilisation de l’autre (Gadal et al.,
1997; Huet et al., 1975). Pourtant, les premières données structurales de Bischler
concernant Rpa34 et Rpa49 au sein de l’holoenzyme indiquaient que ces deux sous-
unités étaient distantes (Bischler et al., 2002). Bischler et ses collaborateurs avaient
utilisé les données de microscopie électronique à 1,6 nm de résolution pour avoir
une idée précise des contours de l’ARN Pol I (Bischler et al., 2002; De Carlo et al.,
2003). Ils ont ensuite comparé cette structure à celle obtenue en présence d’anti-
corps spécifique de Rpa34 et de Rpa49. Une nouvelle densité sur les contours tri-
dimensionnels de l’ARN Pol I est observée au microscope électronique et est due
aux anticorps et donc à la présence des sous-unités ciblées.
Par des approches différentes, l’équipe de P. Cramer a obtenu des donnés
concordantes avec une possible interaction de ces sous-unités. Dans cette étude
Kuhn et ses collaborateurs se sont d’abord appuyés sur les donnés
cristallographiques de l’ARN Pol II obtenues en 2001 (Cramer et al., 2001). La
comparaison de cette structure avec celle de l’ARN Pol I visualisée par microscopie
électronique a révélé la forte conservation structurale entre les deux complexes
multimériques (Armache et al., 2003; Cramer et al., 2001). On retrouve dans les
deux structures la région catalytique, les mâchoires, ou encore la pince avec une
forme comparable. A contrario, des régions se distinguant de cette structure pourront
être considérées comme potentiellement liées à la présence des sous-unités
spécifiques de l’ARN Pol I. Dans le but d’identifier ces régions, ils ont comparé la
structure 3D de l’ARN Pol I en absence ou en présence de Rpa34 ou de Rpa49. Le
déficit de densité électronique des deux formes incomplètes (rpa34∆, rpa49∆) est
logiquement associé aux sous-unités manquantes et se situe dans les deux cas à
l’arrière de l’ARN pol I suggérant qu’elles s’associent l’une à l’autre (Figure 10). Cette
protrusion formée par les deux sous-unités spécifiques Rpa34 et Rpa49 n’est pas
retrouvée dans l’ARN Pol II. (Figure 11-A-B)
Enfin, dans cette étude il a été montré que Rpa34 et Rpa49 présenteraient des
PO
homologies structurales avec les facteurs Rap74 et Rap30 appartenant aux
complexes TFIIF. TFIIF est un facteur de transcription de l’ARN pol II qui semble
avoir différents rôles mais la fonction qui semble la mieux caractérisée est celle liée à
l’élongation (Conaway et al., 2000; Dvir et al., 2001). L’effet positif de TFIIF sur
l’élongation a été étudié in vitro et in vivo. Cette homologie suggère que Rpa49
pourrait avoir un rôle dans l’élongation par l’ARN pol I.
PP
C HAPITRE II:
polymérase I
Préambule
Chez E. coli, tout comme chez les eucaryotes, le contenu en ribosomes varie selon
la croissance. La synthèse d’ARNr est donc soumise à une régulation permanente,
permettant de répondre aux besoins de la cellule. Des changements de conditions
nutritionnelles, environnementales ou de stress sont des stimuli suffisants pour
adapter le taux de synthèse des ARNr (Grummt, 1999; Nomura, 1999; Warner,
1999). La transcription de l’ADNr par sa complexité peut être régulée à différents
niveaux, cette caractéristique lui confère une plasticité et une capacité d’adaptation
unique. Nous allons nous intéresser dans cette partie aux mécanismes impliqués
dans le processus de régulation transcriptionnelle de l’ARN pol I. Deux voies
majeures de régulation de la synthèse de l'ARN ribosomique ont été décrites: la
modulation du nombre de PIC (complexes de pré-initiation) et les mécanismes
modulant l'activité de l’ARN Pol I (indépendamment de la formation des PICs). Nous
nous focaliserons dans un premier temps sur la régulation de l’ARN Pol I par des
facteurs protéiques influençant le processus d’initiation et d’élongation. Puis nous
aborderons des aspects davantage liés à la chromatine. Nous insisterons notamment
sur le rôle des protéines HMGB et des nucléosomes qui déterminent l’accessibilité
du locus d’ADNr pour l’ARN Pol I et sa capacité de transcription.
I-Régulation de l’initiation
PQ
complexes se lient au promoteur basal. Cependant, ces deux complexes d’initiation
partagent très peu d’homologie (Keener et al., 1998; Schnapp and Grummt, 1991).
De même, le facteur UBF serait équivalent à Hmo1 mais un rôle d’Hmo1 dans
l’initiation n’a jamais été montré. Dans cette partie, nous nous contenterons de traiter
des mécanismes de régulation liés à des facteurs d’initiation qui semblent
fonctionnellement conservés de l’Homme à la levure S. cervisiae.
PR
Rapamycine
Cytoplasme TORC1
TORC1 POL II
Maf1
Rrn3
5s ADNr
Figure12: Schéma du mode de régulation potentiel par la voie TOR. Sch9 peut être phosphorylé
par TORC1, ces deux kinases font parties des deux effecteurs principaux. Sch9 peut permettre l'activa-
tion du facteur Rrn3, empêcher l'effet des protéines inhibitrices Maf1 sur la transcription par l'ARN pol
III et phosphoryler Stb3, Dot6, Tod6, Rpd3L pour réguler l'activité de l’ARN pol II sur la transcription des
gènes codant pour des protéines ribosomiques. En présence de rapamycine l'absence de ces phos-
phorylations par TORC1 et Sch9 provoque une diminution de la transcription. (Adapté de Huber et al.
2009, Wei et al, 2009).
Il a été montré que chez la levure S. cerevisiae les complexes Rrn3-ARN Pol I sont
en quantité limitée en phase stationnaire (Milkereit and Tschochner, 1998). La
réduction de ces complexes effectifs en transcription serait due à une dégradation de
Rrn3 après inactivation de la voie TOR mais surtout à une diminution de la synthèse
de nouvelles protéines Rrn3 (Philippi et al., 2010) alors que la quantité d’ARN pol I
resterait stable. L’importance du facteur Rrn3 dans la régulation de la transcription
est parfaitement illustrée par l’utilisation de la souche mutante CARA (pour
Constitutive Association de Rrn3 et A43). Cette souche contient une modification
génétique permettant l’expression constitutionnelle de la protéine Rpa43 fusionnée à
Rrn3. Dans ces conditions, on observe une résistance accrue à la rapamycine et un
maintien de la transcription par l’ARN Pol I, mais aussi de la transcription par l’ARN
Pol II et du 5S par l’ARN Pol III (Laferté et al., 2006). Rrn3 est donc une cible
clairement établie de la rapamycine mais qui n’influence pas seulement la régulation
de la transcription par l’ARN Pol I mais aussi celle de l’ARN Pol II et l’ ARN Pol III.
Cette conclusion, faisant de Rrn3 une protéine centrale dans la réponse à la
rapamycine, est cependant à nuancer puisqu’une étude récente suggère que la
diminution de la quantité des protéines ribosomiques est un évènement suffisant
pour réduire la transcription par l’ARN Pol I (Reiter et al., 2010). Le travail de l’équipe
du Docteur Warner publié en 2007 pourrait expliquer pourquoi la souche CARA est
davantage résistante à la rapamycine concernant la transcription des gènes codants
pour les protéines ribosomiques. Le complexe CURI serait impliqué ; Utp22 et Rrp7
sont liées aux pré-ARNr en cours de transcription, si la transcription par l’ARN pol I
diminue, ces protéines sont relarguées et forme le complexe CURI en s’associant à
CK2 et Ifh1. Une partie des protéines Ifh1 ne peut donc plus stimuler la transcription
des gènes codant pour les protéines ribosomiques. Il est possible que l’effet observé
dans la souche CARA après traitement à la rapamycine soit dû au fait que la
transcription par l’ARN pol I est maintenue grâce à la fusion Rpa43-Rrn3, en
conséquence les protéines Utp22 et Rrp7 ne forment pas immédiatement le
complexe CURI et la transcription dépendante de Ifh1 peut se poursuivre plus
longtemps(Rudra et al., 2007). Il semble donc trop simple de réduire la réponse à la
rapamycine à l’inhibition de seulement une des trois ARN pol ; ces études renforcent
au contraire l’idée d’interdépendance des 3 ARN pol et d’une régulation systémique
PT
ciblant ces trois machineries de transcription. La protéine Sch9 pourrait être à la
base de cette régulation(Huber et al., 2011).
Chez les mammifères, l’importance du facteur TIF1-A dans la transcription par l’ARN
Pol I a vite été établie. Les premières expériences de transcription in vitro à partir
d’extraits de cellules en quiescence ont montré que l’ARN Pol I était inactive mais
que la transcription pouvait être activée par l’ajout d’extrait issu de cellule en phase
de croissance. Le facteur responsable de cette activation a été identifié comme étant
TIF1A (Buttgereit et al., 1985). En phase de quiescence, chez les mammifères TIF1A
est délocalisé du nucléoplasme vers le cytoplasme ce qui explique l’incapacité à
initier la transcription. Le facteur Rrn3/Tif1A est donc une cible conservée au cours
de l’évolution pour réguler la synthèse d’ARNr.
PU
I-2-TFIIH
TFIIH est un complexe multi-protéique de grande taille (510 kDA) conservé chez
l’Homme et chez la levure S. cerevisiae. Ce facteur hétéromultimérique semble
impliqué dans différentes fonctions. Il est par exemple impliqué dans les processus
de réparation de l’ADN par excision de nucléotides (NER) qui prend en charge la
réparation des lésions dues aux ultraviolets (Egly, 2001), son activité requiert
notamment une double activité ADN hélicase portée par Rad3 et Rad25 chez la
levure.
Les données actuelles sur ce facteur TFIIH indiquent qu’il interviendrait davantage
dans le processus d’initiation. En effet, il ne semble pas être enrichi dans la
séquence transcrite mais plutôt au promoteur des gènes d’ARN Pol II (Mayer et al.,
2010). TFIIH possède en son sein la protéine Kin28 qui semble essentielle à la
transcription par son activité kinase car elle phosphoryle la sérine 5 de la queue
CTD. Cette phosphorylation participe à la phase de translocation de l’enzyme (pour
revue (Conaway et al., 2000). Il se pourrait également que l’activité hélicase de
Rad25 participe à l’ouverture de la bulle de transcription (Holstege et al., 1997;
Holstege et al., 1996). L’équipe de Grummt en 2002 a proposé une fonction du
facteur TFIIH dans la transcription par l’ARN pol I chez les mammifères. Cette
hypothèse repose sur deux faits expérimentaux : TFIIH stimule la transcription de
l’ARN Pol I in vitro, et on observe la présence de ce facteur en microscopie dans le
nucléole. Un rôle de TFIIH chez S. cerevisiae est également suggéré du fait que des
mutants de TFIIH présentent des défauts de transcription de l’ARN Pol I. Les auteurs
suggèrent que le rôle potentiel de TFIIH dans la transcription par l’ARN Pol I
concernerait l’initiation car ces mutants de TFIIH (Kin28-ts et tbf1-ts) ont un
phénotype comparable à un mutant d’initiation de l’ARN pol I (rpa43-ts) (Iben et al.,
2002). Le rôle précis de TFIIH dans la transcription par l’ARN pol I reste malgré tout
assez mal connu.
QL
II-Facteurs d’élongation impliqués dans la transcription par l’ARN
pol I.
Préambule
Coupar et Chesterton en 1975 par des expériences menées sur des foies de rats
proposaient que la variation du taux d’élongation serait un facteur déterminant pour
réguler la transcription par l’ARN Pol I plutôt que le nombre d’ARN pol chargées sur
l’ADNr (Coupar and Chesterton, 1975). Cette théorie n’est pas tombée en désuétude
puisqu’elle fut reprise 20 ans plus tard par Tom Moss (Stefanovsky et al., 2006).Pour
comprendre la régulation du cycle de transcription de l’ARN Pol I, il semble donc
nécessaire d’appréhender non seulement l’initiation de la transcription mais aussi les
étapes postinitiatrices. En effet, la processivité, la vitesse d’élongation et la capacité
d’outrepasser les contraintes topologiques rencontrées par l’ARN pol I vont
influencer directement sur sa capacité à transcrire et sur le devenir des transcrits. À
ce titre, la quantité d’ARN Pol I engagée en transcription à un moment T peut ne pas
être directement liée à la quantité d’ARN produits, d’où la nécessité de caractériser
et de comprendre le fonctionnement de facteurs de transcription impliqués dans
l’élongation par l’ARN pol I.
Chez les eucaryotes, la majorité des études concernant le rôle de ces facteurs ont
d’abord été menées sur l’ARN pol II et leur importance n’est plus à démontrer. Ces
facteurs sont à la base de processus clefs permettant d’influer directement sur la
processivité de l’ARN pol II et sur la vitesse de synthèse du transcrit. De plus, des
études récentes suggèrent également que ces facteurs peuvent entrainer des
phénomènes de pauses transcriptionnelles favorisant le « capping » du transcrit
directement lié à son devenir. Enfin, ils permettent à l’ARN pol d’outrepasser
certaines contraintes topologiques ou chromatiniennes pouvant moduler ou arrêter
temporairement l’ARN pol II en phase d’élongation.
QM
La phosphorylation de la queue CTD, présente sur la plus grande sous-unité de
l’ARN pol II, a longtemps été présentée comme nécessaire et suffisante pour le
recrutement de ces facteurs. Cependant, des études récentes ont montré d’une part
que la queue CTD n’était pas essentielle au recrutement de ces facteurs de
transcription, même si elle y contribue (Mayer et al., 2010) et que certains de ces
facteurs avaient une capacité d’interaction directe avec l’ARN pol I (Birch et al., 2009;
Viktorovskaya et al., 2011). Ces études, et d’autres plus antérieures que nous allons
décrire dans les paragraphes suivants, tendent à montrer que le fonctionnement de
l’ARN pol I est aussi soumis à une régulation par des facteurs d’élongation dont la
plupart seraient communs à l’ARN pol II.
QN
positifs de l’élongation. Par cette approche, ont été identifiées des protéines définies
comme étant des facteurs de transcription (tableau 3) de l’ARN Pol I.
Dans une étude récente, l’équipe de Patrick Cramer a classé les facteurs
d’élongation impliqués dans la transcription par l’ARN pol II en trois groupes selon
leurs profils de répartition sur les gènes dont ils régulent la transcription (Mayer et al.,
2010). Le groupe 1 est composé de Spt4, Spt5, Spt6, le groupe 2 est composé de
Elf1 et Spn1 et le groupe 3 de Spt16, Paf1, Ctk1, Bur1 (figure 13). On peut noter que
tous les facteurs du groupe 1 sont des suppresseurs alors que les facteurs du
groupe 2 et 3 sont synthétiques létaux en combinaison avec la délétion de RPA49
suggérant des rôles différents dans l‘élongation de l’ARN pol I. Dans la partie
suivante, j’ai donc choisi de décrire ces facteurs et leurs rôles potentiels dans
l’activité d’élongation de l’ARN pol I.
QO
Facteur phénoype double mutant Δ-Rpa49Δ référence
Tableau 3: Récapitulatif des liens génétiques entre la délétion de RPA49 et des facteurs de transcrip-
tion.
0.20
0.15
0.10 Groupe 1 Groupe 2
Spt4 Spn1
0.05 Spt5 elf1
Spt6
0.30
0.25
ChIP-chip profil
0.20
0.15
Groupe 3
0.10 Paf1
Ctk1
0.05 Bur1
Spt16
Figure 13: Profil de répartition moyen de facteurs de transcription sur 339 gènes de taille moyenne chez S.
cerevisiae (1238 nucléotides+/_ 300). On peut distinguer trois groupes de facteurs de transcription selon leur
profil de répartition sur les gènes (Adapté de Mayer et al 2010).
II-3-Spt4/Spt5
Deux études récentes (Klein et al., 2011; Martinez-Rucobo et al., 2011) ont permis
de démontrer la conservation structurale de ces facteurs à travers l’évolution et la
conservation des zones d’interactions de ces facteurs avec l’ARN Pol II. Il a été
montré dans ces études qu’une des propriétés conservées de Spt4/spt5 est de
bloquer les acides nucléiques près du centre actif, de stabiliser la bulle de
transcription et de rendre l’ARN pol en cours d’élongation plus processive (Figure 14-
A-B). Ce mécanisme rendrait la transition entre l’initiation et l’élongation irréversible.
Cette activité serait essentiellement portée par le domaine NGN (« Nus G N-terminal
domain ») alors que les fonctions de couplage transcriptionnel décrit précédemment
seraient d’avantage liées aux domaines KOW (pour Kyprides, Ouzounis, Woese
(Kyrpides et al., 1996) dont le nombre varie selon les espèces (Figure 14-A). Un rôle
eucaryote spécifique est également rempli par le domaine C terminal de Spt5 qui
peut recruter d’autres complexes impliqués dans l’élongation (PAFc : Polymerase II
Associated Factor) après phosphorylation (Liu et al., 2009).
QQ
A-
Archée Bactérie
Eucaryote
NGN
Zn Spt4
binding
ADN avant le
passage de
l'ARN polymerase
90°
Centre actif
Deux publications récentes ont été plus loin pour comprendre la fonction de Spt5
(Anderson et al., 2011; Viktorovskaya et al., 2011). Il a été montré que Spt5 est
capable d’interagir avec de nombreux facteurs impliqués dans la transcription par
l’ARN Pol I. En effet, Spt5 peut interagir avec Rpa190, Rpa 135, Rpa49, Rpa34 et
Rrn3. La méthode utilisée ici de GST pull down et l’absence de contrôle négatif ne
permettent pas de conclure formellement quant à l’existence de ces interactions.
Spt5 est une protéine essentielle ce qui a conduit à utiliser des versions mutantes
pour étudier son rôle. L’une d’entre elles (spt5 C292R) est capable de supprimer le
phénotype de cryosensibilité d’une souche rpa49-∆. Ce mutant de Spt5 altère
significativement le taux de synthèse d’ARNr sans pour autant changer le nombre
d’ARN Pol I par gène, ni le nombre de copies d’ADNr. Ce phénomène peut
s’expliquer par une différence dans la vitesse d’élongation. Par une approche de
microscopie électronique en étalement de Miller, il a également été montré dans ces
études que l’absence de Spt5 entrainait une réorganisation du positionnement des
ARN pol I le long du gène d’ADNr. Sur de nombreux gènes on observe un nombre
plus important d’ARN Pol I en 3’ qu’en position 5’ proche du promoteur. Dans un
contexte sauvage, en présence de Spt5 la situation inverse est observée. L’auteur
explique ce phénomène par la conservation chez l’ARN pol I du mécanisme de
pause effectuée par Spt5 sur l’ARN Pol II chez la drosophile (Wu et al., 2003) même
si ce phénomène n’a pas été observé pour l’ARN Pol II de levure S. cerevisiae.
Pour conclure, il semble établi que Spt5 intervienne dans l’élongation par l’ARN pol I
même si sa fonction n’est pas clairement élucidée. Il semblerait que ce rôle soit
double. D’une part Spt5 augmenterait la vitesse de transcription par une action
directe ou en permettant le recrutement du complexe Paf (Polymerase II Associated
QS
Factor) (voire ci-dessous)(Zhang et al., 2010). D’autre part, il est suggéré que Spt5
puisse intervenir dans la pause, l’absence de pause pourrait améliorer le phénotype
de croissance d’une souche rpa49-∆. Une autre hypothèse serait qu’en absence de
Spt5, l’ARN pol I en élongation est plus instable conduisant au décrochage des ARN
pol I bloquées ou défectives probablement abondantes dans le cas d’une souche
rpa49-Δ. Cette dernière hypothèse pourrait expliquer pourquoi Spt5 améliore la
croissance d’une souche Rpa49-∆(Anderson et al., 2011).
II-4-Spt6
Spt6 a donc différents rôles : facteur d’élongation, histone chaperonne. Il est alors
difficile de savoir si ce facteur est directement impliqué dans l’élongation par l’ARN
pol I. Il est néanmoins intéressant de souligner que Spt6 semble particulièrement
requise pour maintenir une structure nucléosomale des gènes hautement transcrits
(Ivanovska et al., 2011), ce qui pourrait lui conférer un rôle dans la région la plus
activement transcrite du génome : l’ADNr. Le rôle de ce facteur dans la transcription
par l’ARN Pol I reste à confirmer. Très récemment, une étude double hybride atteste
l’existence de contact entre Rpa43 et Spt6 (Beckouet et al., 2011).
II-5-Spt16
QT
Spt16 appartient au complexe FACT (Facilitate Chromatin Transcription) qu’il forme
avec son partenaire la protéine Pob3. Cet hétérodimère est bien conservé chez les
eucaryotes, à l’exception d’une région de Pob3 qui contient un domaine HMGB.
Chez S. cerevisiae, ce domaine est absent mais est remplacé par la protéine HMGB
Nhp6 qui est alors nécessaire à l’activité FACT (Formosa, 2008; Stillman). Le
complexe FACT est décrit comme capable d’interagir avec les nucléosomes grâce à
son domaine de liaison à l’ADN mais aussi par la capacité de Pob3 et de Spt16 de
contacter les histones (VanDemark et al., 2008). Il a notamment été montré que
FACT stimulerait la transcription en déstabilisant l’octamère d’histone par le
relargage du dimère H2A-H2B (Figure 15) (Orphanidies and Reinberg, 2000).
Dans le cas S. cerevisiae, l’implication de Spt16 comme facteur d’élongation n’a pas
été démontrée, cependant en consultant les résultats d’un crible génétique utilisant
des versions hypomorphes de gènes essentiels, il apparaît qu’une version
hypomorphe de l’allèle codant pour SPT16 est synthétique létale avec RPA49
(Davierwala et al., 2005). Ce lien génétique suggère la conservation du processus
décrit précédemment mais reste à confirmer.
QU
pol I
1
Spt16
pol I Pob3 Spt16
2 Pob3
3 pol I
Figure 15: Représentation du mode d'action probable des protéines du complexe FACT. (1) La
présence de nucléosomes pourrait constituer un point de blocage pour le passage de l'ARN pol I. (2)
Spt16 et Pob3 sont capables de se fixer directement sur l'ADN ou sur les nucléosomes. A partir de là,
ce complexe pourrait permettre de relarguer un hétérodimère H2A-H2B de l'octamère d'histone
(Stillman et al. 2010, Vandemark et al. 2008). De plus, il a été suggéré que le complexe FACT pourrait
être recruté directement sur l'ARN pol I. (3) La déstabilisation du nucléosome faciliterait le passage de
l'ARN pol.
II-6-Paf1c
Le complexe Paf1 (Paf1c) est constitué de 5 protéines : Cdc73, Ctr9, leo1, Rtf1 et
Paf1. La caractérisation de Paf1C comme un facteur de transcription de l’ARN pol II
a largement été documentée. Il a été décrit initialement comme facteur d’initiation car
Paf1c est capable de faciliter l’initiation en influant sur la fixation de TBP sur la boite
TATA (Stolinski et al., 1997). Paf1c semble également impliqué dans l’élongation car
il peut interagir avec les facteurs d’élongation Spt4/Spt5 et avec les protéines de
FACT (Squazzo et al., 2002). De plus, Paf1c a la capacité de stimuler l’élongation
aussi bien in vivo qu’in vitro (Chen et al., 2009; Rondon et al., 2004). Enfin, Paf1c
peut recruter le complexe methyltransférase COMPASS permettant la méthylation
des lysine 4 et 79 de l’histone H3 chez la levure (Krogan et al., 2003) mais aussi
chez la drosophile (Adelman et al., 2006) et chez l’humain (Zhu et al., 2005). Paf1c
est donc directement acteur de la transcription par l’ARN pol II.
Deux études récentes de l’équipe de Schneider ont suggéré un rôle de Paf1C dans
la transcription par l’ARN Pol I(Zhang et al., 2010). En 2009, ils ont d’abord montré
que Paf1C immunopreciptait avec l’ADNr et que son absence diminuait le taux de
synthèse des grands ARNr sans pour autant changer drastiquement le nombre
d’ARN pol engagées en transcription. Dans la publication suivante un lien de létalité
synthétique avec RPA49 a été mis en évidence et il a été montré que Paf1c purifié
augmente la vitesse de transcription par l’ARN pol I dans une expérience de run off.
L’intervention de Paf1c dans l’optimisation de la transcription de l’ARN pol I semble
donc admise mais il est important de noter qu’aucune interaction de Paf1 n’a été
mise en évidence avec l’ARN pol I, posant ici la question de son recrutement.
RM
Interagit avec FACT et Spt4/5.
Stabilise la fermeture de la pince. Stimule la transcription.
Augmente la processivité. PAF1c
Spt5 Spt16
Spt4 Pob3
Spt6 Déstabilise les octamères
pol I d'histones.
Histone Chaperonne.
re-positionement des nucléosomes.
Rôle sur la chromatine mais
peu d'information.
*Dans le cas de ces 2 gènes essentiels, il s'agit d'un lien génétique avec RPA49 et une version mutée ou
hypomorphe respectivement pour Spt5 et Spt16.
(H) Caractérisé chez l'Homme
? non étudié
Figure 16: Résumé des informations concernant différents facteurs de transcriptions impliqués dans la
transcription par l'ARN pol I et l'ARN pol II.
En effet, il est intéressant de souligner que chez la levure S. cerevisiae une mutation
ou l’absence des facteurs Spt4, Spt5, Paf1, entrainent tous un défaut de maturation
du 35S. Gallagher et ses collaborateurs ont suggéré en 2004 que le SSU
processome contenu dans les boules terminales décorant les ARNr naissants
pourraient influencer sur la transcription (Gallagher et al., 2004). L’étude réalisée par
Schneider en 2007 a renforcé la notion d’interdépendance entre l’étape d’élongation
et celle de la maturation de l’ARNr 35S. Une mutation (rpa135-D784G) dans le site
actif de l’ARN pol I provoque un défaut d’élongation et conduit également à des
défauts de maturation du pré-ARNr et d’assemblage des ribosomes(Schneider et al.,
2007). Cette donnée soutient l’hypothèse que les défauts de maturation observés
peuvent être la conséquence d’un défaut d’élongation de l’ARN pol I et non la cause.
Il est probable que dans le futur des études in vitro et in vivo soient nécessaires pour
aller plus loin dans la compréhension de ces mécanismes d’élongation de l’ARN Pol I
qui, comme des études le suggèrent, seraient l’étape clef dans la régulation de la
synthèse des grands ARNr ( pour revue (Moss et al., 2006)).
II-7- La nucléoline
RO
Même si la nucléoline semble capable de stimuler la transcription de l’ARN Pol II
(Angelov et al., 2006), ses fonctions in vivo semblent spécifiques du fonctionnement
d’une seule des 3 ARN pol eucaryotes, l’ARN Pol I. En 2002, Roger et al. ont montré
que l’injection de nucléoline dans des oocytes de xénope entraine une baisse de
l’accumulation du pré-ARNr alors que dans le même temps la transcription Pol II et
Pol III n’est pas affectées. Les auteurs, par des tests de transcription, ont également
montré que la séquence du promoteur est déterminante quant à la possibilité d’action
de la nucléoline. Ils n’observent des effets sur la transcription uniquement si la région
transcrite est flanquée en 5’ d’une séquence promotrice d’ARN Pol I et pas d’ARN
Pol II (Roger et al., 2002). Une autre étude en 2007 sur des cellules HeLa, montre
par des expériences de ChIP que la nucléoline est enrichie sur la région transcrite de
l’ADNr et ne l’est pas dans l’espace intergénique de l’ADNr ou sur les gènes
transcrits par l’ARN Pol II et ARN Pol III (Rickards et al., 2007). Cette étude,
initialement menée pour identifier des facteurs ayant une activité FACT, montre que
la nucléoline est importante pour la transcription par l’ARN pol I et possède une
activité FACT. D’ailleurs, depuis 2006, l’équipe de Philippe Bouvet a montré que la
nucléoline avait des propriétés d’histones chaperones, notamment grâce à sa queue
N terminale acide (Angelov et al., 2006). Dans cette publication, la capacité de la
nucléoline d’améliorer significativement l’efficacité des machineries de remodelage
de la chromatine SWI/SNF et ACF est mise en évidence. La nucléoline permet aussi
un recyclage et une déstabilisation plus efficace de l’octamère d’histone en facilitant
le décrochage des dimères H2A-H2B (Mongelard and Bouvet, 2007). La nucléoline
répond aux critères définissant une protéine à activité FACT, c’est-à-dire facilitant la
transcription sur une matrice chromatinienne. Cette activité FACT portée par la
nucléoline, tout comme celle portée par Spt16, semble impliquée dans la
transcription par l’ARN pol I.
IV-Régulation Chromatinienne
Préambule
RP
mécanismes comme l’élongation rentrent en jeu pour réguler le taux de synthèse.
Dans cette partie nous allons aborder un point qui influence toutes les régulations
préalablement décrites, il s’agit des régulations chromatiniennes de l’ADNr qui
s’échelonnent à deux niveaux : à l’échelle globale du locus d’ADNr où l’on peut
observer des modulations des ratios entre copies actives et inactives en
transcription, et à l’échelle du gène où des changements chromatiniens peuvent
faciliter ou empêcher la transcription par l’ARN pol I.
Historiquement, les gènes d’ADNr ont été les premiers à avoir été visualisés en
microscopie électronique. Ces structures ont été apparentées à des « arbres de
Noël » laissant apparaître des transcrits naissants autours d’un axe formé par la
matrice d’ADN (Miller and Beatty, 1969). Les travaux menés par Oscar L Miller, Jr et
ses collaborateurs en 1969 ont ainsi permis de mettre en évidence l’hétérogénéité
transcriptionnelle des répétitions des gènes d’ADNr. Cette approche basée sur
l’étalement de la chromatine et l’observation au microscope électronique permet de
visualiser sur un gène les ARN Pol I actives en transcription flanquées de leurs ARN,
alors que d’autres gènes adjacents en sont dépourvus (Figure 17). La technique
d’étalement de la chromatine de Miller consiste à réaliser une lyse hypotonique des
cellules permettant à la chromatine de sortir du noyau. La préparation cellulaire est
ensuite centrifugée sur une grille de microscopie électronique permettant d’observer
les fibres de chromatine s’échappant du noyau (Osheim et al., 2009).
Il a ainsi été montré que chez la majorité des organismes eucaryotes, les gènes
ribosomiques sont répartis en deux populations distinctes, les régions actives (Figure
17-B) et inactives transcriptionnellement (Figure 17-A). Il semble maintenant établi
que l’ADNr inactif contient des nucléosomes espacés de manière régulière
contrairement à l’ADNr actif (Dammann et al., 1993; Sogo and Thoma, 1989). Ces
nucléosomes semblent visualisable par ces étalements de chromatine en se basant
sur des critères morphologiques, néanmoins, aucune caractérisation moléculaire
avec des anticorps couplés à des grains d’or n’a pu être réalisée pour confirmer qu’il
s’agit bien de nucléosome.
RQ
A-
Exemple d'un nucléole étalé par la technique dite
de "Miller spread". On repère aisément les régions
denses entourées d'ARN qui représente les gènes
d'ADNr transcrits par l'ARN pol I.
région entre
deux gènes d'ADNr 500nm
B-
ARNr 500nm
Nucléosomes
Copies
ouvertes
Copies ouvertes
Copie fermée (1100nm)
500nm
Figure 17: A- Exemple d'un nucléole de levure S. cerevisiae dont la chromatine a été étalé et contras-
tée avant observation au microscope électronique. Exemple d'un gène actif en transcription
(Panneau de droite). (Albert et al, 2011) et photographie d'Isabelle Léger silvestre. B- Visualisation
d'une copie d'ADNr considérée comme "fermée", c'est à dire non-transcrite. On distingue d'ailleurs
des structures nucléosomales. (revue Albert et al. 2011)
En se basant sur cette organisation chromatinienne différente, la technique de
photopontage au psoralène s’est avérée un outil essentiel. Le psoralène est un agent
s’intercalant dans l’ADN double brin et qui génère des liaisons covalentes après
irradiation aux UV. Le psoralène se fixe moins efficacement sur les matrices d’ADN
contenant des nucléosomes « canonique ». Les différences d’incorporation de
psoralène seront alors révélées par migration sur gel d’agarose, l’ADN ayant
incorporé le plus de psoralène aura une migration ralentie. Cette fixation différentielle
du psoralène peut également être révélée par microscopie électronique où l’on
aperçoit après dénaturation de l’ADN des structures simples brins en boucles de la
taille correspondante à celle couverte par un nucléosome (environ 140 paires de
base), l’ADN non nucléosomal apparaît sous forme double brin (Dammann et al.,
1993) (Figure 18). Cette technique de « psoralen cross linking » a renforcé l’idée de
l’hétérogénéité chromatinienne au sein du locus d’ADNr, et a permis de quantifier le
rapport existant entre gènes ouverts et fermés. Ainsi, chez la levure S. cerevisiae et
chez les mammifères on estime que seulement une partie (environ 50%) des gènes
d’ADNr sont actifs en transcription. Dans le cas des eucaryotes supérieurs, les
signaux de stress, l’absence de nutriment ou la présence de facteurs de croissance
entrainent des changements du taux de transcription par l’ARN Pol I sans pour
autant nécessiter une variation du nombre de gènes accessibles pour la transcription
(Stefanovsky et al., 2006). Au contraire, la littérature suggère que le ratio entre gènes
actifs et inactifs chez le mammifère resterait constant du fait de modifications
épigénétiques stables (CpG méthylations) d’un nombre fixe de gènes (Santoro and
Grummt, 2001). Cette notion a été remise en cause, étant donné que plusieurs
publications ont démontré des variations possibles du nombre de gènes actifs à
certains stades de la différenciation cellulaire ou dans le cas de dérèglements
pathologiques (Sanij et al., 2008; Tucker et al., 2010). Par exemple, une sous-
expression d’UBF cause une augmentation du nombre de copies fermées. Au sein
de ces gènes inactifs, on a alors deux types de structure chromatinienne: des gènes
sous forme d’hétérochromatine contenant des méthylations qui ne peuvent pas être
activés et des gènes euchromatiques assemblés sous forme nuclésomale qui ont la
capacité d’être réactivés (Sanij et al., 2008).
RS
Inactif Actif Inactif
Psoralen + UV
Digestion et isolation
de l'ADN
psoralen - +
Figure 18: Technique de Psoralen Cross Linking. Le psoralen est incapable de s'intercaler dans
les structures nucléosomales. Au contraire les régions "ouvertes" transcrites par l'ARN pol I sont
accessibles. Cette différence,s'illustre en microscopie électronique par une hétérogénéité entre les
gènes inactifs faisant apparaitre des boucles simple brin issues de la protection par les nucléoso-
mes, et les gènes actifs ne montrant pas de boucle simple brin. En gel électrophorèse, l'ADN ayant
fixé le plus de psoralen migrera plus lentement (actif) que les gènes inactifs ayant accumulé moins
de psoralen (inactif).(La barre représente 1kbAdapté de Damman et al., 1993)
Chez la levure S. cerevisiae, il a longtemps été suggéré que ce ratio de copies
actives/inactives serait aussi un levier de régulation pour contrôler la synthèse
d’ARNr. Cette hypothèse s’appuie sur l’observation qu’en phase stationnaire la
quantité de gènes actifs diminue parallèlement au taux de synthèse d’ARNr
(Sandmeier et al., 2002). La protéine responsable de ce mécanisme serait l’histone
deacétylase Rpd3. Une étude de Tsang et al. 2003 abonde dans ce sens. Dans cette
étude, on observe une délocalisation de l’ARN Pol I qui serait induite par une
altération structurale du nucléole suite à un traitement par la rapamycine. Rpd3 serait
responsable de ce changement puisqu’il n’est pas observé dans un contexte rpd3-∆.
De plus, par des expériences de « Northern blot », on observe dans un rpd3-∆ un
effet moins fort de la rapamycine qui entraine une diminution de l’accumulation de
35S après traitement à la rapamycine, suggérant que Rpd3 serait impliquée dans la
régulation par la voie TOR et que son absence confèrerait au mutant une résistance
à la rapamycine (Tsang et al., 2003). Cependant, ces observations ont été
contredites pas les équipes de Beyer et Nomura qui ont montré que le traitement à la
rapamycine entrainait une diminution de la synthèse de l’ARNr sans pour autant
diminuer le nombre de gènes actifs, mais plutôt en limitant l’association de l’ARN pol
I compétente en transcription (French et al., 2003).
Les données concernant Rpd3 sont donc clairement contradictoires concernant son
implication dans la voie TOR, mais l’ensemble de ces études suggère qu’une
réduction du nombre de copies fermées ne constitue pas un processus central et
essentiel pour la régulation de la transcription par l’ARN Pol I.
L’étude menée par French et al. abonde dans le sens de ces observations(French et
al., 2003). Dans cette publication, ont été utilisées des souches de S. cerevisiae avec
un nombre réduit de répétitions du gène d’ADNr (40 copies) (Kobayashi et al., 1998).
La majeure partie des gènes est alors sous forme active. Si la transcription par l’ARN
pol I est dépendante du nombre de gènes actifs, le taux de synthèse sera environ
deux fois plus faible comparé à une souche sauvage contenant 150 copies. Ce
modèle est contredit ici par French et ses collaborateurs qui démontrent que l’on
peut diminuer le nombre de copies actives jusqu’à 40, sans pour autant affecter la
croissance et le taux de synthèse de l’ARNr (French et al., 2003). Les étalements de
RU
Miller confirment que la diminution du nombre de gènes actifs est compensée par
une augmentation du nombre d’ARN pol I engagées en transcription.
Les études menées par l’équipe de Kobayashi explicitent alors quelle pourrait être
l’utilité de cette hétérogénéité chromatinienne au sein d’un même locus. Ainsi, en
2010, Ide et ses collaborateurs a démontré que la sensibilité aux UV des souches de
S. cerevisiae augmentait considérablement si le nombre de gènes d’ADNr était
faible. La fonction principale de ces répétitions aux caractéristiques chromatiniennes
hétérogènes serait de maintenir l’intégrité génomique des cellules, de limiter les
phénomènes de recombinaisons illégitimes et de mener à bien le couplage de la
transcription et de la réparation (Ide et al., 2010). Les copies inactives pourraient
donc avoir un rôle davantage lié à la stabilité du génome plutôt qu’à la régulation
transcriptionnelle de l’ARN pol I.
SL
Il semble maintenant admis que les gènes d’ADNr inactifs ont une structure
nucléosomale, la structure des gènes actifs est, elle, largement débattue. La
controverse repose principalement sur la présence ou non de nucléosomes sur les
gènes transcrits par l’ARN pol I. Dans cette partie nous revisiterons les différentes
données plaidant en faveur de l’une ou de l’autre hypothèse.
Une étude menée dans l’équipe de Nomura prend parti en faveur d’un rôle des
histones sur les gènes actifs d’ADNr pour structurer et faciliter la transcription par
l’ARN pol I. Leur approche consiste à regarder l’effet de la déplétion de l’histone H3
sur la transcription par l’ARN pol I. L’interprétation de cette étude reste délicate étant
donné l’effet pleiotrope que peut avoir une déplétion de H3, et du fait que H3 est déjà
caractérisée comme ayant un rôle dans l’initiation de l’ARN Pol I au niveau du
complexe UAF (Keener et al., 1997a). De plus, UAF a récemment été identifié
comme un complexe influant directement sur la structure chromatinienne des gènes
d’ADNr (Goetze et al., 2010). Dans cette étude, la déplétion des histones H2B ou
H2A aurait été plus judicieuse.
SM
présence de gènes inactifs dans leurs souches AA (all active), il semble difficile de
pouvoir conclure quant à la présence d’histones sur les gènes actifs à partir de cette
étude.
SN
n’a jamais été observé de structure nucléosomale sur les gènes actifs. Ceci signifie
soit que les gènes actifs ne possèdent pas de nucléosome ou dans une structure qui
n’est pas préservé lors des étalements de la chromatine.
La transcription par l’ARN Pol I chez les mammifères semblent nécessiter une
activité histone chaperonne qui pourrait être apportée par la nucléoline (Angelov et
al., 2006; Rickards et al., 2007) ou encore par FACT (Birch et al., 2009). Ce besoin
suggère l’existence d’une structure nucleosomale sur les gènes actifs. Cependant,
l’étude de ces différents états chromatiniens chez les mammifères se heurte aux
même limites que celles décrites précédemment : l’hétérogénéité du locus d’ADNr.
Les manipulations génétiques étant moins aisées dans les cellules de mammifères
les approches décrites précédemment chez la levure S. cerevisiae n’ont pu être
pratiquées. Cependant, l’existence de méthylations sur l’ADNr chez les mammifères
a permis l’utilisation d’une approche alternative. En effet, en se basant sur le fait que
seuls les gènes inaccessibles au psoralène (inactifs) sont méthylés (Stancheva et al.
1997), l’utilisation d’enzymes dont l’activité dépend de l’état de méthylation de l’ADN
a permis de séparer deux populations de gènes selon leurs méthylations (Santoro
and Grummt, 2001). HpaII est une enzyme qui ne peut pas couper une séquence
d’ADN méthylée. Les régions ciblées par cette enzyme sont les résidus CpG situés
sur le gène d’ADNr en -143 (dans l’UCE) et dans la région codante (+154). Ainsi, en
utilisant cette propriété, après extraction de l’ADN, environ 50% des gènes d’ADNr
de rats semblent résistant à la coupure. Cette proportion corrobore les données de
“psoralen cross linking” (Conconi et al., 1989). Par cette approche, l’équipe de
Grummt a mis en évidence le rôle de TTF1 et son influence sur le recrutement de
facteurs remodeleurs de la chromatine inhibiteurs (NORC : nucleolar chromatin
remodeling complex) ou activateurs (CSB : Cockayne Syndrome group B) pour la
transcription de l’ADNr. Ces études ont largement contribué à mettre en évidence
l’importance du contexte chromatinien pour la transcription par l’ARN Pol I (Li et al.,
2006b; Yuan et al., 2007). De plus, la digestion par HpaII combinée à des
expériences de ChIP sur l’ARN Pol I et sur les histones a permis de montrer que
seuls les gènes sensibles à HpaII portaient l’ARN Pol I, alors que les histones était
présentes aussi bien sur les gènes actifs qu’inactifs (Yuan et al., 2007).
SO
III-2-c-Physarum polycephalum : retour vers le futur
Le Physarum polycephalum est un myxomycète qui fut utilisé comme modèle d’étude
pour comprendre les caractéristiques chromatiniennes de l’ADNr. L’utilisation de cet
organisme est dans ce cas particulièrement judicieuse étant donné que l’ADNr n’est
pas lié au chromosome ce qui rend sa purification facile. De plus, en fin de phase G2
tous les gènes d’ADNr sont actifs (Hall and Turnock, 1976) ce qui permet une
purification spécifique de gène d’ADNr actifs. Une première étude en 1982 montre
que la région transcrite des gènes actifs a une perméabilité au psoralène bien
supérieure que la région non transcrite (Judelson and Vogt, 1982). Deux années plus
tard, Prior et ses collaborateurs ont utilisé l’IAF (sulfhydryl reagent
iodoacetamidofluorescein) pour étudier la structure chromatinienne de gènes actifs
ou inactifs purifiés. L’IAF marque les groupes sulfhydryle contenus notamment sur
l’histone H3. Ce marquage ne peut avoir lieu que lorsque le groupement est
accessible. On n’observera donc pas de marquage sur des structures nucléosomales
fermées. Dans ces expériences, un marquage est observé uniquement dans les
régions transcrites de l’ADNr, à contrario, on n’observe pas de réaction dans les
régions non transcrites de l’ADNr. Cette analyse a été complétée par la
caractérisation en microscopie électronique des structures nucléosomales observées
et a permis de proposer une structure alternative de nucléosome sur l’ADNr des
gènes actifs : le lexosome (figure 19 B).
SP
A-
Gène inactif
(1) (3)
Nucléotides
(2) (4)
Gène actif
B- 80 150 Nucléotides
Nucléosome Lexosome
Nucléosome Tetrasome
Figure 19: A- Distribution des tailles des bulles simple brin après traitement au psoralen et étalement
des gènes fermés (1) et ouverts (2) d'après Damman et al. 1993. A droite est représenté la distribu-
tion des tailles des structures simples brins (1-2) mais pour des structures nucléosomales (3) ou
composé de tétrasomes (4).(3-4) Daprès Puerta et al. 1993. B-Exemple de structures nucléosomales
alternatives. Vue au microscope électronique de nucléosome ou de tétramère sur une matrice ADN
(Lavelle et al. 2007). Modèle du lexosome. Le lexososome serait un arrangement nuclésosomal non
canonique retrouvé sur l'ADNr (Prior et al. 1983).
III-2-d-Structure chromatinienne alternative des gènes actifs ?
La structure chromatinienne des gènes actifs d’ADNr n’est donc pas encore
clairement élucidée et certains résultats semblent parfois contradictoires, le débat se
situant autour de la présence ou non de nucléosome. Cependant en sortant de cette
dialectique, l’ensemble des données de la littérature suggère l’existence d’une
SR
structure chromatinienne réconciliant les deux points de vues. Cette structure serait
largement dépourvue de nucléosomes canoniques mais posséderait des
arrangements chromatiniens alternatifs. Il reste à savoir comment se forme cette
structure alternative, des protéines structurantes spécifiques de l’ADNr pourrait être
impliquées, notamment certaines protéines HMGB qui sont spécifiquement enrichies
sur les gènes actifs et dont nous allons expliciter le rôle dans la partie suivante.
Les protéines HMG ont été découvertes il y a presque 40 ans. Elles ont été définies
comme des protéines chromatiniennes abondantes manifestant une forte mobilité sur
gel d’électrophorèse (Goodwin et al., 1975). Cette dernière propriété est d’ailleurs à
l’origine de leur nom (High Mobility Group) même si les initiales de son découvreur
H.M Goodwin laissent penser que la raison du choix de cet acronyme fut double.
Cette famille de protéines est présente chez tous les eucaryotes et absente des
eubactéries et des archées. Elles participent à la majorité des processus ADN
dépendant et sont exprimées abondamment. À titre indicatif dans une cellule de
mammifère, on estime à plus d’un million de protéines HMG (Duguet et al., 1981).
Ces valeurs sont à mettre en perspective dans un génome de 3 milliards de paires
de base contenant près de 20 millions d’histones par cellule.
SS
de transcription, de recombinaison ou encore de réplication (Agresti and Bianchi,
2003; Catez et al., 2003).
Pour comprendre l’importance de ces protéines, il est intéressant de noter que les
protéines HMGB sont des protéines qui diffusent très rapidement dans le noyau, se
fixent et se dissocient de leurs cibles ADN de manière transitoire. On estime chez les
mammifères qu’un nucléosome entre en interaction avec une protéine HmgB1 en
moyenne toutes les deux secondes (Agresti and Bianchi, 2003).
La principale caractéristique structurale de ces protéines HMGB est l’existence d’une
ou plusieurs boites HMG. Un domaine HMG est une région de 80 acides aminés qui
est responsable de la capacité des protéines HMGB à s’accrocher et à courber
l’ADN. Il est important de noter que parmi ces 80 acides aminés seules une minorité
est conservée au sein des protéines de cette famille. Aromatiques ou basiques pour
la plupart, ces acides aminés conservés sont impliqués dans le maintien de la
structure tridimensionnelle du domaine et dans l’interaction avec l’ADN. En dépit,
d’une faible conservation générale de la séquence primaire du domaine HMGB, la
structure tridimensionnelle est quant à elle conservée(Bustin, 1999). On observe une
structure tertiaire en forme de L contenant trois hélices alpha (figure 20). Ces hélices
et la région N-terminale du domaine se replient en deux bras formant entre eux un
angle d’environ 80° (Xu et al., 2002). Le domaine HMG se fixe préférentiellement sur
des structures particulières de l’ADN, au niveau des petits sillons élargis de l’ADN,
des jonctions à quatre voies, de l’ADN modifié par le cis-platine, de l’ADN relâché, ou
encore au niveau des points d’entrée et de sortie des nucléosomes (Bustin, 1999;
Thomas and Travers, 2001). Une fois fixé, ce domaine induirait, via l’insertion de la
protéine HMGB dans le petit sillon, une courbure de l’ADN.
ST
A-
B-
12 90 179 209
N C HMO1
Boite A Boite B C
Boite HMGB Boite HMGB
non consensus consensus
Figure 20: A- Représentation structurale d'une boite HMG B consensus. On voit les 3 hélices
alpha en vert au sein d'une boite de 80 acides aminés. B- Représentation schématique des deux
protéines à boites HMGB Hmo1 et UBF1 de levure S. cerevisiae et humaine. La boite A en N termi-
nal ne répond pas aux critères d'une boite HMG classique. Chez UBF, on a un domaine de diméri-
sation en N-terminal, la partie en noire dans la boite 2 correspond à la région d'épissage absente
dans le cas d'UBF2.
Les HMGB sont elles-mêmes partagées en deux groupes :
La classe 1 des protéines HMGB rassemble des protéines n'ayant qu'un seul
domaine HMG. Ces protéines ne sont exprimées que dans certains tissus et se fixent
sur des séquences spécifiques d'ADN. On peut citer pour exemple des régulateurs
transcriptionnels tels que le facteur SRY (Sex determining Region Y) qui est le
déterminant du sexe mâle chez les mammifères (Sinclair et al, 1990), les facteurs
activateurs lymphoïdes T Cell Factor- 1 (TCF-1) et Lymphocyte Enhancer Factor-1
(LEF-1) (Travis et al., 1991); (van de Wetering and Clevers, 1992).
La classe 2 semble impliquée dans des phénomènes biologiques très variés comme
la recombinaison, la réplication, la réparation, la transcription de l’ADN. Ce sont des
protéines qui possèdent plusieurs domaines HMG et qui reconnaissent des
structures courbées de l’ADN. Ce groupe comprend entre autres la protéine HMGB1
(Pauken et al., 1994) qui est une protéine ubiquitaire, ainsi que les protéines HMGB2
(Shirakawa and Yoshida, 1992) et HMGB3 (Vaccari et al., 1998). Ces trois protéines
possèdent deux domaines HMG notés A et B et un domaine riche en acides aminés
acides dans la partie C-terminale. Les protéines humaines UBF1 et Hmo1 de S.
cerevisiae sur lesquels nous allons revenir par la suite font partie de cette dernière
sous-famille.
IV-3- UBF1
IV-3-a-généralité
UBF (Upstream Binding Factor) est une protéine HMGB qui a été caractérisée chez
l’humain (Jantzen et al., 1990), la souris (Hisatake et al., 1991) et le xénope (Pikaard
et al., 1989). De plus les bases de données indiquent qu’un équivalent d’UBF serait
présent chez tous les vertébrés. Cette protéine est très conservée entre ces
différents organismes, à titre d’exemple entre la souris et l’Homme on observe une
homologie de séquence atteignant 97%.
TL
Chez les mammifères, ces deux protéines isoformes sont issues d’un même ARNm
mais diffèrent en raison d’épissage entrainant l’absence d’une région de 37 acides
aminés dans UBF2. Chez le xénope, on retrouve également deux protéines
isoformes différenciées par 22 acides aminés mais issues de deux gènes différents
(Bachvarov and Moss, 1991).
TM
(Cairns and McStay, 1995; Jantzen et al., 1992). Il est à noter que la boite 4 est
absente chez le xenope. Cette différence explique l’impossibilité de la version UBF1
de xénope de remplacer UBF1 humain et réciproquement (Bell et al., 1989). Enfin, le
domaine de dimérisation retrouvé aussi bien chez l’humain que chez le xénope en
position N-terminale serait essentiel à l’activité d’UBF (Jantzen et al., 1992; McStay
et al., 1991).
Cette boite de dimérisation, ces motifs HMG et la queue C-terminale contenus dans
UBF1 lui confèrent la capacité de structurer l’ADN. Il a d’ailleurs été proposé
qu’UBF1 serait capable de former une structure particulière appelé enhancesome.
L’enhancesome est constitué d’un dimère d’UBF1 permettant une courbure de 360°
de l’ADN aboutissant à la formation d’une boucle d’ADN d’environ 150 paires de
base (Bazett-Jones et al., 1994) (Figure 21). La formation d’une telle structure
associée aux capacités d’interactions d’UBF1 avec d’autres protéines seraient
directement impliquées dans les différents rôles joués par cette protéine que nous
allons décrire dans le paragraphe suivant.
TN
UBF
ADN
Figure 21: Modèle structural d'enhancesome . Un dimère d'UBF pourrait être responsable d'une
telle structure par la capacité des protéines HMGB à modifier la structure de l'ADN.(adapté de Stefa-
novsky et al. 2006).
IV-3-b-UBF : un facteur d’initiation
Un rôle d’UBF dans le processus d’initiation s’est imposé dès 1989 du fait de sa
présence sur les régions proximales du promoteur d’ADNr (Pikaard et al., 1989). Les
études qui ont suivi ont proposé qu’UBF serait un facteur déterminant pour stimuler
l’assemblage du complexe d’initiation grâce à sa propension à augmenter la
concentration locale des facteurs impliqués (McStay et al., 1997). La fixation d’UBF
sur la région promotrice serait un alors un prérequis à l’assemblage du PIC, il
permettrait la juxtaposition de la séquence activatrice (UCE) et du promoteur basal
(CE). Des études biochimiques montrent que deux des sous-unités de SL1, TAFI48
et TBP interagissent directement avec UBF (Beckmann et al., 1995; Tuan et al.,
1999). De plus, des expériences de footprinting sur SL1 suggèrent un accrochage
coopératif entre UBF et SL1 (Bell et al., 1988). De ces résultats découlent le modèle
suivant. UBF s’accrocherait aux régions promotrices suivies par SL1. Le recrutement
consécutif de l’ARN Pol I se ferait par de multiples interactions. UBF interagirait
directement avec deux sous-unités de l’ARN Pol I, CAST et PAF53, (Panov et al.,
2006; Schnapp et al., 1994) alors que l’ARN pol I lierait SL1 via TIF-1A (Miller et al.,
2001). L’intervention d’UBF dans le processus d’initiation semble donc admise.
Cependant le mécanisme d’action d’UBF décrit précédemment reste lui soumis à
controverse. En effet, une étude de 2006 a démontré, par des approches in vitro,
qu’UBF n’interviendrait ni avant ni au moment de l’assemblage du PIC, mais à une
étape plus tardive. UBF faciliterait le départ de l’ARN Pol I du promoteur en assistant
la conversion entre une ARN Pol I abortive produisant de petits transcrits (10-15
nucléotides) et une ARN Pol I stable en phase d’élongation (Panov et al., 2006). Ces
résultats acquis intégralement in vitro permettent de proposer un modèle alternatif
d’action d’UBF au promoteur mais ne remettent pas intégralement en cause
l’ensemble des données acquises sur la stimulation de l’ARN Pol I par UBF1 et son
rôle dans l’assemblage du PIC.
Le fait de retrouver UBF à la fois sur les régions promotrices et sur les régions
transcrites de l’ADNr a conduit à formuler l’hypothèse d’une fonction autre que celle
impliquée dans l’initiation. Au niveau de la région transcrite, plusieurs fonctions
d’UBF ont été proposées et convergent toutes vers une capacité d’UBF à réguler
TP
l’état chromatinien des gènes d’ADNr. En effet, il a été montré in vitro, qu’UBF
pouvait s’opposer aux effets inhibiteurs du linker histone H1 sur la transcription par
l’ARN pol I. De plus, UBF1 semble pouvoir déplacer l’histone H1 contenue sur une
matrice nucléosomale (Kermekchiev et al., 1997). Ces données ont fait d’UBF un
candidat idéal comme facteur participant à la régulation de l’état chromatinien des
gènes transcrits par l’ARN pol I. En accord avec ce rôle, il a été montré que
l’insertion de séquences ectopiques d’ADNr permet le recrutement d’UBF et
confèrent à la chromatine une structure « ouverte » similaire à celle retrouvée sur les
NOR (Region Organisatrice du Nucléole) (Mais et al., 2005). Dans le même ordre
d’idées, l’adressage d’UBF sur des sites ectopiques entraine là aussi une
décondensation de la chromatine (Chen et al., 2004). UBF serait donc une potéine
HMGB capable de modifier la chromatine et en particulier l’ADNr.
De plus, il a été montré qu’UBF pouvait agir directement sur la régulation du nombre
de copies actives en transcription. En effet, une diminution de la quantité d’UBF
induite par interférence à l’ARN conduit à une augmentation du nombre de gènes
d’ADNr inaccessibles au psoralène, donc inactifs (Sanij et al., 2008). La quantité
d’UBF1 permettrait donc de réguler le nombre de copies actives. Cette donnée est
confirmée par la littérature puisque selon les stades de différenciation cellulaire on
observe une corrélation entre la quantité d’UBF et le nombre de copies actives (Liu
et al., 2007; Poortinga et al., 2004). UBF selon son abondance permettrait la
fermeture ou l’ouverture d’un certain nombre de copies mais ne serait pas capable
d’entrainer l’ouverture des gènes constitutivement fermés par des méthylations.
Ainsi, on distinguerait dans les cellules de mammifères trois états chromatiniens
différents, les gènes méthylés représentant 50% de la population, les gènes inactifs
sans méthylation qui peuvent changer d’états chromatiniens en présence d’UBF et
enfin les gènes actifs en transcription contenant UBF (Sanij et al., 2008).
UBF est donc un constituant spécifique des gènes actifs et semble être un acteur
central dans leur maintien sous la forme activée ; reste à connaître les
conséquences de sa fixation sur la chromatine et sur la transcription par l’ARN Pol I.
TQ
une stimulation par des facteurs de croissance dans des cellules de mammifères
induirait une augmentation du taux de transcription sans induire pour autant une
augmentation du nombre d’ARN pol I par gène. UBF serait responsable de
l’ajustement du taux de transcription par une accélération des processus d’élongation
d’un facteur 5. Le rôle d’UBF serait étroitement corrélé à son état de phosphorylation
sur les acides aminés 117 et 201 contenus respectivement sur la boite 1 et 2. En
absence de phosphorylation, UBF fixé sur l’ADN aurait un rôle inhibiteur permettant
de ralentir l’ARN Pol I en phase d’élongation (Stefanovsky et al., 2006). En cas de
phosphorylation par la kinase ERK, les interactions entre UBF et l’ADN seraient
perturbées causant l’apparition d’une structure plus permissive à la transcription
(Stefanovsky et al., 2006). Par ces mécanismes, les auteurs estiment que l’ARN Pol I
aurait la capacité de passer d’une vitesse de synthèse d’ARN de 20 nucléotides par
seconde à plus de 100 par le seul fait d’une modification de sa matrice d’ADN.
D’après Tom Moss, un tel mécanisme serait suffisant pour réguler à lui seul la
transcription par l’ARN Pol I chez les mammifères.
Il est alors possible que UBF modifie la structure chromatinienne des gènes actifs
par une compétition avec le linker histone H1 comme le suggère l’étude de
TR
Kermeckiev (Kermekchiev et al., 1997). Les ChIP réalisées sur H1 concordent avec
ce modèle puisque la présence de H1 sur les gènes d’ADNr est augmentée en
absence d’UBF1 (Sanij et al., 2008). Ces données suggèrent que UBF1 serait un
marqueur spécifique des gènes actifs responsable de l’établissement d’une structure
chromatinienne particulière permissive pour la transcription par l’ARN Pol I.
IV-4-Hmo1
Hmo1 a été purifiée pour la première fois en 1996 et caractérisée comme une
protéine de 35kDa appartenant à la famille des HMGB (Lu et al., 1996). Chez la
levure S. cerevisiae on compte 10 protéines HMGB, la majorité d’entre elles ne
possèdent qu’une seule boite HMG. Hmo1 a une structure qui se rapproche des
protéines HMG existant chez les eucaryotes supérieurs puisqu’elle possède en son
sein deux boites HMG (figure 20). La boite A en position N terminal ne présente que
de faibles homologies de séquence avec une boite HMGB consensus, au contraire
de la boite B qui ressemble au motif HMG retrouvé chez les mammifères, notamment
celui retrouvé sur la protéine HMGB1 (Kamau et al., 2004; Lu et al., 1996). Cette
ressemblance a d’ailleurs conduit à proposer que la protéine Hmo1 de levure et
HMGB1 humaine seraient équivalentes. Cependant, des expériences de
complémentations hétérospécifiques menées entre cette protéine de levure et de
mammifère n’ont pas permis de valider cette hypothèse (Lu et al., 1996). L’équipe de
Grove s’est attelée à étudier les caractéristiques biochimiques d’Hmo1 et de ses
différents domaines. La boite B est essentielle pour l’accrochage à l’ADN et participe
également à la modification de la structure de l’ADN. La boite A au contraire a une
faible affinité pour l’ADN et ne semble pas posséder les domaines suffisant pour
assumer une fonction HMG (Kamau et al., 2004). Cependant, une interaction entre la
boite A et le domaine C terminal d’Hmo1 a été décrite comme requise pour moduler
la conformation de l’ADN (Bauerle et al., 2006; Xiao et al., 2010).
Ces données in vitro sont néanmoins à confronter aux résultats obtenus in vivo,
puisqu’il a été publié dès 1996 qu’une délétion du motif C terminal n’entrainait pas de
phénotype de croissance, indiquant que cette forme d’Hmo1 tronquée est
fonctionnelle (Lu et al., 1996). Depuis cette date, Hmo1 a été au centre de
nombreuses études in vivo mettant en évidence son implication dans une pléiotropie
TS
de fonctions. En effet, de par son abondance (estimée à 20 mille molécules par
cellule (Ghaemmaghami et al., 2003) et sa capacité à cibler de nombreuses régions
du génome, la fonction d’Hmo1 peut être reliée directement ou indirectement à la
majorité des processus ADN dépendants.
La protéine Hmo1 a été initialement décrite comme une protéine HMGB nucléaire
importante pour la stabilité et l’architecture générale du génome (Lu et al., 1996).
Ainsi, son absence se traduit par une instabilité génomique accrue reflétée par une
hypersensibilité à la Mnase et une augmentation du taux de perte plasmidique (Lu et
al., 1996). Ce rôle d’Hmo1 a été confirmé en 2002, puisque la recherche de mutants
présentant un haut taux de mutations spontanées a permis la constitution d’une
collection de gènes hsm (high spontaneous mutagenesis) dont l’un d’entre eux
contient une mutation du gène HMO1. De cette observation les auteurs ont inféré un
rôle d’Hmo1 dans la réparation. Hmo1 serait une protéine initiatrice de la voie de
réparation en rendant accessible les lésions à la machinerie de réparation (Alekseev
et al., 2002). Cette hypothèse est soutenue par différents liens génétiques entre
HMO1 et les gènes codant pour des protéines impliquées dans la réparation telles
que Sgs1, Top3 (Gadal et al., 2002a). Deux publications en 2009 par l’équipe de
Marco Foiani et de Dennis M. Livingston abondent dans ce sens. En effet, des
mutations de l’ADN polymérase (pol3-14) ou de la topoisomérase 2 (top2-1)
provoquent un phénotype de létalité dans certaines conditions qui peut être supprimé
en absence d’Hmo1. Cette suppression serait due à la capacité des cellules
d’outrepasser les points de contrôle du cycle cellulaire en absence d’Hmo1. Dans
des conditions normales, Hmo1 recouvrirait les lésions ADN et permettrait
directement ou indirectement l’arrêt du cycle cellulaire (Bermejo et al., 2009; Kim and
Livingston, 2009). Enfin, outre ce rôle d’Hmo1 en réponse à des stress génotoxiques,
Hmo1 est aussi connu pour organiser et structurer certaines régions du génome en
absence de lésions. En effet, il a été montré qu’Hmo1 se fixait aux séquences CAG
qui sont des régions répétées et très instables. Hmo1 permet dans ce cas de
structurer ces régions dans une conformation chromatinienne particulière dépourvue
de structure nucléosomale canonique. En absence d’Hmo1, on trouve un profil de
TT
digestion similaire à celui d’une matrice recouverte par des octamères d’histones
(Kim and Livingston, 2009). Hmo1 est donc une protéine participant au maintien et à
l’organisation du génome.
TU
régions riches en GC appelées IVR (« intervening région ») au niveau du promoteur.
L’auteur propose qu’Hmo1 pourrait agir soit en formant des boucles d’ADN entre le
Core Promoteur et UAS et positionner le PIC (Kasahara et al., 2011).
Une fonction de Hmo1 en relation avec la transcription par l’ARN pol I a été suggérée
en 2002 par la démonstration de l’existence d’un lien génétique entre HMO1 et
RPA49 (Gadal et al., 2002a). La double délétion hmo1-∆ rpa49-∆ n’est pas viable.
Etant donné les divers rôles d’Hmo1, il était important de clarifier que l’effet observé
est lié spécifiquement à un dysfonctionnement de l’ARN Pol I. Un plasmide
permettant la transcription de l’ADNr par l’ARN pol II a été utilisé et permet la
suppression du phénotype de mort dans une souche rpa49∆-hmo1∆. Cette
suppression signifie que la létalité observée est uniquement due à un défaut
dépendant de l’ARN pol I (Nogi et al. 1991).
Au-delà de cette létalité synthétique, il est intéressant de noter que la surexpression
d’Hmo1 parvient à corriger le phénotype d’un mutant rpa49-∆ (Gadal et al., 2002a).
Hmo1 est la protéine HMGB de levure S. cerevisiae la plus abondante ; il apparaît
surprenant que sa quantité soit un facteur limitant même dans un contexte génétique
particulier. Dans cette étude, un effet d’Hmo1 sur la structure de la chromatine des
gènes codant pour l’ADNr a été suggéré (Gadal et al., 2002a). Cette fonction d’Hmo1
est apparue d’autant plus plausible, quelques années plus tard, après obtention
d’immunoprecipitation des régions transcrites de l’ADNr par ChIP contre la protéine
Hmo1 (Berger et al., 2007; Hall et al., 2006; Kasahara et al., 2007).
L’équipe d’Achim Griesenbeck a par la suite poursuivi l’étude de la fonction d’Hmo1
sur l’ADNr. Dans une publication en 2008, l’auteur s’applique à répertorier les
constituants protéiques des gènes actifs et inactifs par la technique de ChEC
psoralène. Il s’est alors avéré qu’Hmo1 était un composant exclusif des gènes actifs
en transcription. De plus, l’utilisation d’une souche thermosensible permettant la
déplétion de Rrn3, a permis de prouver qu’Hmo1 était capable de rester accrochée
sur l’ADNr indépendamment de la transcription par l’ARN Pol I. Cette donnée ne
signifie pas que la fixation d’Hmo1 sur l’ADNr soit ARN pol I indépendante mais que
le maintient d’Hmo1 sur ces gènes actifs ne requiert pas (au moins à court terme)
une activité de transcription par l’ARN Pol I (Merz et al., 2008). De manière
surprenante, Hmo1 semble disparaître des gènes actifs dans une souche uaf30-Δ
UL
(Goetze et al. 2010). Ce résultat n’est pas discuté par l’auteur de cette publication,
mais pourrait suggérer une incompatibilité entre la fixation d’Hmo1 et la transcription
par l’ARN Pol II sur l’ADNr (observée dans une souche uaf30-∆ (Conrad-Webb and
Butow, 1995; Vu et al., 1999)).
L’utilisation d’une souche hmo1-∆ a permis de montrer que cette protéine HMGB
n’était pas essentielle pour l’établissement d’un état chromatinien caractéristique des
gènes actifs (Merz et al., 2008). En effet, dans une souche hmo1-∆, on distingue
toujours une bande représentant les gènes actifs et inactifs par la méthode de
“psoralen cross linking”. Cependant, la bande des gènes actifs comparativement aux
gènes inactifs est d’intensité plus faible que dans une souche sauvage. Ce résultat
permet d’affirmer que la délétion d’Hmo1 change le rapport entre copies ouvertes et
fermées en faveur des gènes inactifs.
Enfin, dans une publication récente, il a été montré que l’arrêt du cycle par le facteur
alpha factor en G1/S conduit à l’ouverture des copies jusqu’au passage en phase S
durant laquelle les gènes seront refermés (Dammann et al., 1995; Wittner et al.,
2011). Si durant ce blocage G1/S, on empêche la transcription Pol I (rrn 3-ts (ts pour
thermosensible)), on observe une accumulation de copies ouvertes uniquement si
Hmo1 est présent. En absence d’Hmo1, il ne reste que des copies fermées après 5
heures de blocage en G1. Cette donnée renforce le rôle essentiel d’Hmo1 dans le
maintien des gènes actifs.
De manière intéressante, dans la susnommée expérience on peut noter qu’après 2,5
heures de blocage sans transcription Pol I et en absence d’Hmo1, on ne parvient pas
à distinguer les bandes actives et inactives par la technique de “psoralen cross
linking”. On observe dans ce cas une situation intermédiaire avec un rapprochement
de la bande du haut vers la bande du bas empêchant de les discriminer. Cette
observation rappelle celle faite par Damman en 1995 qui a aussi observé un
rapprochement entre les bandes des gènes actifs et inactifs à l’entrée en phase
stationnaire, c’est-à-dire lorsque la transcription par l’ARN Pol I diminue (Dammann
et al., 1995). L’absence d’Hmo1 dans un contexte où il y a peu de transcription par
l’ARN pol I facilite ce rapprochement des deux bandes et probablement la fermeture
des copies d’ADNr. Ces résultats sont à mettre en perspective avec l’importance
d’Hmo1 dans une souche rpa49-∆ où la transcription par l’ARN Pol I est faible
(Beckouet et al., 2008) et devient impossible en absence d’Hmo1 (Gadal et al.,
2002a). L’étude du rôle d’Hmo1 dans ce contexte génétique rpa49-∆ semble donc
UM
particulièrement intéressante pour comprendre la fonction des protéines HMGB sur
l’ADNr et sera un des axes de recherche détaillés dans cette thèse. Nous tenterons
d’aller plus loin dans la compréhension de la mécanistique d’action d’UBF1 et
d’Hmo1 sur l’ADNr.
UN
C HAPITRE III:
Préambule
Le noyau fut en 1802 la toute première structure cellulaire identifiée et son étude fut
poursuivie par Robert Brown en 1831(Ramsbottom, 1932). Son rôle central dans la
viabilité cellulaire ainsi que son implication dans l’hérédité ont vite contribué à le
populariser.
L’ultrastructure du noyau et son organisation furent révélées par la microscopie
électronique et complétée par la microscopie photonique conduisant à une claire
définition de sa morphologie. Sa caractéristique morphologique majeure est la
présence d’une double membrane lipidique constituant la frontière avec le
cytoplasme. A contrario, l’espace nucléaire est dépourvu de membranes lipidiques.
Cette absence de frontière lipidique, considérée par le passé comme condition sine
qua none à l’existence d’organisation, a contribué à soutenir l’image d’un
compartiment désorganisé. Cette vision est maintenant largement dépassée.
Il apparaît en effet que le noyau est un espace organisé contenant le matériel
génétique, mais aussi capable de le maintenir et d’assurer son expression. Alors que
les aspects moléculaires des processus réplicatifs et transcriptionnels ont été très
étudiés, leur organisation spatiale et temporelle au sein du noyau reste peu connue.
De plus, même si l’étude des séquences répétées pose encore problème, les
améliorations techniques nous permettent d’avoir très peu de limite sur la
connaissance des séquences primaires d’ADN constituant un génome alors que
l’étude de leur organisation au sein de l’espace nucléaire est soumise à des limites
techniques et constitue un des challenges de l’ère post-génomique (Figure 22). Les
innovations technologiques en microscopie ou l’apparition de techniques telles que le
3C (Conformational Chromosome Capture) (Dekker et al., 2002) contribuent à
apporter des solutions pour l’étude de ces problématiques mais l’organisation tri-
dimensionnelle ainsi que ses implications fonctionnelles restent des domaines à
explorer.
UO
Figure 22
Dans les deux premières parties de cette thèse nous nous sommes attelés à décrire
à l’échelle moléculaire le rôle des protéines impliquées dans la transcription et la
structure chromatinienne du locus d’ADNr. Au cours de ma thèse, j’ai également
étudié l’organisation fonctionnelle du chromosome portant les répétitions d’ADNr
chez la levure S. cerevisiae : le chromosome XII. Dans cette introduction, je décrirai
dans un premier temps la structure et l’organisation du constituant majeur du noyau :
la chromatine, puis nous décrirons l’arrangement spatial des chromosomes et des
différents éléments structuraux, dont le nucléole, impliqués dans l’organisation
spatiale du génome.
Le constituant principal des chromosomes est l’ADN autour duquel vont s’associer
des protéines formant la chromatine. Quantitativement, on retrouve plus de protéine
que d’ADN sur un chromosome. Cette association forme la fibre chromatinienne, elle
même structurée et organisée selon plusieurs niveaux de compaction. Cette
organisation est variable selon le type cellulaire, le cycle ou encore la croissance
cellulaire et influe directement sur l’ensemble des processus ADN dépendants.
L’organisation du noyau s’analyse donc à différentes échelles, de la fibre d’ADN sous
forme de chromatine à l’agencement de l’ensemble des chromosomes au sein du
volume nucléaire. Dans cette partie nous décrirons ces différents niveaux
d’organisations.
I-1-Composition de la chromatine
I-1-a-l’ADN
L’ADN (acide désoxyribonucléique) forme deux chaines orientées de manière
antiparallèle. L’ADN double brin est agencé sous forme d’une hélice non figée. Au
moins trois structures sont supposées exister dans des conditions physiologiques;
les formes A, B et Z (Ghosh and Bansal, 2003) (Figure 23-A).
UQ
A- B- C-
fibre de 30nm
Noyau interphasique
nucléosome
fibre de 10nm
ADN
(Adaptée de Lyer et al. 2011)
Figure 23-A- Exemple de 3 formes possibles de la double hélice d'ADN: A, B, Z de la gauche vers la
droite. B- Représentation de la structure d'un nucléosome entouré par la double hélice d'ADN. C- Fibre
chromatinienne reconstituée et observée en microscopie électronique, en présence de H1 (panel de
droite) on observe un repliement de la fibre différente (forme en boucle), ce n'est pas le cas en absence
de H1 (panel de gauche). Les deux panels du bas représentent des grossissements du panel supé-
rieur. D- 2 modèles de repliement de la fibre de 30nm, en solénoide (gauche) ou en Zig-Zag (droite) E-
L'ADN de 2 nm de diamètre se replie autour d'un octamère d'histone formant une structure de 11nm.
L'ADN génomique serait ensuite agencé dans une structure plus compactée pour permettre l'organisa-
tion du génome en interphase.
La forme B est la plus répandue et a été caractérisée par Watson et Crick en 1953
(Watson and Crick, 1953). Les formes A et B sont principalement organisées avec
des hélices de taille uniforme, alors que la forme Z à une structure plus irrégulière
(Figure 23-A). Deux formes suplémentaires ont été décrite comme potentiellement
existante in vivo, il s’agit de la forme S (Cluzel et al., 1996) et la forme P (Allemand et
al., 1998). Elle correspondrait à une forme hyper étirée de l’ADN (Bustamante et al.,
2003). La transition d’une forme à l’autre est dynamique et dépend des contraintes
appliquées à la fibre chromatinienne ; de ce fait, l’étude de ces états transitoires est
difficile (Sinden, 2005). Les différentes formes d’arrangement de la double hélice
d’ADN peuvent s’avérer déterminantes puisque les facteurs de transcription ont une
affinité différente entre les formes B et Z. Ainsi, la transcription peut être influencée
positivement ou négativement selon la forme d’ADN rencontrée par l’ARN pol (Rich
and Zhang, 2003). Des modifications sur la séquence d’ADN telles que des
méthylations peuvent également changer l’équilibre de transition entre la forme B et
la forme Z et influencer r sur les processus ADN dépendants.
A l’état relâché, la forme B d’ADN, forme une hélice de 2.37nm de diamètre, un tour
total comprend 10,4 paires de bases et mesure 3.4nm (Behe et al., 1981). En tenant
compte de ces valeurs, on peut approximer la taille d’un génome d’une cellule
diploïde humaine ; il représenterait environ deux mètres si on assemblait tout l’ADN
sous forme B bout à bout. Cet ADN est stocké dans une structure d’à peine quelques
dizaines de micromètres qui offre un volume largement suffisant pour contenir cette
quantité d’ADN, la problématique principale est d’ordonner cette information
génétique. Nous allons décrire certaines de ces protéines capables d’organiser
fonctionnellement l’ADN dans le volume nucléaire.
US
hétérodimères. Ainsi, deux hétérodimères H3-H4 associés à deux hétérodimères
H2A-H2B forment un octamère d’histones également appelé nucléosome (Figure 23-
B). La partie N-terminale des histones est dans une configuration permettant son
accessibilité même au sein du complexe nucléosomal fermé (Luger et al., 1997). Ces
queues d’histones sont particulièrement riches en lysines et en arginines, et sont
soumises à des modifications post traductionnelles tel que des phosphorylations, des
acétylations, des méthylations qui modifient les propriétés de la particule
nucléosomale (pour revue voir (Kouzarides, 2007)). La combinaison de ces
modifications a permis de suggérer l’existence d’un « code histone », qui rajoute un
niveau d’information génétique se superposant au code génétique défini par la
séquence primaire (Jenuwein and Allis, 2001). Enfin, une autre variation peut
intervenir dans la constitution de l’octamère d’histones du fait de l’existence de
nombreux variants d’histones (Pour revue voir (Khorasanizadeh, 2004)). Ces
variants d’histones, par leurs tailles et leurs caractéristiques biochimiques confèrent
aux nucléosomes de nouvelles propriétés en se substituant à une des histones
classiques contenues dans l’octamère. De manière brève, il a été rapporté
l’existence d’un variant pour H2B (H2Bv), deux variants pour H3 (H3.3, CENPA) et
quatre variants pour H2A (H2AX, H2AZ, macroH2A et H2ABBD). Ces variants
d’histones sont souvent associés à des localisations nucléaires ou à des processus
particuliers. A titre d’exemple, le variant CENPA est spécifique des régions
centromériques (Sullivan et al., 1994), il a récemment été proposé qu’il pourrait
permettre d’enrouler l’ADN de manière opposée à son sens d’enroulement au sein
d’un hémisome (Furuyama and Henikoff, 2009). H3.3 est souvent synonyme
d’activité transcriptionnelle alors que la présence de macro-H2A est plutôt un signe
de répression(Sarma and Reinberg, 2005). Cette spécialisation pourrait contribuer à
la compartimentation en environnement local activateur ou inhibiteur au sein de
l’espace nucléaire. Il existe également un certain nombre de protéines appelées
« linker histones » ; ces dernières sont des protéines composées d’une structure
tripartite avec un domaine globulaire flanqué de deux domaines basiques en N et C
terminal (Krylov et al., 1993). Ces protéines semblent impliquées dans la compaction
de la chromatine notamment en bloquant la structure nucléosomale au niveau du
point de sortie de l’ADN. Contrairement aux histones, ces protéines sont bien moins
conservées dans le monde eucaryote. On peut citer la protéine H1 connu chez les
mammifères alors que la levure S. cerevisiae contient le linker histone Hho1 qui ne
UT
semble pas partager cette structure tri-partite préalablement décrite (Landsman,
1996).
UU
similarités avec les histones eucaryotes. Les histones archéens présentent la
particularité de s’assembler dans des structures qui s’apparentent davantage à des
tétrasomes (deux dimères H3 et H4) qui couvre individuellement moins de 100 paires
de base. Ces structures présentent une flexibilité plus importante que les octamères
d’histone (Musgrave et al., 1991; Sandman and Reeve, 2005).
MLL
émergeraient des boucles structurées en plectonème (Delius and Worcel, 1974;
Thanbichler and Shapiro, 2006). HU aide à cette organisation dynamique
directement impliquée dans l’accessibilité des séquences d’ADN et à la régulation de
la transcription (Peter et al., 2004).
Sur la base de leurs activités topologiques, il est important de noter que ces
protéines HU ne ressemblent pas à des histones et se rapprocheraient d’avantage
des protéines HMGB trouvées chez les eucaryotes (Oberto et al., 1994). In vitro,
HMGB1 peut d’ailleurs organiser des structures en plectonème (Stros et al., 1994).
De plus, les HMGB semblent pouvoir remplacer HU dans l’établissement de la super
hélicité négative (Paull et al., 1993). Ces données ont conduit à suggérer que les
protéines HMGB permettraient de former des structures en plectonème au sein du
génome eucaryote majoritairement organisé sous forme toroïdale. Ces régions
particulières organisées par les protéines HMGB favoriseraient les processus ADN
dépendant (Travers and Muskhelishvili, 2007). Ainsi, même si les histones sont les
organisateurs centraux de la chromatine, d’autres protéines telles que les protéines
HMGB chez les eucaryotes ou HU chez les procaryotes peuvent organiser l’ADN.
Ces régions dépourvues de nucléosomes correspondraient principalement aux
régions activement transcrites. Elles seraient minoritaires chez les eucaryotes,
contrairement aux procaryotes où seulement 12% des régions sont non codantes
alors que 98% le sont chez les eucaryotes (Ahnert et al., 2008). L’exemple
procaryote nous montre d’une part que le premier niveau de compaction de l’ADN
est son degré d’enroulement et que d’autre part qu’il existe des architectures
génomiques indépendantes des nucléosomes plus rares mais essentielles à
l’organisation du génome eucaryotes et à son expression.
L’ADN est chargé négativement par les phosphates qui produisent des répulsions
électrostatiques des régions adjacentes empêchant des repliements sur elle même
de la fibre d’ADN (Bloomfield, 1996). Les histones sont chargées positivement et
permettent de neutraliser ces charges négatives laissant la possibilité de repliement
à la fibre d’ADN. Il y a plus de 30 ans, Finch et Klug ont été les premiers à proposer
un modèle mettant en jeu de tels repliements entre les nucléosomes. Les octamères
d’histones seraient agencés en une fibre de 30nm grâce à l’intervention du «linker
MLM
histone » H1 ou d’ions Mg2+ (Finch and Klug, 1976) (Figure 23-C). La fibre de 30nm
permettrait une compaction du génome suffisante pour expliquer l’organisation des
chromosomes dans un noyau interphasique (Figure 23-E). L’hypothèse de la fibre de
30nm s’appuie sur l’observation de nucléosomes isolés observés en microscopie
électronique à transmission qui laisse apparaitre une fibre de 30nm de diamètre.
Malgré de nombreuse études menées pour élucider l’agencement des nucléosomes
au sein de cette structure, l’intérieur même de la fibre reste mal connu et soumis à
controverse. Deux modèles principaux sont proposés (pour revue voir
(Khorasanizadeh, 2004)) (Figure 23-D). Selon le premier, la fibre de 30 nm formerait
un solénoïde au sein duquel les nucléosomes sont agencés en hélice (Robinson et
al. 2006). Le second modèle dit « en zig zag » serait une structure en solénoïde
consistant en une hélice à deux point de départs. Les nucléosomes seraient
successivement d’un coté puis de l’autre de la molécule d’ADN provoquant le
croisement de l’ADN entre deux nucléosomes au centre de la fibre de 30nm. Le pas
de cette double hélice est estimé à 32nm et contient 19 nucléosomes (Schalch et al.,
2005). De nombreuses études in vitro ont apporté leur soutien à l’un ou l’autre
modèle, sans pouvoir conclure définitivement (Robinson et al., 2006; Schalch et al.,
2005). Routh et ses collaborateurs ont proposé que les structures en solénoïde ou
en Zig-Zag sont dépendantes de la taille du « linker ADN » (ADN retrouvé entre
chaque nucléosome) (Routh et al., 2008). Etant donné que la structure de la fibre de
10nm est variable du fait des différentes tailles d’ADN entre chaque nucléosome, il a
été suggéré récemment que les modèles en solénoïde et en zig zag puissent être
contenus sur une même fibre (Grigoryev et al., 2009).
Cependant, au delà de ce débat sur la structure interne de cette fibre de 30nm, son
existence même pose encore question. L’observation in vivo de cette structure
s’avère plus difficile. Les approches de cryomicroscopie par les procédés de
vitrification devraient permettre d’observer cette structure dans un état préservé.
Pourtant de Dubochet et ses collaborateur en 1986, à Eltsov en 2008 aucune section
nucléaire observée n’a permis de mettre en évidence la fibre de 30 nm (Dubochet et
al., 1986; Eltsov et al., 2008; Konig et al., 2007) remettant sérieusement en cause
l’hypothèse de son existence in vivo et son observation in vitro. Seule l’équipe de
Patrick Shultz, dans une étude récente observe une fibre de 30 nm en microscopie
électronique. Elle serait minoritaire dans le noyau et se situerait dans des régions
MLN
périphériques d’hétérochromatine (Kizilyaprak et al., 2010). Chez la levure, peu de
données in vivo soutiennent l’existence de cette fibre de 30 nm. Pourtant Bystricky et
ses collaborateurs en utilisant des sondes fluorescentes placées à des distances de
14 à 103 kb les unes des autres sur un même chromosome de levure S. cerevsiae
ont mesuré des distances entre les différentes sondes compatibles avec une
compaction de 30 nm (Bystricky et al., 2004) mais pouvant également soutenir
d’autres degrés de compaction de l’ADN (Maeshima et al.). Ces résultats obtenus
chez la levure sont à relativiser puisque d’une part ils s’appuient sur le postulat que
la fibre est compactée de manière homogène entre deux sondes, d’autre part Job
Dekker en utilisant la technique de « chromosome capture » a obtenu des données
inférant vers une structure nucléosomale moins compactée que celle décrite pour la
fibre de 30 nm (Dekker, 2008).
MLO
dans le noyau; la chromatine s’organiserait alors en domaines ouverts et fermés
selon un modèle de globule fractal sur lequel nous reviendrons plus tard (Fussner et
al., 2010; Lieberman-Aiden et al., 2009).
Au delà des investigations concernant la fibre d’ADN, la chromatine doit être aussi
étudiée à une échelle comprenant la prise en compte de grandes structures
traversant le noyau selon une organisation d’ordre supérieur. De nombreuses études
s’appuyant sur des modélisations biophysiques ont permis de proposer différents
modes d’organisations. Le modèle des boucles radiales propose que la chromatine
est organisée en boucles de 50 à 200 kb sur des régions de 1MB donnant lieu à une
structure en rosette (Munkel et al., 1999) alors que le modèle des boucles géantes
propose l’existence d’une seule boucle sur un même domaine de 1MB (Sachs et al.,
1995). Enfin, le modèle du « chromonema » a été proposé par Andrew Belmont en
1994 après observation de structure d’ADN d’un diamètre de 100-130 nm. Cette
structure serait dûe aux repliements de la fibre de 30 nm en hélice (Belmont and
Bruce, 1994).
I-3-a-Euchromatine et hétérochromatine.
MLP
A- B-
HC
Nucleolus
EC
(Fawcett DW, The Cell: An Atlas of Fine Structure, (Kizilyaprak et al. 2010)
WB Saunders, Philadelphia, 1966, p. 153.)
Figure 24: A-B- Répartition de l'hétérochromatine dans deux types cellulaires. Ultrastructure de
deux types cellulaires observés en microscopie électronique. Le plasmocyte contient de larges régions
d'hétérochromatine (HC) localisées majoritairement en périphérie (A). A contrario, des cellules de rétines
de rongeurs présentent de larges foyers d'eurochromatine (EC) en périphérie (B).
Très tôt, il a été suggéré que cette distinction morphologique traduisait l’état
transcriptionnel des régions concernées. Ainsi les régions d’hétérochromatine
seraient inactives, a contrario, l’euchromatine refléterait des régions chromatiniennes
décompactées et activement transcrites (Heitz, 1928). La différence de compaction
est essentiellement due aux variations de la composition chromatinienne en histones
et en modifications post-traductionnelles de ces dernieres. En résumé,
l’hétérochromatine apparaît plus compactée et présente une activité
transcriptionnelle plus faible que l’euchromatine. Cependant, il est important de noter
que cette organisation a été décrite comme dynamique et peut évoluer selon les
phases du cycle cellulaire ou en réponse à certains signaux cellulaires (Grewal and
Jia, 2007).
I-3-b-territoire chromosomique
MLR
nucléotides fluorescents ont tous deux contribué à confirmer de manière illustrative le
modèle de Bovari (Figure 25-A-B-C) (Pour revue (Cremer and Cremer, 2010)). Dans
le même ordre d’idée, la démonstration qu’un traitement au laser dans une zone
confinée du noyau entrainait des dommages à l’ADN restreint à un ou deux
chromosomes a encore appuyé le modèle de territoire chromosomique (Figure 25-D-
E). Récemment, les travaux de Job Dekker par la technique de 3C suivie de
séquençage massif (Hi-C) ont définitivement validé la présence de territoires
chromosomiques par des approches non microscopiques (Lieberman-Aiden et al.,
2009). De nouvelles questions se posent alors, et en premier lieu, comment se
répartissent ces chromosomes en des territoires restreints ?
MLS
A- B- C-
Dommage Dommage
laser laser
D-
Bien que la notion de territoires chromosomiques chez l’humain ne soit pas remise
en cause, une controverse existe concernant les espaces séparant ces différentes
régions. Trois scénari sont discutés (Branco and Pombo, 2006; Heard and Bickmore,
2007). Le premier modèle consiste à tracer une véritable frontière entre chaque
chromosome. L’accessibilité à la machinerie transcriptionnelle dans le territoire
chromosomique serait impossible, les gènes actifs auraient alors besoin de se situer
à l’extérieur de ce territoire chromosomique, (Zirbel et al., 1993). Un modèle opposé
se présente sous la forme de larges territoires chromosomiques accessibles y
compris à la machinerie de transcription (Dehghani et al., 2005). Enfin, un model
intermédiaire en terme de « porosité » du territoire chromosomique prédit la
possibilité d’une structure comprenant des boucles d’ADN sortant du territoire
chromosomique, permettant de nombreux contacts entre différents loci situés sur
différents chromosomes (Heard and Bickmore, 2007). L’existence de cette
conformation est là aussi soutenue par les données de 3C (Dekker et al., 2002).
Cependant, ces modèles ne sont pas exclusifs, il a été montré que l’ARN pol II n’a
pas accès au chromosome X inactivé chez la souris ce qui infère dans ce cas vers la
possibilité des territoires chromosomiques imperméables à la machinerie
transcriptionnelle (Chaumeil et al., 2006).
MLU
Enfin, les résultats obtenus dans l’étude de l’équipe de Job Decker et le travail
d’Aurélien Bancaud ont permis de proposer l’existence d’une organisation de la
chromatine de levure en domaines fractaux d’environ 100nm (Bancaud et al., 2009;
Lieberman-Aiden et al., 2009) (Figure 26-A-B). Il existerait des sous-domaines
globulaires qui ensemble formeraient les territoires chromosomiques. Cette
conformation faciliterait l’assemblage et le désassemblage de l’ADN ce qui pourrait
être utile pour activer ou réprimer les gènes. Ce modèle serait en accord avec la
double fonction du noyau de stockage et d’expression de l’information génétique
puisque ce modèle facilite un enroulement et un déroulement de l’ADN variable selon
les besoins et présente un degré de compaction suffisant pour contenir l’ensemble
du génome au sein du noyau (van Steensel and Dekker, 2010).
MML
A- A l'échelle: du noyau des chromosomes d'un megabase
B-
Chromosome linéaire
Orange:gène actif
Bleu:Inactif
Figure 26: A- Organisation du génome à trois échelles selon le modèle des globules fractals. B- Forma-
tion des globules à partir d'un chromosome linéaire.
I-3-c-Territoire chromosomique chez S. cerevisiae
Cette conclusion est néanmoins à nuancer pour les raisons suivantes. D’une part,
une caractéristique majeure des territoires chromosomiques se situe dans leur
propension à empêcher les phénomènes de recombinaison entre des chromosomes
éloignés. Cette situation n’est pas observée chez S. cerevisiae puisque la fréquence
des événements de recombinaison semble être identique entre deux régions issues
d’un même chromosome ou de 2 chromosomes différents (Haber and Leung, 1996).
Il existe pourtant des territoires chromatiniens qui limitent les contacts avec le reste
du noyau. En effet, même si les techniques de cytologie habituellement utilisées ne
permettent pas d’observer d’hétérochromatine chez S. cerevisiae (Léger-Silvestre et
al., 1999), le noyau de levure contient certaines régions d’ADN possédant les
caractéristiques moléculaires de l’hétérochromatine. Parmi elles, on retrouve
notamment les régions télomériques et les loci HM. Ces régions sont résistantes aux
endonucléases ce qui reflète leur état de compaction, elles sont localisées à la
périphérie du noyau et sont majoritairement hypoacétylées (Braunstein et al., 1996;
Gotta et al., 1996; Rine and Herskowitz, 1987). Ces domaines hétérochromatiniens,
à l’image des territoires chromosomiques, constituent une barrière favorisant ou
MMN
réprimant la recombinaison respectivement avec des régions d’ADN en leur sein ou
à l’extérieur de ces régions (Marvin et al., 2009). Chez la levure, les territoires
chromosomiques ne semblent pas être le modèle le plus pertinent pour décrire
l’organisation des chromosomes, cependant il est admis qu’ils sont soumis à une
organisation définie. En effet, on sait que les télomères occupent la périphérie du
noyau (Funabiki et al., 1993; Gotta et al., 1996) (Figure 27-A-C), que les centromères
sont près du centre organisateur des microtubules (SPB :spindle pole body) et à
l’opposé du nucléole (Funabiki et al., 1993; Heun et al., 2001b; Jin et al., 2000)
(Figure 27-A-B). Ainsi, faute de territoires chromosomiques à proprement parler,
c’est un modèle de configuration pseudo-Rabl qui est à privilégier pour décrire
l’organisation des chromosomes chez la levure (Bystricky et al., 2005; Rabl, 1885)
(Figure 27-A). Cette orientation est soutenue par la modélisation des chromosomes
de levures de S. cerevisiae de Duan et ses collaborateurs en 2010. Il est néanmoins
important de noter que la conformation en « Rabl » n’est pas antinomique avec
certains aspects des « territoires chromosomiques» puisque même au sein d’une
organisation type « Rabl » on observe d’avantage d’interactions intra-
chromosomiques que inter-chromosomiques (Duan et al., 2010).
MMO
D-
C-
B- Adapté de
Yamaguchi et al. 2011
répétition télomérique
chromatine
condensée
100nm
Nucléole
SPB CEN
ADNr
A-
tel
tel
tel
E-
F-
MMQ
Les mouvements de la chromatine sont un autre aspect à prendre en considération
lorsque l’on parle de dynamique chromatinienne. La stratégie la plus commune pour
observer le mouvement d’un gène dans une cellule vivante est l’insertion de
séquences d’opérateurs bactériens dans le génome (opérateurs tetO, lacO)
reconnus par les répresseurs correspondant fusionnés à des protéines fluorescentes
(Marshall et al., 1997; Robinett et al., 1996; Straight et al., 1996). Marshall et ses
collaborateurs ont été les premiers à essayer de déterminer le coefficient de mobilité
et le niveau de confinement d’un gène donné. Dans cette étude, les mouvements du
gène LEU2 étiqueté par des opérateurs lacO ont été suivis pendant 10 minutes en
microscopie à fluorescence. Ils ont d’abord constaté que le gène suivait un
mouvement aléatoire avec un coefficient de diffusion de 5.10-4 m2 par seconde. La
MSD (Mean Square Displacement), un outil standard pour caractériser les propriétés
diffusives de particules a été utilisée dans cette étude pour évaluer les mouvements
décrits. Dans les cas d’une diffusion normale d’une particule dans un liquide, la MSD
est proportionnelle aux intervalles de temps entre chaque mesure et ce coefficient de
proportionnalité représente le coefficient de diffusion. Du fait que le gène est contenu
dans le noyau, la MSD ne peut croître indéfiniment selon le coefficient de diffusion,
elle va atteindre un plateau qui sera équivalent au carré du rayon du noyau.
Cependant, les études citées précédemment révèlent l’apparition d’un plateau bien
plus précocément que celui attendu pour un confinement par le noyau. Cette
observation permet de proposer que le gène observé est confiné dans un volume
nucléaire restreint. Dans l’étude de Marshall pour le locus LEU2, il a été observé un
rayon de 300nm.
Les études qui ont suivi chez la levure S. cerevisiae ont d’abord confirmé ce
mouvement diffusif dans un rayon de confinement (Heun et al., 2001a). Cependant,
les premières données chiffrées obtenues en 1997 ont été remises en cause puisque
le coefficient de diffusion dans la levure de 5.10-4 m2 par seconde (Marshall et al.,
1997) est bien plus faible que celle rapportée dans des études ultérieures (qui ont
été réalisées dans ce cas dans des cellules haploïdes) (Bystricky et al., 2005; Cabal
et al., 2006; Gartenberg et al., 2004; Hediger et al., 2002; Heun et al., 2001a). De
manière intéressante, le rayon de confinement semble variable et dépendrait de la
position du locus sur le chromosome ou de son activité transcriptionnelle. En effet,
les régions télomériques semblent avoir une zone de confinement plus petite que
MMR
des loci ayant une position plus centrale sur le chromosome (Bystricky et al., 2005;
Cabal et al., 2006; Gartenberg et al., 2004). De la même manière, les ARS
(Autonomously Replicating Sequence) ont tendance à avoir un rayon de confinement
plus restreint au début de la phase S (Heun et al., 2001a). Enfin, certains gènes
activés adressés à la périphérie réduisent parallèlement leurs régions de
confinement (Cabal et al., 2006). La capacité de mouvement d’un locus serait donc
liée à sa position dans le noyau. L’étude de Gartenberg en 2004 illustre parfaitement
cette situation : le locus LYS2, une fois excisé de sa position originale au milieu du
bras droit du chromosome a une capacité de mouvement augmenté (10-2 m2 par
seconde contre 5.10-3 m2 par seconde initialement) et n’est plus confiné que par
l’enveloppe nucléaire. La seule contrainte que subissait ce locus était d’être sur un
chromosome (Gartenberg et al., 2004). D’autres régions comme les foyers sub-
télomériques restent à la même position après excision signifiant que la mobilité de
cette région génomique est contrainte indépendamment de sa position sur le
chromosome.
Cette notion de contrainte est d’ailleurs reprise par Cabal et ses collaborateurs qui
ont observé la dynamique du gène GAL1. Leurs résultats indiquent que le
mouvement de leur locus d’intérêt ne suit pas un mouvement de libre diffusion mais
plutôt de type sous diffusif. L’existence de mouvements sous diffusif chez S.
cerevisiae a été confirmée par l’équipe d’Aurélien Bancaud (Bancaud et al., 2009;
Hajjoul et al., 2009). Le phénomène de sous diffusion peut être la résultante d’un
grand nombre de causes telles que l’encombrement nucléaire, la viscosité du
nucléoplasme, ou les propriétés physiques du polymère considéré. L’ensemble de
ces travaux montre que la mobilité de la chromatine varie d’un locus à l’autre par les
coefficients de diffusion et par les rayons de confinement. Des mouvements
s’apparentant à des « sauts » de loci de près de 500 nm ont été décrits par Heun et
ses collaborateurs (Heun et al., 2001a). Ces mouvements semblent être dépendants
de l’ATP et ne seraient donc pas imputables à la seule agitation thermique. Des
enzymes telles que des ARN pol pourraient donc être impliquées.
De manière intéressante, les observations faites dans ces études chez la levure
semblent suivre des lois retrouvées dans d’autres organismes. Dans des cellules
Hela, les valeurs obtenues convergent vers le coefficient de diffusion observé chez
S. cerevisiae et sont également variables selon les régions du génome (Chubb et al.,
MMS
2002). Un mouvement de type sous diffusif proche de celui observé par Cabal a été
récemment rapporté pour des loci bactériens (Cabal et al., 2006; Weber et al., 2010).
Préambule
MMT
semblent suffisants pour pouvoir expliquer une partie de l’organisation en « Pseudo-
Rabl » des chromosomes de levures.
MMU
membrane interne à la membrane externe maintenant ainsi une polarité fonctionnelle
de l’enveloppe (Lusk et al., 2007). Chez les métazoaires, les protéines de la
membrane nucléaire interne sont souvent attachées à un réseau de filaments
intermédiaires d’environ 10nm de diamètre appelés les lamines nucléaires qui sont
capables d’interagir avec les chromosomes (Akhtar and Gasser, 2007). Aucun
homologue de lamine n’a été identifié chez les plantes et les champignons
unicellulaires comme les levures. Cependant, sur la base d’homologie de séquences
et de leurs localisations, quelques protéines pourraient être des équivalents des
lamines chez les plantes (Blumenthal et al., 2004).
Le pore nucléaire constitue une des structures les plus marquantes du noyau. Ils
apparaissent comme de larges structures très bien conservées, même si leur masse
moléculaire diffèrent entre levures et vertébrés (60 MDa et 125 MDa,
respectivement) (Vasu and Forbes, 2001). Le nombre de pores nucléaires semble
varier d’une cellule à l’autre et serait étroitement corrélé à l’activité de la cellule. Chez
la levure, on observe de 65 à 180 pores nucléaires (Winey et al., 1997). Un pore
nucléaire est composé de trente protéines appelées nucléoporines. Chaque
nucléoporine est présente par multiple de 8 (entre 8 et 56). Le diamètre du pore
nucléaire est proche de 9nm permettant une diffusion passive des petites molécules
inférieure à 40 KDa (Gorlich and Kutay, 1999). Des protéines en dessous de 40 kDa
peuvent être transportées par diffusion passive. Cependant, même pour des petites
protéines comme les histones, ce type de transport est peu efficace. Des
mécanismes de transports actifs complètent ce processus de transfert, permettant
notamment le passage des protéines plus larges comme les précurseurs
ribosomiques et le contrôle des échanges nucléo-cytoplasmiques (Gorlich and Kutay,
1999). Le canal central du pore nucléaire est constitué de filaments cytoplasmiques
formant des prolongements dont la structure s’apparente à un « panier de basket»
tourné vers le nucléoplasme (Figure 27-F). Cette structure sert de point d’ancrage à
la chromatine (Dilworth et al., 2001; Galy et al., 2000; Ishii et al., 2002) et fait du pore
nucléaire une structure organisatrice du noyau. Nous reviendrons plus tard sur son
implication dans la régulation de l’expression des gènes.
MNL
II-1-d- le centre organisateurs des microtubules
MNM
est expliqué par le fait que le locus LEU2 est situé sur le chromosome III à 22kb du
centromère qui est accroché au SPB via un réseau microtubulaire. Cette donnée
renforce l’importance du SPB comme structure organisatrice dans l’architecture du
noyau de levure (Marshall et al., 1997).
MNN
27-D). Le nombre de télomères délocalisés augmente lors de la délétion simultanée
des deux complexes yKU et SIR suggérant que ces complexes ont des fonctions
redondantes, mais qu’il existe aussi d’autres mécanismes permettant l’adressage
des télomères en périphérie. Les mécanismes de localisation des télomères en
périphérie ne sont cependant pas encore élucidés et semblent faire intervenir les
propriétés physiques du polymère d’ADN. Lorsque l’on définit les foyers télomériques
un autre facteur à prendre en compte est celui de la taille des bras chromosomiques.
En effet, les bras courts ne peuvent explorer l’ensemble du noyau et leurs télomères
ont tendance à être localisés en périphérie mais proches du centromère, au contraire
des bras plus longs. Cette observation se vérifie par les fréquences d’interaction bien
plus élevées entre les régions télomériques appartenant aux bras courts qu’avec le
reste du génome (Duan et al., 2010; Therizols et al., 2010). L’organisation des
télomères est donc directement dépendante des caractéristiques du chromosome
auquel ils appartiennent, un bras court devient une limite pour explorer le noyau et
établir des interactions télomériques avec des télomères issus de bras longs. Cette
organisation rappelle celle décrite pour les territoires chromosomiques où les petits
chromosomes ont tendance à être spatialement proches (Lieberman-Aiden et al.,
2009).
II-2-concept d’auto-assemblage
MNO
résultats des expériences de photo-blanchiment et de photo-activation l’illustre bien
(Beaudouin et al., 2006; Lippincott-Schwartz et al., 2001; Phair and Misteli, 2000). Le
concept d’auto-assemblage résout ce paradoxe apparent et confère aux
mouvements macromoléculaires un rôle dans la stabilisation de l’organisation du
génome. Selon cette hypothèse, les constituants nucléaires seraient soumis à un
mouvement perpétuel et c’est leur capacités d’interaction, leur temps de résidence et
leur vitesse de diffusion qui contribueraient à former l’hétérogénéité nucléaire en
plusieurs domaines (Misteli, 2001a). Ainsi, les protéines d’un même type ou
participant aux mêmes processus auraient tendance à se regrouper à proximité de
leurs cibles communes et constitueraient de ce fait une région aux caractéristiques
particulières. Cette organisation est maintenue par l’afflux permanent de protéines au
sein de ces sous domaines. A titre d’exemple, malgré la stabilité apparente des
régions hétérochromatiniennes contenant l’histone H1, il est important de noter que
cette protéine H1 a un temps de résidence sur l’ADN bien plus faible que les
histones (Phair and Misteli, 2000). La stabilité de ces régions est donc apportée par
un perpétuel renouvellement des protéines qui y sont préférentiellement retenues.
L’encombrement macromoléculaire serait un des facteurs qui contribuerait
directement au phénomène d’auto-assemblage. Dans un territoire donné, de fortes
concentrations macromoléculaires permettraient d’exclure ou de ralentir le
mouvement de particules. Cette notion est particulièrement pertinente si on l’applique
à l’espace nucléaire qui est très fourni en macroéléments. En effet, il est estimé
qu’un noyau d’eucaryote supérieur à une concentration macromoléculaire de l’ordre
de 100 mg/ml dans l’euchromatine et près de 400 mg/ml dans l’hétérochromatine
(Bohrmann et al., 1993; Daban, 2000). Cet encombrement peut induire des
phénomènes d’exclusion, réduire la diffusion et même changer les capacités
d’accrochage d’une protéine (Bancaud et al., 2009; Beaudouin et al., 2006). Par
exemple, la capacité d’accrochage des protéines H1 est augmentée dans
l’hétérochromatine (Bancaud et al., 2009). L’encombrement participe au maintien et
à la construction des sous-domaines nucléaires.
II-3-Régulation positionnelle
MNP
Préambule
Comme nous venons de le voir, l’espace nucléaire est organisé en domaines définis
par des concentrations locales en constituants particuliers (Spector, 2001) (Figure
28-A). Cette hétérogénéité conduit à une localisation préférentielle de régulateurs
transcriptionnels dans certains domaines. Malgré l’importante concentration
nucléaire en macromolécules, la fibre chromatinienne et les gènes sont caractérisés
par des mouvements de diffusion. La régulation spatiale de la transcription est
définie par une activité génique qui serait modifiée suite au déplacement d’un gène
dans un domaine où des régulateurs transcriptionnels se concentrent.
MNQ
A- Corps d' Compartiment
Territoires épissage interchromatinien
chromosomiques
Pore nucléaire
Enveloppe nucléaire
Corps PML
Nucléole
Lamine nucléaire
Corps Cajal
Territoires
chromosomiques
( Adaptée de Lanctot at al. 2007)
2 mm
MNS
exprimé (Kumaran et al., 2008). De plus, une étude provenant du laboratoire de
Bickmore a également montré que des gènes accrochés à la membrane interne par
la protéine Lap2β étaient pour certains réprimés et d’autres encore actifs. Ces
résultats tendent à indiquer que, chez les métazoaires, les foyers
hétérochromatiques en périphérie nucléaire constituent un environnement local
défavorable mais pas rédhibitoire pour l’activité de transcription.
Chez la levure S. cerevisiae la situation est comparable puisqu’il a été montré que la
localisation en périphérie nucléaire était un environnement défavorable à la
transcription (Andrulis et al., 1998). Les expériences de FISH sur ARN de Feuerbach
et ses collaborateurs ont directement impliqué les foyers télomériques dans ces
phénomènes de répression puisqu’ils ont constaté qu’un gène rapporteur est réprimé
lorsqu’il est associé avec ces structures périphériques (Feuerbach et al., 2002). Le
regroupement des télomères en périphérie requiert notamment les protéines Esc1 et
KU (Taddei et al., 2004) (Figure 27). Ces protéines permettent le recrutement des
protéines SIR et la déacétylation des histones composants les régions concernées
(Ottaviani et al., 2008). La forte concentration locale en protéines SIR empêche la
transcription au sein de ces régions. D’ailleurs, si on provoque le relâchement de ces
regroupements télomériques par la délétion des protéines Ku et Esc1, on observe un
relarguage de Sir2 dans le nucléoplasme et le phénomène de répression
périphérique est aboli. Chez la levure, la concentration locale en protéine Sir2 est
donc suffisante pour créer une région défavorable à la transcription.
Un rôle régulateur des pores nucléaires dans l’activité transcriptionnelle fut proposé
dès 1985 par Blöbel. Ce concept novateur fut baptisé « gene gating » et faisait du
pore nucléaire un environnement favorable à la transcription (Blobel, 1985). D’après
cette hypothèse, le positionnement des gènes à proximité des pores nucléaires serait
lié à leur état transcriptionnel et favoriserait l’export des ARN issus d’un gène ainsi
positionné (Blobel, 1985). La même année, les travaux de Hutchison et Weintraub
étoffaient cette théorie par la démonstration que les régions chromatiniennes
adjacentes aux pores présentaient une hypersensibilité à la DNase I (Hutchison and
Weintraub, 1985). Plus tard, le laboratoire d’Ulrich Laemmli montra par une approche
MNT
génétique que l’état transcriptionnel d’un gène pouvait être modifié s’il était associé à
des protéines du pore nucléaire ou impliqués dans l’export des ARNm. De ce fait, il
soutint l’hypothèse initiale de Blobel et proposa lui aussi que les régions adjacentes
aux pores nucléaires constitueraient un environnement local activateur (Ishii et al.,
2002). L’association de certains gènes avec les protéines du pore nucléaire fut par la
suite mise en évidence par ChIP (Casolari et al., 2004) puis de nombreuses études
in vivo indiquèrent que certains gènes étaient préférentiellement localisés aux pores
lorsqu’ils étaient activés (Cabal et al., 2006; Casolari et al., 2004; Dieppois et al.,
2006; Taddei et al., 2006). Cette localisation permettrait une efficacité optimale de la
transcription (Cabal et al., 2006; Taddei et al., 2006). Les études menées sur la
localisation de ces gènes au sein de cet environnement s’insèrent donc pleinement
dans la problématique de « régulation positionnelle ». Très récemment, l’équipe de
Brickner a découvert l’existence d’une voie d’adressage aux pores des gènes par
une séquence nommée GRS (« Gene Recruitment Sequence ») qui serait suffisante
pour entrainer la localisation d’un gène en périphérie nucléaire. Ces séquences de 8
paires de base ont été mises en évidence au niveau du promoteur INO1, puis
recherchées au sein du génome. Une centaine de séquences de ce type a été
identifiée (Ahmed et al., 2010). Dans l’étude de Cabal et ses collaborateurs en 2006,
d’autres mécanismes d’adressage ont été décrits. Ils ont observé que le cluster de
gènes GAL explore le volume nucléaire lorsqu’ils sont inactivés ; leur activation va
leur conférer de nouvelles propriétés et augmenter leur capacité de confinement près
des pores nucléaires (Cabal et al., 2006). Les complexes SAGA et TREX2 seraient
nécessaires à cette localisation périphérique (Rodriguez-Navarro et al., 2004). Les
voies d’adressage des gènes aux pores nucléaires sont donc multiples et ardemment
discutées dans de nombreuses publications. Les mouvements des gènes inductibles
ont notamment été étudiés mais les mécanismes afférents ne sont pas encore
clairement élucidés (Cabal et al., 2006; Dieppois et al., 2006; Dilworth et al., 2001;
Schmid et al., 2006). Il reste notamment à clarifier la relation de causalité entre la
localisation aux pores et la transcription (Pour revue Dieppois et al. 2010). Il est
néanmoins clairement établi que la localisation en périphérie n’est pas
systématiquement requise pour la transcription (Cabal et al., 2006; Taddei et al.,
2006) mais qu’il existe un environnement local favorable à la transcription à proximité
des pores nucléaires.
MNU
La périphérie nucléaire est donc un environnement hétérogène partagé entre des
régions activatrices et des environnements hétérochromatiniens périphériques
défavorable à la transcriptions. On trouve en effet les foyers télomériques où il existe
une répression de la transcription (Andrulis et al., 1998; Taddei et al., 2009) et les
complexes de pores nucléaires où se localisent des gènes actifs. Ils formeraient
deux environnements distincts puisque la colocalisation des pores nucléaires avec
les foyers télomériques n’a pas été observée chez S. cerevisiae (Taddei et al., 2004).
Cependant, la délétion de certains composants du pore nucléaire entraine la
délocalisation d’une partie des télomères, suggérant un lien structural ou fonctionnel
entre ces deux entités organisant le génome (Galy et al., 2000).
Même si ces études ont été menées majoritairement chez la levure, ces
phénomènes de régulation par le pore nucléaire pourraient être conservés. Chez la
drosophile, un complexe d’histone acetyl transférase, le MSL intéragit avec des
composants du pore nucléaire et permet d’augmenter la transcription du
chromosome X d’un facteur 2 ; la délétion des deux protéines responsables de cet
accrochage empêche cette augmentation (Mendjan et al. 2006). Chez l’humain, on
observe peu d’hétérochromatine à proximité des pores nucléaires (Schermelleh et
al., 2008) cependant les expériences de ChIP-on-ChIP n’ont pas permis de montrer
une corrélation entre l’activité des gènes et un adressage au pore nucléaire (Brown
et al., 2008a). Dans l’optique de montrer la conservation du lien entre les pores
nucléaires et les gènes actifs il est important de considérer deux études récentes
menées chez la drosophile qui mettent en évidence l’existence de nucléoporines
solubles dans le volume nucléaire (Capelson et al., 2010; Kalverda et al., 2010). Cet
aspect rend les approches en ChIP insuffisantes pour établir un lien entre les pores
nucléaires et la position d’un gène.
Par analogie avec les foyers de réplication (Nakamura et al., 1986), il a été proposé
que le phénomène de transcription pourrait être aussi organisé en foyers (Jackson et
al., 1993). L’incorporation de nucléotides marqués tel que le BrUTP (5-bromouridine
5’-triphophate) dans des cellules de mammifères à permis d’identifier des régions où
MOL
se concentraient des ARN néosynthtétisés révélateurs d’une intense activité de
transcription en des positions très localisées (Figure 28-B). Ces concentrations
locales d’ARN ont été baptisées « transcription factories » par l’équipe de P. Cook
(Iborra et al., 1996). Plus récemment, ces usines à transcription ont également été
révélées par l’utilisation d’anticorps contre la sérine 2 du domaine C-terminal de la
queue CTD, connue pour être un marqueur de l’ARN pol II active en élongation
(Phatnani and Greenleaf, 2006). Le regroupement d’ARN pol II activé au sein du
volume nucléaire semble donc acté. De plus, l’analyse détaillée de ces foyer
transcriptionnels a révélé qu’ils ne contenaient pas seulement l’ARN pol active en
transcription mais des facteurs de transcription et de maturation (de Jong et al.,
1996; Janicki et al., 2004; Pombo et al., 1999). Peter Cook évalua le nombre d’ARN
polymérases par foyer entre 6 et 8 dans des régions de 50 à 100nm de diamètre
(Cook, 1999; Iborra et al., 1996; Jackson et al., 1998; Pombo et al., 1999). D’autres
études ont également rapporté l’existence de regroupement de gènes transcrits
autour des corps d’épissage (« splicing speckles ») qui ont un diamètre plus
important que ceux décrits pour les usines à transcription(Brown et al., 2008b). De
manière intéressante, une étude en 2008 a décrit un constituant majeur de ces
« splicing speckles », SC35, comme un facteur stimulant l’élongation (Fededa and
Kornblihtt, 2008). Cette donnée donne une pertinence fonctionnelle à ces
phénomènes de co-localisation. Les « transcription factories » permettraient de
constituer un environnement local favorable à l’initiation et/ou à l’élongation par
l’accumulation de facteurs de transcription en son sein (Chubb et al. 2003, Yao et al.
2007).
Pour favoriser ces processus de regroupement, il a été suggéré que les gènes
contenant les mêmes séquences promotrices auraient tendances à s’assembler en
usines à transcription. Cette hypothèse a été validée par une approche consistant à
exprimer des plasmides portant des séquences promotrices identiques (Xu and
Cook, 2008), mais l’interaction entre des promoteurs identiques endogènes n’a pas
été confirmée (Osborne et al., 2004; Simonis et al., 2004). D’autre part, un autre
point prête à débat quant à la formation de ces environnements locaux et concerne
la dynamique des gènes faisant parties de ces foyers. Osborne et ses collaborateurs
proposent que les gènes actifs ont tendance à se rapprocher plus les un des autre
que lorsque ces mêmes gènes sont inactivés (Osborne et al., 2004). De la même
MOM
manière, les techniques de séquençage massif combinée à la technique de 3C chez
S. cerevisiae et chez S. pombe ont permis de confirmer le regroupement d’ARNt ou
de gènes impliqués dans des processus biologiques proches (Duan et al., 2010;
Tanizawa et al., 2010). Néanmoins, d’autres études utilisant le 4C et le FISH ont
montré que l’inhibition de la transcription par l’ I-amanitine ne changeait pas
forcément le profil d’interaction entre les gènes (Palstra et al., 2008). Il est donc
difficile de tirer des conclusions définitives sur la formation de ces usines à
transcription. Il semble néanmoins que les gènes actifs peuvent interagir entre eux
de manière dynamique mais que ce regroupement n’est pas essentiel à leurs
activités.
MON
Le nucléole est un élément architectural majeur au sein du volume nucléaire. Nous
allons voir dans la partie suivante qu’il peut être considéré comme la parfaite
illustration du concept des « transcription factories ». Dans une partie précédente de
cette thèse, nous avons évoqué la structure, la dynamique et l’importance du
nucléole dans la transcription des gènes d’ADNr ( chapitre I, II-2), nous allons ici
aborder les conséquences de la présence d’une telle structure sur l’organisation
globale du génome.
Chez la levure, le nucléole s’organise autour des gènes d’ADNr qui ne représentent
pas plus de 10% du génome ; il constitue pourtant une région occupant à elle seul
près d’un tiers du volume nucléaire. De nombreux facteurs de nature protéique et
ribonucléoproteique (RNP) impliqués dans la biogenèse des ribosomes sont
concentrés au nucléole. Le nucléole occupe un espace bien défini au sein du noyau
chez S. cerevisiae puisqu’il est retrouvé systématiquement dans des cellules
interphasiques accolé à l’enveloppe nucléaire et faisant face au SPB. Ce
positionnement participe directement à l’organisation nucléaire des chromosomes
pour plusieurs raisons : d’une part la taille du nucléole influence directement sur le
positionnement de certaines régions chromosomiques telles que les télomères
(Therizols et al., 2010), d’autre part il semblerait que d’autres gènes que les gènes
d’ADNr sont régulés par leur proximité au nucléole. Il s’agit notamment des gènes
codant pour les ARNt tel que le gène SUP53 codant pour un ARNt qui se localise,
quand il est activé, au nucléole (Thompson et al., 2003).
MOO
l’ARN pol I (Sirri et al., 2008). Il semblerait que la formation du nucléole soit un
phénomène d’auto assemblage (Misteli, 2001b). Le travail de Dundr et ses
collaborateurs favorise cette hypothèse. Dans leur étude, les mouvements des
protéines concentrés au sein du nucléole ont été observés en FRAP. Par cette
approche, il fut démontré que les composants de la machinerie de transcription par
l’ARN pol I sont échangés rapidement entre le nucléole et le nucléoplasme.
L’accrochage simultané des constituants de la machinerie de transcription sur la
matrice d’ADN et l’abondante accumulation d’ARNr formeraient le nucléole (Dundr et
al., 2002). Le lien entre transcription et structure nucléolaire ne prête donc plus à
débat. Cependant, l’organisation interne de ces séquences d’ADNr au sein du
nucléole est elle soumise à controverse. Chez les mammifères, il faut imaginer
l’agencement en 3D dans le volume nucléolaire d’une centaine de gènes transcrits
de plus de 6000 nm de long, contenant en moyenne 180 polymérases par gène,
faisant chacune 15 nm de diamètre et produisant des ARN qui mesurent au
maximum 350nm de long décorés par une structure circulaire terminale de 20 nm
(Puvion-Dutilleul et al., 1997; Trendelenburg et al., 1996). La polémique se situe
principalement sur la localisation exacte de l’ARN pol I active en transcription. Les
approches de détection en microscopie électronique de l’ARN pol I donnent des
résultats divergents selon les équipes (pour revue (Raska, 2004)). Cependant
certains modèles d’organisation ont été proposés et constituent une base de travail
pour imaginer et conceptualiser l’organisation des centaines de gènes d’ADNr et de
l’ARNr au sein du nucléole. Cheutin et ses collaborateurs proposent que les centres
fibrillaires soient composés d’un ou deux gènes d’ADNr repliés sur eux mêmes
(Figure 29-A). Le DFC adjacent stockerait l’ARN néo-synthétisé (Cheutin et al.,
2002). Une autre étude combine les données tomographiques de Cheutin à des
expériences de ChIP et de 3C pour proposer un autre modèle relativement proche
où un gène d’ADNr transcrit formerait un cylindre dessiné par les ARN pol I alors que
les séquences promotrices et terminatrices seraient au centre de ce cylindre
(Denissov et al., 2011) (Figure 29-B). Au contraire, pour Ivan Raska les centres
fibrillaires seraient le lieu de stockage des gènes inactifs (Raska, 2004). Le débat
reste donc entier concernant l’organisation des gènes d’ADNr. Cependant l’existence
du regroupement spatial des gènes d’ADNr dans un environnement local favorable à
leur transcription est acté et correspond au critère définissant une usine à
transcription.
MOP
A-
Milieu
riche
Milieu
pauvre
MOR
d’ARN de transfert, et de manière générale beaucoup de régions répétées et
inactives. Les expériences de 3C de O’Sullivan en 2009 chez S. cerevisiae ont
également révélé une interaction des séquences répétées avec l’ADNr ; il propose
d’ailleurs que ces régions répétées ( Ty et Y’) organisent le génome en se servant de
leurs ancrages au nucléole (O'Sullivan et al., 2009). Duan et al, par analogie avec les
résultats obtenus chez les mammifères, proposent que seulement une faible partie
du génome est associé à l’ADNr chez S. cerevisiae (Duan et al., 2010). Chez la
levure, une attention toute particulière a été portée aux gènes codant pour les ARN
de transfert qui se placeraient à proximité du nucléole (Thompson et al., 2003; Wang
et al., 2005) (Figure 30-A). D’après David Engelke, les 275 gènes codant pour les
ARNt se regrouperaient et se localiseraient près du nucléole. De plus, il a été
suggéré que cette colocalisation serait étroitement liée à leur état transcriptionnel
puisque que le gène SUP53 n’est proche du nucléole que lorsqu’il est transcrit. De
plus, ce rapprochement serait lié à l’activité de transcription de l’ARN pol I puisque
cette co-localisation est abolie dans le cas d’une délétion du gène RPA49. Enfin, il
est également suggéré que sur une région donnée, la localisation et la transcription
du gène codant pour les ARNt par l’ARN pol III inhiberait l’activité du gène transcrit
par l’ARN pol II adjacent. Il est cependant nécessaire d’apporter plusieurs éléments
d’informations à ces conclusions. Premièrement une étude de la localisation du gène
SUP53, ou plus précisément du gène adjacent LEU2 a été faite in vivo, et le locus
n’est pas détecté au nucléole (Bystricky et al., 2005). De plus, le travail de Duan et
ses collaborateurs en 2010 a confirmé le regroupement de certains gènes codant
pour les ARNt mais a aussi montré qu’une partie n’était pas localisée au nucléole,
mais proche des régions centromeriques (Duan et al., 2010). Enfin, une analyse
globale de la transcription n’a pas permis de révéler de lien entre l’activité de l’ARN
pol III et l’activité des gènes adjacents au locus des gènes codant pour les ARN de
transfert (Conesa et al., 2005). Les conclusions du groupe de David Engelke sont
donc à nuancer, d’autant que s’il est avéré qu’une majorité des 275 gènes d’ARNt
est localisée au nucléole, ce positionnement aurait de grandes conséquences sur
l’organisation du génome soumis dans le cas de la levure à l’organisation en Rabl.
Des expériences supplémentaires, notamment en utilisant des conditions in vivo sont
nécessaires pour valider la véracité de cette hypothèse.
MOS
SUP53 (rouge) nucleole (vert) superposition
Active SUP53
Inactive SUP53
Figure 30: A- L'inactivation de l'expression du gène se fait par mutation du promoteur de SUP53.
La localisation du gène est détectée sur des cellules fixées de S. cerevisiae par FISH de sondes recon-
naissant la position du gène adjacent. Le nucléole est détecté par une sonde contre le snoARN U14.
(Thompson et al. 2003). B- Représentation de la localisation des centromères et des différents domai-
nes en contact avec les lamines (LAD), et le nucléole (NAD) sur l'ensemble des chromosomes humains.
P artie expérimentale
Au cours de cette introduction, nous avons évoqué l’existence de deux sous unités
spécifiques de l’ARN pol I. Ces deux polypeptides ont été caractérisés il y a plus de
trente ans par Huet et ses collaborateurs, mais leur rôle n’a pas été clairement
élucidé (Huet et al., 1975). Ces dernières années, plusieurs publications ont apporté
de nouveaux éléments sur le rôle et le positionnement de ces deux polypeptides sur
l’ARN pol I (Beckouet et al., 2008; Kuhn et al., 2007). Ces deux dernières
publications ont servies de base de travail durant ma thèse.
Les autres expériences de cette publication ont été menées par Fréderic Beckouet et
ses collaborateurs et ont permis de renforcer l’idée que Rpa34 et Rpa49 fonctionnent
en hétérodimère. Rpa34 permettrait la stabilisation de la sous unité Rpa49 et
l’optimisation de ses fonctions. Cette publication a également apporté de nouveaux
éléments quant à la fonction de ces deux sous-unités spécifiques. L’absence de
Rpa49 cause un défaut d’initiation et d’élongation. Le défaut d’élongation est mis en
évidence par une sensibilité accrue au mycophénolate et serait du à l’absence de
relargage du facteur Rrn3 de l’ARN pol I en élongation. De plus, dans une souche
CARA où Rrn3 a été fusionné à Rpa43, Rpa49 devient essentielle ce qui renforce
MOU
l’idée d’un rôle de Rpa49 en lien avec le positionnement et le relargage du facteur
Rrn3. Ce travail est présenté en annexe.
Un rôle de Rpa49 dans l’élongation en lien avec le relargage de Rrn3 a donc été
suggéré. Cependant, la publication de l’équipe de Partrick Cramer quelques mois
auparavant suggère que l’hétérodimère Rpa49/Rpa34 et Rrn3 auraient des positions
opposées sur l’ARN pol I. Cette nouvelle information structurale n’est pas en faveur
d’une interaction directe entre Rpa49 et Rrn3 qui permettrait le relargage de Rrn3 de
l’ARN pol I. Les données publiées en 2010 par Sebastian Geiger ont apporté de
nouveaux éléments sur Rpa49 (Geiger et al., 2010). Dans cette étude, ils ont établi
que le domaine de dimérisation de Rpa49 et Rpa34 était structurellement proche du
facteur de transcription TFIIF alors que la partie C-terminal de Rpa49 se
rapprocherait de TFIIE. Ces résultats montrent que le fonctionnement de l’ARN pol I
et ARN pol II partage plus de mécanismes communs que ceux supposés en se
basant sur les séquences primaires des protéines appartenant aux différents
systèmes de transcription. Le domaine tWH identifié sur la queue C terminal de
Rpa49 permettrait notamment un accrochage à l’ADN et l’absence de ce domaine
contribuerait au défaut d’élongation (Beckouet et al., 2008). Cependant, ces
nouvelles données n’expliquent pas comment la protéine Rpa49 peut agir sur le
relargage de Rrn3 tout en étant positionnée à son opposé sur l’ARN pol I.
L’étude que nous présentons ici, se situe dans le prolongement de ces publications
de l’équipe de Patrick Cramer et de Pierre Thuriaux. Dans cette publication Isabelle
Léger Silvestre à contribué à la partie expérimentale de manière importante. Elle a
permis d’obtenir des images de microscopies électroniques de qualité et en quantité
suffisante pour pouvoir caractériser et quantifier les structures observées. Martin
Ostermaier a aussi participé à l’observation et à la quantification d’une partie des
étalements de Miller présentés dans cette publication. Christophe Normand a réalisé
le crible génétique contre Rpa34 accessible dans les figures supplémentaires.
Patrick Shultz a participé à l’élaboration du modèle proposé en simulant la position
de deux ARN pol I en cours de transcription. Jorge Perez Fernandez a contribué à ce
travail par la mise en place du PFGE (« pulse field Gel Electrophoresis ») au sein du
MPL
laboratoire et l’élaboration d’un protocole de ChIP permettant d’augmenter les
rendements de purification de la chromatine nucléolaire. Enfin, Kostya Panov et
Joost Zomerdijk m’ont permis d’utiliser les équivalents humains de Rpa34 et Rpa49
de S. cerevisiae et ainsi d’étendre à l’Homme nos résultats acquis chez S.
cerevisiae.
Dans cette étude nous avons montré la conservation fonctionnelle de ces deux sous-
unités Rpa34 et Rpa49 dans trois organismes eucaryotes évolutivement distants.
Nos données nous ont permis de montrer l’existence de contacts entre les ARN pol I
en cours de transcription qui seraient abolis en absence de ces deux sous-unités
spécifiques. Ces contacts seraient déterminants pour assurer le bon fonctionnement
de l’ARN pol I au cours de l’élongation et pour l’intégrité du nucléole. De plus, le
modèle proposé permet de réconcilier les données concernant la structure de l’ARN
pol I (Kuhn et al., 2007) et les liens fonctionnels décrits entre Rpa49 et Rpa43 par
Beckouet en 2008(Beckouet et al., 2008).
MPM
Published January 24, 2011 JCB: Article
Introduction
In all living organisms, multisubunit DNA-dependent RNA subunits, including a 10-subunit extended core and a peripheral
polymerases are built around a common set of five core sub- heterodimer of subunits Rpb4/Rpb7. Rpb4 and Rpb7 have
units (A2BB’V in eubacteria; Minakhin et al., 2001) In archeal counterparts in Pol I and Pol III, Rpa43/Rpa14 and Rpc17/
and eukaryotic enzymes, five additional subunits (related through Rpc25, respectively. Pol I and Pol III have counterparts to each
common ancestry) are required, leading to a 10-subunit extended of the 12 Pol II subunits and, in addition, two and five specific
core (Cramer et al., 2008; Kwapisz et al., 2008). In eukaryotes, subunits, respectively, which may be responsible for some of
three nuclear RNA polymerases are found, each transcribing the specific functions of these two enzymes. In this study, we
a dedicated set of genes. RNA polymerase II (Pol II) transcribes focus on Pol I–specific subunits Rpa34 and Rpa49, which have
all protein-coding genes and most of the small nuclear RNA structural homology with the Rap74/Rap30 subunits of the Pol II
genes. RNA polymerase III (Pol III) is transcribing 5S ribo- transcription factor TFIIF (Kuhn et al., 2007).
somal RNA (rRNA) genes, tRNA genes, and some noncoding Pol I is the most active and abundant RNA polymerase in
RNA genes. RNA polymerase I (Pol I) produces a single tran- eukaryotes. Its enormous transcriptional output can best be visual-
script, the large polycistronic precursor (35S pre-rRNA in yeast) ized using the DNA spread method previously developed by
processed in multiple successive steps into the mature rRNAs Miller et al. (1969), where the 35S rRNA genes (rDNA) adopt a
(in yeast, 25S, 18S, and 5.8S rRNAs). Pol II is composed of 12 “Christmas tree” conformation. In Saccharomyces cerevisiae,
Correspondence to Olivier Gadal: gadal@[Link] © 2011 Albert et al. This article is distributed under the terms of an Attribution–
Noncommercial–Share Alike–No Mirror Sites license for the first six months after the pub-
Abbreviations used in this paper: FOA, fluoroorotate; GIM, genetic interaction lication date (see [Link] After six months it is available under a
mapping; PFGE, pulse-field gel electrophoresis; rRNA, ribosomal RNA; WT, Creative Commons License (Attribution–Noncommercial–Share Alike 3.0 Unported license,
wild type. as described at [Link]
Figure 1. PAF53/CAST heterodimer is functionally conserved from human to budding yeast. (A) Pol I–specific subunits in S. cerevisiae, S. pombe, Mus
musculus, and Homo sapiens. (B) Nucleolar localization of CAST depends on PAF53. CAST fused with YFP (YFP-CAST) is expressed in a WT yeast produc-
ing Nop1 fused to mCherry (mCherry-Nop1) with (PAF53) or without () PAF53 coexpression (see Materials and methods). (right) The overlay of both
fluorescent signals (merge) is shown. (C) Immunoprecipitation of budding yeast Pol I demonstrates that association of CAST to Pol I requires human PAF53.
HA-tagged CAST (HA-CAST) is detected in the supernatant (SUP) with or without coexpression of PAF53. Using IgG Sepharose to immunopurify TAP-tagged
budding yeast Pol I (IP), CAST copurifies with Pol I only when coexpressed with PAF53 (+). Western blot using Pap and 12CA5 revealed tagged bud-
ding yeast Pol I (Rpa190-TAP) and CAST (HA-CAST) in supernatant (SUP) and immunoprecipitated fraction (IP), respectively. (D) Nucleolar localization of
PAF53 depends on CAST. PAF53 fused with YFP (YFP-PAF53) is expressed in a WT budding yeast producing Nop1 fused to mCherry (mCherry-Nop1) with
(CAST) or without CAST (). CAST expression is required for both a detectable YFP signal and a nucleolar localization of PAF53. (E) PAF53 expressed
in budding yeast is stabilized by CAST coexpression. PAF53 is detected in a whole cell extract from WT budding yeast expressing PAF53 (PAF53) alone
or coexpressed with CAST (PAF53 CAST) using PAF53 antibody (A-PAF53). Nop1 (A-Nop1) is used as loading control. Total extract from HeLa loaded in
lane 1 is used as control for PAF53 detection. White lines indicate that intervening lanes have been spliced out. (F) Overexpressed PAF53 complements
rpa49% cold-sensitive growth defect. 10-fold serial dilutions of RPA49-deleted strain expressing budding yeast RPA49 (Rpa49), empty vector (), PAF53
expressed from a strong promoter (PPGK-PAF53), or an even stronger budding yeast promoter PTEF1 (PTEF1-PAF53) were spotted on 5-FOA–containing plates
to check for complementation of the mutant cold sensitivity at 25°C (see Materials and methods for plasmid-shuffling assay). Plates without FOA () are
used as control to confirm that the same number of cells were spotted. The strength of the complementation is evaluated by comparing plates with (FOA) or
without FOA (). (G) Expression of the PAF53/CAST heterodimer complements the RPA34 deletion phenotype. 10-fold serial dilutions of rpa34 deletion
strains containing budding yeast RPA34 (Rpa34), empty vector (), PAF53 driven from a moderate promoter (PAF53), CAST expressed from the budding
yeast promoter PTEF1 (CAST) or coexpressing PAF53 and CAST (PAF53 CAST) were spotted on 1 g/liter caffeine-containing plates to check for suppression
of the rpa34% mutant hypersensitivity. Strength of the suppression of drug sensitivity was evaluated by comparing plates with (+) or without () caffeine
spotted with equivalent amount of cells.
Figure 2. Rpa49/Rpa34 heterodimer is conserved in fission yeast. (A) In S. cerevisiae, nucleolar localization of Sp-Rpa34 depends on Sp-Rpa49.
Sp-Rpa34 fused with YFP (YFP-Sp-Rpa34) is expressed in a WT budding yeast with (Sp-Rpa49) or without () Sp-Rpa49 coexpression. In all cases, cells
produce Nop1 fused to mCherry (mCherry-Nop1) and Nup49 fused with CFP (CFP-Nup49) to label the nucleolus and the nuclear pore complexes, respec-
tively. (right) Overlay of the three fluorescent signals (merge) is shown. (B) Sp-Rpa34/Sp-Rpa49 heterodimer complements budding yeast Rpa34 essential
function in a Pol I mutant background (rpa135-D395N). 10-fold serial dilutions of rpa34% rpa135-D395N double-deletion strains containing S. cerevisiae
RPA34 (Rpa34), empty vector (), Sp-Rpa34 (Sp-Rpa34), Sp-Rpa49 (Sp-Rpa49), or coexpressing Sp-Rpa34 and Sp-Rpa49 (Sp-Rpa34/Sp-Rpa49) were
spotted on plates with (FOA) or without FOA (), and complementation was evaluated by comparing plates with (FOA) or without FOA (). (C) Sp-Rpa34
deletion barely affects growth in S. pombe. 10-fold serial dilutions of S. pombe WT and Sp-rpa34 deletion strains in rich medium at 30°C after 48 (left) and
120 h (right). (D) Sp-rpa34 Sp-rpa49 double deletion is viable in S. pombe. To generate the double-mutant strain, we crossed two haploid strains bearing
when coexpressed with CAST. Interestingly, CAST depletion WT fission yeast. Both drugs deplete the pool of NTP in vivo
in mouse and human cells leads to concomitant disappear- and have a strong effect on strains with defects in RNA poly-
ance of PAF53, whereas the level of other Pol I subunits is un- merase elongation. Sensitivity to both drugs is suppressed by
affected (unpublished data). Therefore, our results suggest overexpression of Sp-Rpa49 (Fig. 2 E). Therefore, our results
that coexpression of CAST and hPAF53 is required for strongly suggest that in S. pombe, both Pol I–specific subunits
hPAF53 stabilization. are conserved and functionally exchangeable with the budding
We next tested the ability of the human subunits to com- yeast Rpa49/Rpa34 heterodimer.
plement the rpa49% and/or rpa34% phenotypes by plasmid-
shuffling assays (see Materials and methods). hPAF53 on its The C-terminal domains of budding
own is unstable; therefore, we expressed hPAF53 under the yeast Rpa34 contain a nucleolar
control of the strong PGK1 or the very strong TEF1 promoter. localization signal
rpa49% cold sensitivity was corrected by hPAF53 only when We showed that Rpa49 overexpression could suppress all known
the pTEF1 promoter was used (Fig. 1 F). rpa34% has little growth phenotypes of rpa34%, suggesting that Rpa34 function is re-
defect, but it is hypersensitive to caffeine (1,3,7-trimethylxanthine; stricted to stabilization of Rpa49 (Beckouet et al., 2008), but in
Beckouet et al., 2008). We assayed the ability of CAST, hPAF53, higher eukaryotes, the orthologue of Rpa34 has several specific
or both to suppress caffeine sensitivity. CAST and hPAF53 functions of its own (Yamazaki et al., 1999; Yamamoto et al.,
complemented the rpa34% mutant phenotype only when co- 2004; Panov et al., 2006). Our sequence analysis reveals that
expressed (Fig. 1 G). Therefore, our results suggest that the these polypeptides share a lysine-rich C-terminal domain. This
the single Sp-rpa34 or Sp-rpa49 deletion. After meiosis, we analyzed the growth of single- and double-mutant offspring. Viability of the double mutant was
confirmed in 20 tetrads. A representative tetratype tetrade is shown, with WT, single Sp-rpa34, or Sp-rpa49 deletion and double Sp-rpa34% Sp-rpa49%
($$) genotype. (E) The sensitivity of the Sp-rpa34 deletion strain to mycophenolic acid and 6-azauracil is suppressed by Sp-Rpa49 overexpression.
10-fold serial dilutions of Sp-rpa34% S. pombe expressing Sp-RPA34 (Sp-Rpa34), an empty vector (Sp-rpa34$), or overexpressing Sp-RPA49 (Sp-rpa34$ +
Sp-Rpa49) were spotted on rich media (left; ), 75 μg/ml 6-azauracil (middle; +6-AZA), or 40 μg/ml mycophenolic acid (right; +MPA) and grown for
4 d at 25°C.
Figure 3. The C-terminal domain of Rpa34 is a nucleolar localization signal. (A) Rpa34 C-terminal domain is fully dispensable in vivo. 10-fold serial dilu-
tions of four double-mutant budding yeast strains, rpa34% top1% (top left), rpa34% stb5% (top right), rpa34% rpa14% (bottom left), or rpa34% gcr2% (bot-
tom right), are shown. Double mutants containing RPA34 (Rpa34), empty vector (), Rpa34-$C driven from a Ppgk1 promoter (Rpa34-$C), or overexpressing
Rpa49 (2μ-RPA49) were spotted on 5-FOA–containing plates to check for complementation of the lethality of the double mutant. Plates were incubated for
3 d at 30°C. Strength of the complementation was evaluated by comparing plates with (FOA) or without FOA (). (B) Nucleolar localization of Rpa34
is independent of Rpa49. Rpa34 fused with YFP (YFP-Rpa34) is expressed in a WT budding yeast or in a mutant lacking Rpa49 (rpa49%). Both strains
produce Nop1 fused to mCherry (mCherry-Nop1). (right) Overlay of both fluorescent signals (merge) is shown. (C) Nucleolar localization of Rpa34-$C is
dependent on Rpa49. Rpa34$C fused with YFP (YFP-Rpa34$C) is expressed in WT or in a mutant lacking Rpa49 (rpa49%). Both strains produce Nop1
fused to mCherry (mCherry-Nop1). (right) Overlay of both fluorescent signals (merge) is shown.
Rpa34 and Rpa49 influence increased (French et al., 2003). We first demonstrated that
nucleolar morphology double-mutant rpa49% fob1% strains are viable at 30°C, having
We have shown that the Pol I–specific Rpa49/Rpa34 hetero- either 190 or 25 rDNA copies (Fig. 5 B). To confirm this sur-
dimer is functionally conserved from yeast to humans. We prising result, we establish that rDNA copy number in both
hypothesized that Pol I–specific subunits might be responsible for strains is unaffected by rpa49 deletion (Fig. 5 A). Growth of the
the two most prominent features of Pol I transcription: nucleo- rpa49% strain is severely impaired at 25°C (Liljelund et al.,
lar assembly and high RNA polymerase loading rate per gene. 1992). Comparing growth of the rpa49% fob1% strains con-
We first focused on nucleolar alterations caused by the absence taining 25 versus 190 rDNA copies, we noted that the cold sen-
of Pol I–specific subunits. We labeled the nuclear periphery sitivity is alleviated upon reduction in the number of rDNA
using GFP-Nup49, a nuclear pore protein, and the nucleolus repeats (Fig. 5 B).
using mCherry-Nop1, an abundant nucleolar protein, in WT, Quantitative fluorescence analysis revealed that in pres-
rpa34%, and rpa49% cells (Fig. 4 A). Nucleolar alterations in ence of Rpa49, the reduction from 190 to 25 rDNA copies
rpa34% and rpa49% cells were determined by thresholding the resulted in a nucleolus of normal size (Fig. 5 C). Electron micros-
fluorescent nucleolar signal detected using confocal microscopy copy observations showed that the nucleolus in the 25 rDNA
in a large number of cells (Berger et al., 2008). Because the copies background is characterized by an identifiable crescent-
cumulative distribution function accurately describes volume shaped area of fibrillo-granular material adjacent to the nuclear
distribution in large samples, we used this representation to envelope (Fig. 5 D). Interestingly, in the Rpa49 deletion strain
evaluate the nucleolar size for each mutant (Fig. 4 B). The nu- with 25 rDNA copies, but not with 190 copies, a crescent-shaped
cleolar size increases considerably in rpa49% cells, suggesting
Figure 4. Rpa34 and Rpa49 are required for nucleolar integrity. (A) Nucleolar structure of rpa49% and rpa34% cells assessed by fluorescent microscopy.
Representative confocal sections of strains TMS1-1a (WT), BEN18-1a (rpa34%), and BEN19-1a (rpa49%) expressing TetR-GFP staining the nucleus, GFP-
Nup49 staining the NPC (NPC/nucleus), and mCherry-Nop1 staining the nucleolus (mCherry-Nop1) are shown. (right) Overlay of both fluorescent signals
(merge) is shown. (B) Cumulative distribution function of the nucleolar volume in Pol I mutants. The nucleolar volume was estimated by thresholding using
the intensity of the mCherry fluorescent signal in WT, rpa49%, and rpa34% mutant cells (nWT = 907; nrpa49 = 620; nrpa34 = 928). (C) Ultrastructural study of
cryofixed, cryosubstituted WT, rpa34%, and rpa49% budding yeast cells. Representative sections of the nuclei are depicted, with manual segmentation of
nucleolus bounded by red lines. The cytoplasmic ribosomal contents in the three budding yeast strains are depicted in a selected frame. (D) Quantification
of ultrastructural morphological alterations in Pol I mutants. Nucleolar area normalized by nuclear surface is estimated by manual segmentation of electron
microscopy sections (n = 20). (E) Quantification of the ribosomal cytoplasmic content in Pol I mutants. Ribosomal content of representative sections (n = 20)
was manually counted and expressed as ribosomes per micrometer cubed. (F) Polysomal profiles (OD260 nm) after sucrose density gradient centrifugation
derived from the rpa49% mutant and WT strain. The positions of 40S ribosomal subunits, 60S ribosomal subunits, polysomes, and half-mer polysomes (H)
are indicated.
Figure 5. rpa49% phenotype in strains with 190 or 25 copies of rDNA. (A) rDNA copy number is unaffected by rpa49 deletion in a fob1 deletion back-
ground. PFGE of chromosomes from rpa49% fob1% strains resulting from invalidation of the rpa49% gene in fob1% strains containing either 25 or 190
copies of rDNA or from original fob1% strains. Separated chromosomes were stained with ethidium bromide (right). Hybridization of rDNA probes was
performed to estimate chromosome XII size (left). (B) Growth phenotype of the fob1%rpa49% double-mutant strains bearing 190 or 25 copies of rDNA.
10-fold serial dilutions of strains BEN20-1a (25 rDNA copies rpa49$ fob1%) and BEN21-1a (190 rDNA copies rpa49$ fob1%) deleted for rpa49 and
containing 25 or 190 copies, respectively, of rDNA and an empty vector () or bearing RPA49 (Rpa49) were spotted on plates with (FOA) or without FOA
() and grown at 25°C for 7 d. (C) Nucleolar structure of Pol I mutants assessed by fluorescent microscopy. Representative confocal sections of strains
NOY1071 (25 rDNA copies fob1%), NOY1064 (190 rDNA copies rpa49$), and BEN20-1a (25 rDNA copies rpa49%) containing GFP-Nup49 staining
the NPC (GFP-Nup49) and mCherry-Nop1 staining the nucleolus (mCherry-Nop1). (right) Overlay of both fluorescent signals (merge) is shown. (D) Ultra-
structural study of cryofixed, cryosubstituted strains with 25 rDNA copies with (WT) or without Rpa49 (Rpa49%).
Figure 6. Quantification of polymerases along transcribed rDNA genes. (A) Visualization of active genes in rDNA. Using a mutant strain with a reduced
number of rDNA copies (strain NOY886; 42 rDNA copies), we obtained high quality spreads from total nucleolar DNA. (B) Quantification of actively
transcribed rDNA genes. The quantification of active genes in mutant strain (42 active gene in NOY886) is compatible with previous results (French et al.,
2003). (C) Visualization of individual polymerases on negatively stained Miller spread. In mutant strains with 25 rDNA copies, Pol I density on each gene
is very high. Using higher magnification (bottom left), we can still detect individual polymerases, which can be quantified (right; red circles). Note that a
nascent rRNA can be visualized from each detected polymerase.
complexes per gene in its absence. We then measured the dis- polymerases with the corresponding random distribution pre-
tance between adjacent polymerases to evaluate whether the dicted (Fig. 7 B). In all cases, the observed distance between
Pol I molecules were randomly distributed on the rRNA genes polymerases was shorter than that predicted for the random dis-
(Fig. 7 B). The distances between polymerases depend intrin- tribution. These results suggest clustering of polymerases. We
sically on the Pol I density on each rRNA gene, which varies have introduced a new parameter in our simulations to take this
between strains. Therefore, for each polymerase load, we first effect into account. When 60% of polymerases are modeled as
compared the empirical measurements of distance between being in direct contact with each other and 40% are randomly
Figure 7. Miller spread of 190 and 25 rDNA copy strains with or without Rpa49. (A) Representative Miller spread from NOY1071 bearing 25 rDNA
copies (25 rDNA copies [WT]), BEN20-1a bearing 25 rDNA copies and rpa49$ (25 rDNA copies [rpa49%]), and NOY1064 bearing 190 rDNA copies
(190 rDNA copies [WT]). (right) Interpretive tracing of the genes is shown. Polymerases that appear on the gene are shown on the tracing by black dots.
(B and C) Cumulative distribution function of the distances between adjacent polymerases in strains NOY1071 (red; 25 rDNA copies [WT]), BEN20-1a
(blue; 25 rDNA copies [rpa49%]), and NOY1064 (green; 190 rDNA copies [WT]) is shown. Solid lines, empirical measurement; dashed lines, random
(B) or simulated (C).
Figure 8. Two successive elongating Pol I complexes allow a contact between Rpa49 and Rpa43 subunit of adjacent molecules. (A) Frequent association of
adjacent Pol I depends on Rpa49. We generated diploid cells expressing two versions of Pol I containing an Rpa190 subunit fused to either the Myc or HA
tag. These tagged proteins are efficiently detected in cell extract supernatants (SUP). After formaldehyde cross-linking and extensive DNase treatment, we
immunoprecipitated Pol I using anti-HA antibodies (IP). We evaluated the amount of polymerase dimers/multimers by assessing the extent of Myc-tagged
Rpa190 coprecipitation. We use a strain bearing only Myc-Tag Pol I as negative control (no HA tag; lanes 1 and 4). The presence of dimers/multimers is
dependent on Rpa49, as shown by lack of Myc-tagged Rpa190 coimmunoprecipitation in rpa49 deletion background (rpa49%; compare lanes 5 and 6)
(B) 3D model of Pol I as determined by cryo–electron microscopy. The positions of the Pol I–specific Rpa43/Rpa14 and Rpa49/Rpa34 heterodimers are shown
in purple and in green, respectively. (C) Fitting of the atomic structure of the highly homologous Pol II elongation complex (Protein Data Bank accession
no. 2YU9) into the cryo–electron microscopy structure of RNA Pol I. The transcribed DNA is shown in red, and the 10-subunit core Pol II is shown in blue.
distributed, the simulated data are in good agreement with our ExoIII footprinting experiments on RNA Pol II elongation
experimental measurements in the case of the 190 and 25 rDNA complexes (Samkurashvili and Luse, 1998). Interestingly, in
copy strains in the presence of Rpa49 (Fig. 7 C). However, in this model, the Rpa49/Rpa34 subunits of one polymerase are
the 25 rDNA copy/rpa49% strain, we measured larger distances brought in close proximity to the Rpa43/Rpa14 heterodimer of
between polymerases compared with the predictions of the the following Pol I. Genetic evidence previously suggested that
model. Therefore, we propose that the interactions between suc- Rpa49 and Rpa43 are functionally linked (Beckouet et al.,
cessive Pol I complexes are strongly reduced in the absence of 2008). To test whether Rpa49 directly associates with Rpa43,
Rpa49, accounting for the reduction in the number of adjacent we coexpressed GST-tagged Rpa49 and HA-tagged Rpa43 in
Pol I complexes. Therefore, Rpa49 is required to ensure high Escherichia coli. Because Rpa49 and Rpa34 form heterodimers,
density of Pol I per rDNA gene. Furthermore, our data suggest we used GST-tagged Rpa49 and HA-tagged Rpa34 as positive
that Rpa49 is involved in establishing contact between adjacent controls. Upon purification on glutathione Sepharose beads,
Pol I complexes. both Rpa34 and Rpa43 copurify with GST-Rpa49 (Fig. 8 E,
lanes 2 and 6). In contrast, HA-tagged Rpa43 or HA-tagged
Molecular modeling of contacts between Rpa34 are not copurified with GST alone (Fig. 8 E, lane 4 and 8).
adjacent polymerases on rDNA genes Therefore, genetic and biochemical assays suggest a direct inter-
Rpa49 seems to be required for interaction between adjacent action between Rpa43 and Rpa49.
transcribing polymerases. To confirm the requirement on Rpa49
for contact between adjacent polymerases, we coexpressed in a Discussion
(D) Positioning of a second Pol I elongation complex (yellow) following a leading Pol I elongation complex (blue) by imposing a straight B-form linker
DNA and a contact between the Pol I molecules. The black arrow represents the direction of RNA Pol I translation during elongation. (left) The model is
rotated 180° around the vertical axis as compared with the right panel. (E) HA-tagged Rpa43 and Rpa34 bind to GST-tagged Rpa49 when expressed in
E. coli. Expression and purification of recombinant GST-Rpa49 or GST alone in the presence of HA-tagged Rpa34 or Rpa43 is described in Materials and
methods. The supernatants of E. coli cell lysates (SUP) were incubated with glutathione Sepharose 4B beads. After washing, GST-Rpa49 and GST were
eluted with sample buffer (IP), and the fractions were analyzed by Western blotting to detect coprecipitation of HA-tagged Rpa34 (lanes 1–4) or Rpa43
(lanes 5–8). In the supernatant fractions, we detect full-length HA-Rpa34 and HA-Rpa43 and minor degradation products. Note that Rpa34 and Rpa43
appear specifically enriched in samples containing affinity-purified GST-Rpa49 compared with GST alone (compare lane 2 with lane 4 for Rpa34; compare
lane 6 with lane 8 for Rpa43). White lines indicate that intervening lanes have been spliced out.
proteins, Gno1, a cofactor of the RNA helicase Prp43, and two Materials and methods
components of the C/D snoRNP complexes Nop56 and Nop58
were shown to interact with Rpa34 (Beckouet et al., 2008). Yeast strains, plasmid construction, and plasmid-shuffling assays
Yeast strains used in this study are listed in Table S1, and oligonucleotides
Therefore, the C-terminal domain is involved in the recruitment are listed in Table S2. Yeast strains were constructed by meiotic crossing
of species-specific binding partners, which are responsible for and plasmid DNA transformation. S. cerevisiae–null alleles with KanMX4
nucleolar targeting. insertions were obtained from EUROSCARF and were checked using ad
hoc PCR amplifications. The Sp-rpa34% gene deletion in S. pombe strain
BENSP1-1a was performed by homologous recombination using PCR-
Pol I transcription influences amplified fragments with oligos 746 and 747 with plasmid p29802 as
nucleolar morphology template. Sp-Rpa49% (rpa51$) was obtained as previously described
using plasmid pYN1003usds (Nakagawa et al., 2003). pDONR201
The nucleolus is the largest nuclear domain, the integrity of (Invitrogen), pREP41 (Basi et al., 1993), pRS413, pRS423, pRS425 (Sikorski
which depends directly on rRNA production (Trumtel et al., and Hieter, 1989), pVV200, pVV208 (Van Mullem et al., 2003), p29802,
2000; Hernandez-Verdun et al., 2002). This structure is con- pUN100-mCherry-NOP1 (mCherry-NOP1) and pASZ11-CFP-NUP49
(CFP-NUP49; Berger et al., 2008), pFL36-CII, pGID-CII (Berger et al.,
served in all eukaryotes, and most nuclear steps of ribosome bio- 2007), pOG5-RPA34 (Gadal et al., 1997), pENTR-PAF53, pENTR-CAST,
genesis take place within the nucleolus. In the absence of Rpa34 pENTR-HA-CAST (Panov et al., 2006), pOG1-A34 (Beckouet et al., 2008),
and especially Rpa49, nucleolar assembly is severely compro- pENTR-RPA49 (Beckouet et al., 2008), pYN1003usds (Nakagawa et al.,
2003), and pNOY373 (Wai et al., 2000) were previously described.
mised. Importantly, the altered nucleolar morphology in rpa49- pEB5 and pENT-Rpa34DC58 were provided by E. Bertrand and
null strains correlates with a significant reduction in the number F. Beckouët, respectively.
of ribosomes per cell. When we artificially decreased the number pRS425-PPGK was constructed by ligating the NdeI fragment from
pVV200 in the SmaI site of pRS425. pCNOD08, a gateway vector that
MF(ALPHA)2/YGL089C promoter (prMFA2) that allowed selectivity for microscope. Wide-field fluorescent images were captured with a micro-
MATA haploid cells (Decourty et al., 2008). The strain also contains the scope (IX-81; Olympus) equipped with a polychrome V monochromator
complementing plasmid pGID-RPA34 that allows expression of Rpa34 and a camera (CoolSNAP HQ; Roper Industries) controlled with Meta-
under the control of its own promoter terminator and carrying HPH and Morph acquisition software (version 6; Universal Imaging Corp.). Confocal
klURA3 markers. Diploids were selected on YPD medium complemented microscopy was performed using a Nipkow-disk confocal system (Revolution;
with hygromycin and G418. Double mutants were generated by sporula- Andor) installed on a microscope (IX-81), featuring a confocal spinning
tion of diploids on RSS media and selection on YPD complemented with disk unit (CSU22; Yokogawa) and a cooled electron multiplying charge-
hygromycin, G418, and ClonNat. coupled device camera (DU 888; Andor). The system was controlled using
the FAST mode of Revolution IQ software (Andor). Images were acquired
Immunoprecipitation, sucrose gradient, antibodies, and pulse-field gel using a 100× Plan Apo 1.4 NA oil immersion objective and a twofold lens
electrophoresis (PFGE) in the optical path. Single laser lines used for excitation were diode-
Immunoprecipitation of Rpa190 with coexpressed CAST and PAF53 was pumped solid-state lasers exciting GFP fluorescence at 488 nm (50 mW;
performed as described previously (Galy et al., 2004). In brief, yeast cells Coherent) and mCherry fluorescence at 561 nm (50 mW; Cobolt jive), and
were lysed by French press in buffer A (10 mM Hepes, pH 7.5, 150 mM a bi-bandpass emission filter (Em01-R488/568-15; Semrock) allowed col-
KCl, 1.5 mM MgCl2, 1 mM DTT, 1 mM PMSF, 0.1% Triton X-100, 10 μg/ml lection of the green and red fluorescence. Pixel size was 65 nm. For quan-
leupeptin, and 10 μg/ml pepstatin). The lysates were centrifuged at tification of nucleolar volume, z stacks of 41 images with a 250-nm z step
15,000 g for 30 min at 4°C. TAP-tagged Rpa190 was purified using IgG were used. Exposure time was 200 ms. Digital pictures were processed
Sepharose, and bound fractions were eluted with acid elution. Isolation of using Photoshop software (version CS3; Adobe).
ribosomes under low salt conditions by sucrose gradient centrifugation was
performed as previously described (Gadal et al., 2002). In summary, cells Electron microscopy and quantitative analysis of Miller spreads
were harvested and lysed by vortexing with glass beads in buffer contain- For morphological analysis of nucleoli, budding yeast were cryofixed by
ing 10 mM Tris-HCl, pH 7.5, 100 mM NaCl, 30 mM MgCl2, and 0.35 mM high pressure freezing (EMPACT; Leica) and cryosubstituted with 0.02%
cycloheximid. Nuclei and cell debris were pelleted by centrifugation at OsO4, 0.1% uranyl acetate, and 1% glutamate in acetone for 72 h. Cells
14,000 g for 5 min at 4°C. Ribosomal subunits were separated by centrifu- were embedded in a Lowicryl resin (HM-20) polymerized at 50°C. Sec-
gation for 12 h at 100,000 g in a SW40 rotor at 4°C on a 10–40% su-
Submitted: 17 June 2010 Hernandez-Verdun, D., P. Roussel, and J. Gébrane-Younès. 2002. Emerging con-
Accepted: 21 December 2010 cepts of nucleolar assembly. J. Cell Sci. 115:2265–2270.
Huet, J., J.M. Buhler, A. Sentenac, and P. Fromageot. 1975. Dissociation of two
polypeptide chains from yeast RNA polymerase A. Proc. Natl. Acad. Sci.
USA. 72:3034–3038. doi:10.1073/pnas.72.8.3034
References Kuhn, C.D., S.R. Geiger, S. Baumli, M. Gartmann, J. Gerber, S. Jennebach,
Basi, G., E. Schmid, and K. Maundrell. 1993. TATA box mutations in the T. Mielke, H. Tschochner, R. Beckmann, and P. Cramer. 2007.
Schizosaccharomyces pombe nmt1 promoter affect transcription effi- Functional architecture of RNA polymerase I. Cell. 131:1260–1272.
ciency but not the transcription start point or thiamine repressibility. doi:10.1016/[Link].2007.10.051
Gene. 123:131–136. doi:10.1016/0378-1119(93)90552-E Künzler, M., and E.C. Hurt. 1998. Cse1p functions as the nuclear export re-
Beckouet, F., S. Labarre-Mariotte, B. Albert, Y. Imazawa, M. Werner, O. Gadal, ceptor for importin alpha in yeast. FEBS Lett. 433:185–190. doi:10
Y. Nogi, and P. Thuriaux. 2008. Two RNA polymerase I subunits con- .1016/S0014-5793(98)00892-8
trol the binding and release of Rrn3 during transcription. Mol. Cell. Biol. Kwapisz, M., F. Beckouët, and P. Thuriaux. 2008. Early evolution of eukary-
28:1596–1605. doi:10.1128/MCB.01464-07 otic DNA-dependent RNA polymerases. Trends Genet. 24:211–215.
Berger, A.B., L. Decourty, G. Badis, U. Nehrbass, A. Jacquier, and O. Gadal. doi:10.1016/[Link].2008.02.002
2007. Hmo1 is required for TOR-dependent regulation of ribosomal Lechertier, T., V. Sirri, D. Hernandez-Verdun, and P. Roussel. 2007. A B23-
protein gene transcription. Mol. Cell. Biol. 27:8015–8026. doi:10 interacting sequence as a tool to visualize protein interactions in a cellular
.1128/MCB.01102-07 context. J. Cell Sci. 120:265–275. doi:10.1242/jcs.03345
Berger, A.B., G.G. Cabal, E. Fabre, T. Duong, H. Buc, U. Nehrbass, J.C. Liljelund, P., S. Mariotte, J.M. Buhler, and A. Sentenac. 1992. Characterization
Olivo-Marin, O. Gadal, and C. Zimmer. 2008. High-resolution statisti- and mutagenesis of the gene encoding the A49 subunit of RNA poly-
cal mapping reveals gene territories in live yeast. Nat. Methods. 5:1031– merase A in Saccharomyces cerevisiae. Proc. Natl. Acad. Sci. USA.
1037. doi:10.1038/nmeth.1266 89:9302–9305. doi:10.1073/pnas.89.19.9302
Bischler, N., L. Brino, C. Carles, M. Riva, H. Tschochner, V. Mallouh, and P. Miller, O.L. Jr., and B.R. Beatty. 1969. Visualization of nucleolar genes. Science.
Schultz. 2002. Localization of the yeast RNA polymerase I-specific sub- 164:955–957. doi:10.1126/science.164.3882.955
units. EMBO J. 21:4136–4144. doi:10.1093/emboj/cdf392
S. cerevisiae
BY4741 MATa his3%1 leu2%0 met15%0 ura3%0 EUROSCARF
BY4742 MATalpha his3%1 leu2%0 lys2%0 ura3%0 EUROSCARF
ODN1-1a MATa his3%1 leu2%0 met15%0 ura3%0 trp1%0 This study
TMS1-1A MATa his3-%1, leu2-%0, C, ura3-%0, ade2-801, lys2-801,LYS2::TETR-GFP, This study
THE JOURNAL OF CELL BIOLOGY
Table S3, showing relative enrichment of each detected yeast ORF deletion, is provided as an Excel file.
References
Beckouet, F., S. Labarre-Mariotte, B. Albert, Y. Imazawa, M. Werner, O. Gadal, Y. Nogi, and P. Thuriaux. 2008. Two RNA polymerase I subunits control the binding
and release of Rrn3 during transcription. Mol. Cell. Biol. 28:1596–1605. doi:10.1128/MCB.01464-07
Machín, F., J. Torres-Rosell, G. De Piccoli, J.A. Carballo, R.S. Cha, A. Jarmuz, and L. Aragón. 2006. Transcription of ribosomal genes can cause nondisjunction. J.
Cell Biol. 173:893–903. doi:10.1083/jcb.200511129
Pelloquin, L., P. Belenguer, Y. Menon, N. Gas, and B. Ducommun. 1999. Fission yeast Msp1 is a mitochondrial dynamin-related protein. J. Cell Sci. 112:4151–4161.
S2 JCB
I-4 Discussion Publication 2011
Dans mon introduction, nous nous sommes attelés à décrire des facteurs de
transcription potentiellement impliqués dans l’élongation. Cette phase de la
transcription en comparaison avec l’initiation et la terminaison fut longtemps la moins
étudiée dans le cas du fonctionnement de l’ARN pol I. Il semblerait néanmoins que
l’élongation soit maintenant largement considérée puisque deux études publiées les
mois derniers viennent étoffer la liste des facteurs d’élongations communs entre
l’ARN pol II et l’ARN pol I (Beckouet et al., 2011; Lepore and Lafontaine, 2011). Les
mécanismes régissant l’élongation de l’ARN pol I sont donc des mécanismes en
pleine exploration (pour revue Albert et al. 2011 présentée en annexe).
Au cours de notre étude, nous avons étudié des mutants ou des protéines
impliquées dans l’élongation de l’ARN pol I. Nous nous sommes principalement
appuyés sur l’utilisation du mutant de l’élongation rpa49-∆ pour étudier ces
phénomènes. Durant ma thèse, d’autres équipes de recherches et notamment David
Schneider et ses collaborateurs ont cherché des liens génétiques avec RPA49 pour
identifier des facteurs d’élongation de l’ARN pol I (Anderson et al., 2011; Schneider
et al., 2006; Zhang et al., 2010). L’utilisation du mutant d’élongation rpa49-∆ est donc
un bon candidat pour identifier de nouveaux facteurs. Il serait intéressant de
rechercher par une approche génétique globale de nouveaux suppresseurs et
synthétique létaux de RPA49 pour identifier des facteurs impliqués dans l’élongation
par l’ARN pol I. Cette démarche a déjà été initiée au sein de notre laboratoire.
MPO
plasticité du système transcriptionnel de l’ARN pol I. En effet, l’étude de ces facteurs
d’élongation dans le cas de l’ARN pol I est souvent contrariée par des phénomènes
d’expansion des répétitions des gènes d’ADNr ou par un changement du ratio entre
copies ouvertes et fermées. Dans une 25 copies les gènes seront tous sous forme
activée et le nombre de copies ne peut pas varier. Ces différents paramètres vont
faciliter la caractérisation d’un facteur d’élongation et l’interprétation des phénotypes
observés. L’utilisation de cette souche et de la souche mutante rpa49-∆ pourra
permettre d’identifier de nouveaux facteurs.
Dans notre étude nous avons montré l’importance des deux sous-unités spécifiques
de l’ARN pol Iet proposé un modèle permettant de réconcilier les différentes données
de la littérature pouvant apparaître contradictoires. Nous avons proposé que Rpa49
faciliterait les contacts entre deux ARN pol I adjacentes sur le locus d’ADNr en
transcription et permettrait le relargage de Rrn3 (notre étude). Pour construire ce
modèle, nous nous sommes appuyés sur les données structurales issues du travail
de l’équipe de Cramer en 2007, décrivant le positionnement des sous unités Rpa34
et Rpa49 dans une position opposé à la plate-forme de fixation de Rrn3 (Kuhn et al.,
2007). Par des approches in vitro, nous avons montré la possibilité d’une interaction
entre Rpa43 et Rpa49 qui permettrait le relargage de Rrn3. De plus, par co-
immunoprécipitation nous avons montré l’existence d’interactions entre des ARN pol
I en transcription. Dans l’avenir, il serait intéressant de tester différents mutants de
l’allèle RPA49 pour établir quels sont les domaines nécessaires à l’interaction de
Rpa49 avec Rpa43 entre 2 ARN polymérases adjacentes. La présence ou l’absence
de contact pourra être tester par co-immunoprécipitation et par FRET en étiquetant
les sous unités Rpa49 et Rpa43. De plus, les informations structurales qui sont
maintenant à notre disposition grâce aux publications de l’équipe de Patrick Cramer
pourraient nous permettre de cibler plus facilement les régions qui pourraient être
potentiellement requises pour établir cette interaction (Geiger et al., 2010; Kuhn et
al., 2007).
MPP
II- Rôle et conservation évolutive des protéines HMGB sur la
transcription par l’ARN pol I.
Hmo1 chez S. cerevisiae et UBF1 chez l’Homme sont des protéines chromatiniennes
non-histones qui se lient à l'ADNr. Dans cette étude nous avons montré la
conservation fonctionnelle de ces protéines et découvert un équivalent chez S.
pombe. Nous avons montré qu’une surexpression de ces protéines peut améliorer le
fonctionnement de l’ARN Pol I et influencer la morphologie du nucléole. Une des
difficultés de ce projet résidait dans le fait que ces protéines assurent plusieurs
fonctions cellulaires et qu’elles se fixent sur les régions d’ADNr qui sont répétées et
hétérogènes. Nous avons réussi en utilisant des versions tronquées de ces protéines
à découpler différentes fonctions d’Hmo1 et par l’utilisation des souches avec un
MPQ
nombre de copies d’ADNr réduit à étudier spécifiquement la chromatine des gènes
actifs. Nos résultats suggèrent que la fonction conservée de ces protéines serait de
maintenir une structure et une topologie de l’ADNr permissive sur la région la plus
transcrite du génome.
II-2- Publication
MPR
HMG-box factors share conserved functions in ribosomal DNA transcription from yeast to
humans
Regensburg, Germany.
* Corresponding author:
Olivier Gadal
email: gadal@[Link]
1
Abstract
Production of large ribosomal RNAs (rRNAs) by RNA polymerase I (Pol I) is limiting for
proliferation and growth in most eukaryotic cells. In this study, we addressed the functional
conservation of HMGB proteins, containing High Mobility Group Box motifs in transcription
demonstrated that the three HMGB proteins Hmo1 (S. cerevisiae), UBF1 (human), and the
newly identified SpHmo1 (S. pombe) are localized in the nucleolus and all rescue the growth
phenotype of the Pol I mutant, rpa49-Δ. Thus we suggest the name HMGB-P for HMGB
proteins regulating Pol I for this group of factors. HMGB-Ps are not fully interchangeable
because they also acquired species-specific functions. Hmo1 co-localizes with UBF when co-
expressed in human cells, but depletion of UBF is not functionally rescued by Hmo1
yeast is not achieved by UBF1. Our results suggest that these HMGB-P factors are universally
able to stimulate elongation by specifying a chromatin status of rRNA genes permissive for
transcription.
2
Introduction
Cell growth requires a large amount of protein synthesis. Since the ribosome is the molecular
machine making proteins, ribosome production may be regarded as the “house building”
function of the cell (Lempiainen & Shore, 2009). Ribosome biogenesis involves the
coordinated regulation of the three nuclear RNA polymerases, to produce four ribosomal
RNAs (rRNAs). These are assembled with ribosomal proteins (RPs) and represent at least
80% of cellular RNA. RNA polymerase I (Pol I) synthesizes a large polycistronic 35S rRNA
which is processed to generate the three large rRNAs: 25S, 18S and 5.8S. RNA polymerase
III (Pol III) produces 5S rRNA. RNA polymerase II (Pol II) transcribes 80 genes encoding
RPs and over 200 genes coding for trans-acting factors involved in ribosome assembly. In this
The essential components of the Pol I transcription machinery have now been identified in all
major groups from yeast to vertebrates. Pol I consists of fourteen subunits. Each subunit
except for Rpa14, is conserved from yeast to humans, (Beckouet et al, 2008; Panov et al,
2006b). During initiation, Pol I, Rrn3 (TIF-IA in mammals), and TFIIH are recruited to
transcription factors bound to the promoter (Grummt, 2003; Iben et al, 2002). Rrn3 and TFIIH
are conserved from yeast to humans (Iben et al, 2002). Complexes bound to rRNA coding
genes (rDNA) promoters are more divergent. In mammals, the promoter specificity is
conferred by TIF-IB/SL1 complex and stabilized by the upstream binding factor (UBF) (Bell
et al, 1988). SL1 is a protein complex containing TATA-binding protein (TBP) and four TBP
associated factors (TAFs) that are required for Pol I activity (Gorski et al, 2007; Russell &
Zomerdijk, 2005). SL1 is required for rRNA transcription. In S. cerevisiae, the promoter-
bound complex comprises two components: the three-subunit Core Factor (CF) and the
3
Upstream Activating Factor (UAF). CF is functionally related to TIF-IB/SL1 and binds
directly to the core promoter domain. This factor is essential for transcription (Keys et al,
1994; Nomura, 2001). Despite the confusing nomenclature, UAF and UBF are unrelated, and
have very different activities in vivo. UAF is made of the histones H3 and H4 (Keener et al,
1997) and four other polypeptides. It strongly enhances the binding of CF to the promoter via
In vertebrates, UBF has been linked to Pol I regulation. UBF has two splicing variants, UBF1
and UBF2, generated from a single transcript (O'Mahony & Rothblum, 1991). Both can bind
to the rDNA promoter, UBF1 being a more potent activator (Kuhn et al, 1994). UBF1
interacts directly with the Pol I subunit PAF53 (Hanada et al, 1996; Schnapp et al, 1994) and
stimulates Pol I at several steps of the transcription cycle. It has been reported to act in the
recruitment of SL1 (Friedrich et al, 2005), in the formation of the preinitation complex
(McStay et al, 1991), and in regulating promoter escape (Panov et al, 2006a). UBF binding
extends from the promoter region to the entire transcribed region (O'Sullivan et al, 2002;
Sanij & Hannan, 2009). Through its direct binding to the transcribed region, UBF can regulate
Pol I elongation (Stefanovsky et al, 2006). Tandem arrays of a heterologous DNA sequence
with high affinity for UBF introduced into human chromosomes formed pseudo-NORs
(nucleolar organizer regions) (Mais et al, 2005). Association of UBF with pseudo-NORs
induced chromatin decondensation, and the recruitment of the Pol I machinery (Mais et al,
2005). rDNA are organized in tandem repeats, of which less than 50% are actively
transcribed. Pol I activity is controlled by both transcription rate per gene and the number of
active genes. Recent reports have demonstrated that UBF can also regulate the number of
Despite the central regulatory function of UBF, a clear counterpart in yeasts is yet to be
4
identified. UBF1 contains six high mobility group (HMG) boxes, and via the first three HMG
boxes, it binds and kinks the DNA (Stefanovsky et al, 2001). Revealing a tight genetic
interaction with the specific Pol I subunit Rpa49, we previously identified Hmo1, a yeast
HMG-box protein, as a bona fide Pol I transcription factor (Gadal et al, 2002). Rpa49 is
implicated in recycling of Rrn3 after initiation and stimulating the elongation step in vivo
(Albert et al, 2011; Geiger et al, 2010). In vitro studies have shown that the presence of Rpa49
on Pol I stimulates elongation (Kuhn et al, 2007). Deletion of HMO1 in the rpa49Δ strain
causes lethality whereas overexpression of Hmo1 suppresses the growth phenotype of rpa49Δ
(Gadal et al, 2002). Like UBF1, Hmo1 is mostly a nucleolar protein, bound to rDNA and
implicated in Pol I transcription. UBF and Hmo1 have also been linked to the TOR pathway,
connecting the regulation of Pol I activity to nutrient signals (Berger et al, 2007; Lempiainen
The known functions of UBF are mainly restricted to Pol I transcription, whereas Hmo1 is
deficient mutants (Lu et al, 1996), and both spontaneous and UV-induced mutation
frequencies increase (Alekseev et al, 2002). Hmo1 together with Top2 suppresses
chromosome fragility during the S phase to preserve genome integrity (Bermejo et al, 2009).
Furthermore, Hmo1 binds ribosomal protein gene (RPG) promoters and regulates their
expression (Berger et al, 2007; Hall et al, 2006b; Kasahara et al, 2007). It also interacts with
TFIID and localizes to the Pol II transcription start site (Kasahara et al, 2008).
In the present study, we directly addressed the functional conservation of HMGB proteins in
human UBF1 and UBF2 are localized to the nucleolus, and UBF1 but not UBF2 can rescue
5
are required for dimerization, DNA binding and bending (Xiao et al, 2010). Since budding
yeast Hmo1 and UBF1 N-terminal domains share a similar organization, we could define a
common core required for stimulation of Pol I. Using this core domain, we then identified a
Sp-Hmo1 ortholog in fission yeast. With three HMGB proteins behaving as bona fide Pol I
activators, we used deletion analysis to define a conserved domain required for Pol I
stimulation. Without this conserved domain, Hmo1 can stimulate RPG expression but not Pol
I transcription. Finally, using a mutant background in which all rRNA genes are active, we
showed that the three HMGB proteins could stimulate Pol I elongation most likely by
6
RESULTS
To determine whether the yeast Pol I factor, Hmo1, and the major human Pol I regulator,
UBF, have similar functions in vivo, we used a yeast strain to express two UBF splicing
variants, UBF1 and UBF2. YFP-UBF1 and YFP-UBF2 were expressed in a yeast strain
bearing two fusion proteins, the nucleolar mRFP-Nop1 (the yeast ortholog of fibrillarin), and
Hmo1-CFP, which maps to the rDNA. Hmo1 is associated with rDNA, and is located at the
nucleolar/nucleoplasmic interface only partly overlapping with Nop1 (Gadal et al, 2002).
localized in vivo (Figure 1A upper panel; YFP-UBF2 not shown). This co-localization was
unexpected, but could be the result of UBF1 expression in yeast. In contrast, when YFP-
UBF1 is not expressed mRFP-Nop1 and Hmo1-CFP only partially overlap (Figure 1A lower
panel).
UBF1 and UBF2 in a hmo1Δ mutant background growing slowly at 25°C. No significant
rescue of the growth defect of hmo1Δ at 25°C could be observed, showing that neither UBF1
nor UBF2 can substitute fully for Hmo1 in vivo (data not shown).
Hmo1 directly interacts with the region transcribed by Pol I as well as with a subset of Pol II
promoters of RP genes (Berger et al, 2007; Hall et al, 2006a; Kasahara et al, 2007). The
absence of Hmo1 becomes lethal when combined either with mutations in components of Pol
(rps23AΔ). We examined whether expression of UBF1 or UBF2 can rescue the lethality of
these two double mutant strains. None of the two proteins could suppress the lethality of the
hmo1Δ rps23AΔ mutant background, and only UBF1 expression restored growth of the
7
hmo1Δ rpa49Δ double mutant (Figure 1B; see also Figure 6A). Furthermore, only untagged
UBF1 protein could rescue the growth phenotype when expressed in hmo1Δ rpa49Δ cells
These results show that although UBF1 cannot fully recapitulate Hmo1 function, its
Hmo1 and UBF1 share a low sequence similarity but both can rescue viability of a double
mutant hmo1Δ rpa49Δ. The organization of Hmo1 into three domains has been previously
described (Figure 2A); box A is a poorly conserved HMG box which can potentially behave
as a dimerization motif, box B is a conserved HMG box, and box C is a highly charged motif
involved in DNA bending (Xiao et al, 2010). The domain organization of UBF1 is well
established with an N-terminal dimerization domain (UBF-D), five conserved HMG boxes
(with the first being the most canonical), followed by a charged C-terminal motif (Schnapp et
al, 1994). Together with the alignment of the amino acid sequences from the most conserved
HMG boxes (Hmo1 box B and UBF box 1) in both proteins (Gadal et al, 2002), Hmo1 and
UBF1 appear to share a similar organization within the first 260 amino-acids, with a
dimerization motif, a conserved HMG box, and a conserved domain spanning box C (see
Figure 6B). To compare the functions of the Hmo1 and UBF1 domains, we analyzed the
and UBF-box1-2 (Figure 2A). Both proteins localized in the yeast nucleolus (Figure 2B) but
only UBF-box1-2 could rescue growth in the hmo1Δ rpa49Δ background (Figure 2C). Box A
of Hmo1 is defined as a degenerated HMG box motif. We swapped the box A of Hmo1 with
the dimerization motif of UBF (Figure 2 D). To evaluate the functionality of this chimeric
8
UBF/Hmo1 (Chim-hmo1) on both Pol I machinery and Pol II promoters, it was expressed in
hmo1Δ rpa49Δ and hmo1Δ rps23aΔ backgrounds. Expression of Chim-hmo1 rescued the
growth phenotype in both mutants (Figure 2D). Thus, the N-terminal domain of UBF1
encompassing the dimerization domain and the first two HMG boxes can functionally
We showed that UBF1 expression in yeast restores rpa49Δ hmo1Δ viability. To study the
expression plasmid into the HT1080 human-cell line. When expressed, Hmo1 mostly co-
localized with UBF in nucleoli with a low nucleoplasmic signal (Figure 3A). Like UBF,
(Figure 3A) (Roussel et al, 1993). Since rDNA transcription is reduced or even stopped during
mitosis of mammalian cells (Hernandez-Verdun et al, 2002), this observation suggests that
like UBF, Hmo1 associates with ribosomal gene chromatin even in the absence of Pol I
transcription (Roussel et al, 1993; Wittner et al, 2011). To further illustrate this point, we next
expressed Hmo1 in a cell line (3D-1) bearing a pseudo-NOR (Mais et al, 2005). On
from nucleoli. They sequester a significant fraction of many components of the Pol I
transcription machinery, including UBF. Pseudo NORs lack Pol I promoter sequences, and are
therefore transcriptionally silent and do not recruit RNA binding factors such as nucleolin or
fibrillarin. When expressed at low levels in 3D-1 cells, Hmo1 is concentrated in pseudo-NORs
(Figure 3A), providing further evidence that Hmo1 can be recruited directly to ribosomal gene
9
UBF is essential for cellular growth and proliferation, as shown by shRNA-mediated
depletion (Figure 3B). A growth arrest phenotype is observed upon activation of a tetracycline
inducible shRNA targeting both UBF1 and UBF2 in the human cell line HT1080. By
ablate UBF expression and induce Hmo1 expression (Figure 3B). In this context, we observed
that Hmo1 cannot overcome the growth arrest associated with UBF depletion (Figure 3C).
This shows that UBF fulfills specific functions that cannot be complemented by Hmo1
expression.
Using complementation assay in human cells, Hmo1 is shown to co-localize with UBF in
vivo, but it cannot recapitulate UBF function. UBF has multiple roles in the Pol I transcription
cycle, at the initiation step of rDNA transcription, and during elongation (Panov et al, 2006a;
Stefanovsky et al, 2006). Using complementation assay in budding yeast, both UBF1 and
Hmo1 could stimulate the Pol I machinery. In conclusion, UBF1 and Hmo1 are not
We next aligned the consensus region shared by Hmo1 and the UBF1 N-terminus with the
role in Pol I transcription also in this organism. We identified four HMGB proteins on the
basis of their sequence similarity with Hmo1 and UBF1 Box1-2. We first expressed each of
those four proteins in fusion with YFP in S. cerevisiae. Only SPBC28F2, hereafter called Sp-
Hmo1, is concentrated to the nucleolus (Figure 4A). We next expressed the four untagged
proteins in S. cerevisiae hmo1Δ rpa49Δ double mutant (Figure 4B). Only Sp-Hmo1 restored
growth of the double mutant. As observed for heterologous expression of UBF1 or UBF2,
expression of Sp-Hmo1 did not rescue lethality in a hmo1Δ rps23aΔ background (Figure 6A).
10
This heterospecific complementation assay suggests that Sp-Hmo1 is a Pol I transcription
factor.
We next tested whether Sp-Hmo1 influences Pol I activity in S. pombe. HA-tagged Sp-Hmo1
was detected by immunofluorescence in wild-type (WT) [Link]; the fluorescent signal was
nucleolar protein (Figure 5A). In contrast with HMO1 in S. cerevisiae, deletion of Sp-HMO1
In S. cerevisiae, Hmo1 is required for growth at 25°C, and an hmo1Δ mutant strain
accumulates unprocessed 35S rRNA suggesting an rRNA processing defect (Hall et al,
Using northern blot analysis to assess the steady-state content of ribosomal RNA precursors in
Sp-hmo1Δ mutant cells and in WT cells, we observed a depletion of the two earliest
precursors, 35S and 32S rRNA, but detected no or mild effect on other downstream precursors
(27SA, 27SBL 27BS, and 20S rRNA) (Figure 5B). Therefore, Sp-Hmo1 is required for normal
accumulation of early rRNA precursors, but not for further rRNA processing.
In S. cerevisiae, Hmo1 is essential in the absence of Rpa49 and its over-expression suppresses
the rpa49Δ growth defect at 25°C (Gadal et al, 2002). We tested whether this genetic link is
conserved in S. pombe. The ortholog of the budding yeast Rpa49 is Rpa51 in S. pombe, and is
hereafter termed Sp-Rpa49 (Nakagawa et al, 2003). We crossed the S. pombe haploid single
mutants Sp-hmo1Δ and Sp-rpa49Δ, and tried to detect double-deletion mutants after meiosis.
Out of 64 offsprings, we could not generate viable double mutants suggesting that Sp-HMO1
and Sp-RPA49 deletions are synthetically lethal in S. pombe (Figure 5C). A Sp-RPA49
deletion is unable to grow at 25°C, and over-expression of Sp-Hmo1 from the strong NMT1
promoter effectively suppresses this growth defect (Figure 5D). We then used northern
blotting to analyse the steady-state content of ribosomal RNA precursors in WT, Sp-rpa49Δ,
11
and Sp-rpa49Δ with Sp-Hmo1 over-expression. The 35S rRNA level was partially recovered
upon Sp-Hmo1 over-expression with no effect on other downstream precursors. Thus, growth-
budding yeast Pol I. Hmo1 is also involved in the regulation of ribosomal protein gene (RPG)
expression (Berger et al, 2007). UBF1 and Sp-Hmo1 are unable to stimulate RPG expression,
as judged by the lack of rescue of hmo1Δ rps23aΔ lethality (Figure 6A). Therefore, Hmo1,
UBF1, and Sp-Hmo1 appear to share a common role in Pol I transcription. Upon sequence
alignment we identified a conserved region (CR) that may be required for an ancestral
function of these three proteins (Figure 6B). To better define the minimal core of Hmo1
necessary for Pol I activation, we generated a set of Hmo1 deletions (Figure 6C): Box A,
comprising only the first 90 residues of Hmo1; Box AB, lacking the C-terminal domain and
the CR; and “Hmo1ΔCR” containing an internal deletion spanning the CR and “Hmo1ΔC”;
and removing the last 36 residues which has been previously shown to have a no growth
phenotype (Lu et al, 1996). We expressed the four deletion constructs in two mutants in
which Hmo1 is essential, hmo1Δ rpa49Δ and hmo1Δ rps23aΔ (Figure 6C). Hmo1 and
Hmo1ΔC suppress lethality in both backgrounds whereas Hmo1ΔCR only restores growth in
the hmo1Δ rps23aΔ mutant. Without the conserved region, Hmo1 is unable to rescue lethality
in an hmo1Δ rpa49Δ strain. Therefore, each of the three HMGB proteins share a minimal
conserved core domain, which is required in Hmo1 to support growth in a Pol I-mutant
background. We propose that, in addition to HMG boxes, the presence of the conserved
12
region domain and the functional interaction with Pol I, may define a new sub-family of
proteins, termed “HMGB-P”, for HMGB transcription factors stimulating Pol I activity.
lethal at 25°C. Upon over-expression of Hmo1, growth is rescued (Gadal et al, 2002). Over-
expression of UBF1 and Sp-Hmo1 also rescue the rpa49Δ growth defect (Figure 7A). In both
yeast and human cells, approximately half of the rRNA coding genes are simultaneously
1993), or Miller chromatin spreading analyses (Osheim et al, 2009). In human cells, UBF1
regulates the number of active copies in a dose-dependent manner (Sanij et al, 2008). We thus
investigated the possibility that HMGB proteins regulate the number of active genes in S.
cerevisiae. In the absence of Rpa49, the ratio of active/inactive copies is similar to the
isogenic Wild-type strain (BY4741; data not shown). Psoralen analysis shows that expression
of Hmo1 or UBF1 in rpa49Δ increases the number of active genes (Figures 7B and C). This
finding is consistent with previously published data suggesting a regulatory function of UBF
and Hmo1 in regulating the chromatin structure of rRNA genes (Sanij et al, 2008; Wittner et
al, 2011).
From the above results, the rescue of rpa49Δ strain by overexpression of HMGB-P proteins
could be explained by the increase of open rDNA genes. In a previous study, we documented
13
that the rpa49Δ mutant phenotype is alleviated when artificially decreasing the copy number
of the rRNA gene from 200 to 25 (Albert et al, 2011). This drastically increased the ratio of
open/closed rDNA genes, but resulted in a reduced number of active genes. To investigate
open rRNA gene number, we next tested whether overexpression of these proteins rescued a
growth defect associated with rpa49Δ mutant while all rDNA genes were active. Using
psoralen cross-linking analyses, we first confirmed that all genes adopt the open chromatin
further improved the growth of rpa49Δ in a 25 rRNA gene copy number strain (Figure 7E).
Therefore, in a context where all rRNA genes are active, over-expression of HMGB protein
can further suppress a Pol I mutant related growth phenotype. These data suggest that
HMGB-P proteins can stimulate rDNA transcription via another mechanism besides
Since HMGB-Ps are expected to act in the chromatin context of rRNA genes, we investigated
the possibility that nucleosomes inhibit Pol I activity in a rpa49Δ background. Indeed, the
strong reduction in Pol I density per gene in rpa49Δ could lead to an increased density of
HMGB-Ps could then interfere with this re-assembly (Wittner et al, 2011). To directly test
this possibility, we used the 25 copy strain, which has a very low nucleosome density (Merz
et al, 2008). We characterized by ChIP the occupancy of histones H3 and H2B on rDNA, in
the presence or absence of Rpa49 in a low-copy strain. Using optimized ChIP protocol for
rDNA, we could immunoprecipitate over 10% of the total rDNA with histones H3 and H2B
(Figure 7F). Note that 10% of total DNA is still significantly lower than yield obtained with
nucleosome density at open rRNA genes (Wittner et al, 2011). In agreement with the presence
14
of H3/H4 in UAF complex, a promoter-bound transcription factor, H3 is preferentially
associated with the Pol I promoter (Keener et al, 1997). In absence of Rpa49, we did not
detect significant changes in H3 and H2B loading on rDNA compared with wild-type (Figure
7F).
This prompted us to investigate the association of the yeast homologue to linker histone H1 in
metazoan Hho1 with the 25 copies of rRNA gene loci. Hho1 is encoded in budding yeast by a
single non-essential gene and is enriched in rDNA. Hho1 could be required for normal rDNA
compaction and processing of Pol I (Levy et al, 2008). Analysis of occupancy of Hho1 in a
WT strain showed a specific enrichment on the 35S coding region (Figure 7G). In the absence
of Rpa49, we detected a two-fold decrease of Hho1 association with rDNA (Figure 7G; see
In conclusion, in a strain with a reduced rDNA copy number, which are nearly all actively
transcribed, we observe no differences in core histone association in a RPA49 wild type and
deletion backgrounds . However, association of the putative yeast linker histone, Hho1 is
decreased in the rpa49Δ strain. These findings suggest that HMGB-Ps could act via a
mechanism other than modifying the core histone recruitment to rDNA genes.
Active rDNA genes have a chromatin organization that is permissive for Pol I transcription.
25copy-rpa49Δ, we used the only method allowing visualization and characterization of Pol I
loading on rDNA at a single molecule level (Osheim et al, 2009). We analyzed the rDNA
15
strain. A low Pol I occupancy compromises the morphological identification of rRNA
transcription units. Even when all genes are actively transcribed in the absence of Rpa49,
identification of individual genes is technically challenging (Albert et al, 2011). We had even
more difficulties to identify nucleolar regions (Miller trees) after spreading the rpa49Δ mutant
that overexpressed Hmo1. Indeed, while Hmo1 rescues the growth phenotype of a rpa49Δ
mutant, its over-expression decreases the polymerase density from 36+/-5 to 17 +/-6
polymerases per gene (Figure 8A). Since Miller spreads only reveal a snapshot of the kinetic
events of Pol I transcription, the decrease in Pol I density per gene could result from
decreased initiation, or increased elongation rate. The growth defect of the rpa49Δ mutant is
density per gene. We conclude that this reveals a stimulation of elongation rate. We next
evaluated the Pol I occupancy on Miller’s trees obtained from an 25-copy rRNA gene strain
with or without over-expression of Hmo1. In such strains, rDNA transcription units, identified
on the basis of their repetition and Christmas trees morphology, are easily detectable. Our
statistical analyses confirmed that Hmo1 overexpression leads to a decrease in Pol I loading
rate on active genes (Figure 8B). In conclusion, our results suggest that HMGB-Ps allows a
stimulation of Pol I elongation. This stimulation is detectable at a single gene level with wild-
type Pol I, but without any detectable growth phenotype. However, this stimulation became
16
DISCUSSION
In eukaryotic cells, the transcription of the repeated rDNA genes by RNA polymerase I (Pol I)
is the first step of the very complex process of ribosome biogenesis. The extreme efficiency of
this enzyme as well as its fine regulation occur at different levels: availability and
active genes, number of polymerases per gene, and chromatin status of the rDNA locus. In the
present study, we combined multiple approaches to better define the role of HMGB proteins
acting as Pol I transcription factors. We provide evidence that HMGB proteins may increase
demonstrated that the HMGB proteins: Hmo1 from budding yeast, Sp-Hmo1 from fission
yeast, and UBF1 from human cell, all share the capacity of stimulating Pol I activity. Despite
overall low sequence similarities, these three proteins share a similar domain organization and
their common capacity to stimulate Pol I activity might be provided by a conserved region.
This region could contact activation factors for Pol I or recognize topological features of the
rDNA gene (see below). However, since this region is proximal to the consensus HMGB
motif, we hypothesize that it might be essential for regulating the chromatin state of rDNA
genes to facilitate transcription by Pol I. The presence of such a conserved motif may define a
novel sub-type of HMGB proteins, the HMGB-P, for HMGB proteins acting as Pol I
transcription factors. The functional conservation of this motif, however, has yet to be
17
demonstrated. The finding that HMGB-Ps exist in three evolutionarily distant organisms
suggests that eukaryotes could have an ancestral HMGB-P factor, stimulating Pol I activity by
Evidence that HMGB-Ps help Pol I elongation is provided in budding yeast (Gadal et al,
2002), fission yeast (this work), and in humans (Stefanovsky et al, 2006). The truncated
versions of Hmo1 allowed us to dissect two distinct in vivo activities of Hmo1: regulation of
ribosomal protein gene transcription and Pol I activation. Hmo1 is involved in many DNA-
polymerase I (Gadal et al, 2002) and RNA polymerase II (Berger et al, 2007; Hall et al,
2006b; Kasahara et al, 2008; Kasahara et al, 2007). In contrast, UBF1 does not stimulate
ribosomal protein gene expression but suppresses the Pol I deletion phenotype upon
heterologous expression in yeast. Therefore, Hmo1 is an HMGB-P but has acquired other
species-specific functions in budding yeast. UBF1 acts at multiple steps of the Pol I cycle in
human cells. UBF1 has an established function during Pol I elongation (Stefanovsky et al,
2006) but has been primarily described as a key player in Pol I initiation (Paule, 1998). We
have no evidence of the function of Hmo1 in Pol I initiation. When expressed in human cells,
budding yeast Hmo1 and UBF colocalise throughout the cell cycle but Hmo1 cannot
recapitulate the essential function of UBF. The colocalization of UBF and Hmo1 could
suggest a physical association of both proteins in human cells. UBF1 contains at least five
HMG boxes, with only the first two being conserved in Hmo1. The requirement for more than
two HMG boxes in humans is well established and