0% ont trouvé ce document utile (0 vote)
15 vues357 pages

Étude de l'Organisation et Transcription des Gènes d'ADN Ribosomiques

Transféré par

sakerhadjer07
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
15 vues357 pages

Étude de l'Organisation et Transcription des Gènes d'ADN Ribosomiques

Transféré par

sakerhadjer07
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

%N VUE DE LOBTENTION DU

%0$503"5%&-6/*7&34*5²
%0$503"5%& -6/*7&34*5²%&506-064&
%&506-064&
$ÏLIVRÏ PAR 
Université Toulouse III Paul Sabatier (UT3 Paul Sabatier)
 $ISCIPLINE OU SPÏCIALITÏ 
Biologie cellulaire et moléculaire

0RÏSENTÏE ET SOUTENUE PAR 


BENJAMIN ALBERT
LE  20/12/11à 14h00
4ITRE 

Étude de l'organisation spatiale et de la transcription des gènes d'ADN


ribosomiques

%COLE DOCTORALE 
Biologie, Santé, Biotechnologies (BSB)
5NITÏ DE RECHERCHE 
UMR5099
$IRECTEURS DE 4HÒSE 
Olivier Gadal
2APPORTEURS 
Cosmin Saveanu (Chercheur à l'institut Pasteur)
Patrick Heun (Max Planck Institute of Immunobiology and Epigenetics, Freiburg)
MEMBRES DU JURY :
Michel Werner (Directeur de Recherche CEA)
Christophe Lavelle ( Chercheur au Museum National d'Histoire Naturelle, Paris)
Pierre-Emmanuel Gleizes (Professeur UPS, Toulouse)
Olivier Gadal (Chercheur Laboratoire de Biologie Moléculaire Eucaryote, Toulouse)
REMERCIEMENTS


On a que trop rarement l’occasion de remercier ses proches alors je ne me


priverai pas ici de remercier ma famille. Un grand merci à mon père, ma mère, les
cousines, tantes, oncle, mes sœurs, mon frère, les pièces rapportées en tout
genre… j’ai essayé d’être le digne représentant des comportements déviants de
notre fratrie du 78. J’ai une pensée toute particulière pour mon grand-père qui a
fait les dix de ders pendant ma thèse et pour ma grande mère, qui a été ma
première supportrice pendant ces quatre années.

   

     !                      
  """
  &   


Lors de mon rite initiatique à la recherche, plus communément appelé master 2,


les premiers mots de notre enseignant/gourou ont été les suivantes : « vous
faites désormais partie de l’élite » (Denis Milan, 2007). Du fait de ces paroles
prêchées par un con…vaincu, il me semble primordiale avant toute chose de
souligner l’incroyable chance que j’ai eu de faire une thèse faisant de moi un
privilégié plutôt qu’un individu appartenant à une quelconque élite. Elle me fut
permise par ma famille, l’université publique et les enseignants qui la compose, les
chercheurs que j’ai rencontré et enfin financé par la solidarité (impôts et
donation privé). Alors je laisserai à ces chantres de la « méritocratie
autoproclamé » leur égoïste fatuité, je voudrais ici simplement remercier tout
ceux qui ont contribuer plus ou moins directement à mon diplôme de doctorat.

$    '       ! 


         "%


   #   '  # 

Le travail que j’ai effectué dans le laboratoire d’Olivier n’aurait aucun sens si je
n’évoquais pas les personnes qui ont fait mon quotidien pendant ces quatre
années. Ils furent la raison, la cause et la conséquence de l’aboutissement de ma
thèse. Il serait stupide de réduire ces années à la compréhension du
fonctionnement de l’ARN polymérase I, cette thèse fut avant tout une aventure
humaine animée par le seul fait de la curiosité et du plaisir de travailler
ensemble. Je ne pense pas être capable d’avoir les mots à la hauteur des
remerciements que je voudrais adresser à chacun ni de dresser une liste
exhaustive de l’ensemble des personnes que j’ai apprécié croiser, je m’excuse par
avance pour les mots ou les personnes oubliées que je n’oublierai pas.



D'une façon générale cette thèse est dédicacée à tous ceux qui ont supportés
quotidienement le claquement de mes tongues, mes blagues, mes discussions
politiques, mon obsession pour l’UMP, la musique trop forte, avec qui mes
rapports furent aussi divers qu'enrichissants.


« Un génie, deux associés, une cloche » (Film Italien 1975, Sergio leone)

Je ne peux évidemment que remercier mon équipe et tous les gens qui en ont fait
partie. Olivier tu as fait le choix (ou le non choix) d’un étudiant qui s’est défini
comme une personne incompétente, je t’en remercie et j’espère t’avoir rendu la
confiance que tu m’as accordé. Je te remercie également pour le chef que tu as
été et l’ami que tu es. Enfin, je te remercie d’avoir construit une équipe, qui je le
crains, ne me laissera que des regrets. Merci, à vous les deux Christophes, du 16
eme arrondissement à l’Ariège, du col de la chtouille à Jean Emmanuelle, des
jalons bien placés à ma dent déplacé… Merci pour tout, j’espère vous rendre un
jour ce que vous m’avez donné parce « qu’à la base, j’étais pas fait pour ça » (le
rocker).

« Un génie, deux associés, une cloche »… et la fille. (Film de charme Savoyard 2008)

Merci à toi Isabelle, j’ai véritablement apprécié travailler avec toi mais j’ai
surtout adoré la personne que tu es, et même si nous nous sommes pas promener
le long du canal avec un carton sur la tête je ne pense pas que tu aies besoin de
cela pour savoir tout le bien que je pense de toi. Merci beaucoup.

Merci à tous les membres de l’équipe Gadal, présents, futurs, passés, Céline,
Hicham, Mathieu, Adrien, Sylvain, merci Elodie pour ton attention culinaire lors
de ma thèse, je ne serai probablement pas à la hauteur pour la tienne. Merci à toi
Jorge, ta rencontre fut un réel plaisir et je te souhaite à toi et ta petite famille
que du bien.
Je remercie Odile (et son petit Ricard) pour tous ces verres d’eau (ou de whisky)
et ces cafés que nous avons fumés ensemble sur les marches, et que nous
continuerons, j’espère, à partager autre part que sur un escalier. J’en profite
ainsi pour remercier les fumeurs du bâtiments avec qui j’ai adoré ne pas fumer.

Merci aux travailleurs du RDC, Isabelle, Imen j’ai appris à vous apprécier
pendant ma thèse et je ne regretterai pas ces moments que nous avons passé les
cheveux au vents en train de gratter du champignon. Merci aussi à Hicham qui
s’est malheureusement converti au cours de sa thèse mais qui reste mon libanais
préféré, à Franck avec qui j’ai trouvé un partenaire pour m’adonner à certains
vice, à Lucas pour sa gentillesse et ses promenades bucoliques entourées de CRS,
et merci aux autres bystrickettes Mathieu, Sylvia, Anne Claire.

Merci à Magalie et Thomas, je ne perd pas espoir que l’on puisse partir un jour
sur l’autre continent…

Je remercie Michou à qui je souhaite une heureuse retraite, à Safi, Cathy pour
votre patience à devoir gérer l’inconséquence administrative de chacun et
surtout pour votre gentillesse. Merci à David, qui en plus d’être un grand
footballeur, est aussi capable de cadrer les photos. Merci aussi à tout les
« tecnikciens » qui rendent la vie plus facile avec le sourire.

Je n‘oublierai pas tous les gens qui n’ont pas de noyau du LMGM avec qui j’ai
partagé de très bon moments; Pascal, Philou, Mimi, Delphine, JC (et Anita), le
petit Stouch avec qui j’ai adoré travailler et à qui je souhaite que ses problèmes
d’alcool se règlent au plus vite, sans évidemment oublier miss Nolivos (qui ne m’a
pas remercié dans sa thèse mais que j’aime bien quand même).

Merci à Mathieu et à Elodie, vous êtes des personnes d’une simplicité reposante,
merci pour tout.

Je remercie également les gens du second Celia, Clément, Yasmine, Marie,


Régine, Yves, merci à Patrice et Sylvain (ou l’inverse), Coralie, Lisa qui ont eu la
gentillesse de venir à ma soirée de thèse, Guillaume et Coco avec qui j’ai adoré
partager des fous rires, et merci bien entendu à Bilou. Je voudrais aussi
remercier Natalia à qui je souhaite bonne chance.

Je remercie évidemment les gens qui ont fait partie de l’association du « dernier
verre » dont le président Stéphane labialle est ce que le Rag time est aux nuits
toulousaines, c’est à dire unique. Merci Stéphane et Claire pour tout ces bons
moments, ces discussions avec ou sans alcool. Merci aussi à toi Gaelle pour le
lavage de cerveau de Christophe, le macumba, ta bonne humeur et plus
généralement le plaisir que l’on prend à passer du temps ensemble.
Un grand Merci à une certaine Vanessa Khemici de m’avoir prouvé que le
syndrome de Stockholm existe, en espérant que ma séquestration se poursuive le
plus longtemps possible.

Et enfin, un grand merci à mes trois camarades qui ont été là « depuis le début »,
Ambre, Alan et Romain et leurs moitiés respectives, je serai court mais je n’en
pense pas moins. Je vous remercie sincèrement…

Merci….
Préambule

La production des ARN ribosomaux (ARNr) est une étape fondamentale dans la
biogenèse des ribosomes et représente près de 60% de l’activité transcriptionnelle.
Cette activité a lieu au sein du nucléole qui est une structure dynamique variant de
volume selon la croissance, et conservée dans le monde eucaryote. La production
des ARNr et la formation du nucléole sont entièrement dépendantes de l’activité d’un
unique complexe multiprotéique : l’ARN polymérase I (ARN pol I). Au cours de ma
thèse nous avons étudié le fonctionnement de l’ARN pol I chez la levure de bière S.
cerevisiae à différents niveaux allant du rôle des sous unités composant ce complexe
multiprotéique, à sa matrice d’ADN jusqu'aux rôles des gènes d’ADNr dans
l’organisation tridimensionnelle du génome.

Cette introduction de thèse se déclinera donc en trois parties traitant chacun de ces
aspects. Nous commencerons par décrire les constituants et le fonctionnement de la
machinerie de transcription de l’ARN polymérase I, dans une deuxième partie nous
parlerons de mécanismes permettant de réguler sa transcription. Enfin nous
discuterons de l’organisation spatiale des génomes eucaryotes et plus
particulièrement celui de S. cerevisiae.

 
C hapitre I :

Structure et fonctions de l’ARN polymérase I

Préambule………………………………………..……………………………………..…..1

I-Structure conservé de l’ARN polymérase I……………..……………...….3

I-1-Conservation évolutive des ARN polymérases……………..……………..…….3


I-2- Les ARN polymérases nucléaires eucaryotes……………..……………..…….6
I-3-Sous-unités spécifiques des ARN polymérases eucaryotes………….…..…..7

II- Transcription par l’ARN polymerase I……………..……………..…....…..8

II-1- ARN Pol I et la biogenèse des ribosomes……………..……………..….…….11


II-2- transcription de l’ARN Pol I spécifique d’une région nucléaire: le nucléole
II-2-a-le nucléole : « une usine à transcription »……………..…..….…….12
II-2-b-Structure du nucléole……………..……………..…..…..…..….…….13
II-2-c-Dynamique nucléolaire……………..……………..…..…..…..…..….14
II-3-L’unité de transcription……………..……………..……………..…..…..…..…...15
II-4-Le locus d’ADNr……………..……………..……………..……………..…..……...18
II-5-Réplication et maintien du nombre de copie du locus d’ADNr……………..18
II-6- Initiation de la transcription par l’ARN polymérase I……………..……..…..21
II-6- a- Formation du complexe d’initiation chez S. cerevisiae………..…21
II-6- b- Recrutement de l’ARN polymérase I……………..………………..24
II-6- c- Formation du complexe d’initiation chez les mammifères……….25
II-7- Elongation de l’ARN polymérase I……………..……………..…………………26
II-8-Topoisomérase et transcription ARN Pol I. ……………..…………...…..…...28
II-8-a-les topoisomérases. ……………..……………..………………..…..28
II-8-b-les topoisomérases et transcription par l’ARN Pol I. ……………..29
II-9- Terminaison de la transcription……………..……………..……………..…….32
II-10- Recyclage de l’ARN polymérase I……………..……………..………………..35

 
III-Fonction des deux sous-unités spécifiques de l’ARN Pol I………38

III-1-Sous-unités spécifiques de l‘ARN polymérase I : Rpa34 et Rpa49……….38


III-2-Conservation évolutive de Rpa34 et Rpa49 ……………..……………………38
III-3-Rôle des sous-unités spécifiques de l’ARN Pol I ……………..…..…..…….43

C HAPITRE II:

Régulation de la transcription par l’ARN

polymérase I

Préambule………..……………..……………..…….………..……………..……..…….45

I-Régulation de l’initiation………..……………..……………..…….….……..…45

I-1-Rrn3 et la voie TOR………..……………..……………..…..…………………....…46


I-2-TFIIH………..……………..……………..…….………..……………..………………50

II-Facteurs d’élongation impliqués dans la transcription par l’ARN


pol I. ..……………..…..……………..…..……………..……..…..……………..….……51

II-1-Facteurs d’élongation de l’ARN Pol II …..……..…..……………..……….…….51


II-2-Facteurs d’élongation communs à l’ARN Pol I et à l’ARN Pol II ……………51
II-3-Spt4/Spt5…..……..…..……………..………..……..…..……………..……..………55
II-4-Spt6…..……..…..……………..………..……..…..……………..……..…………..…58
II-5-Spt16…..……..…..……………..………..……..…..……………..……..……..….…58
II-6-Paf1c…..……..…..……………..………..……..…..……………..………..……..…..61
II-7- La nucléoline …..……..…..……………..………..……..…..……………..……….63

III-Régulation Chromatinienne..……..…..…..……..…..…..……..…..…………64

III-1-Dynamique du locus d’ADNr : rôle du ratio copies actives/inactives……65

 
III-2-Composition chromatinienne des gènes actifs. ..……..…..…..……..…..…70

III-2-a- Chez S. cerevisiae .……..…..…..……..…..…….……..…..…..……..…..…..71

III-2-b- Chez les Mammiferes..……..…..…….……..…..…..……..…...……..…..…..73

III-2-c-Physarum polycephalum : retour vers le futur…..……..…...…….....…….73

III-2-d-Structure chromatinienne alternative des gènes actifs ? …..……..…...…73

IV-Hmo1 et UBF: protéines caractéristiques des gènes actifs en


transcription. .…..…….……..…..…..……..…...……..…....……..…...……..………74
IV-1-Les protéines HMG.…..…….……..…..…..……..…...……..…..….…..…….…...77
IV-2-Les protéines HMGB..…….……..…..…..……..…...……..…..….………….……78
IV-3- UBF1..…….……..…..…..……..…...……..…..….…..…..…….……..…..…..……80
IV-3-a-généralité..…….……..…..…..……..…...……..…..….…..…….……80
IV-3-b-Structure d’UBF..…….……..…..…..……..…...……..…..….…….…81
IV-3-c- UBF : un facteur d’initiation..…….……..…..…..……..…...……..…84
IV-3-c-UBF et structure chromatinienne..…….……..…..…..……..…...…..84
IV-4-Hmo1..…….……..…..…..……..…...……..…..….…..…….……….…..…..………87
IV-4-a-Hmo1 et stabilité génomique. ..…….……..…..…..……..…...……..88
IV-4-b- Hmo1 et transcription Pol II..…….……..…..…..……..…...……..…89
IV-4-c- Hmo1 et transcription Pol I..…….……..…..…..……..…...……......90

C HAPITRE III:

Organisation nucléaire chez la levure S.


cerevisiae

Préambule..…….……..…..…..……..…...……..…..….…..…….………..…..……..….93

I- Structure et organisation de la chromatine. …..…..….…..………..….95


I-1-a-l’ADN..…….……..…..…..……..…...……..…..….…..…….………..…..……..….95

 
I-1-b- Histones, variant d’histones et protéines HMG…..…..……..…...…………97
I-2-Compaction de la chromatine. ..…….……..…..…..……..…...……..…..….……99
I-2-a-Nucléosome et la fibre de 10nm…..…..……..…...……..…..……..…99
I-2-b-Compaction sans histones…..…..……..…...……..…..……..…...…100
I-2-c-De la fibre de 30nm à l’organisation de la chromatine…..…..…….101
I-3-Organisation nucléaire des chromosomes. …..…..……..…...……..…..…….104
I-3-a-Euchromatine et hétérochromatine. …..…..……..…...……..…..….104
I-3-b-territoire chromosomique …..…..……..…...……..…..……..…...…..106
I-3-c-Territoire chromosomique chez S. cerevisiae…..…..……..…...…..112
I-4- Dynamique de la chromatine…..…..……..…...……..…..……..…...……..……115
I-4-a-Variation de la composition protéique de la fibre d’ADN…..…..….115
I-4-b-Mouvement de la fibre chromatinienne ..…..………………..…..….115

II- Éléments structuraux de l’architecture nucléaire et régulation


positionnelle. …..…..……..…...……..…..……..…...……..…..……..…...………..118
1-Eléments structuraux de l’architecture nucléaire…..…..……..…...……..……118
II-1-a- Matrice nucléaire..…….……..…..…..……..…...……..…..….….…119
II-1-b- L’enveloppe nucléaire et la lamina…..…..……..…...……..…..…..119
II-1-c- Pores nucléaires..…….……..…..…..……..…...……..…..….…..…120
II-1-d- le centre organisateurs des microtubules…..…..……..…...……...120
II-1-e- Foyers télomériques ..…….……..…..…..……..…...……..…..……122
II-2-concept d’auto-assemblage…..…..……..…...……..…..……..…...……..……..123
II-3-Régulation positionnelle…..…..……..…...……..…..……..…...……...…..…….124
II-3-a-Caractère inhibiteur de la périphérie nucléaire…..…..……..…......127
II-3-b-Caractère activateur des pores nucléaire…..…..……..…...………128
II-3-c- Le concept des « usines à transcription »…..…..……..…...……..130

II-4-Le nucléole ; Facteur organisateur du génome et régulateur de la


transcription …..…..……..…...……..…..……..…...……..…..……..…...……..……132
II-4-a-Le nucléole : une usine à transcription..…...……..…...…...………133

II-4-b-Régulation péri-nucléolaire..…...……..…...…...……..…...…...…..136

 
P artie expérimentale

I- Rôle et conservation évolutive des sous unités spécifiques Rpa34


et Rpa49. ..…….……..…..…..……..…...……..…..….…..…….………...……..……139

I-1 Publication 2008..…….……..…..…..……..…...……..…..….…..…….…………..139

I-2 préambule Publication 2011..…….……..…..…..……..…...……..…..….…..…..140

I-3 Publication 2011..…….……..…..…..……..…...……..…..….…..…….…………..141

I-4 Discussion Publication 2011..…….……..…..…..……..…...……..…..….…..…143

I-4-a-Rpa49-∆ une souche de choix pour étudier l’élongation de l’ARN pol


I..…….……..…..…..……..…...……..…..….…..…….……………………..143
I-4-b-Contact entre ARN pol I ..…….……..…..…..……..…...……..…….144

II- Rôle et conservation évolutive des protéines HMGB sur la


transcription par l’ARN pol I. ..…….……..…..…..……..…...……..…..….…..145

II-1- préambule Publication..…….……..…..…..……..…...……..…..….…..…….…145


II-2- Publication..…….……..…..…..……..…...……..…..….…..…….…….…...…….145
II-3- Discussion Publication..…….……..…..…..……..…...……..…..….…..………148

III- Organisation tri dimensionnelle du chromosome XII de levure.


.……..…..…..……..…...……..…..….…..…….……...……..…..…..……..……….……148

III-1- préambule publication..…….……..…..…..……..…...……..…..….…..………148

II-2 publication..…….……..…..…..……..…...……..…..….…..…….…….…...……..149

III-3-discussion de la publication..…….……..…..…..……..…...……..…..….…….151

III-3-a- L’organisation du génome ; de la physique à la biologie……….151

III-3-b-Le nucléole, un facteur architectural du noyau ? …...……………152

 
IV-Organisation tri dimensionnelle des gènes d’ADNr..…….………153

IV-1-Stratégie d’étiquetage d’un gène d’ADNr..…….……..…..…..……..…...…154

IV-2-résultats..…….……..…..…..……..…...……..…..….…..…….…………………157

Discussion et perspectives

I- Sous unités spécifiques, topologie et protéine HMGB……..…......159

I-1-Contact entre ARN pol I, un mécanisme d’élongation ? …..…..……..….....159

I-2-Structure chromatiniennes des gènes actifs…..…..……..…...……..…..……160

1-3-Hmo1 et UBF, facteurs topologiques de l’ADNr en transcription. …..……162

I-4-Hmo1 : une protéine multifonctionnelle…..…..……..…...……..…..……..…..168

II-Organisation tri-dimensionelle du génome de S. cerevisiae.……169

II-1-Le 3C et la microscopie, deux approches complémentaires…..…..……….170

II-2-De l’étude du nucléole à l’ADNr…..…..……..…...……..…..……..…...……….171

II-3-Organisation de l’ADNr…..…..……..…...……..…..……..…...……..…..……...172

Références

 
Annexe

Nuclear organization and chromatin dynamics: collapsed polymers or


biologically driven interactions?
Benjamin Albert, Isabelle Léger-Silvestre, Christophe Normand and Olivier Gadal1,2

Regulation of ribosomal RNA production by RNA polymerase I: Does


elongation come first?
Benjamin Albert, Jorge Perez-Fernandez, Isabelle Leger-Silvestre and Olivier Gadal

Two RNA Polymerase I Subunits Control the Binding and Release of Rrn3
during Transcription.
 )) #"+. '$ , ""+. "+0#(%+/
  +. $ ++!#! +/   # #&-

 
A bréviation


35S : Précurseurs des ARNr 25S, 18S et 5,8 chez S. cerevisiae
aa : Acides aminés
ADN : Acide désoxyribonucléique
ARN : Acide ribonucléique
ARNm : ARN messager
ARNr : ARN ribosomique
ARNt : ARN de transfert
ADNr : Locus d’ADN ribosomique
Rpa : « RNA polymerase A »
CTD : « Carboxy Terminal Domain »
UTP : « U three protéins »
FC : Centre fibrillaire
DFC : Composant Fibrillaire Dense
GC : Composant Granulaire
ETS : « external transcribed sequence »
ITS : « internal transcribed sequence »
ARS : « autonomously replicating sequence »
RFB : «réplication fork barrier
IGS : « Intergenic Spacer »
E-Pro : « Enhancer Promoter »
Fob1 : « FOrk Blocking »
TIF : « transcription intermediary Factor »
CAST : « CD3e-associated signal transducer »
PAF : « Polymerase Associated Factor »
TOR : « Target Of Rapamycine »
Spt : « Supressor of Ty »
CF : « Core Facto r »

 
Kb : Kilo base
kDa : Kilo Dalton
NTS : « Non-Transcribe Spacer »
ORF : : « Open Reading Frame »
PAF : « Pol I Associated Factor »
PCR : « Protein Chain Reaction
UAF : « Upstream Activating Factor »
UBF : « Upstream Binding Factor »
TTF-I : « Transcription Terminaison Factor »
TAF : « TBP associated Factor »
TBP : « TATA Binding Protein »
TFIIB : « Transcription Factor of RNA polymerase II, B »
TFIID : « Transcription Factor of RNA polymerase II, D »
TFIIS : « Transcription Factor of RNA polymerase II, S »
TFB : « Archeal Transcription Factor homologous to TFIID »
SL1 : « Selectivity factor 1 »
UV : Ultra Violet
TCR : « Transcription Coupled Repair »
ChEC : « Chromatin Endogenous Cleavage »
NER : « Nucleotide Exision Repair »
ChIP : « Immuno-Précipitation Chromatinienne »
ChIP on chip : « Immuno-Précipitation Chromatinienne sur puces à ADN »
3C : « Chromosomal Conformation Capture »
5C : « Chromosomal Conformation Capture Carbon Copy »
Hi-C : « Genome wide Chromosomal Conformation Capture »

 
C HAPITRE I:

Structure et fonctions de l’ARN polymérase I

Préambule

Le paradigme fondamental de la biologie moléculaire proposé par Francis Crick en


1958 s’appuie encore aujourd’hui sur l’existence universelle de mécanismes
permettant la conversion d’un ADN en ARN (Crick, 1958). L’année suivante, Weiss
valide cette hypothèse découvrant dans des cellules de mammifères une activité
ARN polymérase ADN dépendante (ARN pol) (Weiss and Gladstone, 1959). Cette
découverte fut suivie peu après par la purification d’ARN pol dans différentes
espèces de bactéries par Michael Chamberlin et Jerard Hurwitz, corroborant ainsi le
postulat initial de Crick de l’existence d’ARN pol dans tous les organismes
(Chamberlin and Berg, 1962). D’intenses recherches ont ensuite été consacrées à la
caractérisation de ce complexe multi-protéique. Ces investigations furent
récompensées en 1959 par le prix Nobel de médecine attribué à l’espagnol Severo
Ochoa pour la caractérisation d’une ARN pol qui de manière anecdotique se révéla
une décennie plus tard, être une enzyme de dégradation (Ochoa, 1959) .

Dans les années soixante, les travaux menés sur la bactérie Escherichia coli ont
permis de dévoiler les premières ébauches structurales d’une ARN pol. Cette
enzyme est alors décrite comme un complexe de grande taille (0.5 MDa) formant
une structure catalytique appelée « core enzyme » se combinant avec une famille de
facteurs σ assurant la reconnaissance des promoteurs des gènes (Chamberlin and
Berg, 1962; Zhang et al., 1997). Il s’avérera par la suite que cette structure
« simplifiée » constituée de 5 sous-unités αNββ’ω est à la base de l’ensemble des
ARN pol ADN dépendantes multimériques du monde du vivant (Figure 1A). Depuis, il
a été établi que chez les archaebactéries, une enzyme unique est responsable de la
synthèse de l’ensemble des ARN cellulaires.

 M
A-

Bactérie Archée Eucaryote

B-

Plate-forme
d'assemblage
tige
pince
Machoire supérieure

Canal ADN

Machoire inférieure
Centre catalytique

Figure1: A- Structure générale des ARN pol bactériennes, archées, et eucaryotes. En bleu est
représenté "le core enzyme" commun aux trois ARN pol bactérienne, archée, et eucaryote. Les sous
unités supplémentaires communes retrouvées chez les Archées et les eucaryotes sont représentées en
violet. B- Structure générale de l'ARN pol eucaryote. Les domaines indiqués dans cette figure repré-
sentent les différentes régions conservées entre les ARN pol eucaryotes. (adaptée de Finn Werner et
DinaGrohmann, 2010)
Les travaux menés chez les eucaryotes ont mis à jour une situation plus complexe.
L’activité ARN pol n’est pas portée par un complexe enzymatique unique mais par
plusieurs. Chez les eucaryotes, la séparation de l’activité de transcription nucléaire
dans trois fractions protéiques distinctes et les travaux de Kedinger révélant une
sensibilité à l’α-amanytine différentielle selon les fractions testées, ont permis de
révéler l’existence de trois ARN pol nucléaires (Kedinger et al., 1970; Roeder and
Rutter, 1970).

I-Structure conservée de l’ARN polymérase I

I-1-Conservation évolutive des ARN polymérases

Les ARN pol sont retrouvées dans des organismes évolutivement distants expliquant
certains phénomènes de spéciation; cependant leurs modes de fonctionnement se
basent sur des processus hautement conservés au cours de l’évolution. Les
similitudes structurales et mécanistiques des ARN pol multimériques suggèrent que
le dernier ancêtre commun aux archées, bactéries et eucaryotes, avait une structure
proche de l’ARN pol trouvée actuellement chez la bactérie (Werner and Grohmann,
2011) (Figure 1A).
Les études biochimiques, génétiques et structurales sur S. cerevisiae ont fait que
l’ARN pol II de cet organisme est aujourd’hui la mieux caractérisée des ARN pol
eucaryotes. Pour cette raison, nous nous appuierons essentiellement dans cette
partie, sur des données concernant l’ARN Pol II de levure S. cerevisiae lorsque nous
parlerons des ARN pol eucaryotes. Cependant, étant donné la conservation des
différentes sous-unités des trois ARN pol eucaryotes, on pourra croiser les
différentes informations structurales d’une ARN pol à l’autre (Voir tableau 1).

 O
Bactéries Archées S. cerevisiae

ARN POL I ARN POL II ARN POL III


β RpoA Rpa190 Rpb1* Rpc160
β' RpoB Rpa135 Rpb2 Rpoc128
α RpoD Rpc40 Rpb3 Rpc40
α RpoL Rpc19 Rpb11 Rpc19
ω RpoK Rpb6 Rpb6 Rpb6
RpoF Rpa14 Rpb4 Rpc17
RpoH Rpb5 Rpb5 Rpb5
Sous-unités RpoE Rpa43 Rpb7 Rpc25
paralogues RpoM Rpa12 Rpb9 Rpc11
RpoN Rpb10 Rpb10 Rpb10
RpoP Rpb12 Rpb12 Rpb12
RpoG Rpb 8 Rpb 8 Rpb 8
Rpa34 Rpc31
Sous-unités Rpa49 Rpc34
spécifiques Rpc37
Rpc53
Rpc82

Tableau 1: Classification des sous-unités d'ARN pol bactériennes, archéennes, et de S.


cerevisiae. Les sous-unités spécifiques sont indiquées en rouge. *queue CTD.
L’ensemble des ARN pol bactériennes, archéennes et eucaryotes partagent les
sous-unités INββ’ω (Figure 1A). Ces sous-unités constituent le « core enzyme »,
elles sont essentielles à la fonction de transcription. Le core enzyme se structure
autour des deux grandes sous-unités ββ’ formant le site catalytique (Cramer et al.,
2008; Sweetser et al., 1987). Autour de ce « core enzyme», on retrouve des
polypeptides I qui sont requis pour les fonctions basiques de l’ARN pol. Parmi ces
fonctions, l’association avec l’ADN est essentielle et est permise par le canal ADN
qui est une structure d’environ 7nm chargée positivement. Compte tenu de sa
longueur, on estime qu’environ 20 paires de bases pourraient être engagées dans
une enzyme en cours d’élongation (Cramer et al., 2001; Rice et al., 1993). Le canal
d’ADN aboutit à la poche catalytique permettant de stabiliser la bulle de transcription
et d’ouvrir l’ADN en amont. Le « clamp » (la pince) permet, lors de sa fermeture, une
association efficace avec l’ADN (Figure 1B). Ce « core enzymatique » combiné au
facteur σ chez la bactérie est suffisant pour assumer une activité de transcription
spécifique. Autour de cette structure ancestrale, on retrouve chez les eucaryotes et
les archées un certain nombre de sous-unités qui ne sont pas directement impliqué
dans le processus catalytique. La plupart de ces composants structuraux optimisent
les fonctions essentielles de l’ARN pol en favorisant un repliement optimum des
sous-unités ou en facilitant les contacts avec la matrice d’ADN en cours de
transcription ou de l’ARN néosynthétisé.
Parmi ces domaines on distingue « le stalk » (la tige) surnommé ainsi du fait de la
protubérance qu’il forme au-dessus du « clamp » (Figure 1B). Cette structure,
absente chez la bactérie, permet d’augmenter l’ouverture du complexe enzymatique
au moment de l’initiation et de la processivité pendant l’élongation (Hirtreiter et al.,
2009; Naji et al., 2008). Une plate-forme d’assemblage est également requise chez
les ARN pol multimériques (Figure 1B). Chez les procaryotes, les 2 sous-unités α
suffisent à assumer cette fonction alors que les ARN pol eucaryotiques et archéenne
nécessitent deux sous-unités supplémentaires (Rpb10 et Rpb12). Deux
« mâchoires», peu développées chez les bactéries sont également présentes de part
et d’autre du canal ADN de l’ARN pol eucaryotes. La mâchoire supérieure, présente
chez la bactérie grâce au repliement de la sous-unité β, est davantage proéminente
dans le cas de l’ARN pol eucaryote du fait de la présence de la sous-unités Rpb9. La
mâchoire inférieure absente chez la bactérie est formée par Rpb5 et RpoH
respectivement chez l’ARN Pol II eucaryotes et chez les archées (Figure 1B) (Hirata

 Q
et al., 2008; Korkhin et al., 2009). Ces mâchoires interagiraient avec l’ADN et
participeraient aux changements de conformations de l’ARN pol entre la phase
d’initiation et l’élongation (Bartlett et al., 2004; Cramer et al., 2001).

Les ARN pol des trois royaumes bactériens, archéens et eucaryotes sont constituées
autour d’un ensemble de motifs conservés. L’ARN pol de bactérie permettant de
définir une ARN pol minimale correspondant à environ 25% de la masse totale de
l’enzyme eucaryote et archéenne. L’établissement des structures cristallographiques
de ces complexes enzymatiques a permis d’illustrer à quel point ils étaient
structurellement conservés. Dans ce sens, les trois ARN pol eucaryotes partagent
des structures très proches, et ne diffèrent que par un certain nombre de motifs
spécifiques de leurs fonctions. (tableau1)

I-2- Les ARN polymérases nucléaires eucaryotes

Chacune des 3 ARN pol nucléaires eucaryotes est dédiée à une fonction particulière.
L’ARN pol I est responsable de la transcription d’un gène unique codant pour le
transcrit précurseur des grands ARN ribosomiques (ARNr). Cette spécialisation de
l’ARN pol I semble être partagée chez tous les eucaryotes même si dans le cas du
trypanosome, l’ARN Pol I transcrit aussi des gènes codant pour des protéines de
surfaces (Gunzl et al., 2003). Contrairement à l’ARN pol I, l’ARN pol II se distingue
par la multiplicité des gènes dont elle assure la transcription (près de 90% du
génome). Ces transcrits sont sous la forme d’ARN messagers (ARNm), de petits
ARN nucléaires (snARN) et nucléolaires (snoARN). Il est maintenant clairement
établi que l’ARN pol II assure également la transcription de régions intergéniques
donnant naissances à des ARN cryptiques (Wyers et al., 2005). Enfin, l’ARN pol III
synthétise l’ARNr 5S, les ARN de transferts (ARNt) et un certains nombre de petits
ARN nucléaires non traduits (pour revue (Chédin et al., 1998)).

Comme nous l’avons expliqué précédemment, en dépit de leurs divergences


fonctionnelles, les ARN pol eucaryotes partagent une structure commune. Elles sont
toutes les trois constituées d’un cœur multimérique de 12 sous-unités comprenant le
« core enzyme bactérien » et des sous-unités paralogues. Les sous-unités dites
« paralogues » sont contenues dans une seule des trois ARN pol, mais possèdent un
homologue fonctionnel dans les deux autres ARN pol eucaryotes (tableau 1). Enfin,
on retrouve aussi les sous-unités dites « spécifiques » qui, comme leur nom

 R
l’indique, sont spécifiques de chacune des trois ARN pol eucaryotes.

I-3-Sous-unités spécifiques des ARN polymérases eucaryotes

L’ARN pol II se distingue des autres ARN pol par la présence sur la plus grande de
ses sous-unités d’une extension de la partie C terminal appelée « queue CTD ». Elle
est composée d’une structure peptidique très particulière constituée de répétions (27
chez la levure, 52 chez l’humain) d’une séquence consensus YSPTSPS (Allison et
al., 1988; Corden et al., 1985). De manière prévisible au regard de la structure des
autres ARN pol, cette structure n’est pas nécessaire à l’activité catalytique.
Cependant, la queue CTD est requise pour la croissance in vivo (Allison et al., 1988;
Zehring et al., 1988). Le rôle principal de la queue CTD est de constituer une plate-
forme de recrutement ou de stabilisation des facteurs nécessaires à la transcription
par l’ARN Pol II et à la maturation de ses transcrits. Ce rôle est régulé par des
activités kinases ayant pour cibles les répétitions des sérines de l’heptatide
consensus. La phosphorylation différentielle de la queue CTD est un mécanisme
spécifique de régulation de l’ARN pol II (Buratowski, 2003).
L’ARN pol III contient cinq sous-unités spécifiques partagées en deux groupes.
Rpc31/ Rpc34/ Rpc82 forment un complexe proche du « clamp » de l’ARN pol II
(Proshkina et al., 2006). En leur absence l’ARN pol III peut transcrire de manière non
spécifique, mais la transcription promoteur-dépendante est abolie (Wang and
Roeder, 1997; Werner et al., 1992). Elles semblent être importantes pour l’initiation
de la transcription (Thuillier et al., 1995). Le second groupe est composé des sous-
unités Rpc53 et Rpc37. Ces sous-unités spécifiques interagissent avec Rpc11 et
seraient impliquées dans la terminaison afin d’assurer un système de recyclage
efficace de l’ARN pol III entre la terminaison et l’initiation (Landrieux et al., 2006;
Proshkina et al., 2006).
L’ARN pol I contient deux sous-unités spécifiques Rpa34 et Rpa49 (Gadal et al.,
1997; Huet et al., 1975; Liljelund et al., 1992). La délétion de RPA34 n’entraine
quasiment aucun défaut de croissance ; a contrario, l’absence de Rpa49 confère un
phénotype de cryosensibilité et une croissance lente à 30°C. L’étude du rôle de ces
deux sous-unités spécifiques est un des axes de recherche détaillés dans cette
thèse. Dans le but de comprendre quels peuvent être leurs rôles spécifiques dans la

 S
transcription, nous allons nous efforcer de décrire dans la partie suivante la structure
et le fonctionnement de l’ARN pol I.

II- Transcription par l’ARN polymerase I

Préambule

L’ARN pol II transcrit la majorité du génome, alors que l’ARN pol I est spécifique
produit un seul type de transcrits, l’ARNr. Paradoxalement, en considérant le
pourcentage d’ARN produit dans la cellule, la tendance est inversée. En effet, l’ARN
pol I est la plus active en transcription et représente à elle seule, près de 60% de
l’activité transcriptionnelle de levures S. cerevisiae en croissance (Warner, 1999)
(Figure 2).
Pour assurer cette fonction essentielle, la transcription par l’ARN pol I présente
certaines spécificités. La transcription par l’ARN pol I se déroule dans une structure
nucléaire particulière : le nucléole (Figure 3A). De plus chacun de ces gènes peut
être transcrit de manière simultanée par plus d’une centaine d’ARN Pol I. Ces
propriétés permettent de visualiser les régions transcrites par l’ARN pol I en
microscopie électronique après étalement de la chromatine où l’on distingue les ARN
pol actives en transcription à la suite l’une de l’autre et flanquées d’un ARN néo
synthétisé (Miller and Beatty, 1969). Ces structures particulières ont été nommées
« arbre de Miller » (Figure 3B). Ces caractéristiques impliquent des mécanismes
d’initiation, d’élongation, de terminaison qui sont propres à la transcription par l’ARN
pol I.

 T
Activité
Génome
transcriptionnelle
0,5%
100% 100%
14%

26%
ARN POL III
ARN POL II 89%

ARN POL I 50% 50%

60%

10% 10%
10%

Figure 2: Représentation de l'activité de chaque ARN pol eucaryotes. L'activité transcription-


nelle de chacune des ARN pol eucaryotes est indiquée en pourcentage en fonction de l'activité
transcriptionnelle totale. La colonne de droite représente la taille des régions ciblées par chacune
des ARN pol par rapport à l'ensemble des régions transcrites. (Les pourcentages indiqués sont
tirés de Goffeau et al. 1996, Warner. 1999).
A-
Pores Nucléaires

Ribosomes

Nu
clé
ole
Nucléoplasme

Enveloppe
nucléaire

Cytoplasme
500nm

B-

5' 3'
Pre-ARNr naissant ARN pol I Boules terminales 400nm
30°C 37°C
C-

300nm 300nm

Figure 3: A- Coupe de noyau de levure S. cerevisiae après cryofixation observée en microsco-


pie électronique à transmission. On distingue clairement l'enveloppe nucléaire séparant le cyto-
plasme et le nucléoplasme. On peut noter l'importante densité en ribosomes dans le cytoplasme. Au
sein du noyau, le nucléole se distingue par sa densité aux électrons. (photographie obtenue par I.
Léger-Silvestre) B- Étalement de la chromatine d'un gène d'ADNr transcrit par l'ARN pol I. La position
5' et 3' du gène sont indiquées ainsi qu'un exemple d'ARN pol I, d'ARNr et de boules terminales.
(photographie obtenue par I. Léger-silvestre) C- Photographie de microscopie électronique de noyau de
S. cerevisiae après fixation chimique. La souche D306-5D présente un phénotype de thermosensibilité
induit par une mutation du gène codant dans la grande sous-unité Rpa190. Le passage à 37°C conduit
à une désorganisation du nucléole avec l'apparition de structure compacte et un décollement de l'enve-
loppe nucléaire (adaptée deTrumtel et al. 2000).
II-1- ARN Pol I et la biogenèse des ribosomes

Dans les organismes eucaryotes, la biogenèse des ribosomes est un processus


central et nécessaire à la croissance. Elle nécessite près de 80% de l’énergie dans
les cellules en prolifération et fait l’objet d’une régulation précise (Moss and
Stefanovsky, 2002). La perte du contrôle de la synthèse des ribosomes est d’ailleurs
un des aspects essentiels du développement tumoral puisqu’une production accrue
de ribosomes est nécessaire à la croissance et à la prolifération des cellules
malignes(Drygin et al., 2010).
Les ribosomes sont de larges complexes ribonucléoprotéiques de 4.2 MDa chez les
eucaryotes et 2.5 MDa chez les bactéries dont les ARN occupent près de 50% de la
masse moléculaire totale. Ils sont constitués de deux sous-complexes 60S et 40S
(Svedberg, unité de coefficient de sédimentation) qui sont tous deux produits dans le
nucléole avant d’être transportés séparément dans le cytoplasme. La petite sous-
unité 40S est composée de l’ARNr 18S auquel s’associent 33 protéines
ribosomiques ainsi que des facteurs d’assemblages. La sous-unité 60S est
composée des autres produits de maturation des transcrits de l’ARN Pol I (ARNr
28S, 5,8S), de l’ARNr 5S transcrit par l’ARN Pol III et de 49 protéines ribosomiques.
La biogenèse des ribosomes chez les eucaryotes est un processus largement
conservé au cours de l’évolution. Elle requiert une multitude d’étapes co-et post-
transcriptionnelles finement régulées et organisées dans l’espace et le temps. Une
description détaillée du processus de biogenèse des ribosomes sortirait du cadre de
cette thèse ; nous nous contenterons d’une description brève des étapes principales.
La biogenèse des ribosomes est initiée dans le nucléole où le précurseur des grands
ARN ribosomiques est synthétisé par l’ARN pol I. Cet ARN va alors subir des
modifications de bases à des positions précises via des petits ARN guides (les
snoARN). Ces snoARN vont permettre notamment des méthylations de l’oxygène en
position 2’ des riboses et des conversions d’uridines en pseudouridines (pour revue
(Lafontaine and Tollervey, 1998)). Cette maturation fait intervenir un grand nombre
de snoARN mais aussi d’une série d’exo et d’endonucléases aboutissant à la
production des formes matures des ARN ribosomiques de 18S, 5,8S et 25S. Dès les
étapes précoces de leur maturation ces ARNr sont associés à 78 protéines
ribosomiques et plus de 200 facteurs non ribosomiques. Le pré-ARNr complexé à
ces protéines formerait une particule de 90S (Udem and Warner, 1972). Ce

 MM
précomplexe va être ensuite converti en précurseurs des sous-unités de 40S et 60S
(Udem and Warner, 1972).

La synthèse des ribosomes requiert donc un couplage entre maturation et


transcription particulièrement efficace. L’existence de ce phénomène de couplage
explique la présence de boules terminales situées à l’extrémité des ARN naissants
synthétisés par l’ARN Pol I observées dès 1969 sur les arbres de Miller (Figure 3-B).
Malgré leur découverte précoce par Oskar Miller la nature moléculaire de ces
structures n’a été identifiée que récemment. Ces boules terminales ont été
renommées « SSU processsome » (Dragon et al., 2002) et contiennent le Sno ARN
U3 et les protéines UTP. Ces protéines UTP sont requises pour l’accumulation des
pre-ARNt, et se repartissent en trois sous-complexes UTP-A ou t-UTP, UTPB et
UTP-C. La déplétion des constituants du complexe UTP-A ou t-UTP réduit la
synthèse de l’ARNr 35S, suggérant une dépendance entre la transcription et la
maturation de l’ARNr 35S (Gallagher et al., 2004). Une étude ultérieure suggère que
les t-UTP ne provoquent pas un défaut transcriptionnel, mais entraineraient
rapidement la dégradation des pré-ARNs naissants par TRAMP et l’exosome (Wery
et al., 2009).

La biogenèse des ribosomes s’articule donc principalement autour du


fonctionnement de l’ARN pol I. Son fonctionnement est spécifique d’une région
singulière du noyau dédiée aux étapes précoces de biogenèse des ribosomes : le
nucléole.

II-2- transcription de l’ARN Pol I spécifique d’une région nucléaire: le nucléole

II-2-a-le nucléole : « une usine à transcription »

Le nucléole est le lieu d’activité de l’ARN pol I et conséquemment de l’accumulation


d’une énorme quantité de transcrits et de protéines impliquées dans leur maturation.
Cette abondance de particules ribonucléoprotéiques rend sa détection aisée, il fut
d’ailleurs identifié dès le 18ème siècle par Fontana(Fontana, 1781). 50 années plus
tard, le nom de nucléole lui fut attribué par Valentin (Valentin, 1836). Les progrès
technologiques, notamment en microscopie électronique, ont permis d’avoir une idée

 MN
précise de sa morphologie. Le nucléole apparaît comme une structure nucléaire
proéminente dense aux électrons après l’utilisation de contrastant comme le citrate
de plomb ou l’acétate d’uranyl (Figure 3A). Sur cette coupe de levure, on peut noter
le grand nombre de ribosomes dans le cytoplasme qui illustre parfaitement l’énorme
besoin en ribosomes de la cellule (Figure 3A).

II-2-b-Structure du nucléole

Le nombre et la forme du nucléole varient selon les organismes. Chez S. cerevisiae


on distingue une seule structure nucléolaire, chez les mammifères on peut compter
de 1 à 5 nucléoles. Cette différence s’explique par le fait que chez S. cerevisiae
l’ensemble du locus d’ADNr est porté par un seul chromosome alors que chez
l’Homme il est réparti sur différents chromosomes. Ces régions sont appelées les
NOR (Nucleolar Organizer Region) et sont considérées comme les domaines
organisateurs du nucléole (Bouteille and Hernandez-Verdun, 1979).
La structure nucléolaire présente une certaine hétérogénéité qui reflète l’existence de
trois sous-domaines. Le centre fibrillaire (FC) apparaît comme une région peu
contrastée contenant des fibrilles et entourés par une deuxième région ; le
composant fibrillaire dense (DFC) (Schwarzacher and Wachtler, 1993). Le nombre
de FC n’est pas constant et serait corrélé à l’état de croissance de la cellule. La
densité de FC au sein du nucléole irait en augmentant dans une phase de
croissance rapide (Schwarzacher and Wachtler, 1993). Le FC serait composé
essentiellement par l‘ADNr, l’ARN Pol I, les facteurs de transcription de l’ARN Pol I
(Schwarzacher and Wachtler, 1993) et des transcrits naissants d’ARNr peuvent aussi
y être trouvés (Thiry and Lafontaine, 2005).
Il a été proposé que la présence de FC ne serait pas partagée par l’ensemble des
organismes eucaryotes et serait apparu au cours de l’évolution. Ainsi, la levure ne
contiendrait pas de centre fibrillaire (Thiry and Lafontaine, 2005). Pourtant, des
images obtenues en microscopie électronique obtenues sur la levure S. cerevisiae
permettent de visualiser des structures similaires morphologiquement à des FC
(Léger-Silvestre et al., 1999).
Les FC sont entourés par une autre structure apparaissant plus dense aux
électrons : le composant fibrillaire dense (DFC). Il serait le lieu d’accumulation des
transcrits d’ARNr (Cmarko et al., 2000; Puvion-Dutilleul et al., 1997). La localisation

 MO
exacte de l’ARN pol I active en transcription est une controverse scientifique. Pour
Mais et ses collaborateurs la transcription aurait lieu uniquement dans le FC alors
que les travaux de Koberna et al. proposent qu’elle ait lieu dans le DFC, le FC serait
occupé par l’ADNr non transcrit (Koberna et al., 2002; Mais and Scheer, 2001). De
manière consensuelle, il paraît raisonnable de postuler que l’interphase FC/DFC est
le lieu de synthèse de l’ARNr dans le nucléole.
Enfin, en poursuivant cette description morphologique dans le sens de la progression
des étapes de biogenèse des ribosomes, on retrouve le DFC en contact avec le
composant granulaire (GC) (Cmarko et al., 2000). Dans cette région le pre-ARN,
sous forme de pré-ribosome, poursuit sa maturation par une série de clivage endo et
exo-nucléotidique et des modifications telles que des pseudo-uridinylations. L’ARNr
va alors poursuivre son assemblage avec les protéines ribosomiques responsables
de la formation de la grande et de la petite sous-unité. Au-delà du GC, les particules
pré-ribosomiques néosynthétisées sont libérées du nucléole, où elles sont retenues
(Gadal and Nehrbass, 2002). Elles sont ensuite exportées par le pore nucléaire. On
peut d’ailleurs noter la fréquence élevée de contact entre le nucléole et l’enveloppe
nucléaire chez la levure comme chez les mammifères (Geraud et al., 1989) (Figure
3A). Cette proximité pourrait favoriser les intenses échanges nucléo-cytoplasmiques
nécessaires à la synthèse des ribosomes, à la fois pour l’import des protéines
ribosomiques néosynthetisées et pour le recyclage des facteurs d’assemblage et
l’export des pre-ribosome tardifs (Lechertier et al., 2007). Les pré-ribosomes finissent
leur maturation dans le cytoplasme (clivage du 5.8s pour la 60S, modification de 20S
à 18S chez la levure ou 18S-E à 18S chez les mammifères).

II-2-c-Dynamique nucléolaire

Une différence importante entre les cellules de mammifères et les champignons


unicellulaires tel que S. cerevisiae tient au fait que ces derniers ont une « mitose
fermée » sans rupture de l’enveloppe nucléaire. Au contraire, celle-ci disparaît
pendant la mitose des cellules animales ou végétales. Chez les métazoaires, le
nucléole se désassemble pendant la prophase et se reconstitue en fin de mitose au
moment de la télophase. Il est à noter que certains composants nucléolaires
impliqués dans la transcription par l’ARN Pol I, comme UBF restent à proximité de
l’ADNr pendant la division (Roussel et al., 1996). En dehors du cycle cellulaire, le

 MP
nucléole n’est pas une structure stable mais une structure dynamique qui change de
taille et de morphologie selon les conditions de croissance. Ces changements de
morphologie sont le reflet de l’activité de cette « usine à transcription » (pour revue
(Hadjiolov, 1985; Schwarzacher and Wachtler, 1993). Des souches de S. cerevisiae
où l’ADNr génomique a été supprimé et inséré sur un plasmide transcrit par l’ARN
Pol II présente un nucléole désorganisé (Oakes et al., 1993; Trumtel et al., 2000). De
la même manière, le nucléole est désorganisé lorsque une souche contenant un
allèle thermosensible de la plus grande sous unité de l’ARN pol I est observée dans
des conditions restrictives (Figure 3C). Ce compartiment est donc spécifique et
révélateur de l’activité transcription de l’ARN pol I (Sirri et al., 2008).
Outre les changements de morphologie globaux du nucléole, les approches de
FRAP (Fluorescence Recovery After Photobleaching) ont aussi permis de souligner
la dynamique moléculaire au sein du nucléole (Phair and Misteli, 2000). Il a ainsi pu
être montré que le nucléole est soumis à un flux constant d’échange de protéines
avec le nucléoplasme. De plus, il est important de noter que le nucléole n’est pas
seulement impliqué dans les étapes précoces de la biogenèse des ribosomes. Les
expériences de spectrométrie de masse ont montré que le nucléole contient une
multitude de facteurs impliqués dans de nombreuses fonctions telles que la
réparation, la réplication, l’épissage (Andersen et al., 2005; Andersen et al., 2002).
Le nucléole par cette concentration interne de facteurs va servir à l’accomplissement
de certaines fonctions telles que la transcription de gènes codant pour des ARN de
transfert (Bertrand et al., 1998) ou la séquestration de kinases du cycle cellulaire
(Shou et al., 1999). A ce titre une dérégulation de l’activité de transcription de l’ARN
pol I entrainera une déstructuration du nucléole et aura un effet délétère sur la
biogenèse des ribosomes mais aussi des conséquences sur une pléiotropie de
fonctions cellulaires (Boisvert et al., 2007).

II-3-L’unité de transcription

Les gènes d’ADNr furent parmi les premiers gènes eucaryotes étudiés. Les gènes
d’ADNr de Xénope sont les premiers qui furent isolés (Birnstiel et al., 1966) et clonés
(Morrow et al., 1974). La structure générale des gènes ribosomiques peut être
divisée en deux régions : la région codant pour le précurseur des grands ARN
ribosomiques et les espaces intergéniques (IGS1 et IGS2) (Figure 4).

 MQ
A- S. cerevisiae

9,1kb 9,1kb

5S 18S 5.8S 25S 5S 18S 5.8S 25S

IGS1 IGS2
ADNr35S ADNr35S

RFB 5S ARS
E-PRO UAS CE
B-
-148 -50 -28 +8

Homo sapiens

43kb 43kb

18S 5.8S 28S 18S 5.8S 28S

ADNr45S ADNr45S

UCE CE
-156 -107 -45 +18

Figure 4: Organisation du locus d'ADNr. A- Représentation d'un tandem de gène d'ADNr de S. cerevi-
siae. La région entre les deux gènes d'ADNr contient les séquences d'initiation de la transcription. RFB:
Barriere de fourche réplication. E-PRO: promoteur bi-directionnel ARN pol II. UAS: Upstream activating
sequence. CE: « Control Element ». ARS: « autonomous replication sequence ». B- 2 Unités d'ADNr
d'Homo sapiens sont représentées. UCE: « Upstream Control Element ». « CE: Control élément ».
La taille des transcrits générés à partir de l’ADNr varie; il est d’environ 6 kb chez la
levure et de 13 kb chez les mammifères. Cette différence est essentiellement due à
la différence de taille des espaceurs externes (ETS) et internes (ITS) des régions
transcrites. Une fois transcrit, le précurseur est maturé pour aboutir aux formes
d’ARNr mature (28S, 18S et 5.8S chez les mammifères).
Les régions intergéniques contiennent les séquences responsables de la réplication
et de la transcription. Ainsi, on retrouve une origine de réplication et des régions
promotrices et terminatrices de la transcription par l’ARN pol I. Tout comme la région
transcrite, cette séquence intergénique a une taille variable allant de moins de 5 kb
chez la levure à plus de 30 kb chez l’Homme (Figure 4).
Chez la levure S. cerevisiae et chez les mammifères, par des approches de délétion
au niveau de la région intergénique, les domaines nécessaires à la transcription ont
été identifiés. La région de -148 à +8 semble suffisante pour la transcription et fut
donc définie comme la région promotrice chez la levure S. cerevisiae (Musters et al.,
1989). Des analyses supplémentaires par mutagénèse ont permis de révéler deux
domaines distincts : de -148 au nucléotide -50 et de -28 au nucléotide +8 (Figure 4).
Le domaine en aval est strictement requis pour la transcription promoteur spécifique
et a été nommé Core Element (CE), la seconde zone appelée UAS (Upstream
Activating Sequence) a, comme son nom l’indique, un effet stimulateur.
Chez les mammifères, l’organisation du promoteur est également bipartite et
conservée (Figure 4B). On retrouve le Core Element, il est essentiel et s’étend des
régions -45 à +18, tandis que le domaine amont nommé « Upstream Control
Sequence » (UCS) correspond aux régions des nucléotides -156 à -107 (Figure 4)
(Jones et al., 1988; Learned et al., 1985; Learned et al., 1986). Malgré la
conservation organisationnelle apparente, on n’observe aucune conservation de
séquence de la levure à l’Homme, si ce n’est une forte proportion de
déoxynucléotides A/T dans la région +1. Il est d’ailleurs intéressant de noter que le
principal complexe d’initiation mammifère SL1 n’est ni interchangeable de l’Homme à
la levure, ni de l’Homme à la souris. Les séquences d’initiation et les protéines
impliquées dans ce processus semblent être en partie « espèce spécifique »
(Learned et al., 1985) (Voir chapitre I, II-6).

 MS
II-4-Le locus d’ADNr

Dans la levure S. cerevisiae, environ 10% du génome est représenté par les
répétitions des gènes d’ADN ribosomiques organisées en tandem sur le
chromosome XII. Bien que la plupart des eucaryotes contiennent ces répétitions, leur
nombre varie selon les espèces. Ainsi, dans le monde eucaryote le nombre de
répétitions peut varier de 100 à 10 000 (Hadjiolov, 1985; Long and Dawid, 1980).
Dans un génome de cellules de mammifères, leur nombre est évalué à 400 mais,
contrairement à S. cerevisiae, ces répétitions sont réparties sur cinq paires de
chromosomes (XIII, XIV, XVV, XXI, XXII). Chez l’humain, des études s’appuyant
notamment sur la technique de peignage de l’ADN ont permis de démontrer qu’une
partie des répétitions d’ADNr était non canonique, et probablement non fonctionnelle
(Caburet et al., 2005). De plus, il est important de noter que ces gènes d’ADNr ne
sont pas tous actifs en transcription aussi bien chez la levure que chez les
métazoaires. On estime que seulement 50% des gènes sont actifs en transcription
(Conconi et al., 1989). Nous reviendrons sur cette spécificité en détail dans un
chapitre ultérieur de cette thèse (Chapitre II, III-1)

II-5-Réplication et maintien du nombre de copie du locus d’ADNr

Malgré les évènements de recombinaison et l’instabilité génomique inhérente à des


structures de gènes répétés, le nombre de copies d’ADNr contenu dans la plupart
des organismes est stable. Cependant plusieurs organismes ont la capacité de faire
fluctuer le nombre de copies d’ADNr selon les conditions de croissance. Chez la
levure S. cerevisiae, le mécanisme de maintien du nombre de copies d’ADNr a été
particulièrement étudié par l’équipe du Dr Kobayashi. Les variations du nombre de
copies sont notamment dépendantes de l’origine de réplication (ARS) et d’une région
capable de bloquer la fourche de réplication (RFB). Lors de l’activation d’une ARS, le
domaine RFB permet la progression de la fourche de réplication dans la direction de
la transcription du 35S, mais pas dans le sens opposé (Kobayashi et al., 1992;
Kobayashi and Horiuchi, 1996). La protéine Fob1 est requise pour cette fonction
(Kobayashi and Horiuchi, 1996).
Dans le cas de mutations provoquant l’absence de sous-unité essentielle de l’ARN
pol I (Rpa 135) (maintenue en vie par une construction artificelle permettant la

 MT
transcription de l’ARNr 35S sous contrôle d’un promoteur fort par l’ARN Pol II), on
observe une diminution drastique du nombre de répétitions de gènes d’ADNr, la
réintroduction de la sous-unité manquante induit alors une restauration du nombre
initial de copies (Kobayashi et al., 1998). Cette restauration n’est possible qu’en
présence de Fob1 qui semble donc jouer un rôle primordial dans ce mécanisme.
L’amplification se ferait de la manière suivante ; la fourche de réplication se propage
jusqu’au RFB où une cassure double brin va apparaitre au niveau du site de fixation
de Fob1. La réparation de cette cassure pourra se faire par recombinaison
symétrique entre chromatides sœurs ou par recombinaison asymétrique ; cette
dernière entraine une variation de la taille du locus d’ADNr (Figure 5). Une région
particulière située dans l’IGS1 est directement impliquée dans la régulation de ce
mécanisme. Il s’agit du promoteur bi-directionnel E-PRO qui selon son activité va
favoriser l’un ou l’autre de ces processus. En absence de répression par Sir2, ce
promoteur est activé, on observe alors une activité de transcription par l’ARN pol II.
Sur son passage, l’ARN pol II va déplacer les cohésines présentes dans cette région.
Le complexe cohésine forme un anneau autour des chromatides soeurs afin
d’assurer leur cohésion (pour revue (Nasmyth and Haering, 2009)). Chez la levure, la
cohésine est localisée exclusivement entre les gènes transcrits dans des directions
divergentes : c’est la transcription active qui positionne la cohésine à ces sites et non
la séquence d’ADN (Lengronne et al., 2004). La conséquence de l’activation du
promoteur E-Pro sera alors un appauvrissement local en cohésine qui va favoriser
les recombinaisons asymétriques et donc la variation du nombre de copies d’ADNr
(Figure 5) (Kobayashi and Ganley, 2005).

 MU
La réplication est bloquée et une cassure
double brin apparait au niveau du site de
fixation de FOB1.

E-Pro inactivé E-Pro activé

Recombinaison symétrique des chromatides soeurs Recombinaison asymétrique des chromatides soeurs

Nombre de copies reste stable Changement du nombre de copies


Figure 5: Model d'amplification du locus d'ADNr. L'activité du promoteur bi-directionel E-Pro va
influer sur l'augmentation du nombre de copies de l'ADNr. La protéine Sir2 empêcherait l'activité de
transcription de l'ARN pol II sur ce promoteur. Cette inhibition permet le maintien des cohésines et
favorise la recombinaison entre les chromatides soeurs sans amplification du locus après la coupure
double brin au niveau de la barrière de réplication. En absence d'inhibition, l'activité de transcription va
déplacer les cohésines. Cette déstabilisation permet des phénomènes de recombinaison asymétrique
conduisant à une variation du nombre de gènes d'ADNr. (Adapté de Kobayashi et al. 2011).
La compréhension de ces mécanismes a permis chez la levure S. cerevisiae de
disposer de souches avec un nombre de copies plus ou moins important et maintenu
stable par la délétion de Fob1. Ces souches sont utilisées pour les travaux décrits
dans cette thèse et constituent des outils essentiels pour comprendre l’influence du
nombre de copies sur la transcription par l’ARN pol I.

II-6- Initiation de la transcription par l’ARN polymérase I

L’ARN pol I, tout comme les autres ARN pol, ne peut se lier directement à l’ADN des
séquences promotrice. Seul la reconnaissance du complexe de pré-initiation par
l’ARN pol I permettra sa fixation et la transcription spécifique. La compréhension du
mécanisme d’initiation ne pouvait donc se faire sans une caractérisation préalable
des facteurs impliqués dans l’assemblage du complexe de pre-initiation. Dans le cas
des cellules de mammifères, l’identification de ces facteurs a été menée en
fractionnant des extraits cellulaires et en testant leur activité ARN polymérase sur
une matrice d’ADNr (Grummt, 1981; Zomerdijk et al., 1994a). Chez la levure, des
approches génétiques ont été d’avantage utilisées (Nogi et al., 1991) permettant
d’identifier une kyrielle de mutants défectifs pour la transcription de l’ADNr (mutant
rrn pour « rRNA synthesis défective »). Par cette approche de nombreux gènes
codant pour des protéines directement impliquées dans l’initiation de l’ARN pol I ont
été caractérisés (Nogi et al., 1991). On peut citer entre autres les protéines Rrn3,
Rrn6, Rrn9, Rrn10, Rrn11 impliquées dans l’initiation ou les sous-unités de l’ARN pol
I Rpa135, Rpa12, Rpa43. La combinaison des approches génétiques et
biochimiques a donc permis d’identifier chez la levure S. cerevisiae et chez les
mammifères la majeure partie des facteurs impliqués dans l’initiation de la
transcription par l’ARN pol I. On peut néanmoins noter que chez la levure, ce crible
ne permet d’identifier que les protéines ayant pour seul rôle la production de l’ARNr
et exclut les protéines possédant une autre fonction essentielle.

II-6- a- Formation du complexe d’initiation chez S. cerevisiae.

Chez S. cerevisiae, le recrutement de l’ARN pol I requiert l’intervention de deux

 NM
complexes d’initiation qui lui sont spécifiques, le Core Factor (CF) et l’Upstream
Activating Factor (UAF). Le CF est composé des protéines identifiées par Nogi en
1991, Rrn6, Rrn7 et Rrn11 (Keys et al., 1994; Lalo et al., 1996). On retrouve dans
UAF les protéines Rrn5, Rrn9, Rrn10, les autres membres de ce complexe sont les
deux histones H3-H4 et le facteur Uaf30 (Keener et al., 1997b; Keys et al., 1996;
Siddiqi et al., 2001). Ces deux complexes UAF et CF vont assurer la reconnaissance
de la région promotrice aboutissant ainsi à la formation du complexe de pré-initiation.
UAF et le CF se fixeront respectivement sur les régions UAS et CE. L’effet
stimulateur de l’UAF est fortement dépendant de la présence de TBP, même si cette
protéine ne semble pas associée de manière stable avec ce complexe (Steffan et al.,
1998). TBP, par ses capacités d’interactions avec le complexe UAF et le CF pourrait
permettre de relier ces deux complexes (Lalo et al., 1996; Steffan et al., 1998).
Ce complexe composé alors d’UAF, du CF et de TBP est alors reconnu
spécifiquement par l’ARN pol I qui se doit d’être associée au facteur d’initiation Rrn3
pour avoir la capacité d’être recrutée au niveau du PIC (Complexe de Pré initiation)
(Figure 6). On peut noter que la sous-unité Uaf30 contenue dans UAF est nécessaire
pour la répression de la transcription de l’ADNr par l’ARN Pol II.
In vitro, les complexes recombinants ne permettent pas la production efficace
d’ARNr. Il est possible que des facteurs activateurs restent à identifier ou que la
purification des facteurs transcriptionnels ne soit pas optimale (Keener et al., 1998).

 NN
A-

Upstream POL I
Activating factor Core Factor
Rrn3
Rrn10
Rrn5 Rrn11
Rrn9 Rrn7
H3 H4 Uaf30 TBP Rrn6

UAS CE
o1

o1

o1

o1
Hm

Hm

Hm

Hm
B-
POL I

SL1 Rrn3/TIF1A

TBP TAF110
TAF41
TAF48 TAF63

UCE CE
F

F
UB

F
UB

UB

UB
UB

Figure 6: Complexe d'initiation de l'ARN pol I. A-Chez S. cerevisiae l'ARN pol I est recrutée après son
association avec Rrn3 et la formation du complexe d'initiation comprenant TBP, le complexe UAF
(Upstream Activating Factor), et le CF (Core Factor). La protéine Hmo1 ne semble pas être requise pour
l'initiation mais est localisée sur toute la séquence transcrite dont la région promotrice. B- Chez Homo
Sapiens, on retrouve le complexe SL1 essentiel à la formation du PIC et au recrutement de l'ARN pol I.
UBF joue un rôle stimulateur dans l'initiation et est localisé sur les régions promotrices et les séquences
transcrites.
II-6- b- Recrutement de l’ARN polymérase I

Seulement une minorité d’ARN pol I contenue dans un noyau est active en
transcription (Milkereit et al., 1997). Il existe donc au sein des cellules différentes
formes d’ARN pol I. Les ARN pol I compétentes pour l’initiation sont associées à
Rrn3.
La protéine Rrn3 fut découverte à partir du crible génétique mené dans l’équipe du
Dr Nomura en 1991 (Nogi et al., 1991). Cette protéine essentielle est très conservée
puisqu’on la retrouve chez les mammifères (Bodem et al., 2000), chez la levure S.
pombe (Imazawa et al., 2002), et chez S. cerevisiae. La létalité due à la délétion du
gène RRN3 chez la levure S. cerevisiae est d’ailleurs partiellement supprimée par
l’expression de son équivalent humain TIF1-A (Moorefield et al., 2000). Rrn3 est
recrutée sur l’ARN pol I via une interaction avec Rpa43 (Peyroche et al., 2000). Elle
pourrait ensuite servir de point d’ancrage entre l’ARN pol I et le Core Factor (par une
interaction avec Rrn6) ou le complexe SL1 (Selectivity factor) respectivement chez S.
cerevisiae et chez les mammifères (Miller et al., 2001; Schnapp et al., 1993). La
fonction de Rrn3 est donc bien établie mais un débat persiste quant à la capacité de
l’ARN pol I à se fixer sur le promoteur en absence de Rrn3.
Chez les mammifères, Shnapp et al ont montré que l’ARN Pol I pourrait être recrutée
en absence de Rrn3 (Schnapp et al., 1993), mais sans permettre l’initiation de la
transcription, alors que les résultats du laboratoire de Zomerdijk infèrent vers
l’impossibilité de l’ARN Pol I seule de s’associer aux régions promotrices (Miller et
al., 2001). Dans le cas de la levure, il a été publié que l’ARN Pol I ne pouvait être
recrutée au promoteur en absence de Rrn3 aussi bien in vivo qu’in vitro (Milkereit
and Tschochner, 1998; Yamamoto et al., 1996). Aprikian et al. en 2001, ont pourtant
montré qu’un recrutement était possible sans rrn3 mais formerait un complexe non
compétent pour la transcription ; cette donnée fut confortée chez les mammifères par
Cavanaugh en 2008 (Aprikian et al., 2001; Cavanaugh et al., 2008). L’ensemble de
ces résultats implique donc que Rrn3 est essentielle à la formation d’un complexe
d’initiation compétent pour assumer une activité de transcription. L’association avec
une ARN Pol I sans rrn3 formerait un complexe inactif pour la transcription,
potentiellement inhibiteur.
Le recrutement de l’ARN pol I associée à Rrn3 est suivi du démarrage de la

 NP
transcription avec l’ouverture de la double hélice d’ADN. L’ARN pol I est alors
capable de catalyser la formation des premiers nucléotides mais sans aucun
déplacement du complexe le long de l’ADN. Il s’agit de la phase de transcription
abortive. Ces étapes nécessitent des arrangements structuraux de l’ARN pol I et le
relargage du facteur Rrn3 (Beckouet et al., 2008; Milkereit and Tschochner, 1998).

II-6- c- Formation du complexe d’initiation chez les mammifères.

En dépit d’une absence d’homologie de séquence au niveau des régions


promotrices, il existe une conservation de l’organisation bi-partite du promoteur de
l’ADNr entre S. cerevisiae et les mammifères. Au même titre que le facteur Rrn3 qui
apparait très conservé, on peut supposer une conservation des protéines impliquées
dans la formation du complexe d’initiation chez les mammifères. Toutefois, la
caractérisation de ces facteurs n’a laissé apparaître que peu d’homologie de
séquences de l’Homme à la levure. Aucune information sur la structure tri-
dimentionnelle n’étant disponible, on ne peut que spéculer sur une conservation de
structure.
Ces protéines ont été identifiées pour la plupart par des approches biochimiques
menées chez la souris et l’Humain ; parmi elles on trouve les protéines du complexe
SL1 (appelé TIF-1B chez la souris) et UBF (Figure 6).

SL1 (Selectivity factor) est un complexe protéique nécessaire à l’initiation de la


transcription (Clos et al., 1986; Learned et al., 1985). Il doit son nom à sa capacité de
rétablir l’initiation de la transcription sur les promoteurs humains en présence de
facteurs de transcription de souris alors que le facteur SL1 de souris ne peut stimuler
dans ce cas la transcription (Learned et al., 1985). Chez la souris ce complexe
apparaît conservé mais il n’est pas fonctionnellement interchangeable in vitro avec
son homologue humain.
SL1 forme un complexe de 300 kDa composé de la TBP associée à des TAF (« TBP
associated factors »). Il s’agit des TAFI110, TAFI63, TAFI48 chez l’humain et TAFI95,
TAFI68, TAFI48 chez la souris (Comai et al., 1994; Heix et al., 1997; Zomerdijk et al.,
1994b). Malgré l’identification de ces facteurs à la fin des années 1990, la
reconstitution in vitro du complexe d’initiation par des formes recombinantes des
quatre protéines du complexe SL1 ne semble pas suffisante pour induire la

 NQ
transcription (Heix et al., 1997). Ce résultat négatif peut s’expliquer par l’existence de
facteurs supplémentaires requis pour l’activité de transcription de l’ARN Pol I. La
découverte dix ans plus tard dans les cellules humaines d’une quatrième TAF,
TAFI41, par l’équipe de Zomerdijk illustre cette possibilité (Gorski et al., 2007).

UBF est une protéine à cinq boites HMGB retrouvée au niveau des séquences
promotrices des gènes d’ADNr. UBF coopérerait avec SL1 pour organiser le
complexe d’initiation (Bell et al., 1988; Learned et al., 1986). Cette protéine a été
purifiée sur la base de son affinité pour la séquence activatrice (UCE) et sa capacité
à stimuler l’ARN pol I in vitro (Bell et al., 1990; Pikaard et al., 1989). Par sa capacité
à structurer l’ADN, la fixation d’UBF entrainerait la formation d’une boucle sur l’ADN,
ou enhanceosome, générant une structure favorable à l’assemblage du PIC (Bazett-
Jones et al., 1994). Le rôle stimulateur d’UBF sur l’initiation semble unanimement
reconnu mais le mécanisme d’action prête encore à débat. Nous reviendrons
spécifiquement sur le rôle d’UBF dans la deuxième partie de l’introduction (Chapitre
II, IV-3).
Il est tentant de faire le parallèle entre le système de transcription humain et de
levure S. cerevisiae. SL1 semble être l’équivalent fonctionnel du Core Factor en dépit
d’une homologie de séquence très faible, ils sont tous deux requis pour la
transcription basale (Keener et al., 1998; Lin et al., 1996; Schnapp and Grummt,
1991). Seule la sous-unité Rrn7 semble partager une homologie de séquence avec
TAFI68 (Boukhgalter et al., 2002). Il a récemment été montré que les protéines Rrn7
et TAF163 partagent des homologies structurales et sont fonctionnellement
équivalentes aux facteurs TFIIB (Knutson and S, 2011; Naidu et al., 2011). Les deux
systèmes d’initiation partagent donc d’importantes similarités fonctionnelles (Rrn3 et
Tif1A, CF et SL1, TBP humaine et de levure) même si le rôle d’UBF chez l’homme et
d’UAF chez la levure semble différent.

II-7- Elongation de l’ARN polymérase I

Nous expliciterons dans une partie ultérieure la régulation de l’élongation de l’ARN


pol I par des facteurs en « trans ». Cette partie est consacrée à la description
générale du processus d’élongation commun aux trois ARN pol eucaryotes. Nous
nous appuierons principalement sur les données évolutives pour comprendre quels

 NR
sont ces mécanismes généraux de l’élongation.
Au cours du cycle de transcription, le phénomène de translocation délimite la fin de
l’initiation et le début du processus d’élongation. Ce changement d’activité se traduit
par la synthèse des premiers nucléotides et implique une séparation de l’ARN pol I
du complexe d’initiation.
L’élongation de la transcription est un processus discontinu, l’ARN pol ne se déplace
pas à vitesse constante. En fonction de contraintes physiques (chromatine, topologie
de l’ADN) elle peut moduler ou arrêter transitoirement sa progression. Pour évaluer
l’élongation, deux paramètres sont à prendre en compte ; la vitesse d’élongation (le
nombre de nucléotides polymérisés par seconde) et la processivité, c’est-à-dire le
nombre de nucléotides polymérisés par évènement d’initiation.
Pour assumer cette fonction d’élongation, impliquant l’apparition d’un complexe ARN
pol-ARN-ADN, des changements de conformation sont requis. L’ARN pol I interagit à
la fois avec l’ADN matrice, l’hybride ADN_ARN et le transcrit naissant (Brueckner et
al., 2009).
Chez les archées et les eucaryotes le « stalk » (Figure1) peut interagir avec l’ARN
mais du fait de la dynamique de cette interaction, il est difficile d’obtenir des données
structurales permettant une modélisation exacte de cette interaction. Cette région
n’est pas conservée chez les procaryotes mais dans ce cas la protéine NusA permet
l’interaction avec l’ARN (Ha et al. 2010).
Le rôle du « stalk » présent sur les ARN pol eucaryotes semble particulièrement
important pour l’élongation. En effet, dans le cas de l’ARN pol Archée, l’absence du
« stalk » diminue in vitro la processivité (Hirtreiter et al., 2009) et l’efficacité de
transcription des grands gènes. Le « stalk » faciliterait l’interaction avec les transcrits
naissants et repositionnerait le « clamp » dans une position favorable à l’élongation
(Armache et al., 2005). De même chez S. cerevisiae, l’absence de Rpb4 diminue la
présence de l’ARN pol II sur la partie 3’ des gènes les plus grands (Runner et al.,
2008). Le « stalk » est donc requis pour l’élongation des grands gènes. Au vu de la
taille des gènes d’ADNr, le « stalk » constitué dans l’ARN Pol I de Rpa43 et Rpa14
pourrait avoir un rôle déterminant dans la phase d’élongation. Les données
cristallographiques apportées par l’équipe de P. Cramer en 2007 ont d’ailleurs
permis de montrer que le « stalk » de l’ARN pol I a une structure particulière se
distinguant de l’ARN Pol II (Kuhn et al., 2007). Enfin, le facteur Rrn3 se fixe chez
l’ARN Pol I sur le « stalk », et serait impliqué dans la structure de ce dernier. De ce

 NS
fait, il a été suggéré un rôle de Rrn3 dans l’élongation. La structure de Rrn3 associé
au « stalk » n’a pas encore été caractérisé structuralement en complexe avec Pol I
(Grohmann and Werner).
En résumé, l’élongation est un processus central qui fait intervenir des mécanismes
conservés. Son étude semble particulièrement pertinente sur un gène de grande
taille telle que l’ADNr, puisque à une vitesse de transcription estimée à 50
nucléotides par seconde, la transcription d’un gène d’ADNr de S. cerevisiae prendrait
environ 2 min durant lesquelles l’ARN pol peut accélérer, s’arrêter ou encore se
dissocier de la matrice ADN (Cavanaugh and Thompson, 1985; Dundr et al., 2002;
French et al., 2003).

II-8-Topoisomérase et transcription ARN Pol I.

Préambule

Tout comme la réplication, le phénomène de transcription soumet la fibre d’ADN à


des contraintes mécaniques pouvant altérer sa structure. À titre d’exemple, le super
enroulement en amont de la fourche de réplication forme des structures vrillées qui
empêchent la progression du réplisome. Des protéines sont spécialisées pour
résoudre le stress topologique infligé par ces processus ADN dépendants. Etant
donné l’activité transcriptionnelle intense de l’ARN Pol I, il est évident que ce type de
protéine a un rôle central et nécessaire dans la transcription des gènes d’ADNr.

II-8-a-les topoisomérases.

En 1970, James Wang caractérise pour la première fois chez E. coli une enzyme
capable de relaxer les supertours négatifs de la double hélice d’ADN (Pour revue
(Kyrpides et al., 1996). Cette découverte est fondamentale puisqu’elle permet de
valider l’existence de processus tel que la réplication qui sans topoisomérase sont
théoriquement impossibles. Cette découverte fut suivie par la caractérisation dans
des cellules de souris d’une activité enzymatique relaxant les super tours positifs et
négatifs. Ces enzymes sont en fait présentes chez tous les organismes vivants:
procaryotes, archaebactéries, eucaryotes et virus, elles assurent le maintien du
degré d’enroulement, empêchent la formation de nœud et permettent la séparation
des chromosomes (Goto and Wang, 1985; Holm et al., 1985; Wang, 2002). Ces
protéines appelées topoisomérase sont essentielles à la viabilité de la cellule. Au

 NT
sein d’un même organisme, l’évolution a fait apparaître des variations de séquences
entre différentes topoisomérases entraînant des modifications de la fonction de ces
enzymes. L’action simultanée de ces différentes enzymes assure le maintien du
degré de superenroulement, la séparation des chromatides en mitose et empêche la
formation des nœuds. Il existe plusieurs classes de topoisomérases avec parfois des
rôles antagonistes(Roca, 1995).

La topoisomérase de type I, divisée elle même en deux sous type IA et IB, agit sous
forme de monomères et effectue des coupures simples brin dans l’ADN permettant le
passage de l’autre brin à travers la coupure simple brin (Type IA) ou la libre rotation
autour de l’autre simple brin (Type IB). La topoisomérase II se présente ,elle, sous
forme d’homodimères et va assurer une coupure double pour relâcher des stress de
torsions ou permettre la séparation des chromatides notamment pendant la mitose.
Le dimère se lie à l’ADN sur un segment nommé « G » et capture un autre segment
nommé T après la captation de deux molécules d’ATP (Roca, 1995). L’hydrolyse
d’un ATP permet le passage du brin T à travers le segment G, ce dernier ayant été
clivé. L’hydrolyse du second ATP permettra au complexe topoisomérase de relâcher
le segment T et de pouvoir potentiellement réinitier un cycle.

II-8-b-les topoisomérases et transcription par l’ARN Pol I.

L’activité transcriptionnelle intense de l’ARN pol I nécessite l’intervention de


topoisomérases pour soulager les stress torsionnels. Dans les cellules eucaryotes,
deux topoisomérase majeures sont liées au stress induit par la transcription : Top1 et
et Top2 (Wang, 2002). Dans la plupart des situations, même si leurs mécanismes
d’action sont différents, elles peuvent se substituer l’une à l’autre et résoudre des
torsions négatives et positives. L’activité de ces topoisomérases est donc requise
pendant la transcription qui crée des super tours positifs en amont de l’ARN pol et
négatif en aval. Chez la levure, l’action de ces topoisomérases est requise pour la
synthèse des ARNr (Brill et al., 1987b; Yamagishi and Nomura, 1988). La synthèse
du pré-ARN n’est que peu affectée en absence de Top1 mais la déplétion simultanée
de Top1 et Top2 compromet définitivement la transcription des gènes d’ADNr. Un
lien génétique entre TOP1 et RPA34 a été suggéré par Olivier Gadal en 1997
(Gadal et al., 1997). En effet, la sous-unité Rpa34 devient essentielle en absence de
la topoisomérase I. Ce lien entre la sous-unité Rpa34 et Top1 a été observé ensuite

 NU
en double hybride (Beckouet et al., 2011). Bien que la nécessité d’une activité
topoisomérase pour l’activité ARN Pol I soit évidente, l’implication exacte de ces
protéines est encore peu comprise. Brill a tenté d’élucider l’implication des Top1 et
Top2 sur la transcription de l’ADNr. En utilisant des constructions génétiques dont la
transcription dépend par l’ARN Pol I, il a montré que les topoisomérases sont
principalement requises pour l’élongation de l’ARN Pol I sur des grands gènes,
l’initiation étant moins affectée. En effet, l’accumulation de supertours négatifs
générés par l’ARN Pol I facilite l’ouverture des régions promotrices et donc l’initiation,
a contrario, les super tour positifs s’accumulant devant l’ARN Pol I empêchent sa
progression (Brill et al., 1987a; Brill et al., 1987b). L’action des topoisomérases
permet de lever ce point de blocage. Ce rôle des topoisomérases dans la
transcription ARN Pol I a été confirmé récemment par deux publications du groupe
de D. Tollervey et de A. Beyer(El Hage et al., 2010; French et al., 2010). Dans ces
études, les auteurs montrent que la Top1 interviendrait principalement pour corriger
les torsions négatives après le passage de l’ARN Pol I. En absence de la Top1, on
aurait alors l’apparition de larges bulles d’ADN simple brin générées par l’ARN Pol I
en élongation (Figure 7) (French et al., 2010). De plus l’absence de Top1 favoriserait
un phénomène caractérisé chez E. coli qu’est la formation des R-Loop (Drolet,
2006). Les R-loop correspondent à la formation d’hybrides ARN-ADN hors de la bulle
de transcription. Ces hybrides ARN-ADN sont très stables et bloquent l’élongation
(Tous and Aguilera, 2007). L’absence de Top1 conduit à la formation de telles
structures dans l’ADNr chez S. cerevisiae (Figure 7). Ce phénomène délétère pour la
transcription est logiquement amplifié en absence de l’activité RNase H qui permet
de dégrader les hybrides ARN-ADN (El Hage et al., 2010). Concernant Top2, son
rôle semble d’avantage lié aux relâchements des supertours positifs en amont de
l’ARN Pol I, son absence entraine un ralentissement de l’élongation de l’ARN Pol I
(French et al., 2010). Ces études et les travaux de Lavelle concernant la topologie de
l’ADN suggèrent que Top1 et Top2 peuvent tous deux agir sur les supertours
négatifs et positifs pendant l’élongation de l’ARN Pol I. Cependant les matrices
d’ADN présentes derrière et devant l’ARN Pol I constituent des substrats plus
accessibles respectivement pour la Top 1 et la Top 2(Salceda et al., 2006). Ainsi, la
Top1 serait requise pendant l’élongation par l’ARN Pol I pour éviter la formation de
« R-loop » et la Top2 résoudrait l’accumulation de super tours positifs rencontrés par
l’ARN Pol I (El Hage et al., 2010; French et al., 2010; Lavelle, 2008).

 OL
A-

1
1000 nm

1 2
B-

1- génotype sauvage 4- Absence de Top1

2- Absence de Top2 Absence de Top1

3- Absence de Top1 et de Top2 5- Absence de Top1 et de la RNAse H

Figure 7: Rôle des topoisomérases 1 et 2 dans la transcription ARN pol I. A-Photographie d'un gène
d'ADNr transcrit par l'ARN pol I en absence de Top1, observé en microscopie électronique. Les photo-
graphies 1 et 2 correspondent à des grossissements des régions correspondantes indiquées par une
flèche (1) et (2). B- Schematisation des conséquences de l'absence de Top1 (4), Top2 (2) et de la
RNase H (5). En absence de la Top2, on observerait une accumulation de stress torsionnel positif en
amont de l'ARN pol I. Au contraire l'absence de la Top1 provoque du stress torsionnel négatif après le
passage de l'ARN pol I se traduisant par l'apparition de "R-loop" et de "topo-bubble" (4). L'absence de
la RNase H combinée à celle de la Top1 augmente l'apparition des "R-loop"(5)(Adaptée de French et al.
2010).
II-9- Terminaison de la transcription

La terminaison de la transcription est un évènement crucial puisqu’il permet à la fois


le relargage du transcrit néo-synthétisé et le recyclage efficace de l’ARN pol I. Les
premières expériences in vitro à partir de facteurs purifiés ont permis de définir la
région terminatrice située juste en aval de la région codante pour le précurseur des
grands ARNr (Lang et al., 1994). Chez S. cerevisiae, le terminateur est une
séquence notée T1 située 13 nucléotides après la région transcrite, chez les
mammifères le terminateur se décline sous forme de 8 répétitions (notées T1-T8)
situées 21 nucléotides en aval de la région transcrite (Grummt et al., 1985; Grummt
et al., 1986). Les études menées dans ces deux organismes ont permis d’identifier
une protéine s’accrochant à l’ADN au niveau de ces terminateurs. Il s’agit de la
protéine Reb1 et TTF1 respectivement chez S. cerevisiae et chez les mammifères
(Grummt et al., 1986; Lang and Reeder, 1993). L’accrochage de cette protéine serait
responsable de l’arrêt de la polymérase en cours d’élongation promouvant ainsi la
terminaison à proximité d’une région riche en pyrimidine (Lang et al., 1994). Les
protéines Reb1 et TTF1 contiennent un domaine de liaison à l’ADN qui apparaît
conservé, d’ailleurs ces deux protéines sont interchangeables in vitro (Kuhn et al.,
1990). La conservation de ces protéines renforce l’idée de leur importance dans le
processus de terminaison. L’utilisation de matrices d’ADN immobilisées a montré que
la région terminatrice et le facteur de pause Reb1 sont requis, mais pas suffisants
pour la dissociation du complexe ternaire (ARN-ADN-ARN pol) (Lang et al., 1994;
Mason et al., 1997). L’étude de Reb1 dans le cadre de la terminaison de l’ARN Pol I
est compliquée par la fonction essentielle de Reb1 comme facteur de transcription
Pol II (Morrow et al., 1990). La terminaison de la transcription ne se limite pas à
l’arrêt de l’élongation, mais nécessite le décrochage du complexe ternaire et la
libération du transcrit, il existe probablement d’autres protéines que Reb1 impliquées
dans le processus de terminaison.
Des études plus récentes ont confirmé l’existence de nouvelles protéines impliquées
dans la terminaison de l’ARN pol I qui agiraient selon un mécanisme commun à
l’ARN Pol II. Il s’agit de la terminaison en « torpédo » (Kawauchi et al., 2008; Kim et
al., 2004; West et al., 2004). Ce mécanisme impliquerait une « RNase III–like
endonucléase » Rnt1 qui reconnaît et clive des structures en boucles sur le pre-ARN.

 ON
Ainsi, de manière co-transcriptionnelle, Rnt1 va cliver en 3’ le transcrit dans l’ETS
libérant le précurseur des ARNr (Kufel et al., 1999). Une exonucléase (Rat1) va
ensuite intervenir en association avec l’hélicase Sen1 pour assurer la dégradation de
la région 5’, résultant du clivage de Rnt1, jusqu’à la dégradation complète de l’ARN
restant associé à l’ARN Pol I. Cette dégradation entrainera une déstabilisation de
l’ARN pol provoquant son décrochage (Figure 8-A) (El Hage et al., 2008; Kawauchi
et al., 2008). Récemment, il a été suggéré que la kinase Gcr3 prendrait part à ce
processus en maintenant la phosphorylation sur le produit de clivage de Rnt1. Cette
phosphorylation permettrait l’action de Rat1 pour conclure efficacement le processus
de terminaison (Braglia et al., 2011).

 OO
A-
Reb1 FOB1
1) 25S T1 I T2
POL

25S

Reb1 FOB1
2) 25S T1 I T2
POL

25S
Clivage Rrnt1
Reb1 FOB1
3) 25S T1 T2
I
POL
Pause en T1
Second clivage en T1 (Braglia et al. 2010)

Degradation par Rat1


Reb1 FOB1
4) 25S T1 I T2
POL
Terminaison en T1

B-

WT

rpa12Δ

région 3' 35S 5S région 5' 35S


Figure 8: Terminaison de l'ARN pol I chez S. cerevisiae. A- (1) Le transcrit néoshynthétisé par l'ARN
pol I forme une structure secondaire reconnu par Rnt1. (2) Rnt1 va cliver le pré-ARNr. (3) On assiste
alors à la dégradation complète du transcrit par Rat1, en absence de clivage Rrnt1, un second clivage
semble pouvoir se produire en T1 où l'ARN pol I est en pause au contact de Reb1 (3) entrainant la termi-
naison (D'après El Hage et al. 2011, Braglia et al. 2010). B- Photographie en microscopie électronique
de la région comprise entre la région 3' du gène d'ADNr et le gène 5S (Flèche grise). Les flèches noires
présentent les ARN pol qui ne sont pas présentes dans un contexte sauvage et montrant le défaut de
terminaison induit par l'absence de Rpa12. (D'après Prescoot et al. 2004)
Les deux modèles de terminaison par Reb1/TTF1 ou par « torpédo » ne sont pas en
contradiction et apparaissent au contraire complémentaire. En effet, si le clivage par
Rrnt1 n’a pas lieu, un second clivage en T1 peut avoir lieu. Ce second clivage n’est
possible que si l’ARN pol est en pause grâce à l’action de Reb1 (Braglia et al., 2011).
De même, en absence de Rnt1 un second site de terminaison T2 situé juste avant la
région couverte par Fob1 est impliqué dans l’arrêt de la transcription (Braglia et al.,
2011; Reeder et al., 1999).

Enfin, il est à noter que la délétion de REB1 ou de RNT1 chez S. cerevisiae cause un
défaut de terminaison moins important que celui observé dans le cas de la délétion
du gène RPA12 (Kawauchi et al., 2008; Prescott et al., 2004). Rpa12 est impliquée
dans la terminaison puisqu’en son absence, on observe sur des arbres de Miller des
ARN pol I dans les espaces intergéniques (Figure 8-B). Ce débordement de l’ARN
pol I hors des séquences transcrites illustre un défaut de terminaison et semble
responsable d’un défaut de croissance chez S. cerevisiae et chez S. pombe
(Imazawa et al., 2001; Nogi et al., 1993). Rpa12 est une sous-unité de l’ARN pol I
composée de deux parties : le domaine N-Terminal permet l’accrochage aux autres
sous unité de l’ARN pol I alors que le domaine C-terminal de Rpa12 contient une
homologie de séquence avec TFIIS (Van Mullem et al., 2002). TFIIS est un facteur
de transcription de l’ARN pol II permettant le clivage du transcrit (Wind and Reines,
2000). L’équivalence avec TFIIS a été confirmée par l’équipe de Cramer en montrant
que cette sous-unité Rpa12 était capable de promouvoir le clivage du transcrit sur un
complexe d’élongation en pause (Kuhn et al., 2007). Conséquemment, l’ARN Pol I
possède en son sein une activité intrinsèque de clivage médiée par Rpa12, et ne
semble pas nécessiter comme l’ARN pol II un facteur supplémentaire tel que TFIIS
(Tschochner, 1996). Cette activité de clivage serait une actrice majeure du
processus de terminaison, mais pas seulement. Elle pourrait s’avérer utile dans le
cas d’un blocage d’une ARN pol I en cours d’élongation permettant son décrochage.
Ce phénomène, dans lequel TFIIS est un acteur clef, a été caractérisé pour le
moment uniquement dans le cas de l’ARN Pol II (Saeki and Svejstrup, 2009).

II-10- Recyclage de l’ARN polymérase I

 OQ
Nous venons de décrire le rôle de TTF1 et de Reb1 dans la terminaison. Cependant
la littérature suggère que TTF1 et Reb1 pourraient avoir d’autres fonctions,
notamment dans le recyclage de l’ARN pol I permettant une ré-initiation plus efficace.
En effet, ces protéines se fixent non seulement sur le terminateur mais aussi sur une
séquence d’environ 200 pb située en amont du promoteur, et nommée terminateur
proximal T0 (Vogelauer et al., 1998). Chez les mammifères, tout comme chez S.
cerevisiae, cette séquence influe sur l’initiation de la transcription par l’ARN pol I
(Grummt et al., 1986); (Kulkens et al., 1992). Reb1 serait capable de s’oligomériser
et de se fixer à la fois sur le terminateur et la séquence T0 ce qui conduirait à
l’apparition d’une boucle permettant de mettre en contact les régions terminatrices et
initiatrices. Ainsi les ARN pol I finissant un cycle de transcription pourraient être
directement engagées dans un nouveau processus d’initiation (Kulkens et al., 1992).
Chez les mammifères, il est maintenant admis qu’il existe un contact entre les
régions promotrices et terminatrices des gènes d’ADNr ; TTF1 a été décrit comme
capable d’organiser de tel repliement (Nemeth et al., 2008). Les facteurs TTF1 et
Reb1 seraient alors des facteurs organisateurs qui structurent les unités d’ADNr afin
de faciliter la transcription (Figure 9).

 OR
Reb1 Reb1 Reb1 Reb1 Reb1 Reb1
T0 T1 T0 T1 T0 T1
35S 5S 35S 5S 35S

35S
Reb1 T1
T0
T0
T1
T0
T1

5S

5S

35S

35S

Figure 9: Modèle d'action de la protéine Reb1 dans le mécanisme de recyclage de l'ARN pol I.
La protéine Reb1 peut se fixer à la fois sur la séquence de terminaison T1 et au niveau du terminateur
proximal T0. L'oligomérisation de Reb1 au niveau de ces sites permettrait un rapprochement du
promoteur des sites de terminaison. La promiscuité de ces deux régions aux rôles antagonistes favori-
serait la réinitiation de la transcription par l'ARN pol I. 3 unités de transcription sont représentées en
rouge, en vert et en noir sur chacune d'entre elles, est indiquée la zone d'accrochage de Reb1. Le
schéma du bas représente l'organisation de ces deux unités en cas d'oligomérisation de Reb1.
(D'après Kulkens et al. 1992).
III-Fonction des deux sous-unités spécifiques de l’ARN Pol I

Nous avons vu dans l’introduction que l’ARN pol I de S. cerevisiae est formée de 14
sous-unités. Dix de ses sous-unités forment le core catalytique commun avec l’ARN
pol archéenne. Les quatre sous-unités restantes Rpa14, Rpa34, Rpa43 et Rpa49 ne
sont pas requises pour l’activité catalytique. Ces sous-unités sont impliquées dans le
fonctionnement spécifique de l’ARN pol I.
Rpa43 et Rpa14 forment un hétérodimère spécialisé dans le recrutement du facteur
Rrn3. Cette interaction est requise pour la spécificité de l’initiation de la transcription
par l’ARN pol I et ne peut avoir lieu avec les autres ARN pol. D’ailleurs, la structure
de la « tige » (« stalk ») formée par Rpa43 et Rpa14 est un attribut structural
spécifique de l’ARN Pol I (Kuhn et al., 2007).
Les sous-unités Rpa34 et Rpa49 ont été découvertes il y a plus de 30 ans et n’ont
pas d’équivalent dans les autres ARN pol eucaryotes et archéennes, nous allons
décrire ici les informations sur la fonction de ces deux sous-unités.

III-1-Sous-unités spécifiques de l‘ARN polymérase I : Rpa34 et Rpa49

Ces deux polypeptides ont été caractérisés comme étant des composants de la
polymérase I chez la levure dès 1975 par Huet (Huet et al., 1975). Dans cette
publication, Huet avait décrit une forme de polymérase, obtenue après certaines
conditions de purification, appelé Pol A* où Rpa34 et Rpa49 étaient absents. In vitro,
il s’avère que cette forme Pol A* et l’enzyme complète ont une transcription non
spécifique équivalente sur matrice d’ADN double brin.
Ces deux sous-unités ont alors été définies comme faiblement associées à l’ARN
pol I et n’intervenant pas dans l’activité catalytique de l’ARN pol I. Les études qui ont
suivi ont montré que ces sous-unités n’étaient pas essentielles à la survie, même si
l’invalidation de RPA49 provoque un phénotype de cryosensibilité (Gadal et al.,
1997; Liljelund et al., 1992).

III-2-Conservation évolutive de Rpa34 et Rpa49

 OT
Chez la levure de fission S. pombe ou chez les mammifères, la plupart des sous-
unités composant l’ARN pol I semblent conservées avec celles retrouvées chez S.
cerevisiae (tableau 2). Cependant, la conservation des sous-unités spécifiques
Rpa34 et Rpa49 apparait moins évidente.
Chez la levure S. pombe, un équivalent de Rpa49 de S. cerevisiae a été identifié en
2003 ; il s’agit de la protéine Rpa51. Elle a été définie comme une sous-unité non
essentielle à l’activité catalytique mais nécessaire à l’ARN pol I pour assurer un haut
taux de transcription (Nakagawa et al., 2003). Concernant Rpa34, aucun équivalent
n’a été identifié dans chez l’Homme et chez S. pombe.
Chez les mammifères, il a été suggéré que Rpa34 et Rpa49 soient respectivement
équivalentes aux protéines humaines CAST (CD3 -associated signal transducer)
(PAF49 chez la souris) et PAF53 (polymerase associated factor 53Kda) (Panov et
al., 2006b). Ces deux polypeptides sont en effet décrits comme associés à l’ARN pol
I chez l’Homme et présentent des homologies de séquences avec Rpa34 et Rpa49
(Figure 10). Chez la souris, ces deux sous-unités sont retrouvées et peuvent être
séparées de la polymérase sous certaines conditions chromatographiques donnant
une polymérase Pol A, qui comme Pol A* de levure est capable d’assurer une
transcription non spécifique (Hanada et al., 1996; Yamamoto et al., 2004). Il est
intéressant de noter que ces deux protéines CAST et PAF53 ont toutes deux été
décrites comme capables d’interagir avec le facteur UBF et d’influer directement sur
l’initiation de la transcription (Hanada et al., 1996; Seither et al., 1997) ,(Panov et al.,
2006). De plus, il a été proposé que ces deux facteurs faiblement associés à l’ARN
pol I pourraient participer directement à la régulation de la transcription étant donné
que leur localisation nucléolaire est corrélée à la croissance. En effet, PAF53 et
CAST chez la souris sont délocalisées du nucléole dans un milieu de croissance
cellulaire pauvre en nutriment (Hanada et al., 1996; Yamamoto et al., 2004), même si
cette relocalisation n’est pas toujours observée dans le cas de Paf53 (Seither et al.,
1997).

 OU
S. cerevisiae Homo. sapiens S. pom e

Rpa190 A194 Rpa190


Rpa135 A127 Rpa140
Rpc40 AC40 Rpa42
Rpc19 AC19 Rpc17
Rpb6 hRpb6 Rpb6
Rpa14 ? Ker1
Rpb5 hRpb5 Rpb5
Rpa43 hRpa43 Rpa21
Rpa12 hRpa12 Rpa12
Rpb10 hRpb10 Rpb10
Rpb12 hRpb12 Rpb12
Rpb 8 hRpb 8 Rpb 8
Rpa34 (CAST) ?
Rpa49 (PAF53) Rpa51

Tableau 2: Conservation évolutive des sous unités d'ARN pol d'humain, de S. pom e, et de S. cere-
visiae. Les sous unités spécifiques sont indiquées en rouge. ? signifie qu'aucune protéine n'a encore
été identifiée. () signifie que l'équivalence reste à confirmer.

A- B-
4
7 8:Rpb8
1:Rpa190
6 9:Rpa12
2:Rpa135
8 1 3:Rpc40 10:Rpb10
11 5
4:Rpa14 11:Rpc19
3 12 5:Rpb5 12:Rpb12
10 2 6:Rpb6
49 9 49:Rpa49
7:Rpa43 34:Rpa34
34

Figure 10: Structure de l'ARN pol I. A- Représentation de l'ARN pol II, le cercle rouge montre la locali-
sation probable de l'hétérodimère Rpa34-Rpa49 d'après Khun et al.2007. Les données cristallographi-
que à partir de l'ARN pol II ne font apparaitre aucune densité dans cette région, contrairement à l'ARN
pol I. B- Schéma de l'agencement des différentes sous unités au sein de l'ARN pol I. En gris foncé est
représenté le core enzyme, en gris clair les sous unités communes entre les 3 ARN pol eucaryotes et
archéennes et en rouge les sous unités spécifiques.
Enfin, des tests de complémentation hétérospécifiques par CAST et PAF53 ont été
menés chez la levure S. cerevisiae pour conclure quant à leur conservation
fonctionnelle. Aucune des complémentations par CAST ou PAF53 n’a pu corriger un
phénotype provoqué par l’absence respective de Rpa34 ou Rpa49 (Nakagawa et al.,
2003; Panov et al., 2006). Ce résultat négatif, additionné à la faible homologie de
séquence entre ces différentes protéines (Figure 11), empêche de trancher quant à
la conservation de la fonction de ces deux sous-unités humaines avec leurs
équivalents putatifs chez S. cerevisiae. La partie résultat de cette thèse traitera, entre
autre, de la conservation ce ces sous unités spécifiques.

 PM
A-

[Link]
[Link]
[Link]
[Link]
[Link]

B-
domaine I domaine II
[Link] [Link]
[Link] [Link]
[Link] [Link]
[Link] [Link]
[Link] [Link]

C- domaine III

[Link]
200 (50a.a) 100
[Link] (345a.a)
200 300

A A A A
B B B B

200 100 200 300

D-
Domaine I Domaine II Domaine III
[Link]

68 107 319 368 420 426 a.a

E- Domaine I
[Link]
[Link]
[Link]
68 107 a.a
Domaine II
[Link]
[Link]
[Link]

319 368 a.a


Figure 11 : Alignement des équivalents supposés de Rpa34 (S. cerevisiae) chez les levures
([Link], [Link]) et des vertébrés (P. marinus et H. sapiens). A- Localisation des domaines
de similarité entre orthologues de levure S. pom e, . ipo ica et des vertébrés . marin s et H. sapi-
ens. Les domaines I et II ont été identifiés en utilisant MACAW et sont présents chez tous les ortho-
logues. Le domaine III correspond à une distribution atypique de résidus chargés. a.a(acides aminés)
B- Domaine de similarité I et II. Les alignements sont réalisés à partir des domaines identifiés par
MACAW, avec T-Coffee . C- Distribution des résidus chargés dans le domaine III. Les cartes acido-
basiques des orthologues humains et de S. cerevisiae sont réalisées avec DNA strider.(A-acide,
B-basique)D, E: Similarités de séquences entre les protéines Rpa49 (S. cerevisiae), Paf53
(Homo sapiens), SpRpa49 (S. pombe). D- Distribution des domaines conservés sur la séquence
protéique de Rpa49 de S. cerevisiae. Le domaine III correspond à la conservation des propriétés
basiques de l'extrèmité C-terminal dans les trois espèces. E- Domaines de similarités entre Rpa49,
PAF53, SpRPA49. Les domaines I et II ont été identifiés par alignement de séquences par T-coffee.
Le domaine I correspond à la zone d'intéraction de la sous-unité de S. cerevisiae Rpa49 avec Rpa34.
a.a;acide amine.
III-3-Rôle des sous-unités spécifiques de l’ARN Pol I

Chez la levure S. cerevisiae, les rôles de ces deux sous-unités Rpa34 et Rpa49 ont
rapidement été liés. Une interaction entre ces deux protéines a en effet été suggérée
dès 1997, l’absence de l’une provoquant la déstabilisation de l’autre (Gadal et al.,
1997; Huet et al., 1975). Pourtant, les premières données structurales de Bischler
concernant Rpa34 et Rpa49 au sein de l’holoenzyme indiquaient que ces deux sous-
unités étaient distantes (Bischler et al., 2002). Bischler et ses collaborateurs avaient
utilisé les données de microscopie électronique à 1,6 nm de résolution pour avoir
une idée précise des contours de l’ARN Pol I (Bischler et al., 2002; De Carlo et al.,
2003). Ils ont ensuite comparé cette structure à celle obtenue en présence d’anti-
corps spécifique de Rpa34 et de Rpa49. Une nouvelle densité sur les contours tri-
dimensionnels de l’ARN Pol I est observée au microscope électronique et est due
aux anticorps et donc à la présence des sous-unités ciblées.
Par des approches différentes, l’équipe de P. Cramer a obtenu des donnés
concordantes avec une possible interaction de ces sous-unités. Dans cette étude
Kuhn et ses collaborateurs se sont d’abord appuyés sur les donnés
cristallographiques de l’ARN Pol II obtenues en 2001 (Cramer et al., 2001). La
comparaison de cette structure avec celle de l’ARN Pol I visualisée par microscopie
électronique a révélé la forte conservation structurale entre les deux complexes
multimériques (Armache et al., 2003; Cramer et al., 2001). On retrouve dans les
deux structures la région catalytique, les mâchoires, ou encore la pince avec une
forme comparable. A contrario, des régions se distinguant de cette structure pourront
être considérées comme potentiellement liées à la présence des sous-unités
spécifiques de l’ARN Pol I. Dans le but d’identifier ces régions, ils ont comparé la
structure 3D de l’ARN Pol I en absence ou en présence de Rpa34 ou de Rpa49. Le
déficit de densité électronique des deux formes incomplètes (rpa34∆, rpa49∆) est
logiquement associé aux sous-unités manquantes et se situe dans les deux cas à
l’arrière de l’ARN pol I suggérant qu’elles s’associent l’une à l’autre (Figure 10). Cette
protrusion formée par les deux sous-unités spécifiques Rpa34 et Rpa49 n’est pas
retrouvée dans l’ARN Pol II. (Figure 11-A-B)
Enfin, dans cette étude il a été montré que Rpa34 et Rpa49 présenteraient des

 PO
homologies structurales avec les facteurs Rap74 et Rap30 appartenant aux
complexes TFIIF. TFIIF est un facteur de transcription de l’ARN pol II qui semble
avoir différents rôles mais la fonction qui semble la mieux caractérisée est celle liée à
l’élongation (Conaway et al., 2000; Dvir et al., 2001). L’effet positif de TFIIF sur
l’élongation a été étudié in vitro et in vivo. Cette homologie suggère que Rpa49
pourrait avoir un rôle dans l’élongation par l’ARN pol I.

La partie expérimentale de cette thèse permettra d’apporter de nouvelles


informations sur le rôle et la conservation de ces deux sous-unités. Je présenterai les
données concernant Rpa34 et Rpa49 issues de l’étude de l’équipe de Cramer
publiée en 2010, concomitante à mon étude, dans la partie résultats. Je reviendrai
donc plus tard sur les nouvelles données apportées par l’équipe de Cramer et les
confronterai à nos résultats(Geiger et al., 2010).

 PP
C HAPITRE II:

Régulation de la transcription par l’ARN

polymérase I

Préambule

Chez E. coli, tout comme chez les eucaryotes, le contenu en ribosomes varie selon
la croissance. La synthèse d’ARNr est donc soumise à une régulation permanente,
permettant de répondre aux besoins de la cellule. Des changements de conditions
nutritionnelles, environnementales ou de stress sont des stimuli suffisants pour
adapter le taux de synthèse des ARNr (Grummt, 1999; Nomura, 1999; Warner,
1999). La transcription de l’ADNr par sa complexité peut être régulée à différents
niveaux, cette caractéristique lui confère une plasticité et une capacité d’adaptation
unique. Nous allons nous intéresser dans cette partie aux mécanismes impliqués
dans le processus de régulation transcriptionnelle de l’ARN pol I. Deux voies
majeures de régulation de la synthèse de l'ARN ribosomique ont été décrites: la
modulation du nombre de PIC (complexes de pré-initiation) et les mécanismes
modulant l'activité de l’ARN Pol I (indépendamment de la formation des PICs). Nous
nous focaliserons dans un premier temps sur la régulation de l’ARN Pol I par des
facteurs protéiques influençant le processus d’initiation et d’élongation. Puis nous
aborderons des aspects davantage liés à la chromatine. Nous insisterons notamment
sur le rôle des protéines HMGB et des nucléosomes qui déterminent l’accessibilité
du locus d’ADNr pour l’ARN Pol I et sa capacité de transcription.

I-Régulation de l’initiation

L’initiation est un processus essentiel puisqu’il va déterminer le nombre d’ARN pol I


actives en transcription. L’organisation des régions promotrices montre une certaine
conservation entre la levure et les mammifères mais la caractérisation des facteurs
d’initiation au sein de ces organismes n’a révélé que peu d’homologie de séquence
(Chapitre I, II-6). On suppose maintenant que les complexes protéiques de
mammifère SL1/TIF1B sont équivalents au « Core Factor » de levure, car ces deux

 PQ
complexes se lient au promoteur basal. Cependant, ces deux complexes d’initiation
partagent très peu d’homologie (Keener et al., 1998; Schnapp and Grummt, 1991).
De même, le facteur UBF serait équivalent à Hmo1 mais un rôle d’Hmo1 dans
l’initiation n’a jamais été montré. Dans cette partie, nous nous contenterons de traiter
des mécanismes de régulation liés à des facteurs d’initiation qui semblent
fonctionnellement conservés de l’Homme à la levure S. cervisiae.

I-1-Rrn3 et la voie TOR

Chez S. cerevisiae, la voie TOR (Target Of Rapamycine) régule la biogenèse des


ribosomes au niveau transcriptionnel et traductionnel, et joue un rôle primordial pour
coupler la capacité de croissance des cellules avec la formation des ribosomes
(Powers, 2004). La voie TOR est étroitement conservée de la levure à l’Homme.
L’inhibition de cette voie peut être déclenchée par la rapamycine. L’utilisation de
cette drogue mime des conditions pauvres en nutriments ou de quiescence et
conduit à une diminution de la transcription par l’ARN Pol I, mais aussi de la
transcription des gènes codant pour des protéines ribosomiques ou des ARNt qui
sont synthétisés par l’ARN Pol II et l’ARN pol III respectivement (Powers and Walter,
1999). La voie TOR est donc un processus central qui coordonne l’activité des trois
ARN pol eucaryotes mais dont la mécanistique n’est pas encore entièrement
élucidée (Figure 12). Cependant, il semble acquis qu’un des processus de régulation
est dépendant de la phosphorylation de certaines protéines cibles. Rrn3 est l’une
d’entre elles (Cavanaugh et al., 2002). Comme nous l’avons expliqué
précédemment, l’ARN pol I in vivo et in vitro n’est pas capable d’engager un cycle de
transcription si elle n’est pas associée à Rrn3 (Milkereit and Tschochner, 1998;
Yamamoto et al., 1996). À ce titre Rrn3 semble être une cible de choix de la voie
TOR pour ralentir la transcription par l’ARN Pol I.

 PR
Rapamycine
Cytoplasme TORC1

TORC1 POL II
Maf1

Stb3, Dot6, Tod6


Noyau Rpd3L

Sch9 TORC1 Sch9

Rrn3

Nucléole Maf1 Rrn3


POL III TORC1 POL I
TORC1

5s ADNr

Figure12: Schéma du mode de régulation potentiel par la voie TOR. Sch9 peut être phosphorylé
par TORC1, ces deux kinases font parties des deux effecteurs principaux. Sch9 peut permettre l'activa-
tion du facteur Rrn3, empêcher l'effet des protéines inhibitrices Maf1 sur la transcription par l'ARN pol
III et phosphoryler Stb3, Dot6, Tod6, Rpd3L pour réguler l'activité de l’ARN pol II sur la transcription des
gènes codant pour des protéines ribosomiques. En présence de rapamycine l'absence de ces phos-
phorylations par TORC1 et Sch9 provoque une diminution de la transcription. (Adapté de Huber et al.
2009, Wei et al, 2009).
Il a été montré que chez la levure S. cerevisiae les complexes Rrn3-ARN Pol I sont
en quantité limitée en phase stationnaire (Milkereit and Tschochner, 1998). La
réduction de ces complexes effectifs en transcription serait due à une dégradation de
Rrn3 après inactivation de la voie TOR mais surtout à une diminution de la synthèse
de nouvelles protéines Rrn3 (Philippi et al., 2010) alors que la quantité d’ARN pol I
resterait stable. L’importance du facteur Rrn3 dans la régulation de la transcription
est parfaitement illustrée par l’utilisation de la souche mutante CARA (pour
Constitutive Association de Rrn3 et A43). Cette souche contient une modification
génétique permettant l’expression constitutionnelle de la protéine Rpa43 fusionnée à
Rrn3. Dans ces conditions, on observe une résistance accrue à la rapamycine et un
maintien de la transcription par l’ARN Pol I, mais aussi de la transcription par l’ARN
Pol II et du 5S par l’ARN Pol III (Laferté et al., 2006). Rrn3 est donc une cible
clairement établie de la rapamycine mais qui n’influence pas seulement la régulation
de la transcription par l’ARN Pol I mais aussi celle de l’ARN Pol II et l’ ARN Pol III.
Cette conclusion, faisant de Rrn3 une protéine centrale dans la réponse à la
rapamycine, est cependant à nuancer puisqu’une étude récente suggère que la
diminution de la quantité des protéines ribosomiques est un évènement suffisant
pour réduire la transcription par l’ARN Pol I (Reiter et al., 2010). Le travail de l’équipe
du Docteur Warner publié en 2007 pourrait expliquer pourquoi la souche CARA est
davantage résistante à la rapamycine concernant la transcription des gènes codants
pour les protéines ribosomiques. Le complexe CURI serait impliqué ; Utp22 et Rrp7
sont liées aux pré-ARNr en cours de transcription, si la transcription par l’ARN pol I
diminue, ces protéines sont relarguées et forme le complexe CURI en s’associant à
CK2 et Ifh1. Une partie des protéines Ifh1 ne peut donc plus stimuler la transcription
des gènes codant pour les protéines ribosomiques. Il est possible que l’effet observé
dans la souche CARA après traitement à la rapamycine soit dû au fait que la
transcription par l’ARN pol I est maintenue grâce à la fusion Rpa43-Rrn3, en
conséquence les protéines Utp22 et Rrp7 ne forment pas immédiatement le
complexe CURI et la transcription dépendante de Ifh1 peut se poursuivre plus
longtemps(Rudra et al., 2007). Il semble donc trop simple de réduire la réponse à la
rapamycine à l’inhibition de seulement une des trois ARN pol ; ces études renforcent
au contraire l’idée d’interdépendance des 3 ARN pol et d’une régulation systémique

 PT
ciblant ces trois machineries de transcription. La protéine Sch9 pourrait être à la
base de cette régulation(Huber et al., 2011).

Chez les mammifères, l’importance du facteur TIF1-A dans la transcription par l’ARN
Pol I a vite été établie. Les premières expériences de transcription in vitro à partir
d’extraits de cellules en quiescence ont montré que l’ARN Pol I était inactive mais
que la transcription pouvait être activée par l’ajout d’extrait issu de cellule en phase
de croissance. Le facteur responsable de cette activation a été identifié comme étant
TIF1A (Buttgereit et al., 1985). En phase de quiescence, chez les mammifères TIF1A
est délocalisé du nucléoplasme vers le cytoplasme ce qui explique l’incapacité à
initier la transcription. Le facteur Rrn3/Tif1A est donc une cible conservée au cours
de l’évolution pour réguler la synthèse d’ARNr.

Il semblerait que cette régulation se fasse autour de modification post-


traductionelles, notamment des phosphorylations. Il a notamment été proposé que la
phosphorylation de la sous-unité Rpa43 serait déterminante quant à la capacité de
Rrn3 d’être recrutée (Peyroche et al., 2000). Cependant, une analyse systématique
du rôle de chacun des sites de phosphorylation identifiés sur Rpa43 a été réalisée et
ne confirme pas l’importance de ces phosphorylations dans le recrutement de Rrn3
(Gerber et al., 2008). Il reste possible que certains sites de phosphorylation n’aient
pas été explorés, mais ces données ne sont pas en faveur d’une régulation via la
phosphorylation de Rpa43. La régulation pourrait se faire par des phosphorylations
directement sur Rrn3. Des études récentes (Li et al., 2006a; Tsang et al., 2010) de
l’équipe de Steven Zheng ont montré que la sérine thréonine kinase TOR était
localisée spécifiquement sur le promoteur des gènes d’ADNr chez la levure S.
cerevisiae et chez les mammifères. Cette localisation est dépendante des conditions
de croissance et participe activement à la capacité d’initiation de l’ARN pol I associée
à Rrn3/TIF1A.

 PU
I-2-TFIIH

TFIIH est un complexe multi-protéique de grande taille (510 kDA) conservé chez
l’Homme et chez la levure S. cerevisiae. Ce facteur hétéromultimérique semble
impliqué dans différentes fonctions. Il est par exemple impliqué dans les processus
de réparation de l’ADN par excision de nucléotides (NER) qui prend en charge la
réparation des lésions dues aux ultraviolets (Egly, 2001), son activité requiert
notamment une double activité ADN hélicase portée par Rad3 et Rad25 chez la
levure.

Les données actuelles sur ce facteur TFIIH indiquent qu’il interviendrait davantage
dans le processus d’initiation. En effet, il ne semble pas être enrichi dans la
séquence transcrite mais plutôt au promoteur des gènes d’ARN Pol II (Mayer et al.,
2010). TFIIH possède en son sein la protéine Kin28 qui semble essentielle à la
transcription par son activité kinase car elle phosphoryle la sérine 5 de la queue
CTD. Cette phosphorylation participe à la phase de translocation de l’enzyme (pour
revue (Conaway et al., 2000). Il se pourrait également que l’activité hélicase de
Rad25 participe à l’ouverture de la bulle de transcription (Holstege et al., 1997;
Holstege et al., 1996). L’équipe de Grummt en 2002 a proposé une fonction du
facteur TFIIH dans la transcription par l’ARN pol I chez les mammifères. Cette
hypothèse repose sur deux faits expérimentaux : TFIIH stimule la transcription de
l’ARN Pol I in vitro, et on observe la présence de ce facteur en microscopie dans le
nucléole. Un rôle de TFIIH chez S. cerevisiae est également suggéré du fait que des
mutants de TFIIH présentent des défauts de transcription de l’ARN Pol I. Les auteurs
suggèrent que le rôle potentiel de TFIIH dans la transcription par l’ARN Pol I
concernerait l’initiation car ces mutants de TFIIH (Kin28-ts et tbf1-ts) ont un
phénotype comparable à un mutant d’initiation de l’ARN pol I (rpa43-ts) (Iben et al.,
2002). Le rôle précis de TFIIH dans la transcription par l’ARN pol I reste malgré tout
assez mal connu.

 QL
II-Facteurs d’élongation impliqués dans la transcription par l’ARN
pol I.

Préambule

Coupar et Chesterton en 1975 par des expériences menées sur des foies de rats
proposaient que la variation du taux d’élongation serait un facteur déterminant pour
réguler la transcription par l’ARN Pol I plutôt que le nombre d’ARN pol chargées sur
l’ADNr (Coupar and Chesterton, 1975). Cette théorie n’est pas tombée en désuétude
puisqu’elle fut reprise 20 ans plus tard par Tom Moss (Stefanovsky et al., 2006).Pour
comprendre la régulation du cycle de transcription de l’ARN Pol I, il semble donc
nécessaire d’appréhender non seulement l’initiation de la transcription mais aussi les
étapes postinitiatrices. En effet, la processivité, la vitesse d’élongation et la capacité
d’outrepasser les contraintes topologiques rencontrées par l’ARN pol I vont
influencer directement sur sa capacité à transcrire et sur le devenir des transcrits. À
ce titre, la quantité d’ARN Pol I engagée en transcription à un moment T peut ne pas
être directement liée à la quantité d’ARN produits, d’où la nécessité de caractériser
et de comprendre le fonctionnement de facteurs de transcription impliqués dans
l’élongation par l’ARN pol I.

II-1-Facteurs d’élongation de l’ARN Pol II

Chez les eucaryotes, la majorité des études concernant le rôle de ces facteurs ont
d’abord été menées sur l’ARN pol II et leur importance n’est plus à démontrer. Ces
facteurs sont à la base de processus clefs permettant d’influer directement sur la
processivité de l’ARN pol II et sur la vitesse de synthèse du transcrit. De plus, des
études récentes suggèrent également que ces facteurs peuvent entrainer des
phénomènes de pauses transcriptionnelles favorisant le « capping » du transcrit
directement lié à son devenir. Enfin, ils permettent à l’ARN pol d’outrepasser
certaines contraintes topologiques ou chromatiniennes pouvant moduler ou arrêter
temporairement l’ARN pol II en phase d’élongation.

 QM
La phosphorylation de la queue CTD, présente sur la plus grande sous-unité de
l’ARN pol II, a longtemps été présentée comme nécessaire et suffisante pour le
recrutement de ces facteurs. Cependant, des études récentes ont montré d’une part
que la queue CTD n’était pas essentielle au recrutement de ces facteurs de
transcription, même si elle y contribue (Mayer et al., 2010) et que certains de ces
facteurs avaient une capacité d’interaction directe avec l’ARN pol I (Birch et al., 2009;
Viktorovskaya et al., 2011). Ces études, et d’autres plus antérieures que nous allons
décrire dans les paragraphes suivants, tendent à montrer que le fonctionnement de
l’ARN pol I est aussi soumis à une régulation par des facteurs d’élongation dont la
plupart seraient communs à l’ARN pol II.

II-2-Facteurs d’élongation communs à l’ARN Pol I et à l’ARN Pol II

La caractérisation de facteurs de transcriptions impliqués dans la régulation de


l’élongation de l’ARN Pol I n’est pas aisée. Cette difficulté tient principalement au fait
que les facteurs caractérisés sont également connus pour réguler l’activité de l’ARN
pol II. Cette double spécificité peut poser des problèmes d’interprétation sur le lien
direct ou non avec les phénotypes observés étant donné l’interdépendance des trois
ARN pol eucaryotes (Laferté et al., 2006). L’identification de liens physiques et
génétiques de certains de ces facteurs de transcription avec les sous-unités
spécifiques de l’ARN pol I, Rpa34 et Rpa49, ne permet pas de s’affranchir totalement
de ces contraintes d’interprétation mais constituent des arguments solides pour
soutenir l’hypothèse d’un lien entre ces facteurs et l’ARN pol I.

Dans ce sens, l’équipe de Schneider a utilisé la souche invalidée pour le gène


RPA49 pour identifier des facteurs d’élongation liés à l’ARN Pol I par des approches
génétiques. Il avait été montré précédemment que l’absence de Rpa49 altérerait
l’élongation par l’ARN Pol I (Beckouet et al., 2008; Kuhn et al., 2007). Ce défaut en
fait une cible de choix pour des approches de cribles génétiques permettant
d’identifier dans des doubles mutants des facteurs d’élongation qui amélioreraient
(suppresseur) ou altèreraient (synthétique létal) la croissance. De manière
schématique, les gènes identifiés comme suppresseurs seront considérés comme
des facteurs limitant l’élongation et les synthétiques létaux comme des régulateurs

 QN
positifs de l’élongation. Par cette approche, ont été identifiées des protéines définies
comme étant des facteurs de transcription (tableau 3) de l’ARN Pol I.

Dans une étude récente, l’équipe de Patrick Cramer a classé les facteurs
d’élongation impliqués dans la transcription par l’ARN pol II en trois groupes selon
leurs profils de répartition sur les gènes dont ils régulent la transcription (Mayer et al.,
2010). Le groupe 1 est composé de Spt4, Spt5, Spt6, le groupe 2 est composé de
Elf1 et Spn1 et le groupe 3 de Spt16, Paf1, Ctk1, Bur1 (figure 13). On peut noter que
tous les facteurs du groupe 1 sont des suppresseurs alors que les facteurs du
groupe 2 et 3 sont synthétiques létaux en combinaison avec la délétion de RPA49
suggérant des rôles différents dans l‘élongation de l’ARN pol I. Dans la partie
suivante, j’ai donc choisi de décrire ces facteurs et leurs rôles potentiels dans
l’activité d’élongation de l’ARN pol I.

 QO
Facteur phénoype double mutant Δ-Rpa49Δ référence

Spt4/Spt5 Supresseur Viktorovskaya et al. 2011


Spt16 Synthétique létal Davierwala et al. 2005
Paf1 Synthétique létal Zhang et al. 2010

Tableau 3: Récapitulatif des liens génétiques entre la délétion de RPA49 et des facteurs de transcrip-
tion.

promoteur 5' 3'


ORF
0.30
0.25
ChIP-chip profil

0.20
0.15
0.10 Groupe 1 Groupe 2
Spt4 Spn1
0.05 Spt5 elf1
Spt6

0.30

0.25
ChIP-chip profil

0.20
0.15
Groupe 3
0.10 Paf1
Ctk1
0.05 Bur1
Spt16

Figure 13: Profil de répartition moyen de facteurs de transcription sur 339 gènes de taille moyenne chez S.
cerevisiae (1238 nucléotides+/_ 300). On peut distinguer trois groupes de facteurs de transcription selon leur
profil de répartition sur les gènes (Adapté de Mayer et al 2010).
II-3-Spt4/Spt5

Ce facteur de transcription a la particularité d’être conservé à travers l’évolution, on


retrouve un équivalent chez les procaryotes (NusG), les archées (RpoE/NusG) et les
eucaryotes (spt4/spt5) (Figure 14A). Les rôles décrits pour ces deux facteurs sont
multiples. De manière générale, ils permettraient de stimuler l’élongation de la
transcription, d’augmenter le processivité par la fermeture du « clamp » et de
permettre le couplage de processus co-transcriptionels (réparation, « capping », et
traduction chez les procaryotes) en induisant des pauses durant la transcription
(Burmann et al., 2010; Palangat et al., 2005; Proshkin et al., 2010).

Deux études récentes (Klein et al., 2011; Martinez-Rucobo et al., 2011) ont permis
de démontrer la conservation structurale de ces facteurs à travers l’évolution et la
conservation des zones d’interactions de ces facteurs avec l’ARN Pol II. Il a été
montré dans ces études qu’une des propriétés conservées de Spt4/spt5 est de
bloquer les acides nucléiques près du centre actif, de stabiliser la bulle de
transcription et de rendre l’ARN pol en cours d’élongation plus processive (Figure 14-
A-B). Ce mécanisme rendrait la transition entre l’initiation et l’élongation irréversible.
Cette activité serait essentiellement portée par le domaine NGN (« Nus G N-terminal
domain ») alors que les fonctions de couplage transcriptionnel décrit précédemment
seraient d’avantage liées aux domaines KOW (pour Kyprides, Ouzounis, Woese
(Kyrpides et al., 1996) dont le nombre varie selon les espèces (Figure 14-A). Un rôle
eucaryote spécifique est également rempli par le domaine C terminal de Spt5 qui
peut recruter d’autres complexes impliqués dans l’élongation (PAFc : Polymerase II
Associated Factor) après phosphorylation (Liu et al., 2009).

Chez la levure S. cerevisiae, Spt4 et Spt5 ont été caractérisés comme


potentiellement liés à l’activité de transcription par l’ARN pol I du fait que plusieurs de
ses sous-unités co-purifient avec Spt5 (Schneider et al., 2006). Il a été ensuite
montré par immuno-précipitation de la chromatine (ChIP) que Spt4 et Spt5 sont
associés au locus d’ADNr (Schneider et al. 2006). Les travaux qui ont suivi ont
permis de préciser les rôles de Spt4/spt5 sur l’ADNr. Grâce à des versions mutantes
de Spt5, il a été montré que ces deux protéines pouvaient assumer des fonctions
indépendantes.

 QQ
A-

Archée Bactérie

NGN Spt4 (RPpoE'') NGN Kow


Zn NusG
binding

NGN Kow Spt5 NusG)

Eucaryote

NGN
Zn Spt4
binding

acidic NGN Kow Kow CTR


region 2-4-5 Spt5
1

B- ADN après le passage


de l'ARN polymerase

Spt4 Hybride ADN-ARN Spt4


Spt5 Spt5
Clamp
Clamp

ADN avant le
passage de
l'ARN polymerase

90°

Centre actif

Figure 14: A- Représentation schématique des différentes protéines équivalentes à Spt4/Spt5


dans les règnes procaryote, eucaryote et archéen. Chez la bactérie, la protéine Spt4 n'est pas
conservée, cependant la protéine NusG est équivalente à Spt5. B- Représentation sous deux angles
différents de la localisation de Spt4/ Spt5 sur l'ARN pol II eucaryote. Comme on peut le voir en rouge
ces deux protéines sont situées en proximité immédiate du "clamp" (la pince).
(Adaptée de Martinez-Rucobo, 2011)
Spt4 n’est pas essentielle mais sa délétion entraine une réduction significative du
nombre de copies d’ADNr, et un défaut de maturation des ARNr. Cependant, dans
cette étude, on n’observe qu’une faible diminution du taux de synthèse d’ARNr, pas
de défaut significatif de la processivité de l’ARN pol I (observé dans le cas de l’ARN
pol II dans un spt4-∆) (Mason and Struhl, 2005). Il est donc difficile de conclure quant
à un rôle direct de Spt4 sur la transcription par l’ARN pol I. Il se peut que la fonction
principale de Spt4 vis à vis de l’ARN Pol I soit d’aider Spt5 à assurer sa fonction.

Deux publications récentes ont été plus loin pour comprendre la fonction de Spt5
(Anderson et al., 2011; Viktorovskaya et al., 2011). Il a été montré que Spt5 est
capable d’interagir avec de nombreux facteurs impliqués dans la transcription par
l’ARN Pol I. En effet, Spt5 peut interagir avec Rpa190, Rpa 135, Rpa49, Rpa34 et
Rrn3. La méthode utilisée ici de GST pull down et l’absence de contrôle négatif ne
permettent pas de conclure formellement quant à l’existence de ces interactions.
Spt5 est une protéine essentielle ce qui a conduit à utiliser des versions mutantes
pour étudier son rôle. L’une d’entre elles (spt5 C292R) est capable de supprimer le
phénotype de cryosensibilité d’une souche rpa49-∆. Ce mutant de Spt5 altère
significativement le taux de synthèse d’ARNr sans pour autant changer le nombre
d’ARN Pol I par gène, ni le nombre de copies d’ADNr. Ce phénomène peut
s’expliquer par une différence dans la vitesse d’élongation. Par une approche de
microscopie électronique en étalement de Miller, il a également été montré dans ces
études que l’absence de Spt5 entrainait une réorganisation du positionnement des
ARN pol I le long du gène d’ADNr. Sur de nombreux gènes on observe un nombre
plus important d’ARN Pol I en 3’ qu’en position 5’ proche du promoteur. Dans un
contexte sauvage, en présence de Spt5 la situation inverse est observée. L’auteur
explique ce phénomène par la conservation chez l’ARN pol I du mécanisme de
pause effectuée par Spt5 sur l’ARN Pol II chez la drosophile (Wu et al., 2003) même
si ce phénomène n’a pas été observé pour l’ARN Pol II de levure S. cerevisiae.

Pour conclure, il semble établi que Spt5 intervienne dans l’élongation par l’ARN pol I
même si sa fonction n’est pas clairement élucidée. Il semblerait que ce rôle soit
double. D’une part Spt5 augmenterait la vitesse de transcription par une action
directe ou en permettant le recrutement du complexe Paf (Polymerase II Associated

 QS
Factor) (voire ci-dessous)(Zhang et al., 2010). D’autre part, il est suggéré que Spt5
puisse intervenir dans la pause, l’absence de pause pourrait améliorer le phénotype
de croissance d’une souche rpa49-∆. Une autre hypothèse serait qu’en absence de
Spt5, l’ARN pol I en élongation est plus instable conduisant au décrochage des ARN
pol I bloquées ou défectives probablement abondantes dans le cas d’une souche
rpa49-Δ. Cette dernière hypothèse pourrait expliquer pourquoi Spt5 améliore la
croissance d’une souche Rpa49-∆(Anderson et al., 2011).

II-4-Spt6

Spt6 est un facteur de transcription très conservé au cours de l’évolution. Chez la


levure S. cerevisiae, Spt6 est connu pour influer sur la chromatine au cours de
l’élongation par une activité d’histone chaperonne. Spt6 est d’ailleurs capable
d’assembler des histones sur une matrice d’ADN in vitro (Close et al., 2011). Il est
également important de noter que l’invalidation de Spt6 supprime l’inactivation du
complexe remodeleur de chromatine Swi/Snf (Neigeborn and Carlson, 1987;
Swanson and Winston, 1992) et entraine une diminution globale de fixation des
histones (Kaplan et al. 2003 ). Récemment, il a été montré que Spt6 a la
capacité d’interagir directement avec l’ADN double brin et avec l’ARN pol II (Close et
al., 2011). Spt6 semble avoir également des fonctions indépendantes d’un rôle
d’histone chaperonne puisque cette protéine est conservée chez les procaryotes.
Chez l’Homme, ce facteur est également capable de stimuler l’élongation par l’ARN
pol II in vitro (Endoh et al., 2004).

Spt6 a donc différents rôles : facteur d’élongation, histone chaperonne. Il est alors
difficile de savoir si ce facteur est directement impliqué dans l’élongation par l’ARN
pol I. Il est néanmoins intéressant de souligner que Spt6 semble particulièrement
requise pour maintenir une structure nucléosomale des gènes hautement transcrits
(Ivanovska et al., 2011), ce qui pourrait lui conférer un rôle dans la région la plus
activement transcrite du génome : l’ADNr. Le rôle de ce facteur dans la transcription
par l’ARN Pol I reste à confirmer. Très récemment, une étude double hybride atteste
l’existence de contact entre Rpa43 et Spt6 (Beckouet et al., 2011).

II-5-Spt16

 QT
Spt16 appartient au complexe FACT (Facilitate Chromatin Transcription) qu’il forme
avec son partenaire la protéine Pob3. Cet hétérodimère est bien conservé chez les
eucaryotes, à l’exception d’une région de Pob3 qui contient un domaine HMGB.
Chez S. cerevisiae, ce domaine est absent mais est remplacé par la protéine HMGB
Nhp6 qui est alors nécessaire à l’activité FACT (Formosa, 2008; Stillman). Le
complexe FACT est décrit comme capable d’interagir avec les nucléosomes grâce à
son domaine de liaison à l’ADN mais aussi par la capacité de Pob3 et de Spt16 de
contacter les histones (VanDemark et al., 2008). Il a notamment été montré que
FACT stimulerait la transcription en déstabilisant l’octamère d’histone par le
relargage du dimère H2A-H2B (Figure 15) (Orphanidies and Reinberg, 2000).

Chez les mammifères, l’équipe de Zomerdijk a étudié le rôle de FACT dans la


transcription par l’ARN pol I. Ils ont identifié Spt16 comme co-purifiant avec l’ARN pol
I, et confirmé sa présence sur l’ADNr par immunoprecipitation de la chromatine. Une
diminution de la quantité de Spt16 par ARN interférence conduit à une diminution de
synthèse du pre-ARN de l’ordre de 50%. Cependant en utilisant la technique de
protection à la nucléase S1 avec un oligonucléotide complémentaire des 40 premiers
nucléotides de ce pré-transcrit, on retrouve une quantité équivalente d’ARN indiquant
que la diminution observée de la quantité du transcrit primaire en absence de Spt16
serait liée à un défaut d’élongation (Birch et al., 2009). Cette étude montre
l’intervention de FACT dans le fonctionnement de l’ARN Pol I.

Dans le cas S. cerevisiae, l’implication de Spt16 comme facteur d’élongation n’a pas
été démontrée, cependant en consultant les résultats d’un crible génétique utilisant
des versions hypomorphes de gènes essentiels, il apparaît qu’une version
hypomorphe de l’allèle codant pour SPT16 est synthétique létale avec RPA49
(Davierwala et al., 2005). Ce lien génétique suggère la conservation du processus
décrit précédemment mais reste à confirmer.

 QU
pol I
1

Spt16
pol I Pob3 Spt16
2 Pob3

Nucléosome Hexasome Hexasome Nucléosome

3 pol I

Figure 15: Représentation du mode d'action probable des protéines du complexe FACT. (1) La
présence de nucléosomes pourrait constituer un point de blocage pour le passage de l'ARN pol I. (2)
Spt16 et Pob3 sont capables de se fixer directement sur l'ADN ou sur les nucléosomes. A partir de là,
ce complexe pourrait permettre de relarguer un hétérodimère H2A-H2B de l'octamère d'histone
(Stillman et al. 2010, Vandemark et al. 2008). De plus, il a été suggéré que le complexe FACT pourrait
être recruté directement sur l'ARN pol I. (3) La déstabilisation du nucléosome faciliterait le passage de
l'ARN pol.
II-6-Paf1c

Le complexe Paf1 (Paf1c) est constitué de 5 protéines : Cdc73, Ctr9, leo1, Rtf1 et
Paf1. La caractérisation de Paf1C comme un facteur de transcription de l’ARN pol II
a largement été documentée. Il a été décrit initialement comme facteur d’initiation car
Paf1c est capable de faciliter l’initiation en influant sur la fixation de TBP sur la boite
TATA (Stolinski et al., 1997). Paf1c semble également impliqué dans l’élongation car
il peut interagir avec les facteurs d’élongation Spt4/Spt5 et avec les protéines de
FACT (Squazzo et al., 2002). De plus, Paf1c a la capacité de stimuler l’élongation
aussi bien in vivo qu’in vitro (Chen et al., 2009; Rondon et al., 2004). Enfin, Paf1c
peut recruter le complexe methyltransférase COMPASS permettant la méthylation
des lysine 4 et 79 de l’histone H3 chez la levure (Krogan et al., 2003) mais aussi
chez la drosophile (Adelman et al., 2006) et chez l’humain (Zhu et al., 2005). Paf1c
est donc directement acteur de la transcription par l’ARN pol II.

Deux études récentes de l’équipe de Schneider ont suggéré un rôle de Paf1C dans
la transcription par l’ARN Pol I(Zhang et al., 2010). En 2009, ils ont d’abord montré
que Paf1C immunopreciptait avec l’ADNr et que son absence diminuait le taux de
synthèse des grands ARNr sans pour autant changer drastiquement le nombre
d’ARN pol engagées en transcription. Dans la publication suivante un lien de létalité
synthétique avec RPA49 a été mis en évidence et il a été montré que Paf1c purifié
augmente la vitesse de transcription par l’ARN pol I dans une expérience de run off.
L’intervention de Paf1c dans l’optimisation de la transcription de l’ARN pol I semble
donc admise mais il est important de noter qu’aucune interaction de Paf1 n’a été
mise en évidence avec l’ARN pol I, posant ici la question de son recrutement.

L’ensemble de ces résultats, pour la plupart récents et encore spéculatifs suggère


fortement que certaines des protéines intervenant dans l’élongation de l’ARN Pol II
opèrent également avec l’ARN Pol I (Figure 16). Certaines études, notamment celle
concernant FACT et Spt5 font plus que suggérer un rôle de ces facteurs dans
l’élongation par l’ARN pol I. Cependant, ces études soulèvent certaines
interrogations.

 RM
Interagit avec FACT et Spt4/5.
Stabilise la fermeture de la pince. Stimule la transcription.
Augmente la processivité. PAF1c
Spt5 Spt16
Spt4 Pob3
Spt6 Déstabilise les octamères
pol I d'histones.

Histone Chaperonne.
re-positionement des nucléosomes.
Rôle sur la chromatine mais
peu d'information.

Délétion supprime le phénotype rpa49 Δ

Délétion co-létale avec rpa49 Δ

Facteur Phénotype Phénotype Interaction ChIP ADNr Synthèse ARNr Maturation


délétion délétion ARN pol I ARNr
+rpa49-Δ

Spt5 Létal Suppresseur* Oui Oui Diminue Défaut


Spt6 Viable ? Oui ? Diminue Défaut
Paf1 Viable Létal Non Oui Diminue Défaut
Spt16 Létal Létal* Oui(H) Oui(H) Diminue(H) ?

*Dans le cas de ces 2 gènes essentiels, il s'agit d'un lien génétique avec RPA49 et une version mutée ou
hypomorphe respectivement pour Spt5 et Spt16.
(H) Caractérisé chez l'Homme
? non étudié

Figure 16: Résumé des informations concernant différents facteurs de transcriptions impliqués dans la
transcription par l'ARN pol I et l'ARN pol II.
En effet, il est intéressant de souligner que chez la levure S. cerevisiae une mutation
ou l’absence des facteurs Spt4, Spt5, Paf1, entrainent tous un défaut de maturation
du 35S. Gallagher et ses collaborateurs ont suggéré en 2004 que le SSU
processome contenu dans les boules terminales décorant les ARNr naissants
pourraient influencer sur la transcription (Gallagher et al., 2004). L’étude réalisée par
Schneider en 2007 a renforcé la notion d’interdépendance entre l’étape d’élongation
et celle de la maturation de l’ARNr 35S. Une mutation (rpa135-D784G) dans le site
actif de l’ARN pol I provoque un défaut d’élongation et conduit également à des
défauts de maturation du pré-ARNr et d’assemblage des ribosomes(Schneider et al.,
2007). Cette donnée soutient l’hypothèse que les défauts de maturation observés
peuvent être la conséquence d’un défaut d’élongation de l’ARN pol I et non la cause.

Il est probable que dans le futur des études in vitro et in vivo soient nécessaires pour
aller plus loin dans la compréhension de ces mécanismes d’élongation de l’ARN Pol I
qui, comme des études le suggèrent, seraient l’étape clef dans la régulation de la
synthèse des grands ARNr ( pour revue (Moss et al., 2006)).

II-7- La nucléoline

Depuis sa caractérisation, il y a 38 ans (Orrick et al., 1973), la nucléoline a été


impliquée dans de nombreuses fonctions : transport nucléocytoplasmique,
assemblage des ribosomes, régulation de la structure chromatinienne, la
transcription de gènes d’ARN Pol II, et la maturation des transcrits (Ginisty et al.,
1998a; Ginisty et al., 1998b). Cette protéine très conservée de l’Homme à la levure
est donc impliquée dans une pléiotropie de fonctions, cependant le fait que la
nucléoline est la protéine non ribosomique la plus abondante du nucléole et qu’elle
semble avoir une fonction dans la transcription, renforce l’idée d’une fonction
spécifique dans la synthèse des ARNr.

Des expériences ont démontré l’existence d’une relation entre la nucléoline et la


transcription par l’ARN Pol I. Il a notamment été montré que l’altération de
l’expression de la nucléoline par ARN interférant bloque la synthèse du pré-ARNr
(Rickards et al., 2007).

 RO
Même si la nucléoline semble capable de stimuler la transcription de l’ARN Pol II
(Angelov et al., 2006), ses fonctions in vivo semblent spécifiques du fonctionnement
d’une seule des 3 ARN pol eucaryotes, l’ARN Pol I. En 2002, Roger et al. ont montré
que l’injection de nucléoline dans des oocytes de xénope entraine une baisse de
l’accumulation du pré-ARNr alors que dans le même temps la transcription Pol II et
Pol III n’est pas affectées. Les auteurs, par des tests de transcription, ont également
montré que la séquence du promoteur est déterminante quant à la possibilité d’action
de la nucléoline. Ils n’observent des effets sur la transcription uniquement si la région
transcrite est flanquée en 5’ d’une séquence promotrice d’ARN Pol I et pas d’ARN
Pol II (Roger et al., 2002). Une autre étude en 2007 sur des cellules HeLa, montre
par des expériences de ChIP que la nucléoline est enrichie sur la région transcrite de
l’ADNr et ne l’est pas dans l’espace intergénique de l’ADNr ou sur les gènes
transcrits par l’ARN Pol II et ARN Pol III (Rickards et al., 2007). Cette étude,
initialement menée pour identifier des facteurs ayant une activité FACT, montre que
la nucléoline est importante pour la transcription par l’ARN pol I et possède une
activité FACT. D’ailleurs, depuis 2006, l’équipe de Philippe Bouvet a montré que la
nucléoline avait des propriétés d’histones chaperones, notamment grâce à sa queue
N terminale acide (Angelov et al., 2006). Dans cette publication, la capacité de la
nucléoline d’améliorer significativement l’efficacité des machineries de remodelage
de la chromatine SWI/SNF et ACF est mise en évidence. La nucléoline permet aussi
un recyclage et une déstabilisation plus efficace de l’octamère d’histone en facilitant
le décrochage des dimères H2A-H2B (Mongelard and Bouvet, 2007). La nucléoline
répond aux critères définissant une protéine à activité FACT, c’est-à-dire facilitant la
transcription sur une matrice chromatinienne. Cette activité FACT portée par la
nucléoline, tout comme celle portée par Spt16, semble impliquée dans la
transcription par l’ARN pol I.

IV-Régulation Chromatinienne

Préambule

Pendant longtemps la régulation de la transcription de l’ARN Pol I a été décrite


comme dépendante de deux mécanismes : l’initiation et le nombre de gènes
accessibles à la machinerie de transcription. Comme nous venons de le voir d’autres

 RP
mécanismes comme l’élongation rentrent en jeu pour réguler le taux de synthèse.
Dans cette partie nous allons aborder un point qui influence toutes les régulations
préalablement décrites, il s’agit des régulations chromatiniennes de l’ADNr qui
s’échelonnent à deux niveaux : à l’échelle globale du locus d’ADNr où l’on peut
observer des modulations des ratios entre copies actives et inactives en
transcription, et à l’échelle du gène où des changements chromatiniens peuvent
faciliter ou empêcher la transcription par l’ARN pol I.

III-1-Dynamisme du locus d’ADNr : rôle du ratio copies actives/inactives

Historiquement, les gènes d’ADNr ont été les premiers à avoir été visualisés en
microscopie électronique. Ces structures ont été apparentées à des « arbres de
Noël » laissant apparaître des transcrits naissants autours d’un axe formé par la
matrice d’ADN (Miller and Beatty, 1969). Les travaux menés par Oscar L Miller, Jr et
ses collaborateurs en 1969 ont ainsi permis de mettre en évidence l’hétérogénéité
transcriptionnelle des répétitions des gènes d’ADNr. Cette approche basée sur
l’étalement de la chromatine et l’observation au microscope électronique permet de
visualiser sur un gène les ARN Pol I actives en transcription flanquées de leurs ARN,
alors que d’autres gènes adjacents en sont dépourvus (Figure 17). La technique
d’étalement de la chromatine de Miller consiste à réaliser une lyse hypotonique des
cellules permettant à la chromatine de sortir du noyau. La préparation cellulaire est
ensuite centrifugée sur une grille de microscopie électronique permettant d’observer
les fibres de chromatine s’échappant du noyau (Osheim et al., 2009).

Il a ainsi été montré que chez la majorité des organismes eucaryotes, les gènes
ribosomiques sont répartis en deux populations distinctes, les régions actives (Figure
17-B) et inactives transcriptionnellement (Figure 17-A). Il semble maintenant établi
que l’ADNr inactif contient des nucléosomes espacés de manière régulière
contrairement à l’ADNr actif (Dammann et al., 1993; Sogo and Thoma, 1989). Ces
nucléosomes semblent visualisable par ces étalements de chromatine en se basant
sur des critères morphologiques, néanmoins, aucune caractérisation moléculaire
avec des anticorps couplés à des grains d’or n’a pu être réalisée pour confirmer qu’il
s’agit bien de nucléosome.

 RQ
A-
Exemple d'un nucléole étalé par la technique dite
de "Miller spread". On repère aisément les régions
denses entourées d'ARN qui représente les gènes
d'ADNr transcrits par l'ARN pol I.

copie ouverte (2000nm)

région entre
deux gènes d'ADNr 500nm

Exemple d'un gène d'ADNr actif en transcription


1500 nmn

B-

ARNr 500nm
Nucléosomes

Copies
ouvertes
Copies ouvertes
Copie fermée (1100nm)

500nm
Figure 17: A- Exemple d'un nucléole de levure S. cerevisiae dont la chromatine a été étalé et contras-
tée avant observation au microscope électronique. Exemple d'un gène actif en transcription
(Panneau de droite). (Albert et al, 2011) et photographie d'Isabelle Léger silvestre. B- Visualisation
d'une copie d'ADNr considérée comme "fermée", c'est à dire non-transcrite. On distingue d'ailleurs
des structures nucléosomales. (revue Albert et al. 2011)
En se basant sur cette organisation chromatinienne différente, la technique de
photopontage au psoralène s’est avérée un outil essentiel. Le psoralène est un agent
s’intercalant dans l’ADN double brin et qui génère des liaisons covalentes après
irradiation aux UV. Le psoralène se fixe moins efficacement sur les matrices d’ADN
contenant des nucléosomes « canonique ». Les différences d’incorporation de
psoralène seront alors révélées par migration sur gel d’agarose, l’ADN ayant
incorporé le plus de psoralène aura une migration ralentie. Cette fixation différentielle
du psoralène peut également être révélée par microscopie électronique où l’on
aperçoit après dénaturation de l’ADN des structures simples brins en boucles de la
taille correspondante à celle couverte par un nucléosome (environ 140 paires de
base), l’ADN non nucléosomal apparaît sous forme double brin (Dammann et al.,
1993) (Figure 18). Cette technique de « psoralen cross linking » a renforcé l’idée de
l’hétérogénéité chromatinienne au sein du locus d’ADNr, et a permis de quantifier le
rapport existant entre gènes ouverts et fermés. Ainsi, chez la levure S. cerevisiae et
chez les mammifères on estime que seulement une partie (environ 50%) des gènes
d’ADNr sont actifs en transcription. Dans le cas des eucaryotes supérieurs, les
signaux de stress, l’absence de nutriment ou la présence de facteurs de croissance
entrainent des changements du taux de transcription par l’ARN Pol I sans pour
autant nécessiter une variation du nombre de gènes accessibles pour la transcription
(Stefanovsky et al., 2006). Au contraire, la littérature suggère que le ratio entre gènes
actifs et inactifs chez le mammifère resterait constant du fait de modifications
épigénétiques stables (CpG méthylations) d’un nombre fixe de gènes (Santoro and
Grummt, 2001). Cette notion a été remise en cause, étant donné que plusieurs
publications ont démontré des variations possibles du nombre de gènes actifs à
certains stades de la différenciation cellulaire ou dans le cas de dérèglements
pathologiques (Sanij et al., 2008; Tucker et al., 2010). Par exemple, une sous-
expression d’UBF cause une augmentation du nombre de copies fermées. Au sein
de ces gènes inactifs, on a alors deux types de structure chromatinienne: des gènes
sous forme d’hétérochromatine contenant des méthylations qui ne peuvent pas être
activés et des gènes euchromatiques assemblés sous forme nuclésomale qui ont la
capacité d’être réactivés (Sanij et al., 2008).

 RS
Inactif Actif Inactif

Psoralen + UV

Digestion et isolation
de l'ADN

gel électrophorèse Microscopie électronique


Act
if
Actif
actif
inactif
Inactif

psoralen - +

Figure 18: Technique de Psoralen Cross Linking. Le psoralen est incapable de s'intercaler dans
les structures nucléosomales. Au contraire les régions "ouvertes" transcrites par l'ARN pol I sont
accessibles. Cette différence,s'illustre en microscopie électronique par une hétérogénéité entre les
gènes inactifs faisant apparaitre des boucles simple brin issues de la protection par les nucléoso-
mes, et les gènes actifs ne montrant pas de boucle simple brin. En gel électrophorèse, l'ADN ayant
fixé le plus de psoralen migrera plus lentement (actif) que les gènes inactifs ayant accumulé moins
de psoralen (inactif).(La barre représente 1kbAdapté de Damman et al., 1993)
Chez la levure S. cerevisiae, il a longtemps été suggéré que ce ratio de copies
actives/inactives serait aussi un levier de régulation pour contrôler la synthèse
d’ARNr. Cette hypothèse s’appuie sur l’observation qu’en phase stationnaire la
quantité de gènes actifs diminue parallèlement au taux de synthèse d’ARNr
(Sandmeier et al., 2002). La protéine responsable de ce mécanisme serait l’histone
deacétylase Rpd3. Une étude de Tsang et al. 2003 abonde dans ce sens. Dans cette
étude, on observe une délocalisation de l’ARN Pol I qui serait induite par une
altération structurale du nucléole suite à un traitement par la rapamycine. Rpd3 serait
responsable de ce changement puisqu’il n’est pas observé dans un contexte rpd3-∆.
De plus, par des expériences de « Northern blot », on observe dans un rpd3-∆ un
effet moins fort de la rapamycine qui entraine une diminution de l’accumulation de
35S après traitement à la rapamycine, suggérant que Rpd3 serait impliquée dans la
régulation par la voie TOR et que son absence confèrerait au mutant une résistance
à la rapamycine (Tsang et al., 2003). Cependant, ces observations ont été
contredites pas les équipes de Beyer et Nomura qui ont montré que le traitement à la
rapamycine entrainait une diminution de la synthèse de l’ARNr sans pour autant
diminuer le nombre de gènes actifs, mais plutôt en limitant l’association de l’ARN pol
I compétente en transcription (French et al., 2003).

Les données concernant Rpd3 sont donc clairement contradictoires concernant son
implication dans la voie TOR, mais l’ensemble de ces études suggère qu’une
réduction du nombre de copies fermées ne constitue pas un processus central et
essentiel pour la régulation de la transcription par l’ARN Pol I.

L’étude menée par French et al. abonde dans le sens de ces observations(French et
al., 2003). Dans cette publication, ont été utilisées des souches de S. cerevisiae avec
un nombre réduit de répétitions du gène d’ADNr (40 copies) (Kobayashi et al., 1998).
La majeure partie des gènes est alors sous forme active. Si la transcription par l’ARN
pol I est dépendante du nombre de gènes actifs, le taux de synthèse sera environ
deux fois plus faible comparé à une souche sauvage contenant 150 copies. Ce
modèle est contredit ici par French et ses collaborateurs qui démontrent que l’on
peut diminuer le nombre de copies actives jusqu’à 40, sans pour autant affecter la
croissance et le taux de synthèse de l’ARNr (French et al., 2003). Les étalements de

 RU
Miller confirment que la diminution du nombre de gènes actifs est compensée par
une augmentation du nombre d’ARN pol I engagées en transcription.

L’ensemble de ces résultats mène à la conclusion suivante. La variation du nombre


de copies actives n’est pas un moyen suffisant pour contrôler la transcription par
l’ARN Pol I et la diminution du taux de transcription par l’ARN pol I observée après
traitement à la rapamycine ne corrèle pas avec la diminution du nombre de copies
actives (Claypool et al., 2004). De la même manière l’équipe de Tom Moss a conclu
que chez le rat et l’humain le taux de synthèse d’ARNr n’est pas directement lié au
nombre de copies ouvertes (Stefanovsky et al., 2006), et Sanij et ses collaborateurs
ont également montré qu’une réduction du nombre de gènes actifs de près de 70%
n’entraine qu’une diminution du taux de transcription de l’ordre de 10% (Sanij et al.,
2008). Les facteurs régulateurs de la transcription sont donc d’avantage liés à la
capacité de l’ARN Pol I d’initier et de transcrire efficacement sur sa matrice d’ADNr.

Les études menées par l’équipe de Kobayashi explicitent alors quelle pourrait être
l’utilité de cette hétérogénéité chromatinienne au sein d’un même locus. Ainsi, en
2010, Ide et ses collaborateurs a démontré que la sensibilité aux UV des souches de
S. cerevisiae augmentait considérablement si le nombre de gènes d’ADNr était
faible. La fonction principale de ces répétitions aux caractéristiques chromatiniennes
hétérogènes serait de maintenir l’intégrité génomique des cellules, de limiter les
phénomènes de recombinaisons illégitimes et de mener à bien le couplage de la
transcription et de la réparation (Ide et al., 2010). Les copies inactives pourraient
donc avoir un rôle davantage lié à la stabilité du génome plutôt qu’à la régulation
transcriptionnelle de l’ARN pol I.

III-2-Composition chromatinienne des gènes actifs.

La caractérisation chromatinienne des gènes ouverts et fermés a beaucoup


progressé grâce aux approches de “psoralen cross linking” et de microscopie
électronique citées précédemment. Cependant, l’hétérogénéité observée au sein du
locus d’ADNr a toujours été un frein quant à la caractérisation exacte de ces deux
structures chromatiniennes coexistantes.

 SL
Il semble maintenant admis que les gènes d’ADNr inactifs ont une structure
nucléosomale, la structure des gènes actifs est, elle, largement débattue. La
controverse repose principalement sur la présence ou non de nucléosomes sur les
gènes transcrits par l’ARN pol I. Dans cette partie nous revisiterons les différentes
données plaidant en faveur de l’une ou de l’autre hypothèse.

III-2-a- Chez S. cerevisiae

La levure S. cerevisiae, de par sa maniabilité génétique, constitue un bon modèle


pour répondre à la question de la présence de nucléosomes sur les gènes actifs
d’ADNr. Ces dernières années, la composition chromatinienne des gènes actifs dans
cet organisme a d’ailleurs été très étudiée permettant notamment la publication de
plusieurs études aux conclusions pourtant contradictoires sur lesquelles nous allons
revenir.

Une étude menée dans l’équipe de Nomura prend parti en faveur d’un rôle des
histones sur les gènes actifs d’ADNr pour structurer et faciliter la transcription par
l’ARN pol I. Leur approche consiste à regarder l’effet de la déplétion de l’histone H3
sur la transcription par l’ARN pol I. L’interprétation de cette étude reste délicate étant
donné l’effet pleiotrope que peut avoir une déplétion de H3, et du fait que H3 est déjà
caractérisée comme ayant un rôle dans l’initiation de l’ARN Pol I au niveau du
complexe UAF (Keener et al., 1997a). De plus, UAF a récemment été identifié
comme un complexe influant directement sur la structure chromatinienne des gènes
d’ADNr (Goetze et al., 2010). Dans cette étude, la déplétion des histones H2B ou
H2A aurait été plus judicieuse.

En 2007, la publication de Jones et ses collaborateurs argue en faveur de la


présence d’histones et de nucléosomes sur l’ADNr actif en transcription. Dans ce
cas, ils ont utilisé une souche de levure S. cerevisiae décrite comme ne contenant
connue que des gènes d’ADNr actifs (Souche 42 copies) (Kobayashi et al., 1998).
Par des approches de ChIP sur les histones dans ces souches mutantes, ils ont
montré qu’il était possible d’immunoprécipiter de l’ADNr des régions transcrites. Ces
données indiquent donc la présence d’histones sur les gènes actifs. Cependant,
cette étude a été largement remise en cause puisqu’en 2008 par l’équipe d’Achim
Griesenbeck qui a montré que cette souche contenait en fait une population non
négligeable de gènes inactifs (figureS1 dans (Merz et al., 2008). Etant donné la

 SM
présence de gènes inactifs dans leurs souches AA (all active), il semble difficile de
pouvoir conclure quant à la présence d’histones sur les gènes actifs à partir de cette
étude.

La mise au point de la technique de ChEC (Schmid et al., 2004) appliquée à la


caractérisation de l’ADNr (Chromatine Endogenous Cleavage) par l’équipe de Achim
Griesenbecka permis l’année suivante, la cartographie précise des facteurs associés
aux répétitions d’ADNr et d’autre part, de mettre en évidence que les histones étaient
très peu présentes, voire absentes sur les gènes actifs. Cette approche élégante de
ChEC-Psoralen permet en effet de discriminer si une protéine est sur les copies
actives, inactives ou sur les deux types. Le principe de cette technique repose sur la
fusion de la protéine d’intérêt avec la microccocal nucléase (Mnase) activable par le
calcium. L’ajout de calcium stimule le clivage entrainant la coupure de l’ADN à
proximité du lieu d’accrochage de la protéine. Une expérience de “psoralen cross
linking” suivie d’un southern est ensuite réalisée. Ainsi, une protéine fusionnée à la
Mnase spécifique des gènes actifs comme une sous-unité de l’ARN Pol I entrainera
la disparition de la bande retardée alors qu’une protéine caractéristique des gènes
fermés causera la dégradation rapide de la bande contenant l’ADN ayant fixé le
moins de psoralène. Une histone fusionnée à la Mnase entraine la dégradation
spécifique de la bande du bas correspondant aux gènes inactifs et ne cause que très
peu de dégradation de la bande des gènes actifs. Cette technique est à ce jour la
meilleure preuve du faible contenu en histone des gènes actifs. Cependant, le ChEC
psoralen n’est pas forcément adapté à l’étude de protéines très abondantes comme
le sont les histones. En effet, du fait de l’abondance de l’histone fusionnée à la
Micrococal nuclease on observe assez rapidement des phénomènes de dégradation
non spécifiques entrainant la dégradation de la bande des gènes actifs. De ce fait,
après la dégradation rapide de la bande du bas (gènes inactifs), il est difficile de
savoir si la dégradation que l’on observe dans un deuxième temps de la bande du
haut (gènes actifs) est due à la présence d’histones ou à de la dégradation non
spécifique. À ce jour, les résultats de cette expérience de ChEC-Psoralen sur les
histones sont insuffisantes pour exclure la présence d’histone sur les gènes actifs
mais ces résultats constituent les données les plus convaincantes pour montrer que
les histones sont en quantité relativement faible par rapport aux gènes inactifs. Enfin,
il est nécessaire de noter que lors d’observation d’arbres de Miller de S. cerevisiae, il

 SN
n’a jamais été observé de structure nucléosomale sur les gènes actifs. Ceci signifie
soit que les gènes actifs ne possèdent pas de nucléosome ou dans une structure qui
n’est pas préservé lors des étalements de la chromatine.

III-2-b- Chez les Mammiferes

La transcription par l’ARN Pol I chez les mammifères semblent nécessiter une
activité histone chaperonne qui pourrait être apportée par la nucléoline (Angelov et
al., 2006; Rickards et al., 2007) ou encore par FACT (Birch et al., 2009). Ce besoin
suggère l’existence d’une structure nucleosomale sur les gènes actifs. Cependant,
l’étude de ces différents états chromatiniens chez les mammifères se heurte aux
même limites que celles décrites précédemment : l’hétérogénéité du locus d’ADNr.
Les manipulations génétiques étant moins aisées dans les cellules de mammifères
les approches décrites précédemment chez la levure S. cerevisiae n’ont pu être
pratiquées. Cependant, l’existence de méthylations sur l’ADNr chez les mammifères
a permis l’utilisation d’une approche alternative. En effet, en se basant sur le fait que
seuls les gènes inaccessibles au psoralène (inactifs) sont méthylés (Stancheva et al.
1997), l’utilisation d’enzymes dont l’activité dépend de l’état de méthylation de l’ADN
a permis de séparer deux populations de gènes selon leurs méthylations (Santoro
and Grummt, 2001). HpaII est une enzyme qui ne peut pas couper une séquence
d’ADN méthylée. Les régions ciblées par cette enzyme sont les résidus CpG situés
sur le gène d’ADNr en -143 (dans l’UCE) et dans la région codante (+154). Ainsi, en
utilisant cette propriété, après extraction de l’ADN, environ 50% des gènes d’ADNr
de rats semblent résistant à la coupure. Cette proportion corrobore les données de
“psoralen cross linking” (Conconi et al., 1989). Par cette approche, l’équipe de
Grummt a mis en évidence le rôle de TTF1 et son influence sur le recrutement de
facteurs remodeleurs de la chromatine inhibiteurs (NORC : nucleolar chromatin
remodeling complex) ou activateurs (CSB : Cockayne Syndrome group B) pour la
transcription de l’ADNr. Ces études ont largement contribué à mettre en évidence
l’importance du contexte chromatinien pour la transcription par l’ARN Pol I (Li et al.,
2006b; Yuan et al., 2007). De plus, la digestion par HpaII combinée à des
expériences de ChIP sur l’ARN Pol I et sur les histones a permis de montrer que
seuls les gènes sensibles à HpaII portaient l’ARN Pol I, alors que les histones était
présentes aussi bien sur les gènes actifs qu’inactifs (Yuan et al., 2007).

 SO
III-2-c-Physarum polycephalum : retour vers le futur

Il y a 30 ans Judelson et ses collaborateurs dans une étude sur le Physarum


polycephalum faisaient le constat suivant concernant les gènes actifs de l’ADNr:
« The nature of this « open » configuration is not well understood. It could be related
to the presence of RNA polymerase molecules, HMG proteins, modified histones, or
to altered conformation of nucleosomes» (Judelson and Vogt, 1982). Les
interrogations posées sont encore aujourd’hui tout à fait pertinentes ; il semble donc
intéressant de s’attarder sur les études réalisées sur cet organisme au début des
années 1980.

Le Physarum polycephalum est un myxomycète qui fut utilisé comme modèle d’étude
pour comprendre les caractéristiques chromatiniennes de l’ADNr. L’utilisation de cet
organisme est dans ce cas particulièrement judicieuse étant donné que l’ADNr n’est
pas lié au chromosome ce qui rend sa purification facile. De plus, en fin de phase G2
tous les gènes d’ADNr sont actifs (Hall and Turnock, 1976) ce qui permet une
purification spécifique de gène d’ADNr actifs. Une première étude en 1982 montre
que la région transcrite des gènes actifs a une perméabilité au psoralène bien
supérieure que la région non transcrite (Judelson and Vogt, 1982). Deux années plus
tard, Prior et ses collaborateurs ont utilisé l’IAF (sulfhydryl reagent
iodoacetamidofluorescein) pour étudier la structure chromatinienne de gènes actifs
ou inactifs purifiés. L’IAF marque les groupes sulfhydryle contenus notamment sur
l’histone H3. Ce marquage ne peut avoir lieu que lorsque le groupement est
accessible. On n’observera donc pas de marquage sur des structures nucléosomales
fermées. Dans ces expériences, un marquage est observé uniquement dans les
régions transcrites de l’ADNr, à contrario, on n’observe pas de réaction dans les
régions non transcrites de l’ADNr. Cette analyse a été complétée par la
caractérisation en microscopie électronique des structures nucléosomales observées
et a permis de proposer une structure alternative de nucléosome sur l’ADNr des
gènes actifs : le lexosome (figure 19 B).

 SP
A-

Gène inactif
(1) (3)

Nucléotides

(2) (4)
Gène actif

B- 80 150 Nucléotides

Nucléosome Lexosome

Nucléosome Tetrasome
Figure 19: A- Distribution des tailles des bulles simple brin après traitement au psoralen et étalement
des gènes fermés (1) et ouverts (2) d'après Damman et al. 1993. A droite est représenté la distribu-
tion des tailles des structures simples brins (1-2) mais pour des structures nucléosomales (3) ou
composé de tétrasomes (4).(3-4) Daprès Puerta et al. 1993. B-Exemple de structures nucléosomales
alternatives. Vue au microscope électronique de nucléosome ou de tétramère sur une matrice ADN
(Lavelle et al. 2007). Modèle du lexosome. Le lexososome serait un arrangement nuclésosomal non
canonique retrouvé sur l'ADNr (Prior et al. 1983).
III-2-d-Structure chromatinienne alternative des gènes actifs ?

La principale caractéristique du lexosome est qu’il peut être purifié spécifiquement


par chromatographie d’affinité grâce au groupement Thiol de la cystéine 110 de H3
accessible dans un lexosome contrairement à un nucléosome standard. Cette
structure particulière semble être présente sur l’ADNr (Boffa et al., 1990; Johnson et
al., 1987) et serait spécifique des régions transcrites (Chen and Allfrey, 1987). Même
si in vitro, l’existence du lexosome n’a pas été confirmée (Protacio and Widom, 1996)
(protacio et al. 1996), il constitue un modèle intéressant par sa capacité à faire
converger toutes les données actuelles pourtant jugées comme contradictoires. En
effet, le lexosome, considéré comme une structure nucléosomale assemblée de
manière non canonique semble être perméable au psoralène (Conconi et al., 1984),
ainsi l’hypothèse du lexosome permet de concilier les données de “psoralen cross
linking” et de microscopie électronique montrant l’absence de nucléosome, tout en
expliquant les données de ChIP révélant la présence d’histones et de remodeleur de
la chromatine sur l’ADNr (Jones et al., 2007). Toujours dans le sens de l’existence
d’une structure alternative, dans l’étude de Damman et al. 1993 dans la figure 3
(Figure 19-A), il est présenté un graphique de la distribution des tailles des boucles
simples brins observées en microscopie électronique après traitement au psoralène
dans le cas de gènes ouverts et fermés. Le pic se situant à 150 paires de bases
dans le cas de gènes inactifs, taille cohérente avec le recouvrement d’un
nucléosome et 80 pour les gènes actifs (Dammann et al., 1993). Cette dernière taille
correspond exactement à celle observée dans une étude utilisant également le
psoralène sur une matrice chromatinienne organisée en tétramères (Puerta et al.,
1993) (Figure 19-A). Le tétramère est une structure nucléosomale constituée de
deux hétérodimères H3-H4. Ces données pourraient soutenir l’existence de telles
structures sur l’ADNr actif. L’hypothèse d’une structure alternative des gènes actifs
n’est pas souvent évoquée dans la littérature. Pourtant comme nous venons de le
voir certaines données interprétées différemment pourraient être considérées comme
des éléments indiquant l’existence d’une telle structure chromatinienne.

La structure chromatinienne des gènes actifs d’ADNr n’est donc pas encore
clairement élucidée et certains résultats semblent parfois contradictoires, le débat se
situant autour de la présence ou non de nucléosome. Cependant en sortant de cette
dialectique, l’ensemble des données de la littérature suggère l’existence d’une

 SR
structure chromatinienne réconciliant les deux points de vues. Cette structure serait
largement dépourvue de nucléosomes canoniques mais posséderait des
arrangements chromatiniens alternatifs. Il reste à savoir comment se forme cette
structure alternative, des protéines structurantes spécifiques de l’ADNr pourrait être
impliquées, notamment certaines protéines HMGB qui sont spécifiquement enrichies
sur les gènes actifs et dont nous allons expliciter le rôle dans la partie suivante.

IV-Hmo1 et UBF: protéines caractéristiques des gènes actifs en


transcription.

IV-1-Les protéines HMG

Les protéines HMG ont été découvertes il y a presque 40 ans. Elles ont été définies
comme des protéines chromatiniennes abondantes manifestant une forte mobilité sur
gel d’électrophorèse (Goodwin et al., 1975). Cette dernière propriété est d’ailleurs à
l’origine de leur nom (High Mobility Group) même si les initiales de son découvreur
H.M Goodwin laissent penser que la raison du choix de cet acronyme fut double.
Cette famille de protéines est présente chez tous les eucaryotes et absente des
eubactéries et des archées. Elles participent à la majorité des processus ADN
dépendant et sont exprimées abondamment. À titre indicatif dans une cellule de
mammifère, on estime à plus d’un million de protéines HMG (Duguet et al., 1981).
Ces valeurs sont à mettre en perspective dans un génome de 3 milliards de paires
de base contenant près de 20 millions d’histones par cellule.

La famille des protéines HMG se décline en trois groupes possédant des


caractéristiques et des cibles qui leur sont spécifiques. Brièvement, les HMGA sont
de petites protéines (environ 10kDa), qui contiennent une séquence « AT-hook »
s’insérant dans le petit sillon de l’ADN. Les HMGN sont des protéines d’une masse
moléculaire un peu plus importante et ont la propension de se fixer aux
nucléosomes. Enfin, les HMGB contiennent des motifs HMG nécessaires pour leur
accrochage et leurs actions sur la chromatine. D’une manière générale, les HMG ont
un rôle essentiel dans l’architecture de la chromatine participant ainsi au mécanisme

 SS
de transcription, de recombinaison ou encore de réplication (Agresti and Bianchi,
2003; Catez et al., 2003).

IV-2-Les protéines HMGB

Pour comprendre l’importance de ces protéines, il est intéressant de noter que les
protéines HMGB sont des protéines qui diffusent très rapidement dans le noyau, se
fixent et se dissocient de leurs cibles ADN de manière transitoire. On estime chez les
mammifères qu’un nucléosome entre en interaction avec une protéine HmgB1 en
moyenne toutes les deux secondes (Agresti and Bianchi, 2003).
La principale caractéristique structurale de ces protéines HMGB est l’existence d’une
ou plusieurs boites HMG. Un domaine HMG est une région de 80 acides aminés qui
est responsable de la capacité des protéines HMGB à s’accrocher et à courber
l’ADN. Il est important de noter que parmi ces 80 acides aminés seules une minorité
est conservée au sein des protéines de cette famille. Aromatiques ou basiques pour
la plupart, ces acides aminés conservés sont impliqués dans le maintien de la
structure tridimensionnelle du domaine et dans l’interaction avec l’ADN. En dépit,
d’une faible conservation générale de la séquence primaire du domaine HMGB, la
structure tridimensionnelle est quant à elle conservée(Bustin, 1999). On observe une
structure tertiaire en forme de L contenant trois hélices alpha (figure 20). Ces hélices
et la région N-terminale du domaine se replient en deux bras formant entre eux un
angle d’environ 80° (Xu et al., 2002). Le domaine HMG se fixe préférentiellement sur
des structures particulières de l’ADN, au niveau des petits sillons élargis de l’ADN,
des jonctions à quatre voies, de l’ADN modifié par le cis-platine, de l’ADN relâché, ou
encore au niveau des points d’entrée et de sortie des nucléosomes (Bustin, 1999;
Thomas and Travers, 2001). Une fois fixé, ce domaine induirait, via l’insertion de la
protéine HMGB dans le petit sillon, une courbure de l’ADN.

 ST
A-

B-
12 90 179 209
N C HMO1
Boite A Boite B C
Boite HMGB Boite HMGB
non consensus consensus

103 180 261 765


UBF
Dimerisation Boite 1 Boite 2 Boite 3 Boite 4 Boite 5 C

Figure 20: A- Représentation structurale d'une boite HMG B consensus. On voit les 3 hélices
alpha en vert au sein d'une boite de 80 acides aminés. B- Représentation schématique des deux
protéines à boites HMGB Hmo1 et UBF1 de levure S. cerevisiae et humaine. La boite A en N termi-
nal ne répond pas aux critères d'une boite HMG classique. Chez UBF, on a un domaine de diméri-
sation en N-terminal, la partie en noire dans la boite 2 correspond à la région d'épissage absente
dans le cas d'UBF2.
Les HMGB sont elles-mêmes partagées en deux groupes :
La classe 1 des protéines HMGB rassemble des protéines n'ayant qu'un seul
domaine HMG. Ces protéines ne sont exprimées que dans certains tissus et se fixent
sur des séquences spécifiques d'ADN. On peut citer pour exemple des régulateurs
transcriptionnels tels que le facteur SRY (Sex determining Region Y) qui est le
déterminant du sexe mâle chez les mammifères (Sinclair et al, 1990), les facteurs
activateurs lymphoïdes T Cell Factor- 1 (TCF-1) et Lymphocyte Enhancer Factor-1
(LEF-1) (Travis et al., 1991); (van de Wetering and Clevers, 1992).
La classe 2 semble impliquée dans des phénomènes biologiques très variés comme
la recombinaison, la réplication, la réparation, la transcription de l’ADN. Ce sont des
protéines qui possèdent plusieurs domaines HMG et qui reconnaissent des
structures courbées de l’ADN. Ce groupe comprend entre autres la protéine HMGB1
(Pauken et al., 1994) qui est une protéine ubiquitaire, ainsi que les protéines HMGB2
(Shirakawa and Yoshida, 1992) et HMGB3 (Vaccari et al., 1998). Ces trois protéines
possèdent deux domaines HMG notés A et B et un domaine riche en acides aminés
acides dans la partie C-terminale. Les protéines humaines UBF1 et Hmo1 de S.
cerevisiae sur lesquels nous allons revenir par la suite font partie de cette dernière
sous-famille.

IV-3- UBF1

IV-3-a-généralité

UBF (Upstream Binding Factor) est une protéine HMGB qui a été caractérisée chez
l’humain (Jantzen et al., 1990), la souris (Hisatake et al., 1991) et le xénope (Pikaard
et al., 1989). De plus les bases de données indiquent qu’un équivalent d’UBF serait
présent chez tous les vertébrés. Cette protéine est très conservée entre ces
différents organismes, à titre d’exemple entre la souris et l’Homme on observe une
homologie de séquence atteignant 97%.

La purification d’UBF à partir de ces différents organismes a révélé la présence de


deux polypeptides UBF1, UBF2 (Bachvarov and Moss, 1991; Hisatake et al., 1991).

 TL
Chez les mammifères, ces deux protéines isoformes sont issues d’un même ARNm
mais diffèrent en raison d’épissage entrainant l’absence d’une région de 37 acides
aminés dans UBF2. Chez le xénope, on retrouve également deux protéines
isoformes différenciées par 22 acides aminés mais issues de deux gènes différents
(Bachvarov and Moss, 1991).

In vitro, UBF1 et UBF2 possèdent toutes les deux la capacité de se fixer au


promoteur des gènes d’ADNr sous forme d’homo ou d’hétérodimères. Cependant,
UBF1 est un activateur de la transcription bien plus efficace qu’UBF2 aussi bien in
vivo que in vitro. Le rôle d’UBF2 est soumis à discussion. Il a été proposé qu’UBF2
ne serait capable d’assumer qu’une partie des fonctions d’UBF1 et serait impliqué
uniquement dans un rôle structural au niveau du promoteur (McStay et al., 1997).
Des études suggèrent également qu’il pourrait avoir un rôle pour limiter l’action des
homo-dimères d’UBF1 par la formation d’hétérodimère UBF1/UBF2 moins aptes à
stimuler la transcription. Un changement de stœchiométrie entre UBF1 et UBF2
serait ainsi une voie de régulation modulant le taux de synthèse des ARNr (Hisatake
et al., 1991).

IV-3-b- Structure d’UBF

La principale caractéristique d’UBF est la présence de plusieurs boites HMG. Dans la


littérature le nombre de boites décrit varie de 4 à 6. Cette variabilité dépend des
critères utilisés pour définir une boite HMG. Par exemple « la boite 3 » d’UBF a des
caractéristiques de boite HMG mais contient seulement 51 acides aminés alors
qu’une boite HMG est définie comme une région de 80 acides aminés. De manière
consensuelle, on peut affirmer qu’UBF1 chez les mammifères contient un domaine
de dimérisation et six boites HMG plus ou moins canoniques (Figure 20). Chacune
de ces boites semble avoir des fonctions spécifiques (Bachvarov and Moss, 1991;
Cairns and McStay, 1995). De manière brève, la boite 1 a une forte affinité pour
l’ADN cruciforme et les régions d’ADN riche en GC. Cette boite est nécessaire et
suffisante pour se fixer à l’ADNr (Jantzen et al., 1992). La boite 2 semble importante
pour optimiser la propriété d’accrochage et structurante de la boite 1 ; sans la boite 2
l’accrochage est moins efficace (Yang et al., 2003). Les boites suivantes et le
domaine Carboxy-terminal sont impliqués dans l’interaction avec l’ADN mais aussi
avec des facteurs d’initiations comme SL1 chez l’Homme et Rib1 chez le xénope

 TM
(Cairns and McStay, 1995; Jantzen et al., 1992). Il est à noter que la boite 4 est
absente chez le xenope. Cette différence explique l’impossibilité de la version UBF1
de xénope de remplacer UBF1 humain et réciproquement (Bell et al., 1989). Enfin, le
domaine de dimérisation retrouvé aussi bien chez l’humain que chez le xénope en
position N-terminale serait essentiel à l’activité d’UBF (Jantzen et al., 1992; McStay
et al., 1991).

Cette boite de dimérisation, ces motifs HMG et la queue C-terminale contenus dans
UBF1 lui confèrent la capacité de structurer l’ADN. Il a d’ailleurs été proposé
qu’UBF1 serait capable de former une structure particulière appelé enhancesome.
L’enhancesome est constitué d’un dimère d’UBF1 permettant une courbure de 360°
de l’ADN aboutissant à la formation d’une boucle d’ADN d’environ 150 paires de
base (Bazett-Jones et al., 1994) (Figure 21). La formation d’une telle structure
associée aux capacités d’interactions d’UBF1 avec d’autres protéines seraient
directement impliquées dans les différents rôles joués par cette protéine que nous
allons décrire dans le paragraphe suivant.

 TN
UBF

ADN

Figure 21: Modèle structural d'enhancesome . Un dimère d'UBF pourrait être responsable d'une
telle structure par la capacité des protéines HMGB à modifier la structure de l'ADN.(adapté de Stefa-
novsky et al. 2006).
IV-3-b-UBF : un facteur d’initiation

Un rôle d’UBF dans le processus d’initiation s’est imposé dès 1989 du fait de sa
présence sur les régions proximales du promoteur d’ADNr (Pikaard et al., 1989). Les
études qui ont suivi ont proposé qu’UBF serait un facteur déterminant pour stimuler
l’assemblage du complexe d’initiation grâce à sa propension à augmenter la
concentration locale des facteurs impliqués (McStay et al., 1997). La fixation d’UBF
sur la région promotrice serait un alors un prérequis à l’assemblage du PIC, il
permettrait la juxtaposition de la séquence activatrice (UCE) et du promoteur basal
(CE). Des études biochimiques montrent que deux des sous-unités de SL1, TAFI48
et TBP interagissent directement avec UBF (Beckmann et al., 1995; Tuan et al.,
1999). De plus, des expériences de footprinting sur SL1 suggèrent un accrochage
coopératif entre UBF et SL1 (Bell et al., 1988). De ces résultats découlent le modèle
suivant. UBF s’accrocherait aux régions promotrices suivies par SL1. Le recrutement
consécutif de l’ARN Pol I se ferait par de multiples interactions. UBF interagirait
directement avec deux sous-unités de l’ARN Pol I, CAST et PAF53, (Panov et al.,
2006; Schnapp et al., 1994) alors que l’ARN pol I lierait SL1 via TIF-1A (Miller et al.,
2001). L’intervention d’UBF dans le processus d’initiation semble donc admise.
Cependant le mécanisme d’action d’UBF décrit précédemment reste lui soumis à
controverse. En effet, une étude de 2006 a démontré, par des approches in vitro,
qu’UBF n’interviendrait ni avant ni au moment de l’assemblage du PIC, mais à une
étape plus tardive. UBF faciliterait le départ de l’ARN Pol I du promoteur en assistant
la conversion entre une ARN Pol I abortive produisant de petits transcrits (10-15
nucléotides) et une ARN Pol I stable en phase d’élongation (Panov et al., 2006). Ces
résultats acquis intégralement in vitro permettent de proposer un modèle alternatif
d’action d’UBF au promoteur mais ne remettent pas intégralement en cause
l’ensemble des données acquises sur la stimulation de l’ARN Pol I par UBF1 et son
rôle dans l’assemblage du PIC.

IV-3-c-UBF et structure chromatinienne

Le fait de retrouver UBF à la fois sur les régions promotrices et sur les régions
transcrites de l’ADNr a conduit à formuler l’hypothèse d’une fonction autre que celle
impliquée dans l’initiation. Au niveau de la région transcrite, plusieurs fonctions
d’UBF ont été proposées et convergent toutes vers une capacité d’UBF à réguler

 TP
l’état chromatinien des gènes d’ADNr. En effet, il a été montré in vitro, qu’UBF
pouvait s’opposer aux effets inhibiteurs du linker histone H1 sur la transcription par
l’ARN pol I. De plus, UBF1 semble pouvoir déplacer l’histone H1 contenue sur une
matrice nucléosomale (Kermekchiev et al., 1997). Ces données ont fait d’UBF un
candidat idéal comme facteur participant à la régulation de l’état chromatinien des
gènes transcrits par l’ARN pol I. En accord avec ce rôle, il a été montré que
l’insertion de séquences ectopiques d’ADNr permet le recrutement d’UBF et
confèrent à la chromatine une structure « ouverte » similaire à celle retrouvée sur les
NOR (Region Organisatrice du Nucléole) (Mais et al., 2005). Dans le même ordre
d’idées, l’adressage d’UBF sur des sites ectopiques entraine là aussi une
décondensation de la chromatine (Chen et al., 2004). UBF serait donc une potéine
HMGB capable de modifier la chromatine et en particulier l’ADNr.

De plus, il a été montré qu’UBF pouvait agir directement sur la régulation du nombre
de copies actives en transcription. En effet, une diminution de la quantité d’UBF
induite par interférence à l’ARN conduit à une augmentation du nombre de gènes
d’ADNr inaccessibles au psoralène, donc inactifs (Sanij et al., 2008). La quantité
d’UBF1 permettrait donc de réguler le nombre de copies actives. Cette donnée est
confirmée par la littérature puisque selon les stades de différenciation cellulaire on
observe une corrélation entre la quantité d’UBF et le nombre de copies actives (Liu
et al., 2007; Poortinga et al., 2004). UBF selon son abondance permettrait la
fermeture ou l’ouverture d’un certain nombre de copies mais ne serait pas capable
d’entrainer l’ouverture des gènes constitutivement fermés par des méthylations.
Ainsi, on distinguerait dans les cellules de mammifères trois états chromatiniens
différents, les gènes méthylés représentant 50% de la population, les gènes inactifs
sans méthylation qui peuvent changer d’états chromatiniens en présence d’UBF et
enfin les gènes actifs en transcription contenant UBF (Sanij et al., 2008).

UBF est donc un constituant spécifique des gènes actifs et semble être un acteur
central dans leur maintien sous la forme activée ; reste à connaître les
conséquences de sa fixation sur la chromatine et sur la transcription par l’ARN Pol I.

En se basant sur les capacités structurantes de cette protéine HMGB et sa capacité


à couder l’ADN sous forme d’un « enhancéosome », l’équipe de Tom Moss a
proposé qu’UBF permettrait de réguler l’élongation de l’ARN pol I. Dans ce modèle

 TQ
une stimulation par des facteurs de croissance dans des cellules de mammifères
induirait une augmentation du taux de transcription sans induire pour autant une
augmentation du nombre d’ARN pol I par gène. UBF serait responsable de
l’ajustement du taux de transcription par une accélération des processus d’élongation
d’un facteur 5. Le rôle d’UBF serait étroitement corrélé à son état de phosphorylation
sur les acides aminés 117 et 201 contenus respectivement sur la boite 1 et 2. En
absence de phosphorylation, UBF fixé sur l’ADN aurait un rôle inhibiteur permettant
de ralentir l’ARN Pol I en phase d’élongation (Stefanovsky et al., 2006). En cas de
phosphorylation par la kinase ERK, les interactions entre UBF et l’ADN seraient
perturbées causant l’apparition d’une structure plus permissive à la transcription
(Stefanovsky et al., 2006). Par ces mécanismes, les auteurs estiment que l’ARN Pol I
aurait la capacité de passer d’une vitesse de synthèse d’ARN de 20 nucléotides par
seconde à plus de 100 par le seul fait d’une modification de sa matrice d’ADN.
D’après Tom Moss, un tel mécanisme serait suffisant pour réguler à lui seul la
transcription par l’ARN Pol I chez les mammifères.

UBF participe à la conformation chromatinienne de l’ADNr et influerait directement


sur l’activité de transcription de l’ARN pol I. La question se pose alors de la
coexistence d’UBF et des nucléosomes. Les données biochimiques et structurales
mettant en évidence les structures types « enhanceosomes» suggèrent le
remplacement des histones et des nucléosomes par une telle structure. Cependant,
il a été proposé un modèle alternatif dans lequel UBF coexisterait avec les
nucléosomes en se fixant à leurs côtés (figure 21). Plusieurs données soutiennent
cette hypothèse. UBF peut se fixer sur des nucléosomes sans altérer leurs structures
(Kermekchiev et al., 1997), de plus les pseudos NOR, qui consistent en des
séquenes d’ADNr introduites en position ectopique où se fixe UBF, donnent un profil
nucléosomal après digestion à la microccocale nucléase (Wright et al., 2006). Enfin,
une diminution de la quantité d’UBF par ARNi entrainant une augmentation du
nombre de copies fermées ne provoque pas une augmentation de la quantité d’ADNr
immunoprécipité par ChIP contre les histones (Sanij et al., 2008). Une structure
chromatinienne contenant UBF ne semble donc pas incompatible avec la présence
d’histones.

Il est alors possible que UBF modifie la structure chromatinienne des gènes actifs
par une compétition avec le linker histone H1 comme le suggère l’étude de

 TR
Kermeckiev (Kermekchiev et al., 1997). Les ChIP réalisées sur H1 concordent avec
ce modèle puisque la présence de H1 sur les gènes d’ADNr est augmentée en
absence d’UBF1 (Sanij et al., 2008). Ces données suggèrent que UBF1 serait un
marqueur spécifique des gènes actifs responsable de l’établissement d’une structure
chromatinienne particulière permissive pour la transcription par l’ARN Pol I.

IV-4-Hmo1

Hmo1 a été purifiée pour la première fois en 1996 et caractérisée comme une
protéine de 35kDa appartenant à la famille des HMGB (Lu et al., 1996). Chez la
levure S. cerevisiae on compte 10 protéines HMGB, la majorité d’entre elles ne
possèdent qu’une seule boite HMG. Hmo1 a une structure qui se rapproche des
protéines HMG existant chez les eucaryotes supérieurs puisqu’elle possède en son
sein deux boites HMG (figure 20). La boite A en position N terminal ne présente que
de faibles homologies de séquence avec une boite HMGB consensus, au contraire
de la boite B qui ressemble au motif HMG retrouvé chez les mammifères, notamment
celui retrouvé sur la protéine HMGB1 (Kamau et al., 2004; Lu et al., 1996). Cette
ressemblance a d’ailleurs conduit à proposer que la protéine Hmo1 de levure et
HMGB1 humaine seraient équivalentes. Cependant, des expériences de
complémentations hétérospécifiques menées entre cette protéine de levure et de
mammifère n’ont pas permis de valider cette hypothèse (Lu et al., 1996). L’équipe de
Grove s’est attelée à étudier les caractéristiques biochimiques d’Hmo1 et de ses
différents domaines. La boite B est essentielle pour l’accrochage à l’ADN et participe
également à la modification de la structure de l’ADN. La boite A au contraire a une
faible affinité pour l’ADN et ne semble pas posséder les domaines suffisant pour
assumer une fonction HMG (Kamau et al., 2004). Cependant, une interaction entre la
boite A et le domaine C terminal d’Hmo1 a été décrite comme requise pour moduler
la conformation de l’ADN (Bauerle et al., 2006; Xiao et al., 2010).

Ces données in vitro sont néanmoins à confronter aux résultats obtenus in vivo,
puisqu’il a été publié dès 1996 qu’une délétion du motif C terminal n’entrainait pas de
phénotype de croissance, indiquant que cette forme d’Hmo1 tronquée est
fonctionnelle (Lu et al., 1996). Depuis cette date, Hmo1 a été au centre de
nombreuses études in vivo mettant en évidence son implication dans une pléiotropie

 TS
de fonctions. En effet, de par son abondance (estimée à 20 mille molécules par
cellule (Ghaemmaghami et al., 2003) et sa capacité à cibler de nombreuses régions
du génome, la fonction d’Hmo1 peut être reliée directement ou indirectement à la
majorité des processus ADN dépendants.

IV-4-a-Hmo1 et stabilité génomique.

La protéine Hmo1 a été initialement décrite comme une protéine HMGB nucléaire
importante pour la stabilité et l’architecture générale du génome (Lu et al., 1996).
Ainsi, son absence se traduit par une instabilité génomique accrue reflétée par une
hypersensibilité à la Mnase et une augmentation du taux de perte plasmidique (Lu et
al., 1996). Ce rôle d’Hmo1 a été confirmé en 2002, puisque la recherche de mutants
présentant un haut taux de mutations spontanées a permis la constitution d’une
collection de gènes hsm (high spontaneous mutagenesis) dont l’un d’entre eux
contient une mutation du gène HMO1. De cette observation les auteurs ont inféré un
rôle d’Hmo1 dans la réparation. Hmo1 serait une protéine initiatrice de la voie de
réparation en rendant accessible les lésions à la machinerie de réparation (Alekseev
et al., 2002). Cette hypothèse est soutenue par différents liens génétiques entre
HMO1 et les gènes codant pour des protéines impliquées dans la réparation telles
que Sgs1, Top3 (Gadal et al., 2002a). Deux publications en 2009 par l’équipe de
Marco Foiani et de Dennis M. Livingston abondent dans ce sens. En effet, des
mutations de l’ADN polymérase (pol3-14) ou de la topoisomérase 2 (top2-1)
provoquent un phénotype de létalité dans certaines conditions qui peut être supprimé
en absence d’Hmo1. Cette suppression serait due à la capacité des cellules
d’outrepasser les points de contrôle du cycle cellulaire en absence d’Hmo1. Dans
des conditions normales, Hmo1 recouvrirait les lésions ADN et permettrait
directement ou indirectement l’arrêt du cycle cellulaire (Bermejo et al., 2009; Kim and
Livingston, 2009). Enfin, outre ce rôle d’Hmo1 en réponse à des stress génotoxiques,
Hmo1 est aussi connu pour organiser et structurer certaines régions du génome en
absence de lésions. En effet, il a été montré qu’Hmo1 se fixait aux séquences CAG
qui sont des régions répétées et très instables. Hmo1 permet dans ce cas de
structurer ces régions dans une conformation chromatinienne particulière dépourvue
de structure nucléosomale canonique. En absence d’Hmo1, on trouve un profil de

 TT
digestion similaire à celui d’une matrice recouverte par des octamères d’histones
(Kim and Livingston, 2009). Hmo1 est donc une protéine participant au maintien et à
l’organisation du génome.

IV-4-b- Hmo1 et transcription par la Pol II

Une première publication en mai 2006 mettant en œuvre des approches


d’immunoprecipitation à l’échelle du génome décrit qu’Hmo1 est spécifiquement
localisée sur des promoteurs de gènes codant pour les protéines ribosomiques (PR)
ainsi que sur la région transcrite des gènes d’ADNr (Hall et al., 2006). L’année
suivante, l’équipe de Tetsuro Kokubo a répertorié de manière exhaustive les 138
promoteurs des PR et les a classifiés en plusieurs groupes selon l’abondance
d’Hmo1 sur le promoteur, la présence de Ifh1 et de Rap1. La classification de ces
promoteurs n’a pas permis d’identifier clairement un mode de recrutement ou un
motif ADN spécifique de la fixation d’Hmo1. De plus, l’accrochage d’Hmo1 ne semble
pas limité aux promoteurs des PR puisque qu’Hmo1 est retrouvée sur d’autres
séquences promotrices (Kasahara et al., 2007). Ces études de ChIP révélant les
sites de fixation d’Hmo1 sur certains promoteurs ARN Pol II et sur l’ADNr ont été
complétées par une autre publication utilisant des approches de cribles génétiques :
ces travaux ont montré qu’Hmo1 est essentielle à la croissance cellulaire dans trois
contextes mutants : des mutants de l’ARN pol I, des invalidations de gènes codant
pour des protéines ribosomiques, ainsi que des invalidations affectant des gènes
impliqués dans la réponse au stress (Berger et al., 2007). Dans cette même étude,
des expériences d’analyse globale de la transcription confirment le rôle d’Hmo1 dans
la régulation de la transcription des protéines ribosomiques (Berger et al., 2007)
même si la mécanistique d’action d’Hmo1 sur les promoteurs d’ARN Pol II n’était
alors pas élucidée.

L’équipe de Kokubo a justement été plus loin dans la compréhension de ce


mécanisme en montrant d’une part qu’Hmo1 pouvait interagir avec les parties N-
terminales des TAF (facteur associé à TBP) au sein du complexe de TFIID (Kashara
et al. 2008) et d’autre part qu’Hmo1 était importante pour délimiter la zone
d’assemblage du complexe de pre-initiation. L’assemblage de ce complexe se ferait
entre le site de fixation d’Hmo1, qui serait dépourvu de nucléosome, et la région +1
qui contiendrait un nucléosome (Kasahara et al., 2008). Hmo1 se fixerait sur des

 TU
régions riches en GC appelées IVR (« intervening région ») au niveau du promoteur.
L’auteur propose qu’Hmo1 pourrait agir soit en formant des boucles d’ADN entre le
Core Promoteur et UAS et positionner le PIC (Kasahara et al., 2011).

IV-4-c- Hmo1 et transcription par la Pol I

Une fonction de Hmo1 en relation avec la transcription par l’ARN pol I a été suggérée
en 2002 par la démonstration de l’existence d’un lien génétique entre HMO1 et
RPA49 (Gadal et al., 2002a). La double délétion hmo1-∆ rpa49-∆ n’est pas viable.
Etant donné les divers rôles d’Hmo1, il était important de clarifier que l’effet observé
est lié spécifiquement à un dysfonctionnement de l’ARN Pol I. Un plasmide
permettant la transcription de l’ADNr par l’ARN pol II a été utilisé et permet la
suppression du phénotype de mort dans une souche rpa49∆-hmo1∆. Cette
suppression signifie que la létalité observée est uniquement due à un défaut
dépendant de l’ARN pol I (Nogi et al. 1991).
Au-delà de cette létalité synthétique, il est intéressant de noter que la surexpression
d’Hmo1 parvient à corriger le phénotype d’un mutant rpa49-∆ (Gadal et al., 2002a).
Hmo1 est la protéine HMGB de levure S. cerevisiae la plus abondante ; il apparaît
surprenant que sa quantité soit un facteur limitant même dans un contexte génétique
particulier. Dans cette étude, un effet d’Hmo1 sur la structure de la chromatine des
gènes codant pour l’ADNr a été suggéré (Gadal et al., 2002a). Cette fonction d’Hmo1
est apparue d’autant plus plausible, quelques années plus tard, après obtention
d’immunoprecipitation des régions transcrites de l’ADNr par ChIP contre la protéine
Hmo1 (Berger et al., 2007; Hall et al., 2006; Kasahara et al., 2007).
L’équipe d’Achim Griesenbeck a par la suite poursuivi l’étude de la fonction d’Hmo1
sur l’ADNr. Dans une publication en 2008, l’auteur s’applique à répertorier les
constituants protéiques des gènes actifs et inactifs par la technique de ChEC
psoralène. Il s’est alors avéré qu’Hmo1 était un composant exclusif des gènes actifs
en transcription. De plus, l’utilisation d’une souche thermosensible permettant la
déplétion de Rrn3, a permis de prouver qu’Hmo1 était capable de rester accrochée
sur l’ADNr indépendamment de la transcription par l’ARN Pol I. Cette donnée ne
signifie pas que la fixation d’Hmo1 sur l’ADNr soit ARN pol I indépendante mais que
le maintient d’Hmo1 sur ces gènes actifs ne requiert pas (au moins à court terme)
une activité de transcription par l’ARN Pol I (Merz et al., 2008). De manière
surprenante, Hmo1 semble disparaître des gènes actifs dans une souche uaf30-Δ

 UL
(Goetze et al. 2010). Ce résultat n’est pas discuté par l’auteur de cette publication,
mais pourrait suggérer une incompatibilité entre la fixation d’Hmo1 et la transcription
par l’ARN Pol II sur l’ADNr (observée dans une souche uaf30-∆ (Conrad-Webb and
Butow, 1995; Vu et al., 1999)).
L’utilisation d’une souche hmo1-∆ a permis de montrer que cette protéine HMGB
n’était pas essentielle pour l’établissement d’un état chromatinien caractéristique des
gènes actifs (Merz et al., 2008). En effet, dans une souche hmo1-∆, on distingue
toujours une bande représentant les gènes actifs et inactifs par la méthode de
“psoralen cross linking”. Cependant, la bande des gènes actifs comparativement aux
gènes inactifs est d’intensité plus faible que dans une souche sauvage. Ce résultat
permet d’affirmer que la délétion d’Hmo1 change le rapport entre copies ouvertes et
fermées en faveur des gènes inactifs.
Enfin, dans une publication récente, il a été montré que l’arrêt du cycle par le facteur
alpha factor en G1/S conduit à l’ouverture des copies jusqu’au passage en phase S
durant laquelle les gènes seront refermés (Dammann et al., 1995; Wittner et al.,
2011). Si durant ce blocage G1/S, on empêche la transcription Pol I (rrn 3-ts (ts pour
thermosensible)), on observe une accumulation de copies ouvertes uniquement si
Hmo1 est présent. En absence d’Hmo1, il ne reste que des copies fermées après 5
heures de blocage en G1. Cette donnée renforce le rôle essentiel d’Hmo1 dans le
maintien des gènes actifs.
De manière intéressante, dans la susnommée expérience on peut noter qu’après 2,5
heures de blocage sans transcription Pol I et en absence d’Hmo1, on ne parvient pas
à distinguer les bandes actives et inactives par la technique de “psoralen cross
linking”. On observe dans ce cas une situation intermédiaire avec un rapprochement
de la bande du haut vers la bande du bas empêchant de les discriminer. Cette
observation rappelle celle faite par Damman en 1995 qui a aussi observé un
rapprochement entre les bandes des gènes actifs et inactifs à l’entrée en phase
stationnaire, c’est-à-dire lorsque la transcription par l’ARN Pol I diminue (Dammann
et al., 1995). L’absence d’Hmo1 dans un contexte où il y a peu de transcription par
l’ARN pol I facilite ce rapprochement des deux bandes et probablement la fermeture
des copies d’ADNr. Ces résultats sont à mettre en perspective avec l’importance
d’Hmo1 dans une souche rpa49-∆ où la transcription par l’ARN Pol I est faible
(Beckouet et al., 2008) et devient impossible en absence d’Hmo1 (Gadal et al.,
2002a). L’étude du rôle d’Hmo1 dans ce contexte génétique rpa49-∆ semble donc

 UM
particulièrement intéressante pour comprendre la fonction des protéines HMGB sur
l’ADNr et sera un des axes de recherche détaillés dans cette thèse. Nous tenterons
d’aller plus loin dans la compréhension de la mécanistique d’action d’UBF1 et
d’Hmo1 sur l’ADNr.

 UN
C HAPITRE III:

Organisation nucléaire chez la levure S.


cerevisiae

Préambule

Le noyau fut en 1802 la toute première structure cellulaire identifiée et son étude fut
poursuivie par Robert Brown en 1831(Ramsbottom, 1932). Son rôle central dans la
viabilité cellulaire ainsi que son implication dans l’hérédité ont vite contribué à le
populariser.
L’ultrastructure du noyau et son organisation furent révélées par la microscopie
électronique et complétée par la microscopie photonique conduisant à une claire
définition de sa morphologie. Sa caractéristique morphologique majeure est la
présence d’une double membrane lipidique constituant la frontière avec le
cytoplasme. A contrario, l’espace nucléaire est dépourvu de membranes lipidiques.
Cette absence de frontière lipidique, considérée par le passé comme condition sine
qua none à l’existence d’organisation, a contribué à soutenir l’image d’un
compartiment désorganisé. Cette vision est maintenant largement dépassée.
Il apparaît en effet que le noyau est un espace organisé contenant le matériel
génétique, mais aussi capable de le maintenir et d’assurer son expression. Alors que
les aspects moléculaires des processus réplicatifs et transcriptionnels ont été très
étudiés, leur organisation spatiale et temporelle au sein du noyau reste peu connue.
De plus, même si l’étude des séquences répétées pose encore problème, les
améliorations techniques nous permettent d’avoir très peu de limite sur la
connaissance des séquences primaires d’ADN constituant un génome alors que
l’étude de leur organisation au sein de l’espace nucléaire est soumise à des limites
techniques et constitue un des challenges de l’ère post-génomique (Figure 22). Les
innovations technologiques en microscopie ou l’apparition de techniques telles que le
3C (Conformational Chromosome Capture) (Dekker et al., 2002) contribuent à
apporter des solutions pour l’étude de ces problématiques mais l’organisation tri-
dimensionnelle ainsi que ses implications fonctionnelles restent des domaines à
explorer.

 UO
Figure 22
Dans les deux premières parties de cette thèse nous nous sommes attelés à décrire
à l’échelle moléculaire le rôle des protéines impliquées dans la transcription et la
structure chromatinienne du locus d’ADNr. Au cours de ma thèse, j’ai également
étudié l’organisation fonctionnelle du chromosome portant les répétitions d’ADNr
chez la levure S. cerevisiae : le chromosome XII. Dans cette introduction, je décrirai
dans un premier temps la structure et l’organisation du constituant majeur du noyau :
la chromatine, puis nous décrirons l’arrangement spatial des chromosomes et des
différents éléments structuraux, dont le nucléole, impliqués dans l’organisation
spatiale du génome.

I- Structure et organisation de la chromatine.

Le constituant principal des chromosomes est l’ADN autour duquel vont s’associer
des protéines formant la chromatine. Quantitativement, on retrouve plus de protéine
que d’ADN sur un chromosome. Cette association forme la fibre chromatinienne, elle
même structurée et organisée selon plusieurs niveaux de compaction. Cette
organisation est variable selon le type cellulaire, le cycle ou encore la croissance
cellulaire et influe directement sur l’ensemble des processus ADN dépendants.
L’organisation du noyau s’analyse donc à différentes échelles, de la fibre d’ADN sous
forme de chromatine à l’agencement de l’ensemble des chromosomes au sein du
volume nucléaire. Dans cette partie nous décrirons ces différents niveaux
d’organisations.

I-1-Composition de la chromatine

I-1-a-l’ADN
L’ADN (acide désoxyribonucléique) forme deux chaines orientées de manière
antiparallèle. L’ADN double brin est agencé sous forme d’une hélice non figée. Au
moins trois structures sont supposées exister dans des conditions physiologiques;
les formes A, B et Z (Ghosh and Bansal, 2003) (Figure 23-A).

 UQ
A- B- C-

(Ghosh et bansal. 2003) (Khorasanizadeh et al. 2004)


D-

(robinson et al.2006) (Recouvreux et al. 2011)


E-

fibre de 30nm
Noyau interphasique

nucléosome

fibre de 10nm

ADN
(Adaptée de Lyer et al. 2011)
Figure 23-A- Exemple de 3 formes possibles de la double hélice d'ADN: A, B, Z de la gauche vers la
droite. B- Représentation de la structure d'un nucléosome entouré par la double hélice d'ADN. C- Fibre
chromatinienne reconstituée et observée en microscopie électronique, en présence de H1 (panel de
droite) on observe un repliement de la fibre différente (forme en boucle), ce n'est pas le cas en absence
de H1 (panel de gauche). Les deux panels du bas représentent des grossissements du panel supé-
rieur. D- 2 modèles de repliement de la fibre de 30nm, en solénoide (gauche) ou en Zig-Zag (droite) E-
L'ADN de 2 nm de diamètre se replie autour d'un octamère d'histone formant une structure de 11nm.
L'ADN génomique serait ensuite agencé dans une structure plus compactée pour permettre l'organisa-
tion du génome en interphase.
La forme B est la plus répandue et a été caractérisée par Watson et Crick en 1953
(Watson and Crick, 1953). Les formes A et B sont principalement organisées avec
des hélices de taille uniforme, alors que la forme Z à une structure plus irrégulière
(Figure 23-A). Deux formes suplémentaires ont été décrite comme potentiellement
existante in vivo, il s’agit de la forme S (Cluzel et al., 1996) et la forme P (Allemand et
al., 1998). Elle correspondrait à une forme hyper étirée de l’ADN (Bustamante et al.,
2003). La transition d’une forme à l’autre est dynamique et dépend des contraintes
appliquées à la fibre chromatinienne ; de ce fait, l’étude de ces états transitoires est
difficile (Sinden, 2005). Les différentes formes d’arrangement de la double hélice
d’ADN peuvent s’avérer déterminantes puisque les facteurs de transcription ont une
affinité différente entre les formes B et Z. Ainsi, la transcription peut être influencée
positivement ou négativement selon la forme d’ADN rencontrée par l’ARN pol (Rich
and Zhang, 2003). Des modifications sur la séquence d’ADN telles que des
méthylations peuvent également changer l’équilibre de transition entre la forme B et
la forme Z et influencer r sur les processus ADN dépendants.

A l’état relâché, la forme B d’ADN, forme une hélice de 2.37nm de diamètre, un tour
total comprend 10,4 paires de bases et mesure 3.4nm (Behe et al., 1981). En tenant
compte de ces valeurs, on peut approximer la taille d’un génome d’une cellule
diploïde humaine ; il représenterait environ deux mètres si on assemblait tout l’ADN
sous forme B bout à bout. Cet ADN est stocké dans une structure d’à peine quelques
dizaines de micromètres qui offre un volume largement suffisant pour contenir cette
quantité d’ADN, la problématique principale est d’ordonner cette information
génétique. Nous allons décrire certaines de ces protéines capables d’organiser
fonctionnellement l’ADN dans le volume nucléaire.

I-1-b- Histones, variant d’histones et protéines HMG

Les histones sont les constituants majoritaires de la chromatine, ce sont des


protéines très abondantes et hautement conservées chez les eucaryotes. Il existe
différentes protéines histones, les plus connues sont les particules H2A, H2B, H3 et
H4 (Kornberg and Thomas, 1974). D’un point de vue structural, les histones sont de
petites protéines basiques partageant un motif structural commun qui est constitué
de trois hélices alpha en C-terminal (Luger et al., 1997). Cette structure est
primordiale pour permettre aux histones d’interagir avec l’ADN et de former des

 US
hétérodimères. Ainsi, deux hétérodimères H3-H4 associés à deux hétérodimères
H2A-H2B forment un octamère d’histones également appelé nucléosome (Figure 23-
B). La partie N-terminale des histones est dans une configuration permettant son
accessibilité même au sein du complexe nucléosomal fermé (Luger et al., 1997). Ces
queues d’histones sont particulièrement riches en lysines et en arginines, et sont
soumises à des modifications post traductionnelles tel que des phosphorylations, des
acétylations, des méthylations qui modifient les propriétés de la particule
nucléosomale (pour revue voir (Kouzarides, 2007)). La combinaison de ces
modifications a permis de suggérer l’existence d’un « code histone », qui rajoute un
niveau d’information génétique se superposant au code génétique défini par la
séquence primaire (Jenuwein and Allis, 2001). Enfin, une autre variation peut
intervenir dans la constitution de l’octamère d’histones du fait de l’existence de
nombreux variants d’histones (Pour revue voir (Khorasanizadeh, 2004)). Ces
variants d’histones, par leurs tailles et leurs caractéristiques biochimiques confèrent
aux nucléosomes de nouvelles propriétés en se substituant à une des histones
classiques contenues dans l’octamère. De manière brève, il a été rapporté
l’existence d’un variant pour H2B (H2Bv), deux variants pour H3 (H3.3, CENPA) et
quatre variants pour H2A (H2AX, H2AZ, macroH2A et H2ABBD). Ces variants
d’histones sont souvent associés à des localisations nucléaires ou à des processus
particuliers. A titre d’exemple, le variant CENPA est spécifique des régions
centromériques (Sullivan et al., 1994), il a récemment été proposé qu’il pourrait
permettre d’enrouler l’ADN de manière opposée à son sens d’enroulement au sein
d’un hémisome (Furuyama and Henikoff, 2009). H3.3 est souvent synonyme
d’activité transcriptionnelle alors que la présence de macro-H2A est plutôt un signe
de répression(Sarma and Reinberg, 2005). Cette spécialisation pourrait contribuer à
la compartimentation en environnement local activateur ou inhibiteur au sein de
l’espace nucléaire. Il existe également un certain nombre de protéines appelées
« linker histones » ; ces dernières sont des protéines composées d’une structure
tripartite avec un domaine globulaire flanqué de deux domaines basiques en N et C
terminal (Krylov et al., 1993). Ces protéines semblent impliquées dans la compaction
de la chromatine notamment en bloquant la structure nucléosomale au niveau du
point de sortie de l’ADN. Contrairement aux histones, ces protéines sont bien moins
conservées dans le monde eucaryote. On peut citer la protéine H1 connu chez les
mammifères alors que la levure S. cerevisiae contient le linker histone Hho1 qui ne

 UT
semble pas partager cette structure tri-partite préalablement décrite (Landsman,
1996).

Pour résumer, les histones sont la base architecturale de la chromatine. Cependant,


il existe d’autres protéines qui peuvent être considérées comme des facteurs
architecturaux. Les protéines HMG que nous avons décrites dans la partie II de cette
introduction de thèse en font évidemment partie. Leur abondance combinée à leur
capacité à courber l’ADN en font des protéines architecturales à part entière
(Chapitre II, IV). De plus, les protéines HMG sont connues pour entretenir une
relation étroite avec les nucléosomes et les « linker » histones tel que H1 (Travers,
2003). Cet ensemble de protéines HMG et histones constitue des structures mobiles
et modifiables participant pleinement à la dynamique et à l’organisation nucléaire. De
manière quelque peu manichéenne, on peut séparer ces protéines architecturales en
deux catégories, les histones qui ont un temps de résidence élevé et qui constituent
une structure stable alors que les protéines HMG sont plus mobiles et participent à la
dynamique du génome.

I-2- Compaction de la chromatine.

I-2-a-Nucléosome et la fibre de 10nm

L’enroulement de l’ADN autour de l’octamère d’histone est considéré comme le


premier niveau de compaction. Cette structure a été observée en premier lieu en
microscopie électronique dans le milieu des années 1970 (Olins and Olins, 1974) et
appelée nucléosome (Oudet et al., 1975). Les détails structuraux d’un nucléosome
sont maintenant connus à une résolution de 0 ,19 A° (Davey et al., 2002). Un
nucléosome est capable de couvrir 146 paires de bases et mesure 13 nm de
diamètre et 11 nm de haut (Khorasanizadeh, 2004; Luger et al., 1997; Oudet et al.,
1975) (Figure 23-B). Les nucléosomes sont séparés par des séquences d’ADN libre
appelées « linker ADN » (Widom, 1992). Conformément à la taille d’un nucléosome,
la compaction d’une fibre d’ADN par ces structures forme la fibre de 10nm rappelant
un « collier de perle » (Figure 23-C). L’accrochage du nucléosome à l’ADN est
considéré comme non spécifique, bien que de nombreuses études sur leur
positionnement indiquent des séquences préférentielles de fixation (Mavrich et al.,
2008; Yuan et al., 2005). Cette conformation permet une compaction d’un facteur 6.
Il est à noter que les Archées possèdent également des histones qui présentent des

 UU
similarités avec les histones eucaryotes. Les histones archéens présentent la
particularité de s’assembler dans des structures qui s’apparentent davantage à des
tétrasomes (deux dimères H3 et H4) qui couvre individuellement moins de 100 paires
de base. Ces structures présentent une flexibilité plus importante que les octamères
d’histone (Musgrave et al., 1991; Sandman and Reeve, 2005).

I-2-b-Compaction sans histones

L’ensemble des organismes est soumis à la contrainte préalablement décrite,


l’empaquetage d’un génome conséquent dans un espace restreint. Chez les archées
et les eucaryotes, les protéines histones sont essentielles pour résoudre cette
problématique et ont probablement favorisé la possibilité évolutive d’extension des
génomes (Minsky et al., 1997). Cependant, il ne faut pas éluder le fait que les
procaryotes ne possèdent pas de telles protéines et parviennent pourtant à contenir
leur génome dans un espace restreint ; le nucléoide (Mason and Powelson, 1956). Il
existe donc des modes indépendants de compaction de l’ADN histones.

Chez les procaryotes, la compaction se fait en partie grâce au super enroulement


négatif permettant de restreindre l’espace occupé par l’ADN. Le surenroulement
négatif est le plus courant dans la nature car il permet de compacter l’ADN et
favorise les processus ADN dépendants tel que la transcription ou la réplication
(Giaever et al., 1988; Vologodskii et al., 1979). Les supers enroulements ne sont
cependant pas suffisants pour organiser le génome bactérien, et des protéines
architecturales sont là aussi mises à contribution. Comme la plupart des protéines
chromatiniennes, elles sont de petites tailles et contiennent des résidus basiques
favorisant l’interaction avec l’ADN. La protéine HU fait partie de ces protéines ; elle
est la plus abondante du nucléoide (Murphy and Zimmerman, 1997) et participe
activement à maintenir la structure du chromosome. Elle est capable de stocker des
super tours négatifs (Tanaka et al., 1995) et agit pour maintenir la superhélicité du
génome bactérien (Bensaid et al., 1996). Ces protéines HU, de part leur activité
topologique, favorisent les structures de l’ADN enroulées en plectonème, alors que
les nucléosome autour desquels l’ADN eucaryote est enroulé favorise les structures
toroïdales (Benyajati and Worcel, 1976). L’ADN arrangé en plectonème favorise la
séparation des brins et donc la transcription et la réplication (Boles et al., 1990). Le
génome bactérien s’organiserait alors en rosettes avec un nœud central d’où

 MLL
émergeraient des boucles structurées en plectonème (Delius and Worcel, 1974;
Thanbichler and Shapiro, 2006). HU aide à cette organisation dynamique
directement impliquée dans l’accessibilité des séquences d’ADN et à la régulation de
la transcription (Peter et al., 2004).

Sur la base de leurs activités topologiques, il est important de noter que ces
protéines HU ne ressemblent pas à des histones et se rapprocheraient d’avantage
des protéines HMGB trouvées chez les eucaryotes (Oberto et al., 1994). In vitro,
HMGB1 peut d’ailleurs organiser des structures en plectonème (Stros et al., 1994).
De plus, les HMGB semblent pouvoir remplacer HU dans l’établissement de la super
hélicité négative (Paull et al., 1993). Ces données ont conduit à suggérer que les
protéines HMGB permettraient de former des structures en plectonème au sein du
génome eucaryote majoritairement organisé sous forme toroïdale. Ces régions
particulières organisées par les protéines HMGB favoriseraient les processus ADN
dépendant (Travers and Muskhelishvili, 2007). Ainsi, même si les histones sont les
organisateurs centraux de la chromatine, d’autres protéines telles que les protéines
HMGB chez les eucaryotes ou HU chez les procaryotes peuvent organiser l’ADN.
Ces régions dépourvues de nucléosomes correspondraient principalement aux
régions activement transcrites. Elles seraient minoritaires chez les eucaryotes,
contrairement aux procaryotes où seulement 12% des régions sont non codantes
alors que 98% le sont chez les eucaryotes (Ahnert et al., 2008). L’exemple
procaryote nous montre d’une part que le premier niveau de compaction de l’ADN
est son degré d’enroulement et que d’autre part qu’il existe des architectures
génomiques indépendantes des nucléosomes plus rares mais essentielles à
l’organisation du génome eucaryotes et à son expression.

I-2-c-De la fibre de 30nm à l’organisation de la chromatine

L’ADN est chargé négativement par les phosphates qui produisent des répulsions
électrostatiques des régions adjacentes empêchant des repliements sur elle même
de la fibre d’ADN (Bloomfield, 1996). Les histones sont chargées positivement et
permettent de neutraliser ces charges négatives laissant la possibilité de repliement
à la fibre d’ADN. Il y a plus de 30 ans, Finch et Klug ont été les premiers à proposer
un modèle mettant en jeu de tels repliements entre les nucléosomes. Les octamères
d’histones seraient agencés en une fibre de 30nm grâce à l’intervention du «linker

 MLM
histone » H1 ou d’ions Mg2+ (Finch and Klug, 1976) (Figure 23-C). La fibre de 30nm
permettrait une compaction du génome suffisante pour expliquer l’organisation des
chromosomes dans un noyau interphasique (Figure 23-E). L’hypothèse de la fibre de
30nm s’appuie sur l’observation de nucléosomes isolés observés en microscopie
électronique à transmission qui laisse apparaitre une fibre de 30nm de diamètre.
Malgré de nombreuse études menées pour élucider l’agencement des nucléosomes
au sein de cette structure, l’intérieur même de la fibre reste mal connu et soumis à
controverse. Deux modèles principaux sont proposés (pour revue voir
(Khorasanizadeh, 2004)) (Figure 23-D). Selon le premier, la fibre de 30 nm formerait
un solénoïde au sein duquel les nucléosomes sont agencés en hélice (Robinson et
al. 2006). Le second modèle dit « en zig zag » serait une structure en solénoïde
consistant en une hélice à deux point de départs. Les nucléosomes seraient
successivement d’un coté puis de l’autre de la molécule d’ADN provoquant le
croisement de l’ADN entre deux nucléosomes au centre de la fibre de 30nm. Le pas
de cette double hélice est estimé à 32nm et contient 19 nucléosomes (Schalch et al.,
2005). De nombreuses études in vitro ont apporté leur soutien à l’un ou l’autre
modèle, sans pouvoir conclure définitivement (Robinson et al., 2006; Schalch et al.,
2005). Routh et ses collaborateurs ont proposé que les structures en solénoïde ou
en Zig-Zag sont dépendantes de la taille du « linker ADN » (ADN retrouvé entre
chaque nucléosome) (Routh et al., 2008). Etant donné que la structure de la fibre de
10nm est variable du fait des différentes tailles d’ADN entre chaque nucléosome, il a
été suggéré récemment que les modèles en solénoïde et en zig zag puissent être
contenus sur une même fibre (Grigoryev et al., 2009).

Cependant, au delà de ce débat sur la structure interne de cette fibre de 30nm, son
existence même pose encore question. L’observation in vivo de cette structure
s’avère plus difficile. Les approches de cryomicroscopie par les procédés de
vitrification devraient permettre d’observer cette structure dans un état préservé.
Pourtant de Dubochet et ses collaborateur en 1986, à Eltsov en 2008 aucune section
nucléaire observée n’a permis de mettre en évidence la fibre de 30 nm (Dubochet et
al., 1986; Eltsov et al., 2008; Konig et al., 2007) remettant sérieusement en cause
l’hypothèse de son existence in vivo et son observation in vitro. Seule l’équipe de
Patrick Shultz, dans une étude récente observe une fibre de 30 nm en microscopie
électronique. Elle serait minoritaire dans le noyau et se situerait dans des régions

 MLN
périphériques d’hétérochromatine (Kizilyaprak et al., 2010). Chez la levure, peu de
données in vivo soutiennent l’existence de cette fibre de 30 nm. Pourtant Bystricky et
ses collaborateurs en utilisant des sondes fluorescentes placées à des distances de
14 à 103 kb les unes des autres sur un même chromosome de levure S. cerevsiae
ont mesuré des distances entre les différentes sondes compatibles avec une
compaction de 30 nm (Bystricky et al., 2004) mais pouvant également soutenir
d’autres degrés de compaction de l’ADN (Maeshima et al.). Ces résultats obtenus
chez la levure sont à relativiser puisque d’une part ils s’appuient sur le postulat que
la fibre est compactée de manière homogène entre deux sondes, d’autre part Job
Dekker en utilisant la technique de « chromosome capture » a obtenu des données
inférant vers une structure nucléosomale moins compactée que celle décrite pour la
fibre de 30 nm (Dekker, 2008).

Cette structure nucléosomale de 30 nm a été majoritairement observée et mise en


évidence dans des études de microscopie électronique de la fibre chromatinienne
isolée (Marsden and Laemmli, 1979). Pour expliquer les observations divergentes in
vivo et in vitro, il a été suggéré que la concentration en magnésium utilisée dans les
approches in vitro contribue aux observations « artéfactuelle » de la fibre de 30 nm
(Maeshima et al., 2010). En effet, l’observation de la fibre de 30 nm ne se fait que
dans certain environnement cationique. Si la concentration en Mg2+ est augmentée,
on améliore la compaction et les contacts des nucléosomes entre les différentes
fibres; il est alors impossible d’observer la structure de 30 nm. Au contraire à des
faibles concentrations cationiques, on a une densité de nucléosomes qui diminue et
qui favorise les contacts des structures nucléosomales au sein d’une même fibre et
permet d’observer les fibres de 30 nm. Il est à noter que les concentrations pour
lesquelles la structure de 30 nm est observée est de l’ordre de 1 à 2 mM alors que in
vivo la concentration de Mg2+ est estimée à 3 mM en interphase et 17 mM en
métaphase (pour revue : (Maeshima et al., 2010)). D’après Maeshima et ses
collaborateurs, les concentrations en magnésium utilisées facilitent l’observation de
la fibre de 30 nm mais empêchent l’observation des contacts entre des nucléosomes
contenus sur différentes fibres (Maeshima et al., 2010). D’autres données récentes
s’appuyant sur les techniques de capture des chromosomes et de microscopie
électronique s’écartent également du modèle de 30 nm. Elles suggèrent que la
compaction de la chromatine à 10 nm serait suffisante pour organiser le génome

 MLO
dans le noyau; la chromatine s’organiserait alors en domaines ouverts et fermés
selon un modèle de globule fractal sur lequel nous reviendrons plus tard (Fussner et
al., 2010; Lieberman-Aiden et al., 2009).

Au delà des investigations concernant la fibre d’ADN, la chromatine doit être aussi
étudiée à une échelle comprenant la prise en compte de grandes structures
traversant le noyau selon une organisation d’ordre supérieur. De nombreuses études
s’appuyant sur des modélisations biophysiques ont permis de proposer différents
modes d’organisations. Le modèle des boucles radiales propose que la chromatine
est organisée en boucles de 50 à 200 kb sur des régions de 1MB donnant lieu à une
structure en rosette (Munkel et al., 1999) alors que le modèle des boucles géantes
propose l’existence d’une seule boucle sur un même domaine de 1MB (Sachs et al.,
1995). Enfin, le modèle du « chromonema » a été proposé par Andrew Belmont en
1994 après observation de structure d’ADN d’un diamètre de 100-130 nm. Cette
structure serait dûe aux repliements de la fibre de 30 nm en hélice (Belmont and
Bruce, 1994).

I-3-Organisation nucléaire des chromosomes.

Outre la description structurale de la fibre chromatinienne, et les modèles


biophysiques qui en découlent, d’autres approches permettent de comprendre les
lois régissant l’organisation du génome. En effet, l’observation directe par des
sondes fluorescentes ou par microscopie électronique de l’hétérogénéité
chromatinienne a contribué à comprendre l’organisation des chromosomes au sein
du noyau.

I-3-a-Euchromatine et hétérochromatine.

La description de l’hétérogénéité chromatinienne s’est faite dès le début du XXieme


siècle par Emil Heitz (Heitz, 1928) selon des critères cytologiques.
L’hétérochromatine et l’euchromatine ont pu être différenciées sur la base de leur
affinité ou le Giemsa, il a ainsi pu être montré l’existence de deux types de
chromatine aux caractéristiques différentes. Cette distinction cytochimique fut
complétée par une différenciation morphologique détectée en microscopie
électronique (Figure 24-A) (Tooze and Davies, 1967).

 MLP
A- B-

HC

Nucleolus

EC

(Fawcett DW, The Cell: An Atlas of Fine Structure, (Kizilyaprak et al. 2010)
WB Saunders, Philadelphia, 1966, p. 153.)
Figure 24: A-B- Répartition de l'hétérochromatine dans deux types cellulaires. Ultrastructure de
deux types cellulaires observés en microscopie électronique. Le plasmocyte contient de larges régions
d'hétérochromatine (HC) localisées majoritairement en périphérie (A). A contrario, des cellules de rétines
de rongeurs présentent de larges foyers d'eurochromatine (EC) en périphérie (B).
Très tôt, il a été suggéré que cette distinction morphologique traduisait l’état
transcriptionnel des régions concernées. Ainsi les régions d’hétérochromatine
seraient inactives, a contrario, l’euchromatine refléterait des régions chromatiniennes
décompactées et activement transcrites (Heitz, 1928). La différence de compaction
est essentiellement due aux variations de la composition chromatinienne en histones
et en modifications post-traductionnelles de ces dernieres. En résumé,
l’hétérochromatine apparaît plus compactée et présente une activité
transcriptionnelle plus faible que l’euchromatine. Cependant, il est important de noter
que cette organisation a été décrite comme dynamique et peut évoluer selon les
phases du cycle cellulaire ou en réponse à certains signaux cellulaires (Grewal and
Jia, 2007).

I-3-b-territoire chromosomique

Historiquement, la notion de territoire chromosomique fut introduite pour la première


fois par Carl Rabl (Rabl, 1885), mais le terme exact fut proposé par Théodor Boveri
en 1909 (Boveri, 1909). Carl Rabl suggéra que les structures qu’il observait pendant
la mitose dans un noyau d’amphibien restaient à l’état d’entités indépendantes en
interphase. La prouesse déductive de Carl Rabl est notable puisqu’il ne possédait ni
les moyens techniques de visualiser les chromosomes interphasiques, ni même le
concept de chromosomes. 30 années plus tard, Boveri étudiait des lignées
germinales de vers à partir desquelles il observa la séparation des chromosomes
pendant la mitose. Il décrivit alors que chaque chromosome conservait un espace
spécifique en interphase. De plus, il suggéra que chaque chromosome était séparé
par un espace inter-chromatinien. (Pour revue voir (Cremer et al., 2006)). Cette
notion de territoire chromosomique fut acceptée de tous dans un premier temps puis
délaissée dans les années cinquante suite aux publications d’images de microscopie
électronique ne montrant aucune individualisation des chromosomes interphasiques.
Il a fallu attendre la fin des années 1970 et les travaux de l’équipe de William C.
Dewey et de J. Zimmer pour réhabiliter expérimentalement ce concept (Stack et al.,
1977; Zorn et al., 1976).

Les expériences d’hybridation in situ en fluorescence permettant de « peindre »


chaque chromosome humain et le marquage d’un chromosome entier grâce à des

 MLR
nucléotides fluorescents ont tous deux contribué à confirmer de manière illustrative le
modèle de Bovari (Figure 25-A-B-C) (Pour revue (Cremer and Cremer, 2010)). Dans
le même ordre d’idée, la démonstration qu’un traitement au laser dans une zone
confinée du noyau entrainait des dommages à l’ADN restreint à un ou deux
chromosomes a encore appuyé le modèle de territoire chromosomique (Figure 25-D-
E). Récemment, les travaux de Job Dekker par la technique de 3C suivie de
séquençage massif (Hi-C) ont définitivement validé la présence de territoires
chromosomiques par des approches non microscopiques (Lieberman-Aiden et al.,
2009). De nouvelles questions se posent alors, et en premier lieu, comment se
répartissent ces chromosomes en des territoires restreints ?

L’organisation chromatinienne reflète en premier lieu les arrangements des


chromosomes en fonctions des contraintes géométriques rencontrées au sein du
noyau. Cependant, certains arrangements chromatiniens peuvent conférer un
avantage fonctionnel à la cellule et être favorisés par la sélection naturelle. Un des
enjeux de l’étude de l’architecture nucléaire est de comprendre quelles sont les lois
biologiques et /ou physiques qui régissent cette organisation non aléatoire et quel en
sont les causes ou les conséquences fonctionnelles. Dans ce sens, Wendy Bickmore
et ses collaborateurs ont suggéré que les chromosomes pauvres en gènes sont
localisés à la périphérie du noyau alors que les chromosomes riches auraient une
position plus centrale (Croft et al., 1999). Une étude évolutive avec des cellules de
différents primates montre la conservation de cette organisation (Tanabe et al.,
2002). Cependant, de manière surprenante, il a été montré que les cellules de
rétines de mammifères diurnes présentaient une organisation inverse, c’est à dire,
des régions périphériques décompactées et l’hétérochromatine en position centrale
(Figure 24-A-B). Cette organisation singulière irait de paire avec la vision nocturne et
confèrerait un avantage évolutif (Solovei et al., 2009). Cette observation souligne que
l’organisation des chromosomes conventionnellement décrite n’est pas obligatoire
pour la viabilité cellulaire. L’organisation du génome est donc plastique et
profondément influencée par le contexte cellulaire.

 MLS
A- B- C-

(Adapté de Cremer and Cremer, 2001)


D-
territoires chromosomiques organisation aléatoire

Dommage Dommage
laser laser

D-

(Adapté de Karen and Misteli, 2007)


E-

(Adapté de Cremer and Cremer, 2010)


Figure 25: Mise en évience de l'existence des territoire chromosomiques par la technique de
"chromosome painting". A- Marquage au DAPI des macro et microchromosomes étalés issus de
cellule diploide de poulet. B- Le même étalement de chromosome a été traité par des sondes fluores-
centes combinées avec de l'oestradiol, de la dioxigenine et de la biotine. Ces sondes sont ensuites
détectées par l'utilisation d'anti-corps secondaire couplés à CY3, CY5 et FITC. C- Image d'une coupe
d'un noyau de fibroblaste de poulet observé par microscopie photonique après traitement selon la
technique de "chromosome painting" (pour revue van der Ploeg, 2000) D- Implication du modèle des
territoires chromosomiques et de l'organisation aléatoire après dommage à l'ADN. Le laser est foca-
lisé sur un point précis du noyau, selon l'organisation les dommages seront répartis de manière diffé-
rente. E- Autoradiographie d'une cellule diploide de Hamster après microirradiation en G1 suivi d'un
pulse à la thymidine tritiée et de la fixation des cellules. Flèche: site de microirradiation. F- Chromoso-
mes métaphasiques issus de la même expérience étalés 40 heures après la microirradiation. Seule
une minorité des chromosomes a été atteinte par le laser.
La localisation des chromosomes semble être corrélée à l’activité transcriptionnelle
en son sein. La taille des chromosomes joue également un rôle important dans
l’établissement des territoires chromosomiques ; les plus petits chromosomes ont
tendance à avoir une position plus centrale alors que les grands chromosomes se
situent en périphérie (Bolzer et al., 2005). Une autre découverte importante a
également été que la localisation des chromosomes change pendant la
différenciation (Parada et al., 2004). Dans cette étude de Parada, il a été montré que
les chromosomes voisins ont bien plus de chance de subir des évènements de
translocation entre eux, illustrant parfaitement une des conséquences biologiques de
l’organisation en territoires chromosomiques. L’équipe de Job Dekker a récemment
abondé dans le sens de ces observations, dans son étude s’appuyant sur la
technique de Hi-C, il a montré que les chromosomes de même taille ont tendance à
être proches et qu’il existe une ségrégation entre la chromatine en configuration
« ouverte » et « fermée » (Lieberman-Aiden et al., 2009).

Bien que la notion de territoires chromosomiques chez l’humain ne soit pas remise
en cause, une controverse existe concernant les espaces séparant ces différentes
régions. Trois scénari sont discutés (Branco and Pombo, 2006; Heard and Bickmore,
2007). Le premier modèle consiste à tracer une véritable frontière entre chaque
chromosome. L’accessibilité à la machinerie transcriptionnelle dans le territoire
chromosomique serait impossible, les gènes actifs auraient alors besoin de se situer
à l’extérieur de ce territoire chromosomique, (Zirbel et al., 1993). Un modèle opposé
se présente sous la forme de larges territoires chromosomiques accessibles y
compris à la machinerie de transcription (Dehghani et al., 2005). Enfin, un model
intermédiaire en terme de « porosité » du territoire chromosomique prédit la
possibilité d’une structure comprenant des boucles d’ADN sortant du territoire
chromosomique, permettant de nombreux contacts entre différents loci situés sur
différents chromosomes (Heard and Bickmore, 2007). L’existence de cette
conformation est là aussi soutenue par les données de 3C (Dekker et al., 2002).
Cependant, ces modèles ne sont pas exclusifs, il a été montré que l’ARN pol II n’a
pas accès au chromosome X inactivé chez la souris ce qui infère dans ce cas vers la
possibilité des territoires chromosomiques imperméables à la machinerie
transcriptionnelle (Chaumeil et al., 2006).

 MLU
Enfin, les résultats obtenus dans l’étude de l’équipe de Job Decker et le travail
d’Aurélien Bancaud ont permis de proposer l’existence d’une organisation de la
chromatine de levure en domaines fractaux d’environ 100nm (Bancaud et al., 2009;
Lieberman-Aiden et al., 2009) (Figure 26-A-B). Il existerait des sous-domaines
globulaires qui ensemble formeraient les territoires chromosomiques. Cette
conformation faciliterait l’assemblage et le désassemblage de l’ADN ce qui pourrait
être utile pour activer ou réprimer les gènes. Ce modèle serait en accord avec la
double fonction du noyau de stockage et d’expression de l’information génétique
puisque ce modèle facilite un enroulement et un déroulement de l’ADN variable selon
les besoins et présente un degré de compaction suffisant pour contenir l’ensemble
du génome au sein du noyau (van Steensel and Dekker, 2010).

Le concept de territoires chromosomiques, au même titre que la compaction de la


fibre d’ADN, sont des domaines d’étude qui prêtent à débat et qui sont en
permanence soumis à controverse. L’existence des territoires chromosomiques chez
les mammifères semblent être actée mais ne signifie pas l’absence de contact entre
des chromosomes différents, ni l’absence de boucles d’ADN décompactées
traversant le noyau. Il s’agirait plutôt de positions préférentielles au sein du noyau.
Nous avons vu que l’évolution des modèles proposés a suivi les innovations
technologiques, il est probable que les améliorations des systèmes de microscopie et
l’utilisation des méthodes de « chromosome capture » permettront d’affiner les
modèles proposés ou d’en imaginer de nouveaux.

 MML
A- A l'échelle: du noyau des chromosomes d'un megabase

Territoires chromosomiques ouvert fermé Globule fractal


(Adapté de Lieberman-Aiden et al. 2009)

B-
Chromosome linéaire
Orange:gène actif
Bleu:Inactif

Boucle chromatinienne entre les gènes actifs provo-


quant le regroupement des facteurs de transcription
et la formation des globules chromatiniens.

Les gènes actifs s'associent entre eux alors que les


gènes inactifs s'assemblent dans un autre domaine.

Les domaine actifs et inactifs voisins s'assemblent et for-


ment un domaine plus large composé de régions actives
ou inactives.

L'organisation en globule est composé d'une mosaique


de domaines actifs et inactifs contenu dans des régions
distinctes.

(Adapté de Sanya et al. 2011)

Figure 26: A- Organisation du génome à trois échelles selon le modèle des globules fractals. B- Forma-
tion des globules à partir d'un chromosome linéaire.
I-3-c-Territoire chromosomique chez S. cerevisiae

Dans la levure à bourgeonnement, l’existence des territoires chromosomiques a été


largement discutée. Etant donné la duplication ancestrale du génome
d’Hémiascomycetes, chaque chromosome est une mosaique du génome ancestral
ce qui rend l’utilisation de sondes spécifiques d’un chromosome particulièrement
difficile. Conséquemment, l’utilisation de la technique de « chromosome painting »
est particulièrement difficile chez la levure et a empêché de caractériser ces
territoires comme chez les mammifères. Néanmoins, Lorenz et ses collaborateurs
ont tenté de s’affranchir de ses limites en utilisant la technique de GISH (genomic in
situ hybridization) (Lorenz et al., 2002). Deux espèces proches de levures, S.
cerevisiae et S. paradoxus, ont été croisées de manière à obtenir des noyaux
diploïdes hybrides. L’hybridation des deux génomes avec des sondes de couleurs
différentes a révélé l’existence de deux domaines. De la même manière, en
substituant cette fois ci dans le noyau de S. cerevisiae un chromosome par son
homologue chez S. paradoxus, les auteurs ont observé que le chromosome n’était
pas réparti aléatoirement dans le noyau. Cette étude soutient l’existence de
territoires chromosomiques chez la levure S. cerevisiae.

Cette conclusion est néanmoins à nuancer pour les raisons suivantes. D’une part,
une caractéristique majeure des territoires chromosomiques se situe dans leur
propension à empêcher les phénomènes de recombinaison entre des chromosomes
éloignés. Cette situation n’est pas observée chez S. cerevisiae puisque la fréquence
des événements de recombinaison semble être identique entre deux régions issues
d’un même chromosome ou de 2 chromosomes différents (Haber and Leung, 1996).
Il existe pourtant des territoires chromatiniens qui limitent les contacts avec le reste
du noyau. En effet, même si les techniques de cytologie habituellement utilisées ne
permettent pas d’observer d’hétérochromatine chez S. cerevisiae (Léger-Silvestre et
al., 1999), le noyau de levure contient certaines régions d’ADN possédant les
caractéristiques moléculaires de l’hétérochromatine. Parmi elles, on retrouve
notamment les régions télomériques et les loci HM. Ces régions sont résistantes aux
endonucléases ce qui reflète leur état de compaction, elles sont localisées à la
périphérie du noyau et sont majoritairement hypoacétylées (Braunstein et al., 1996;
Gotta et al., 1996; Rine and Herskowitz, 1987). Ces domaines hétérochromatiniens,
à l’image des territoires chromosomiques, constituent une barrière favorisant ou

 MMN
réprimant la recombinaison respectivement avec des régions d’ADN en leur sein ou
à l’extérieur de ces régions (Marvin et al., 2009). Chez la levure, les territoires
chromosomiques ne semblent pas être le modèle le plus pertinent pour décrire
l’organisation des chromosomes, cependant il est admis qu’ils sont soumis à une
organisation définie. En effet, on sait que les télomères occupent la périphérie du
noyau (Funabiki et al., 1993; Gotta et al., 1996) (Figure 27-A-C), que les centromères
sont près du centre organisateur des microtubules (SPB :spindle pole body) et à
l’opposé du nucléole (Funabiki et al., 1993; Heun et al., 2001b; Jin et al., 2000)
(Figure 27-A-B). Ainsi, faute de territoires chromosomiques à proprement parler,
c’est un modèle de configuration pseudo-Rabl qui est à privilégier pour décrire
l’organisation des chromosomes chez la levure (Bystricky et al., 2005; Rabl, 1885)
(Figure 27-A). Cette orientation est soutenue par la modélisation des chromosomes
de levures de S. cerevisiae de Duan et ses collaborateurs en 2010. Il est néanmoins
important de noter que la conformation en « Rabl » n’est pas antinomique avec
certains aspects des « territoires chromosomiques» puisque même au sein d’une
organisation type « Rabl » on observe d’avantage d’interactions intra-
chromosomiques que inter-chromosomiques (Duan et al., 2010).

 MMO
D-

C-
B- Adapté de
Yamaguchi et al. 2011

répétition télomérique
chromatine
condensée

Adapté de Adapté de Mekhail


Gotta et al. 1997 et Moazed. 2010
tel tel
tel

100nm

Nucléole
SPB CEN

ADNr
A-

tel

tel

tel
E-
F-

(Adapté de Fabre et Hurt, 1997)


Figure 27: A- Schéma de l'organisation du noyau de
levure. 3 chromosomes ont été représentés dont le chro-
mosome XII qui porte les répétions des gènes d'ADNr.
On distingue le centre organisateur des microtubules
(SPB) opposé au nucléole. Les chromosomes sont tous
attachés par leurs centromères reliés au SPB via le
résau microtubulaire. B- Photographie d'une coupe de S.
(Adapté de Dieppois et Stutz. 2010) cerevisiae au niveau du SPB observé en microscopie
électronique après cryofixation.
C- Image de microscopie à fluorescence. Le nucléoplasme est marqué en rouge par le bromure d'éthi-
dium, le nucléole et les foyers télomèriques sont marqués par des anticorps contre Nop1 et Rap1 respec-
tivement en pourpre et en vert. (échelle 1um). D- Les régions télomèriques recruteraient la protéine Rap1
et les complexes SIR (Sir2, 3, 4) qui promeuvent l'expansion de ces régions réprimées. Les protéines
Esc1, Ku et Mps3 permettraient d'ancrer à l'enveloppe les télomères (Schober et al. 2009, Bupp et al.
2007; Taddei et al. 2004). E- Schématisation d'un pore nucléaire et de différentes protéines impliquées
dans la localisation des gènes en périphérie. F- Image de microscopie électronique d'une coupe cellulaire
passant par un pore nucléaire, la flèche la plus large représente les prolongements nucléoplasmiques et
les deux petites flèches les fibrilles cytoplasmiques. Bar d'échelle 100nm.
I-4- Dynamique de la chromatine

La dynamique de la chromatine peut être analysée à deux niveaux : la composition


protéique de la fibre chromatinienne et les mouvements de la chromatine au sein du
volume nucléaire.

I-4-a-Variation de la composition protéique de la fibre d’ADN

Au niveau de la fibre chromatinienne, on peut effectivement noter une dynamique


des constituants de la chromatine se traduisant par l’apparition de structures d’ADN
plus ou moins compactées selon la présence d’histones, de protéines HMG,
d’insulateurs, de variants d’histones ou encore selon les modifications post
traductionnelles de ces protéines structurant l’ADN. Ces changements sont dictés
par les conditions de croissance ou le cycle cellulaire et vont modifier les
caractéristiques structurales de l’ADN impliquant des changement dans sa mobilité,
sa capacité à être transcrite ou à recombiner avec d’autres régions chromatiniennes
(Burgess-Beusse et al., 2002; Felsenfeld and Groudine, 2003; Heard and Bickmore,
2007). La chromatine va donc être soumise à des changements constants dus aux
temps de résidence sur la fibre ADN de ces facteurs protéiques. Pour étudier ce
phénomène, les techniques de FRAP et FLIP, se sont avérées très utiles et ont
permis de montrer que les histones ont un temps de résidence bien supérieur aux
autres protéines, telles que les HMGB et les linkers histones (Kimura and Cook,
2001; Phair and Misteli, 2000; Wachsmuth et al., 2003). Les cartes à haute résolution
de la position des nucléosomes ont permis d’avoir une certaine idée de la dynamique
chromatinienne. Elle donne une indication sur la possibilité d’avoir un nucléosome à
une position donnée à un instant donné. On peut alors distinguer au sein du génome
des régions qui semblent constamment occupées par des structures nucléosomales
s’opposant à des régions où la cartographie du positionnement des nucléosomes est
moins claire, reflétant la dynamique chromatinienne de cette région.

I-4-b- Mouvement et espace de confinement de la fibre chromatinienne.

 MMQ
Les mouvements de la chromatine sont un autre aspect à prendre en considération
lorsque l’on parle de dynamique chromatinienne. La stratégie la plus commune pour
observer le mouvement d’un gène dans une cellule vivante est l’insertion de
séquences d’opérateurs bactériens dans le génome (opérateurs tetO, lacO)
reconnus par les répresseurs correspondant fusionnés à des protéines fluorescentes
(Marshall et al., 1997; Robinett et al., 1996; Straight et al., 1996). Marshall et ses
collaborateurs ont été les premiers à essayer de déterminer le coefficient de mobilité
et le niveau de confinement d’un gène donné. Dans cette étude, les mouvements du
gène LEU2 étiqueté par des opérateurs lacO ont été suivis pendant 10 minutes en
microscopie à fluorescence. Ils ont d’abord constaté que le gène suivait un
mouvement aléatoire avec un coefficient de diffusion de 5.10-4 m2 par seconde. La
MSD (Mean Square Displacement), un outil standard pour caractériser les propriétés
diffusives de particules a été utilisée dans cette étude pour évaluer les mouvements
décrits. Dans les cas d’une diffusion normale d’une particule dans un liquide, la MSD
est proportionnelle aux intervalles de temps entre chaque mesure et ce coefficient de
proportionnalité représente le coefficient de diffusion. Du fait que le gène est contenu
dans le noyau, la MSD ne peut croître indéfiniment selon le coefficient de diffusion,
elle va atteindre un plateau qui sera équivalent au carré du rayon du noyau.
Cependant, les études citées précédemment révèlent l’apparition d’un plateau bien
plus précocément que celui attendu pour un confinement par le noyau. Cette
observation permet de proposer que le gène observé est confiné dans un volume
nucléaire restreint. Dans l’étude de Marshall pour le locus LEU2, il a été observé un
rayon de 300nm.

Les études qui ont suivi chez la levure S. cerevisiae ont d’abord confirmé ce
mouvement diffusif dans un rayon de confinement (Heun et al., 2001a). Cependant,
les premières données chiffrées obtenues en 1997 ont été remises en cause puisque
le coefficient de diffusion dans la levure de 5.10-4 m2 par seconde (Marshall et al.,
1997) est bien plus faible que celle rapportée dans des études ultérieures (qui ont
été réalisées dans ce cas dans des cellules haploïdes) (Bystricky et al., 2005; Cabal
et al., 2006; Gartenberg et al., 2004; Hediger et al., 2002; Heun et al., 2001a). De
manière intéressante, le rayon de confinement semble variable et dépendrait de la
position du locus sur le chromosome ou de son activité transcriptionnelle. En effet,
les régions télomériques semblent avoir une zone de confinement plus petite que

 MMR
des loci ayant une position plus centrale sur le chromosome (Bystricky et al., 2005;
Cabal et al., 2006; Gartenberg et al., 2004). De la même manière, les ARS
(Autonomously Replicating Sequence) ont tendance à avoir un rayon de confinement
plus restreint au début de la phase S (Heun et al., 2001a). Enfin, certains gènes
activés adressés à la périphérie réduisent parallèlement leurs régions de
confinement (Cabal et al., 2006). La capacité de mouvement d’un locus serait donc
liée à sa position dans le noyau. L’étude de Gartenberg en 2004 illustre parfaitement
cette situation : le locus LYS2, une fois excisé de sa position originale au milieu du
bras droit du chromosome a une capacité de mouvement augmenté (10-2 m2 par
seconde contre 5.10-3 m2 par seconde initialement) et n’est plus confiné que par
l’enveloppe nucléaire. La seule contrainte que subissait ce locus était d’être sur un
chromosome (Gartenberg et al., 2004). D’autres régions comme les foyers sub-
télomériques restent à la même position après excision signifiant que la mobilité de
cette région génomique est contrainte indépendamment de sa position sur le
chromosome.

Cette notion de contrainte est d’ailleurs reprise par Cabal et ses collaborateurs qui
ont observé la dynamique du gène GAL1. Leurs résultats indiquent que le
mouvement de leur locus d’intérêt ne suit pas un mouvement de libre diffusion mais
plutôt de type sous diffusif. L’existence de mouvements sous diffusif chez S.
cerevisiae a été confirmée par l’équipe d’Aurélien Bancaud (Bancaud et al., 2009;
Hajjoul et al., 2009). Le phénomène de sous diffusion peut être la résultante d’un
grand nombre de causes telles que l’encombrement nucléaire, la viscosité du
nucléoplasme, ou les propriétés physiques du polymère considéré. L’ensemble de
ces travaux montre que la mobilité de la chromatine varie d’un locus à l’autre par les
coefficients de diffusion et par les rayons de confinement. Des mouvements
s’apparentant à des « sauts » de loci de près de 500 nm ont été décrits par Heun et
ses collaborateurs (Heun et al., 2001a). Ces mouvements semblent être dépendants
de l’ATP et ne seraient donc pas imputables à la seule agitation thermique. Des
enzymes telles que des ARN pol pourraient donc être impliquées.

De manière intéressante, les observations faites dans ces études chez la levure
semblent suivre des lois retrouvées dans d’autres organismes. Dans des cellules
Hela, les valeurs obtenues convergent vers le coefficient de diffusion observé chez
S. cerevisiae et sont également variables selon les régions du génome (Chubb et al.,

 MMS
2002). Un mouvement de type sous diffusif proche de celui observé par Cabal a été
récemment rapporté pour des loci bactériens (Cabal et al., 2006; Weber et al., 2010).

D’autre travaux, ont proposé l’implication dans ces mouvements de longue


envergure de l’actine et la myosine chez les mammifères (Chuang et al., 2006;
Dundr et al., 2007; Nunez et al., 2008). La dynamique chromatinienne serait donc de
différente nature, une partie des mouvements de type sous diffusif serait étroitement
reliée à l’environnement chromatinien de la région d’ADN considérée et aux
caractéristiques physiques de cette dernière. A ce titre, l’organisation génomique au
sein du volume nucléaire est un facteur déterminant qui va influer sur la capacité de
mouvement d’un gène. D’autres part, du fait de l’hétérogénéité nucléaire
chromatinienne et protéique l’influence de ces mouvements pourrait être
déterminante quant à l’expression d’un gène. Dans la partie suivante nous allons
donc nous intéresser aux différents environnements locaux qui constituent le noyau
et qui confèrent à la dynamique chromatinienne une capacité régulatrice de
l’expression des gènes.

II- Éléments structuraux de l’architecture nucléaire et régulation


positionnelle.

II-1-Eléments structuraux de l’architecture nucléaire

Préambule

La chromatine n’est pas distribuée de manière aléatoire dans le noyau. Les


propriétés physico-chimiques de la fibre chromatinienne combinées aux
environnements locaux rencontrés au sein du noyau vont déterminer son
organisation. Les régions fortement compactées d’hétérochromatines, l’enveloppe
nucléaire ou encore les structures nucléolaires constituent autant d’éléments
architecturaux qui vont influencer l’agencement de la chromatine au sein du volume
nucléaire. Ces éléments précédemment cités sont communs à tous les eucaryotes.
Leur étude semble particulièrement pertinente chez la levure S. cerevisiae puisqu’ils

 MMT
semblent suffisants pour pouvoir expliquer une partie de l’organisation en « Pseudo-
Rabl » des chromosomes de levures.

II-1-a- Matrice nucléaire

De manière intuitive, l’observation d’une organisation chromatinienne nucléaire fut


associée à l’existence d’une structure solide charpentant chacun de ces sous
domaines. Ce postulat fut à l’origine du concept et de la recherche de « la matrice
nucléaire ». C’est en 1948 que cette structure fut décrite pour la première fois
(Zbarskii, 1948), puis baptisée 20 ans plus tard, matrice nucléaire (Berezney and
Coffey, 1974). Brièvement, sa mise en évidence nécessite une étape de lavage par
des détergents pour se débarrasser des membranes du noyau, puis une digestion
par la DNase suivie par des traitements hypotoniques pour enlever l’ADN. On obtient
alors une matrice filamenteuse constituée essentiellement de ribonucléoprotéines
(Nickerson, 2001). La matrice nucléaire telle qu’elle est décrite est largement
débattue, et l’obtention de ce réseau filamenteux ne pourrait être qu’artefactuelle
(pour revue (Pederson, 2000)). Cependant, le concept impliquant l’organisation par
des points d’ancrages appartenant à l’enveloppe nucléaire reste possible. Les
protéines du pores nucléaires et les lamines nucléaires, comme nous allons
l’évoquer dans la partie suivante, en sont de bons exemples.

II-1-b- L’enveloppe nucléaire et la lamina.

L’enveloppe nucléaire est constituée d’une double membrane isolant le noyau du


cytoplasme. La membrane externe est en continuité directe avec le réticulum
endoplasmique rugueux et est recouverte de ribosomes alors que la membrane
interne est en contact avec la lamina et la chromatine (pour revue voir (Worman and
Courvalin, 2005)). La composition et les caractéristiques biochimiques de ces deux
membranes diffèrent notamment par l’enrichissement en protéines dans la
membrane externe (Lusk et al., 2007). Ces deux membranes sont séparées par
l’espace périnucléaire mais convergent au niveau des pores nucléaires. Le pore
nucléaire sert de passage pour la diffusion des particules à travers les deux
membranes mais aussi de barrière pour empêcher le transfert de protéines de la

 MMU
membrane interne à la membrane externe maintenant ainsi une polarité fonctionnelle
de l’enveloppe (Lusk et al., 2007). Chez les métazoaires, les protéines de la
membrane nucléaire interne sont souvent attachées à un réseau de filaments
intermédiaires d’environ 10nm de diamètre appelés les lamines nucléaires qui sont
capables d’interagir avec les chromosomes (Akhtar and Gasser, 2007). Aucun
homologue de lamine n’a été identifié chez les plantes et les champignons
unicellulaires comme les levures. Cependant, sur la base d’homologie de séquences
et de leurs localisations, quelques protéines pourraient être des équivalents des
lamines chez les plantes (Blumenthal et al., 2004).

II-1-c- Pores nucléaires

Le pore nucléaire constitue une des structures les plus marquantes du noyau. Ils
apparaissent comme de larges structures très bien conservées, même si leur masse
moléculaire diffèrent entre levures et vertébrés (60 MDa et 125 MDa,
respectivement) (Vasu and Forbes, 2001). Le nombre de pores nucléaires semble
varier d’une cellule à l’autre et serait étroitement corrélé à l’activité de la cellule. Chez
la levure, on observe de 65 à 180 pores nucléaires (Winey et al., 1997). Un pore
nucléaire est composé de trente protéines appelées nucléoporines. Chaque
nucléoporine est présente par multiple de 8 (entre 8 et 56). Le diamètre du pore
nucléaire est proche de 9nm permettant une diffusion passive des petites molécules
inférieure à 40 KDa (Gorlich and Kutay, 1999). Des protéines en dessous de 40 kDa
peuvent être transportées par diffusion passive. Cependant, même pour des petites
protéines comme les histones, ce type de transport est peu efficace. Des
mécanismes de transports actifs complètent ce processus de transfert, permettant
notamment le passage des protéines plus larges comme les précurseurs
ribosomiques et le contrôle des échanges nucléo-cytoplasmiques (Gorlich and Kutay,
1999). Le canal central du pore nucléaire est constitué de filaments cytoplasmiques
formant des prolongements dont la structure s’apparente à un « panier de basket»
tourné vers le nucléoplasme (Figure 27-F). Cette structure sert de point d’ancrage à
la chromatine (Dilworth et al., 2001; Galy et al., 2000; Ishii et al., 2002) et fait du pore
nucléaire une structure organisatrice du noyau. Nous reviendrons plus tard sur son
implication dans la régulation de l’expression des gènes.

 MNL
II-1-d- le centre organisateurs des microtubules

Le noyau de levure S. cerevisiae se différencie des autres noyaux eucaryotes par


différents aspects. Le noyau de levure ne contient pas de lamine, ils n’ont qu’un seul
nucléole, la mitose est fermée avec la persistance de la transcription et il contient
une structure spécialisée, le MTOC (Microtubule Organizer Centre) qui oriente et
organise les chromosomes pendant l’interphase. Cette structure est intégrée dans
l’enveloppe nucléaire. Cet équivalent des centrosomes métazoaires dans la levure
est appelé le « spindle pole body ». Sa structure n’est pas conservée, en
comparaison avec les centrosomes puisqu’il manque le constituant central des
centrosomes : les centrioles (Jaspersen and Winey, 2004). Le SPB est une structure
imposante de plus d’1 giga dalton, près de 20 fois plus large qu’un pore nucléaire. Il
ne contient pourtant qu’une trentaine de protéines différentes chacune présente en
grand nombre (Bullitt et al., 1997). Dans sa partie cytoplasmique, le SPB organise le
cytosquelette alors que parallèlement dans le nucléoplasme, le SPB est connecté
aux centromères des chromosomes. L’attachement se fait via un microtubule relié à
un kinétochore, ce dernier étant accroché à 125 paires de base constituant la région
centromérique du chromosome (Figure 27-B) (McAinsh et al., 2003). Le SPB est à
l’origine de cette structure « Rabl-like » avec tous les centromères groupés d’un coté
du noyau. En phase G1 du cycle cellulaire, le SPB est positionné à l’opposé du
nucléole. Il commence à se dupliquer en G1 jusqu’au début de la phase S ; il devient
alors fonctionnel quand la réplication du chromosome commence (Jaspersen and
Winey, 2004). Pendant la progression du cycle, les SPB au sein de l’enveloppe
nucléaire bougent pour promouvoir la ségrégation des chromatides. Le SPB dans la
levure a donc un rôle très particulier et contrôle l’organisation des chromosomes tout
au long du cycle. Il permet notamment pendant l’interphase de regrouper les
centromères de l’ensemble des chromosomes. La formation de ce cluster de
centromères avait été initialement identifiée par FISH (Bystricky et al., 2004; Guacci
et al., 1997; Jin et al., 1998). L’existence de ce regroupement de centromères a
récemment été confirmée par Duan et ses colaborateurs par la technique de 3C
combinée au séquençage massif (Duan et al., 2010). De manière intéressante, le
traitement des cellules avec du nocodazole, entrainant une dépolymérisation des
microtubules, augmente la taille de la région explorée par le gène LEU2. Ce résultat

 MNM
est expliqué par le fait que le locus LEU2 est situé sur le chromosome III à 22kb du
centromère qui est accroché au SPB via un réseau microtubulaire. Cette donnée
renforce l’importance du SPB comme structure organisatrice dans l’architecture du
noyau de levure (Marshall et al., 1997).

II-1-e- Foyers télomériques

Les extrémités des chromosomes constituent un autre paramètre à prendre en


considération lorsqu’on étudie l’organisation nucléaire. Dans la plupart des
eucaryotes, les séquences télomériques se caractérisent par des domaines répétés.
S. cerevisiae n’échappe pas à cette règle; les télomères sont constitués d’une
séquence d’environ 250 paires de bases contenant des unités répétées (TG1-3). Les
régions subtélomériques sont quant à elles plus grandes (environ 30 kb) et
possèdent en leur sein quelques gènes non essentiels. Les 32 subtelomères de
levures se caractérisent par des séquences communes : on retrouve l’élément X,
une séquence d’environ 500 pb, et l’élément Y’ présent sur un subtelomère sur deux
(Liti and Louis, 2005; Louis et al., 1994). La découverte de ces foyers télomériques
s’est faite à partir du constat suivant : l’hybridation par des sondes fluorescentes
spécifiques des 32 télomères ne fait apparaître que quelques zones de fluorescence,
indiquant un regroupement des télomères (Gotta et al., 1996; Hediger et al., 2002).
Ces foyers télomériques furent également observés dans des cellules vivantes où ils
sont là aussi localisés en périphérie (Figure 27-C) (Bystricky et al., 2005; Schober et
al., 2008; Therizols et al., 2010). De nombreuses protéines participent à
l’établissement de ces foyers ; elles sont d’ailleurs enrichies à la périphérie nucléaire.
Les protéines Sir (Sir 4, Sir 2) sont recrutées par Rap 1 et font parties de cette famille
de protéine (Hecht et al., 1995) (Figure 27-D). De la même manière, les complexes
yKu sont nécessaires à l’organisation de ces télomères (Figure 27-D). Les simples
délétions des protéines appartenant à ces complexes (Sir4, Hdf1 ou Hdf2) entrainent
la désagrégation des foyers télomériques, mais n’altèrent la localisation périphérique
que pour la moitié d’entre eux (Bystricky et al., 2005; Hediger et al., 2002; Laroche et
al., 1998; Tham et al., 2001). Une protéine de la membrane interne de l’enveloppe
nucléaire Esc1 semble jouer un rôle important dans cette localisation des foyers
télomériques par une interaction avec la protéine Sir4 (Taddei et al., 2004) (Figure

 MNN
27-D). Le nombre de télomères délocalisés augmente lors de la délétion simultanée
des deux complexes yKU et SIR suggérant que ces complexes ont des fonctions
redondantes, mais qu’il existe aussi d’autres mécanismes permettant l’adressage
des télomères en périphérie. Les mécanismes de localisation des télomères en
périphérie ne sont cependant pas encore élucidés et semblent faire intervenir les
propriétés physiques du polymère d’ADN. Lorsque l’on définit les foyers télomériques
un autre facteur à prendre en compte est celui de la taille des bras chromosomiques.
En effet, les bras courts ne peuvent explorer l’ensemble du noyau et leurs télomères
ont tendance à être localisés en périphérie mais proches du centromère, au contraire
des bras plus longs. Cette observation se vérifie par les fréquences d’interaction bien
plus élevées entre les régions télomériques appartenant aux bras courts qu’avec le
reste du génome (Duan et al., 2010; Therizols et al., 2010). L’organisation des
télomères est donc directement dépendante des caractéristiques du chromosome
auquel ils appartiennent, un bras court devient une limite pour explorer le noyau et
établir des interactions télomériques avec des télomères issus de bras longs. Cette
organisation rappelle celle décrite pour les territoires chromosomiques où les petits
chromosomes ont tendance à être spatialement proches (Lieberman-Aiden et al.,
2009).

L’organisation en foyers périphériques des télomères va donc contribuer de manière


non négligeable à l’organisation du génome, ils constituent des points d’ancrages
périphériques qui orientent la position du bras chromosomique auquel ils
appartiennent. De plus, les télomères constituent au sein du noyau une région où la
chromatine est peu transcrite et riche en nucléosomes hypoacétylés. Pour empêcher
la propagation de ces régions le long du chromosome on retrouve des variants
d’histone (H2AZ) à la sortie des régions subtélomériques (Babiarz et al., 2006). Les
foyers télomériques forment au sein du noyau des zones aux caractéristiques
chromatiniennes particulières contenant des protéines qui leur sont spécifiques. Ils
constituent un environnement local répressif pour la transcription pouvant influencer
l’expression des gènes localisésqui s’y trouvent.

II-2-concept d’auto-assemblage

Malgré sa fixité apparente, l’organisation nucléaire est soumise à des mouvements


permanents aussi bien de la chromatine que de ses constituants protéiques. Les

 MNO
résultats des expériences de photo-blanchiment et de photo-activation l’illustre bien
(Beaudouin et al., 2006; Lippincott-Schwartz et al., 2001; Phair and Misteli, 2000). Le
concept d’auto-assemblage résout ce paradoxe apparent et confère aux
mouvements macromoléculaires un rôle dans la stabilisation de l’organisation du
génome. Selon cette hypothèse, les constituants nucléaires seraient soumis à un
mouvement perpétuel et c’est leur capacités d’interaction, leur temps de résidence et
leur vitesse de diffusion qui contribueraient à former l’hétérogénéité nucléaire en
plusieurs domaines (Misteli, 2001a). Ainsi, les protéines d’un même type ou
participant aux mêmes processus auraient tendance à se regrouper à proximité de
leurs cibles communes et constitueraient de ce fait une région aux caractéristiques
particulières. Cette organisation est maintenue par l’afflux permanent de protéines au
sein de ces sous domaines. A titre d’exemple, malgré la stabilité apparente des
régions hétérochromatiniennes contenant l’histone H1, il est important de noter que
cette protéine H1 a un temps de résidence sur l’ADN bien plus faible que les
histones (Phair and Misteli, 2000). La stabilité de ces régions est donc apportée par
un perpétuel renouvellement des protéines qui y sont préférentiellement retenues.
L’encombrement macromoléculaire serait un des facteurs qui contribuerait
directement au phénomène d’auto-assemblage. Dans un territoire donné, de fortes
concentrations macromoléculaires permettraient d’exclure ou de ralentir le
mouvement de particules. Cette notion est particulièrement pertinente si on l’applique
à l’espace nucléaire qui est très fourni en macroéléments. En effet, il est estimé
qu’un noyau d’eucaryote supérieur à une concentration macromoléculaire de l’ordre
de 100 mg/ml dans l’euchromatine et près de 400 mg/ml dans l’hétérochromatine
(Bohrmann et al., 1993; Daban, 2000). Cet encombrement peut induire des
phénomènes d’exclusion, réduire la diffusion et même changer les capacités
d’accrochage d’une protéine (Bancaud et al., 2009; Beaudouin et al., 2006). Par
exemple, la capacité d’accrochage des protéines H1 est augmentée dans
l’hétérochromatine (Bancaud et al., 2009). L’encombrement participe au maintien et
à la construction des sous-domaines nucléaires.

II-3-Régulation positionnelle

 MNP
Préambule

Comme nous venons de le voir, l’espace nucléaire est organisé en domaines définis
par des concentrations locales en constituants particuliers (Spector, 2001) (Figure
28-A). Cette hétérogénéité conduit à une localisation préférentielle de régulateurs
transcriptionnels dans certains domaines. Malgré l’importante concentration
nucléaire en macromolécules, la fibre chromatinienne et les gènes sont caractérisés
par des mouvements de diffusion. La régulation spatiale de la transcription est
définie par une activité génique qui serait modifiée suite au déplacement d’un gène
dans un domaine où des régulateurs transcriptionnels se concentrent.

 MNQ
A- Corps d' Compartiment
Territoires épissage interchromatinien
chromosomiques
Pore nucléaire

Enveloppe nucléaire

Corps PML

Nucléole

Lamine nucléaire

Corps Cajal

Territoires
chromosomiques
( Adaptée de Lanctot at al. 2007)

B- Transcription Réplication Réparation

2 mm

(Adaptée de Misteli. 2007)


Figure 28: A- Représentation de l'hétérogénéité nucléaire. Le noyau est constitué d'une mosaïque
de régions dans lesquels s'organisent les chromosomes, les facteurs d'épissages, de transcriptions et
les constituants architecturaux du noyau (Enveloppe nucléaire, lamines, pores nucléaires). B- Dans
des cellules de mammifères, les sites de transcription sont visualisés par incorporation de bromo-UTP.
Ce type de régulation se superposerait aux régulations transcriptionnelles assurées
par des facteurs de transcription et/ou par des remaniements de la structure
chromatinienne. Certains environnements locaux influant sur la transcription des
gènes ont été définis : les foyers télomériques chez la levure S. cerevisiae et
l’enveloppe nucléaire qui ont été décrits comme des environnements qui répriment la
transcription alors que les complexes de pores nucléaires semblent avoir un rôle
activateur. Nous allons décrire dans la partie suivante l’influence de ces
environnements sur la transcription et nous finirons par décrire le rôle d’un autre
environnement local organisé autour de l’activité transcriptionnelle de l’ARN pol I: le
nucléole.

II-3-a-Caractère inhibiteur de la périphérie nucléaire

Dès 1928, l’hétérochromatine visualisée en périphérie du noyau par microscopie


électronique a été associée à des régions pauvres en gènes et
transcriptionnellement inactives (Heitz, 1928). Cette hypothèse fut vérifiée par la
suite notamment chez la drosophile ou il a été montré qu’un même gène localisé
dans ces régions hétérochromatiques ou en dehors était respectivement inactif ou
transcrit (Pour revue (Wilson et al., 1990)).

Chez la drosophile et l’humain il a été montré que les régions périphériques


interagissant avec la lamine étaient pauvres en gènes. Pour ce faire, les auteurs ont
utilisé une adénine méthyltransférase d’E. coli (Dam) et l’ont fusionnée à la lamine B.
L’expression de cette protéine de fusion conduit à une forte méthylation de l’ADN en
contact avec la lamine et a permis de révéler que les régions en contact avec la
lamine étaient majoritairement des régions intergèniques, faiblement transcrites et
répliquées tardivement (Guelen et al., 2008; Pickersgill et al., 2006). De plus, l’équipe
de Van Steensel a démontré que ces régions avaient tendance à être regroupées en
domaine de 0.1 à 10 Mb comprenant des régions intergéniques et des gènes
faiblement transcrits (Guelen et al., 2008). Cependant, il semblerait que ces régions
« réprimées » ne constituent pas une barrière infranchissable au delà de laquelle
toute transcription est impossible. En effet, Kumaran et Spector ont montré en 2008
qu’un gène artificiellement accroché aux lamines nucléaires pouvait encore être

 MNS
exprimé (Kumaran et al., 2008). De plus, une étude provenant du laboratoire de
Bickmore a également montré que des gènes accrochés à la membrane interne par
la protéine Lap2β étaient pour certains réprimés et d’autres encore actifs. Ces
résultats tendent à indiquer que, chez les métazoaires, les foyers
hétérochromatiques en périphérie nucléaire constituent un environnement local
défavorable mais pas rédhibitoire pour l’activité de transcription.

Chez la levure S. cerevisiae la situation est comparable puisqu’il a été montré que la
localisation en périphérie nucléaire était un environnement défavorable à la
transcription (Andrulis et al., 1998). Les expériences de FISH sur ARN de Feuerbach
et ses collaborateurs ont directement impliqué les foyers télomériques dans ces
phénomènes de répression puisqu’ils ont constaté qu’un gène rapporteur est réprimé
lorsqu’il est associé avec ces structures périphériques (Feuerbach et al., 2002). Le
regroupement des télomères en périphérie requiert notamment les protéines Esc1 et
KU (Taddei et al., 2004) (Figure 27). Ces protéines permettent le recrutement des
protéines SIR et la déacétylation des histones composants les régions concernées
(Ottaviani et al., 2008). La forte concentration locale en protéines SIR empêche la
transcription au sein de ces régions. D’ailleurs, si on provoque le relâchement de ces
regroupements télomériques par la délétion des protéines Ku et Esc1, on observe un
relarguage de Sir2 dans le nucléoplasme et le phénomène de répression
périphérique est aboli. Chez la levure, la concentration locale en protéine Sir2 est
donc suffisante pour créer une région défavorable à la transcription.

II-3-b-Caractère activateur des pores nucléaire

Un rôle régulateur des pores nucléaires dans l’activité transcriptionnelle fut proposé
dès 1985 par Blöbel. Ce concept novateur fut baptisé « gene gating » et faisait du
pore nucléaire un environnement favorable à la transcription (Blobel, 1985). D’après
cette hypothèse, le positionnement des gènes à proximité des pores nucléaires serait
lié à leur état transcriptionnel et favoriserait l’export des ARN issus d’un gène ainsi
positionné (Blobel, 1985). La même année, les travaux de Hutchison et Weintraub
étoffaient cette théorie par la démonstration que les régions chromatiniennes
adjacentes aux pores présentaient une hypersensibilité à la DNase I (Hutchison and
Weintraub, 1985). Plus tard, le laboratoire d’Ulrich Laemmli montra par une approche

 MNT
génétique que l’état transcriptionnel d’un gène pouvait être modifié s’il était associé à
des protéines du pore nucléaire ou impliqués dans l’export des ARNm. De ce fait, il
soutint l’hypothèse initiale de Blobel et proposa lui aussi que les régions adjacentes
aux pores nucléaires constitueraient un environnement local activateur (Ishii et al.,
2002). L’association de certains gènes avec les protéines du pore nucléaire fut par la
suite mise en évidence par ChIP (Casolari et al., 2004) puis de nombreuses études
in vivo indiquèrent que certains gènes étaient préférentiellement localisés aux pores
lorsqu’ils étaient activés (Cabal et al., 2006; Casolari et al., 2004; Dieppois et al.,
2006; Taddei et al., 2006). Cette localisation permettrait une efficacité optimale de la
transcription (Cabal et al., 2006; Taddei et al., 2006). Les études menées sur la
localisation de ces gènes au sein de cet environnement s’insèrent donc pleinement
dans la problématique de « régulation positionnelle ». Très récemment, l’équipe de
Brickner a découvert l’existence d’une voie d’adressage aux pores des gènes par
une séquence nommée GRS (« Gene Recruitment Sequence ») qui serait suffisante
pour entrainer la localisation d’un gène en périphérie nucléaire. Ces séquences de 8
paires de base ont été mises en évidence au niveau du promoteur INO1, puis
recherchées au sein du génome. Une centaine de séquences de ce type a été
identifiée (Ahmed et al., 2010). Dans l’étude de Cabal et ses collaborateurs en 2006,
d’autres mécanismes d’adressage ont été décrits. Ils ont observé que le cluster de
gènes GAL explore le volume nucléaire lorsqu’ils sont inactivés ; leur activation va
leur conférer de nouvelles propriétés et augmenter leur capacité de confinement près
des pores nucléaires (Cabal et al., 2006). Les complexes SAGA et TREX2 seraient
nécessaires à cette localisation périphérique (Rodriguez-Navarro et al., 2004). Les
voies d’adressage des gènes aux pores nucléaires sont donc multiples et ardemment
discutées dans de nombreuses publications. Les mouvements des gènes inductibles
ont notamment été étudiés mais les mécanismes afférents ne sont pas encore
clairement élucidés (Cabal et al., 2006; Dieppois et al., 2006; Dilworth et al., 2001;
Schmid et al., 2006). Il reste notamment à clarifier la relation de causalité entre la
localisation aux pores et la transcription (Pour revue Dieppois et al. 2010). Il est
néanmoins clairement établi que la localisation en périphérie n’est pas
systématiquement requise pour la transcription (Cabal et al., 2006; Taddei et al.,
2006) mais qu’il existe un environnement local favorable à la transcription à proximité
des pores nucléaires.

 MNU
La périphérie nucléaire est donc un environnement hétérogène partagé entre des
régions activatrices et des environnements hétérochromatiniens périphériques
défavorable à la transcriptions. On trouve en effet les foyers télomériques où il existe
une répression de la transcription (Andrulis et al., 1998; Taddei et al., 2009) et les
complexes de pores nucléaires où se localisent des gènes actifs. Ils formeraient
deux environnements distincts puisque la colocalisation des pores nucléaires avec
les foyers télomériques n’a pas été observée chez S. cerevisiae (Taddei et al., 2004).
Cependant, la délétion de certains composants du pore nucléaire entraine la
délocalisation d’une partie des télomères, suggérant un lien structural ou fonctionnel
entre ces deux entités organisant le génome (Galy et al., 2000).

Même si ces études ont été menées majoritairement chez la levure, ces
phénomènes de régulation par le pore nucléaire pourraient être conservés. Chez la
drosophile, un complexe d’histone acetyl transférase, le MSL intéragit avec des
composants du pore nucléaire et permet d’augmenter la transcription du
chromosome X d’un facteur 2 ; la délétion des deux protéines responsables de cet
accrochage empêche cette augmentation (Mendjan et al. 2006). Chez l’humain, on
observe peu d’hétérochromatine à proximité des pores nucléaires (Schermelleh et
al., 2008) cependant les expériences de ChIP-on-ChIP n’ont pas permis de montrer
une corrélation entre l’activité des gènes et un adressage au pore nucléaire (Brown
et al., 2008a). Dans l’optique de montrer la conservation du lien entre les pores
nucléaires et les gènes actifs il est important de considérer deux études récentes
menées chez la drosophile qui mettent en évidence l’existence de nucléoporines
solubles dans le volume nucléaire (Capelson et al., 2010; Kalverda et al., 2010). Cet
aspect rend les approches en ChIP insuffisantes pour établir un lien entre les pores
nucléaires et la position d’un gène.

II-3-c- Le concept des « usines à transcription »

Par analogie avec les foyers de réplication (Nakamura et al., 1986), il a été proposé
que le phénomène de transcription pourrait être aussi organisé en foyers (Jackson et
al., 1993). L’incorporation de nucléotides marqués tel que le BrUTP (5-bromouridine
5’-triphophate) dans des cellules de mammifères à permis d’identifier des régions où

 MOL
se concentraient des ARN néosynthtétisés révélateurs d’une intense activité de
transcription en des positions très localisées (Figure 28-B). Ces concentrations
locales d’ARN ont été baptisées « transcription factories » par l’équipe de P. Cook
(Iborra et al., 1996). Plus récemment, ces usines à transcription ont également été
révélées par l’utilisation d’anticorps contre la sérine 2 du domaine C-terminal de la
queue CTD, connue pour être un marqueur de l’ARN pol II active en élongation
(Phatnani and Greenleaf, 2006). Le regroupement d’ARN pol II activé au sein du
volume nucléaire semble donc acté. De plus, l’analyse détaillée de ces foyer
transcriptionnels a révélé qu’ils ne contenaient pas seulement l’ARN pol active en
transcription mais des facteurs de transcription et de maturation (de Jong et al.,
1996; Janicki et al., 2004; Pombo et al., 1999). Peter Cook évalua le nombre d’ARN
polymérases par foyer entre 6 et 8 dans des régions de 50 à 100nm de diamètre
(Cook, 1999; Iborra et al., 1996; Jackson et al., 1998; Pombo et al., 1999). D’autres
études ont également rapporté l’existence de regroupement de gènes transcrits
autour des corps d’épissage (« splicing speckles ») qui ont un diamètre plus
important que ceux décrits pour les usines à transcription(Brown et al., 2008b). De
manière intéressante, une étude en 2008 a décrit un constituant majeur de ces
« splicing speckles », SC35, comme un facteur stimulant l’élongation (Fededa and
Kornblihtt, 2008). Cette donnée donne une pertinence fonctionnelle à ces
phénomènes de co-localisation. Les « transcription factories » permettraient de
constituer un environnement local favorable à l’initiation et/ou à l’élongation par
l’accumulation de facteurs de transcription en son sein (Chubb et al. 2003, Yao et al.
2007).

Pour favoriser ces processus de regroupement, il a été suggéré que les gènes
contenant les mêmes séquences promotrices auraient tendances à s’assembler en
usines à transcription. Cette hypothèse a été validée par une approche consistant à
exprimer des plasmides portant des séquences promotrices identiques (Xu and
Cook, 2008), mais l’interaction entre des promoteurs identiques endogènes n’a pas
été confirmée (Osborne et al., 2004; Simonis et al., 2004). D’autre part, un autre
point prête à débat quant à la formation de ces environnements locaux et concerne
la dynamique des gènes faisant parties de ces foyers. Osborne et ses collaborateurs
proposent que les gènes actifs ont tendance à se rapprocher plus les un des autre
que lorsque ces mêmes gènes sont inactivés (Osborne et al., 2004). De la même

 MOM
manière, les techniques de séquençage massif combinée à la technique de 3C chez
S. cerevisiae et chez S. pombe ont permis de confirmer le regroupement d’ARNt ou
de gènes impliqués dans des processus biologiques proches (Duan et al., 2010;
Tanizawa et al., 2010). Néanmoins, d’autres études utilisant le 4C et le FISH ont
montré que l’inhibition de la transcription par l’ I-amanitine ne changeait pas
forcément le profil d’interaction entre les gènes (Palstra et al., 2008). Il est donc
difficile de tirer des conclusions définitives sur la formation de ces usines à
transcription. Il semble néanmoins que les gènes actifs peuvent interagir entre eux
de manière dynamique mais que ce regroupement n’est pas essentiel à leurs
activités.

Pour comprendre comment se forment ces usines de transcription, il est donc


nécessaire d’avoir une vision dynamique des processus et des constituants
nucléaires. A ce titre, l’analyse in vivo par FRAP de la mobilité de l’ARN pol II et des
protéines associées à l’ADN suggère que la plupart de ces facteurs alternent entre
phase de diffusion dans le nucléoplasme et une phase immobile d’interaction avec la
chromatine (Kimura et al., 2002; Phair et al., 2004). Une augmentation du temps de
résidence de ces protéines dans un environnement chromatinien local permettrait la
formation de ces « transcription factories » selon la théorie organisationnelle de
l’auto assemblage (Misteli, 2001b). De plus, de nombreuses études suggèrent que la
transcription in vivo est initiée de manière stochastique et qu’un gène alterne entre
des phases courtes de transcription et des phases de repos (Raj et al., 2006; Raser
and O'Shea, 2004). Raj et ses collaborateurs ont proposé que lorsque la
concentration en facteurs de transcription augmente, l’efficacité et le rendement de
ces phases de transcription actives sont améliorés plutôt que la fréquence des
évènements transcriptionnels (Raj et al., 2006). Le positionnement d’un gène dans
une usine permettrait donc d’augmenter l’efficacité de ces phases actives. La
possibilité d’un gène d’augmenter l’efficacité de sa transcription serait dépendante de
sa capacité à se localiser au sein d’un environnement local favorable à la
transcription.

II-4-Le nucléole ; Facteur organisateur du génome et régulateur de la


transcription

 MON
Le nucléole est un élément architectural majeur au sein du volume nucléaire. Nous
allons voir dans la partie suivante qu’il peut être considéré comme la parfaite
illustration du concept des « transcription factories ». Dans une partie précédente de
cette thèse, nous avons évoqué la structure, la dynamique et l’importance du
nucléole dans la transcription des gènes d’ADNr ( chapitre I, II-2), nous allons ici
aborder les conséquences de la présence d’une telle structure sur l’organisation
globale du génome.

Chez la levure, le nucléole s’organise autour des gènes d’ADNr qui ne représentent
pas plus de 10% du génome ; il constitue pourtant une région occupant à elle seul
près d’un tiers du volume nucléaire. De nombreux facteurs de nature protéique et
ribonucléoproteique (RNP) impliqués dans la biogenèse des ribosomes sont
concentrés au nucléole. Le nucléole occupe un espace bien défini au sein du noyau
chez S. cerevisiae puisqu’il est retrouvé systématiquement dans des cellules
interphasiques accolé à l’enveloppe nucléaire et faisant face au SPB. Ce
positionnement participe directement à l’organisation nucléaire des chromosomes
pour plusieurs raisons : d’une part la taille du nucléole influence directement sur le
positionnement de certaines régions chromosomiques telles que les télomères
(Therizols et al., 2010), d’autre part il semblerait que d’autres gènes que les gènes
d’ADNr sont régulés par leur proximité au nucléole. Il s’agit notamment des gènes
codant pour les ARNt tel que le gène SUP53 codant pour un ARNt qui se localise,
quand il est activé, au nucléole (Thompson et al., 2003).

II-4-a-Le nucléole : une usine à transcription

Le nucléole constitue la parfaite illustration d’une usine à transcription, puisqu’il s’agit


d’une région restreinte au sein du volume nucléaire où se trouve concentrés l’ARN
pol I, ses facteurs de transcription associés et sa matrice d’ADN : les gènes d’ADNr.
A la manière des « transcriptions factories », le nucléole n’est pas une structure
essentielle à la transcription des gènes d’ADNr puisque l’utilisation artificielle de
l’ARN pol II empêche la formation du nucléole mais est suffisante pour assurer la
synthèse d’ARNr. Cependant, le nucléole permet d’organiser et d‘optimiser le
processus transcriptionnel assuré par l’ARN pol I. La structure du nucléole est
intimement liée à cette fonction et son apparition est la conséquence de l’activité de

 MOO
l’ARN pol I (Sirri et al., 2008). Il semblerait que la formation du nucléole soit un
phénomène d’auto assemblage (Misteli, 2001b). Le travail de Dundr et ses
collaborateurs favorise cette hypothèse. Dans leur étude, les mouvements des
protéines concentrés au sein du nucléole ont été observés en FRAP. Par cette
approche, il fut démontré que les composants de la machinerie de transcription par
l’ARN pol I sont échangés rapidement entre le nucléole et le nucléoplasme.
L’accrochage simultané des constituants de la machinerie de transcription sur la
matrice d’ADN et l’abondante accumulation d’ARNr formeraient le nucléole (Dundr et
al., 2002). Le lien entre transcription et structure nucléolaire ne prête donc plus à
débat. Cependant, l’organisation interne de ces séquences d’ADNr au sein du
nucléole est elle soumise à controverse. Chez les mammifères, il faut imaginer
l’agencement en 3D dans le volume nucléolaire d’une centaine de gènes transcrits
de plus de 6000 nm de long, contenant en moyenne 180 polymérases par gène,
faisant chacune 15 nm de diamètre et produisant des ARN qui mesurent au
maximum 350nm de long décorés par une structure circulaire terminale de 20 nm
(Puvion-Dutilleul et al., 1997; Trendelenburg et al., 1996). La polémique se situe
principalement sur la localisation exacte de l’ARN pol I active en transcription. Les
approches de détection en microscopie électronique de l’ARN pol I donnent des
résultats divergents selon les équipes (pour revue (Raska, 2004)). Cependant
certains modèles d’organisation ont été proposés et constituent une base de travail
pour imaginer et conceptualiser l’organisation des centaines de gènes d’ADNr et de
l’ARNr au sein du nucléole. Cheutin et ses collaborateurs proposent que les centres
fibrillaires soient composés d’un ou deux gènes d’ADNr repliés sur eux mêmes
(Figure 29-A). Le DFC adjacent stockerait l’ARN néo-synthétisé (Cheutin et al.,
2002). Une autre étude combine les données tomographiques de Cheutin à des
expériences de ChIP et de 3C pour proposer un autre modèle relativement proche
où un gène d’ADNr transcrit formerait un cylindre dessiné par les ARN pol I alors que
les séquences promotrices et terminatrices seraient au centre de ce cylindre
(Denissov et al., 2011) (Figure 29-B). Au contraire, pour Ivan Raska les centres
fibrillaires seraient le lieu de stockage des gènes inactifs (Raska, 2004). Le débat
reste donc entier concernant l’organisation des gènes d’ADNr. Cependant l’existence
du regroupement spatial des gènes d’ADNr dans un environnement local favorable à
leur transcription est acté et correspond au critère définissant une usine à
transcription.

 MOP
A-

(Adapté de Cheutin et al. 2002)


B-
SL1
ARNPI en élongation
ARNPI en phase de terminaison
Topoisomérase I
Transcrit naissant ARNr
ARNr
Ribonucléoprotéines
Actine
(Adapté de Denissov et al. 2011)

C- cellule/nucléoide ARN Pol ARN Pol/nucléoide

Milieu
riche

Milieu
pauvre

(Adapté Jin et al. 2006)


Figure 29: A-Modélisation de l'organisation d'un gène d'ADNr à partir des données de tomogra-
phie. Les boules jaunes représentent les ARN pol I et la ligne rouge l'ADNr. Le panel de droite repré-
sente la position potentielle dans le nucléole de cette structure préalablement décrite. Les gènes
d'ADNr se localiseraient dans le centre fibrillaire (FC). B- Denissov et ses collaborateurs proposent
également que le centre fibrillaire abriterait les gènes d'ADNr mais décrivent un enroulement de la
séquence codante du gène d'ADNr autour d'un axe promoteur terminateur. C- Visualisation de regrou-
pement d'ARN pol détecté par une étiquette GFP au sein du nucléoide d'E. coli dans un milieu riche
ou pauvre. Le rétrécissement de l'espace occupé du nucléoide se visualise par rapport à la taille
globale de la cellule en milieu riche.
II-4-b-Régulation péri-nucléolaire

Singulièrement, il a été suggéré que le « nucléole » soit un centre organisateur du


génome des procaryotes (pour revue (O'Sullivan, 2010)). Chez les procaryotes et
notamment dans les organismes modèles Bacillus subtilis et E. coli des
regroupements d’ARN pol ont été identifiés et s’apparentent à des « transcription
factories » produisant entre autres de l’ARNr. De manière intéressante, ces foci
apparaissent en phase exponentielle et entrainent une compaction globale du
génome, alors qu’en phase stationnaire on n’observe pas de regroupement d’ARN
pol et le nucléoide occupe un plus grand espace (Jin and Cabrera, 2006) (Figure 29-
C). Dans le cas des procaryotes ces regroupements d’ARN pol actives influent
directement sur l’organisation du génome. Chez les eucaryotes le nucléole semble
aussi participer à l’organisation des chromosomes.

De la levure aux mammifères, les régions chromatiniennes adjacentes aux nucléoles


présentent certaines caractéristiques. Chez les mammifères, on retrouve souvent de
l’hétérochromatine contenant des régions pauvres en gènes et peu active en
transcription. Par exemple, le chromosome X inactivé est localisé préférentiellement
dans ces zones et oscille entre des régions proches de l’enveloppe nucléaire et du
nucléole (Bourgeois et al., 1985). Cette localisation est dépendante d’ARN non
codant issus du locus Xist. Par opposition avec ces régions faiblement transcrites,
une activité de transcription a également été décrite dans la région nucléolaire. Après
inhibition de l’ARN pol I une activité de transcription est détectée en périphérie
nucléolaire par incorporation de BrUTP laissant penser que l’ARN pol II et/ou l’ARN
pol III sont actives dans cette région (Huang et al., 1998). Les gènes codant pour
l’ARN 5S sont en effet regroupés préférentiellement en position proximale du
nucléole des plantes aux humains (Matera et al., 1995) (Pour revue voir (Haeusler
and Engelke, 2006)). Chez S. cerevisiae, la situation est de fait différente puisque le
gène 5S est inséré directement entre les répétitions des gènes d’ADNr, et se localise
donc au nucléole. Enfin, chez les mammifères, deux publications se sont focalisées
sur ces régions périnucléolaires (Németh et al., 2010; van Koningsbruggen et al.,
2010). Ces deux études ont obtenu des résultats proches et ont permis de montrer
que seulement une faible partie du génome était associée au nucléole (environ 4%)
(Figure 30-B). Ces régions sont enrichies en séquences satellites, des gènes codant
pour des immunoglobulines et des récepteurs olfactifs à doigt de zinc, des gènes

 MOR
d’ARN de transfert, et de manière générale beaucoup de régions répétées et
inactives. Les expériences de 3C de O’Sullivan en 2009 chez S. cerevisiae ont
également révélé une interaction des séquences répétées avec l’ADNr ; il propose
d’ailleurs que ces régions répétées ( Ty et Y’) organisent le génome en se servant de
leurs ancrages au nucléole (O'Sullivan et al., 2009). Duan et al, par analogie avec les
résultats obtenus chez les mammifères, proposent que seulement une faible partie
du génome est associé à l’ADNr chez S. cerevisiae (Duan et al., 2010). Chez la
levure, une attention toute particulière a été portée aux gènes codant pour les ARN
de transfert qui se placeraient à proximité du nucléole (Thompson et al., 2003; Wang
et al., 2005) (Figure 30-A). D’après David Engelke, les 275 gènes codant pour les
ARNt se regrouperaient et se localiseraient près du nucléole. De plus, il a été
suggéré que cette colocalisation serait étroitement liée à leur état transcriptionnel
puisque que le gène SUP53 n’est proche du nucléole que lorsqu’il est transcrit. De
plus, ce rapprochement serait lié à l’activité de transcription de l’ARN pol I puisque
cette co-localisation est abolie dans le cas d’une délétion du gène RPA49. Enfin, il
est également suggéré que sur une région donnée, la localisation et la transcription
du gène codant pour les ARNt par l’ARN pol III inhiberait l’activité du gène transcrit
par l’ARN pol II adjacent. Il est cependant nécessaire d’apporter plusieurs éléments
d’informations à ces conclusions. Premièrement une étude de la localisation du gène
SUP53, ou plus précisément du gène adjacent LEU2 a été faite in vivo, et le locus
n’est pas détecté au nucléole (Bystricky et al., 2005). De plus, le travail de Duan et
ses collaborateurs en 2010 a confirmé le regroupement de certains gènes codant
pour les ARNt mais a aussi montré qu’une partie n’était pas localisée au nucléole,
mais proche des régions centromeriques (Duan et al., 2010). Enfin, une analyse
globale de la transcription n’a pas permis de révéler de lien entre l’activité de l’ARN
pol III et l’activité des gènes adjacents au locus des gènes codant pour les ARN de
transfert (Conesa et al., 2005). Les conclusions du groupe de David Engelke sont
donc à nuancer, d’autant que s’il est avéré qu’une majorité des 275 gènes d’ARNt
est localisée au nucléole, ce positionnement aurait de grandes conséquences sur
l’organisation du génome soumis dans le cas de la levure à l’organisation en Rabl.
Des expériences supplémentaires, notamment en utilisant des conditions in vivo sont
nécessaires pour valider la véracité de cette hypothèse.

 MOS
SUP53 (rouge) nucleole (vert) superposition

Active SUP53

Inactive SUP53

(Adapté de Thompson 2003)

(Adapté de Németh et Langst, 2011)

Figure 30: A- L'inactivation de l'expression du gène se fait par mutation du promoteur de SUP53.
La localisation du gène est détectée sur des cellules fixées de S. cerevisiae par FISH de sondes recon-
naissant la position du gène adjacent. Le nucléole est détecté par une sonde contre le snoARN U14.
(Thompson et al. 2003). B- Représentation de la localisation des centromères et des différents domai-
nes en contact avec les lamines (LAD), et le nucléole (NAD) sur l'ensemble des chromosomes humains.
P artie expérimentale

I- Rôle et conservation évolutive des sous unités spécifiques Rpa34


et Rpa49.

I-1 Publication 2008

Au cours de cette introduction, nous avons évoqué l’existence de deux sous unités
spécifiques de l’ARN pol I. Ces deux polypeptides ont été caractérisés il y a plus de
trente ans par Huet et ses collaborateurs, mais leur rôle n’a pas été clairement
élucidé (Huet et al., 1975). Ces dernières années, plusieurs publications ont apporté
de nouveaux éléments sur le rôle et le positionnement de ces deux polypeptides sur
l’ARN pol I (Beckouet et al., 2008; Kuhn et al., 2007). Ces deux dernières
publications ont servies de base de travail durant ma thèse.

Dans la publication de Beckouet et ses collaborateurs, ma contribution est la


conséquence d’une erreur expérimentale. J’ai involontairement surexprimé Rpa49
dans un contexte où Rpa34 est essentielle à la croissance. De manière surprenante,
la surexpression de Rpa49 permettait de corriger un défaut de croissance du à
l’absence de Rpa34. L’observation de la suppression de ce phénotype et le test dans
différents contextes génétiques ont alors permis de mettre en évidence que le rôle
principal de Rpa34 est de stabiliser Rpa49.

Les autres expériences de cette publication ont été menées par Fréderic Beckouet et
ses collaborateurs et ont permis de renforcer l’idée que Rpa34 et Rpa49 fonctionnent
en hétérodimère. Rpa34 permettrait la stabilisation de la sous unité Rpa49 et
l’optimisation de ses fonctions. Cette publication a également apporté de nouveaux
éléments quant à la fonction de ces deux sous-unités spécifiques. L’absence de
Rpa49 cause un défaut d’initiation et d’élongation. Le défaut d’élongation est mis en
évidence par une sensibilité accrue au mycophénolate et serait du à l’absence de
relargage du facteur Rrn3 de l’ARN pol I en élongation. De plus, dans une souche
CARA où Rrn3 a été fusionné à Rpa43, Rpa49 devient essentielle ce qui renforce

 MOU
l’idée d’un rôle de Rpa49 en lien avec le positionnement et le relargage du facteur
Rrn3. Ce travail est présenté en annexe.

I-2 préambule Publication 2011

Un rôle de Rpa49 dans l’élongation en lien avec le relargage de Rrn3 a donc été
suggéré. Cependant, la publication de l’équipe de Partrick Cramer quelques mois
auparavant suggère que l’hétérodimère Rpa49/Rpa34 et Rrn3 auraient des positions
opposées sur l’ARN pol I. Cette nouvelle information structurale n’est pas en faveur
d’une interaction directe entre Rpa49 et Rrn3 qui permettrait le relargage de Rrn3 de
l’ARN pol I. Les données publiées en 2010 par Sebastian Geiger ont apporté de
nouveaux éléments sur Rpa49 (Geiger et al., 2010). Dans cette étude, ils ont établi
que le domaine de dimérisation de Rpa49 et Rpa34 était structurellement proche du
facteur de transcription TFIIF alors que la partie C-terminal de Rpa49 se
rapprocherait de TFIIE. Ces résultats montrent que le fonctionnement de l’ARN pol I
et ARN pol II partage plus de mécanismes communs que ceux supposés en se
basant sur les séquences primaires des protéines appartenant aux différents
systèmes de transcription. Le domaine tWH identifié sur la queue C terminal de
Rpa49 permettrait notamment un accrochage à l’ADN et l’absence de ce domaine
contribuerait au défaut d’élongation (Beckouet et al., 2008). Cependant, ces
nouvelles données n’expliquent pas comment la protéine Rpa49 peut agir sur le
relargage de Rrn3 tout en étant positionnée à son opposé sur l’ARN pol I.

L’étude que nous présentons ici, se situe dans le prolongement de ces publications
de l’équipe de Patrick Cramer et de Pierre Thuriaux. Dans cette publication Isabelle
Léger Silvestre à contribué à la partie expérimentale de manière importante. Elle a
permis d’obtenir des images de microscopies électroniques de qualité et en quantité
suffisante pour pouvoir caractériser et quantifier les structures observées. Martin
Ostermaier a aussi participé à l’observation et à la quantification d’une partie des
étalements de Miller présentés dans cette publication. Christophe Normand a réalisé
le crible génétique contre Rpa34 accessible dans les figures supplémentaires.
Patrick Shultz a participé à l’élaboration du modèle proposé en simulant la position
de deux ARN pol I en cours de transcription. Jorge Perez Fernandez a contribué à ce
travail par la mise en place du PFGE (« pulse field Gel Electrophoresis ») au sein du

 MPL
laboratoire et l’élaboration d’un protocole de ChIP permettant d’augmenter les
rendements de purification de la chromatine nucléolaire. Enfin, Kostya Panov et
Joost Zomerdijk m’ont permis d’utiliser les équivalents humains de Rpa34 et Rpa49
de S. cerevisiae et ainsi d’étendre à l’Homme nos résultats acquis chez S.
cerevisiae.

Dans cette étude nous avons montré la conservation fonctionnelle de ces deux sous-
unités Rpa34 et Rpa49 dans trois organismes eucaryotes évolutivement distants.
Nos données nous ont permis de montrer l’existence de contacts entre les ARN pol I
en cours de transcription qui seraient abolis en absence de ces deux sous-unités
spécifiques. Ces contacts seraient déterminants pour assurer le bon fonctionnement
de l’ARN pol I au cours de l’élongation et pour l’intégrité du nucléole. De plus, le
modèle proposé permet de réconcilier les données concernant la structure de l’ARN
pol I (Kuhn et al., 2007) et les liens fonctionnels décrits entre Rpa49 et Rpa43 par
Beckouet en 2008(Beckouet et al., 2008).

I-3 Publication 2011

 MPM
Published January 24, 2011 JCB: Article

RNA polymerase I–specific subunits promote


polymerase clustering to enhance the rRNA gene
transcription cycle
Benjamin Albert,1,2 Isabelle Léger-Silvestre,1,2 Christophe Normand,1,2 Martin K. Ostermaier,1,2 Jorge Pérez-Fernández,1,2
Kostya I. Panov,3 Joost C.B.M. Zomerdijk,4 Patrick Schultz,5 and Olivier Gadal1,2
1
Laboratoire de Biologie Moléculaire des Eucaryotes du Centre National de la Recherche Scientifique and 2Université de Toulouse, F-31000 Toulouse, France
3
Medical Biology Centre, School of Biological Sciences, The Queen’s University of Belfast, Belfast BT9 7BL, Northern Ireland, UK
4
Wellcome Trust Division for Gene Regulation and Expression, College of Life Sciences, University of Dundee, Dundee DD1 5EH, Scotland, UK
5
Department of Integrated Structural Biology, Institut de Génétique et de Biologie Moléculaire et Cellulaire, Centre National de la Recherche Scientifique/Institut National
de la Santé et de la Recherche Médicale/Strasbourg University, Illkirch 67404, France
THE JOURNAL OF CELL BIOLOGY

Downloaded from [Link] on January 24, 2011


R
NA polymerase I (Pol I) produces large ribosomal of Miller spreads in the absence of Rpa49 demonstrates
RNAs (rRNAs). In this study, we show that the a fourfold decrease in Pol I loading rate per gene and
Rpa49 and Rpa34 Pol I subunits, which do not decreased contact between adjacent Pol I complexes.
have counterparts in Pol II and Pol III complexes, are func- Therefore, the Rpa34 and Rpa49 Pol I–specific subunits
tionally conserved using heterospecific complementation are essential for nucleolar assembly and for the high
of the human and Schizosaccharomyces pombe ortho- polymerase loading rate associated with frequent contact
logues in Saccharomyces cerevisiae. Deletion of RPA49 between adjacent enzymes. Together our data suggest
leads to the disappearance of nucleolar structure, but that localized rRNA production results in spatially con-
nucleolar assembly can be restored by decreasing ribo- strained rRNA production, which is instrumental for nu-
somal gene copy number from 190 to 25. Statistical analysis cleolar assembly.

Introduction
In all living organisms, multisubunit DNA-dependent RNA subunits, including a 10-subunit extended core and a peripheral
polymerases are built around a common set of five core sub- heterodimer of subunits Rpb4/Rpb7. Rpb4 and Rpb7 have
units (A2BB’V in eubacteria; Minakhin et al., 2001) In archeal counterparts in Pol I and Pol III, Rpa43/Rpa14 and Rpc17/
and eukaryotic enzymes, five additional subunits (related through Rpc25, respectively. Pol I and Pol III have counterparts to each
common ancestry) are required, leading to a 10-subunit extended of the 12 Pol II subunits and, in addition, two and five specific
core (Cramer et al., 2008; Kwapisz et al., 2008). In eukaryotes, subunits, respectively, which may be responsible for some of
three nuclear RNA polymerases are found, each transcribing the specific functions of these two enzymes. In this study, we
a dedicated set of genes. RNA polymerase II (Pol II) transcribes focus on Pol I–specific subunits Rpa34 and Rpa49, which have
all protein-coding genes and most of the small nuclear RNA structural homology with the Rap74/Rap30 subunits of the Pol II
genes. RNA polymerase III (Pol III) is transcribing 5S ribo- transcription factor TFIIF (Kuhn et al., 2007).
somal RNA (rRNA) genes, tRNA genes, and some noncoding Pol I is the most active and abundant RNA polymerase in
RNA genes. RNA polymerase I (Pol I) produces a single tran- eukaryotes. Its enormous transcriptional output can best be visual-
script, the large polycistronic precursor (35S pre-rRNA in yeast) ized using the DNA spread method previously developed by
processed in multiple successive steps into the mature rRNAs Miller et al. (1969), where the 35S rRNA genes (rDNA) adopt a
(in yeast, 25S, 18S, and 5.8S rRNAs). Pol II is composed of 12 “Christmas tree” conformation. In Saccharomyces cerevisiae,

Correspondence to Olivier Gadal: gadal@[Link] © 2011 Albert et al. This article is distributed under the terms of an Attribution–
Noncommercial–Share Alike–No Mirror Sites license for the first six months after the pub-
Abbreviations used in this paper: FOA, fluoroorotate; GIM, genetic interaction lication date (see [Link] After six months it is available under a
mapping; PFGE, pulse-field gel electrophoresis; rRNA, ribosomal RNA; WT, Creative Commons License (Attribution–Noncommercial–Share Alike 3.0 Unported license,
wild type. as described at [Link]

Supplemental Material can be found at:


[Link]
The Rockefeller University Press $30.00
J. Cell Biol. Vol. 192 No. 2 277–293
[Link]/cgi/doi/10.1083/jcb.201006040 JCB 277
Published January 24, 2011

Downloaded from [Link] on January 24, 2011

Figure 1. PAF53/CAST heterodimer is functionally conserved from human to budding yeast. (A) Pol I–specific subunits in S. cerevisiae, S. pombe, Mus
musculus, and Homo sapiens. (B) Nucleolar localization of CAST depends on PAF53. CAST fused with YFP (YFP-CAST) is expressed in a WT yeast produc-
ing Nop1 fused to mCherry (mCherry-Nop1) with (PAF53) or without () PAF53 coexpression (see Materials and methods). (right) The overlay of both
fluorescent signals (merge) is shown. (C) Immunoprecipitation of budding yeast Pol I demonstrates that association of CAST to Pol I requires human PAF53.
HA-tagged CAST (HA-CAST) is detected in the supernatant (SUP) with or without coexpression of PAF53. Using IgG Sepharose to immunopurify TAP-tagged
budding yeast Pol I (IP), CAST copurifies with Pol I only when coexpressed with PAF53 (+). Western blot using Pap and 12CA5 revealed tagged bud-
ding yeast Pol I (Rpa190-TAP) and CAST (HA-CAST) in supernatant (SUP) and immunoprecipitated fraction (IP), respectively. (D) Nucleolar localization of
PAF53 depends on CAST. PAF53 fused with YFP (YFP-PAF53) is expressed in a WT budding yeast producing Nop1 fused to mCherry (mCherry-Nop1) with
(CAST) or without CAST (). CAST expression is required for both a detectable YFP signal and a nucleolar localization of PAF53. (E) PAF53 expressed

278 JCB • VOLUME 192 • NUMBER 2 • 2011


Published January 24, 2011

the rDNA is made of a 6.9-kb-long gene repeated Y150 times, Results


of which about half is transcribed. Transcription of the rDNA is
one to two orders of magnitude greater than the transcription of The human hPAF53/CAST heterodimer
the rest of the genome. In exponentially growing cells, 0.01–10 is functionally conserved from human
Pol II enzymes are found per open reading frame (Bon et al., to budding yeast
2006), whereas >120 Pol I molecules can be detected (by Miller We investigated the functional conservation of specific Pol I
spread; Miller et al., 1969) at the transcribed region of each ac- subunits from budding yeast to human (Fig. 1 A). In budding
tive rDNA repeat (Osheim et al., 2009). yeast, Rpa49 and Rpa34 are not essential for viability, and their
Pol I activity is associated with the largest nuclear amino acid sequences are poorly conserved through evolution.
body, the nucleolus, where all earlier steps of ribosome bio- Orthologues of Rpa49 and Rpa34, PAF53 and PAF49 in mouse
genesis take place. Assembly of the nucleolus is proposed (Hanada et al., 1996; Yamamoto et al., 2004) and hPAF53 and
to be a self-organized process, initiated by production of CAST in human (also called ASE-1 or hPAF49; Panov et al.,
rRNA (Trumtel et al., 2000; Misteli, 2001; Hernandez-Verdun 2006), respectively, have a conserved domain organization with
et al., 2002). In budding yeast, Pol I is essential, but very S. cerevisiae subunits but low sequence similarity. In budding
elegant genetic analyses have been used to show that Pol II– yeast and mouse, Rpa49/Rpa34 orthologues are easily dissoci-
dependent 35S rRNA expression, albeit very inefficiently, ated from the enzyme by high salt treatment (Huet et al., 1975;
can rescue Pol I minus mutants (Nogi et al., 1991). Impor- Hanada et al., 1996), and as a result, these two polypeptides
tantly, in mutant cells where Pol I is inactivated and Pol II is have been classified either as Pol I–associated factors in mouse

Downloaded from [Link] on January 24, 2011


artificially producing rRNA, nucleolar structures are still de- or as Pol I subunits in S. cerevisiae and human. A previous com-
tectable, but with massive alterations (Oakes et al., 1998; plementation attempt has established that Schizosaccharomyces
Trumtel et al., 2000). Therefore, rRNA synthesis achieved pombe Pol I subunit Rpa51, hereafter called Sp-Rpa49, but
from its dedicated transcriptional apparatus is important for not mouse PAF53, can complement rpa49% cold sensitivity
formation of the nucleolar structure. (Nakagawa et al., 2003). Because Rpa49 and Rpa34 function as
In this study, we focus on the role of two Pol I–specific a heterodimer (Kuhn et al., 2007; Beckouet et al., 2008), we
subunits, Rpa49 and Rpa34, in Pol I transcription and nucle- tested the coexpression of human CAST and hPAF53 in a com-
olar morphology. Pol I lacking Rpa34/Rpa49 has been shown plementation assay. We first investigated the localization of
to be active in transcription but impaired in elongation (Huet human CAST when expressed in wild-type (WT) budding yeast,
et al., 1975). In vivo, rpa49 and rpa34 deletion mutants are with or without hPAF53 expression. CAST is nuclear when
viable, but are defective in 35S rRNA production (Liljelund expressed alone but predominantly localized in the nucleolus
et al., 1992; Gadal et al., 1997). Structural insight and bio- when coexpressed with hPAF53 (Fig. 1 B). Starting from a
chemical assays have suggested that Rpa34/Rpa49 form a yeast strain bearing a TAP-tagged Rpa190 (Rigaut et al., 1999),
heterodimer behaving like built-in elongation factors (Kuhn Pol I largest subunit, we purified Pol I to test the association of
et al., 2007). Another clue to Rpa49 function came from the CAST with budding yeast Pol I. CAST is coimmunoprecipi-
observation that in rpa49 deletion mutants, Rrn3 (TIF-IA in tated with budding yeast Pol I only when coexpressed with
mouse), an essential Pol I transcription factor, is recruited hPAF53 (Fig. 1 C). These results suggest that hPAF53/CAST
to the promoter less efficiently and fails to dissociate from heterodimer is replacing the Rpa49/Rpa34 heterodimer in bud-
elongating polymerase (Beckouet et al., 2008). In this study, ding yeast Pol I. We then investigated hPAF53 localization with
we demonstrate that the Rpa34/Rpa49 heterodimer is func- or without CAST coexpression. No YFP-hPAF53 fusion protein
tionally conserved in evolution and required for nucleolar was detected when it was expressed alone, but it was present in
assembly. Using Miller spreads to analyze Pol I distribution the nucleolus when coexpressed with CAST (Fig. 1 D). To test
in the absence of Rpa49 on single transcribed genes, we the idea that CAST stabilizes hPAF53 when coexpressed in
show that there is a decreased clustering of elongating Pol I budding yeast, we quantified hPAF53 by immunodetection in
complexes. 3D modeling of two neighboring Pol I complexes whole cell extracts with or without CAST (Fig. 1 E). hPAF53
unveil how such association can regulate rRNA gene tran- is barely detectable in budding yeast extracts, even if ex-
scription cycle. pressed from the strong PGK1 promoter, but it accumulates

in budding yeast is stabilized by CAST coexpression. PAF53 is detected in a whole cell extract from WT budding yeast expressing PAF53 (PAF53) alone
or coexpressed with CAST (PAF53 CAST) using PAF53 antibody (A-PAF53). Nop1 (A-Nop1) is used as loading control. Total extract from HeLa loaded in
lane 1 is used as control for PAF53 detection. White lines indicate that intervening lanes have been spliced out. (F) Overexpressed PAF53 complements
rpa49% cold-sensitive growth defect. 10-fold serial dilutions of RPA49-deleted strain expressing budding yeast RPA49 (Rpa49), empty vector (), PAF53
expressed from a strong promoter (PPGK-PAF53), or an even stronger budding yeast promoter PTEF1 (PTEF1-PAF53) were spotted on 5-FOA–containing plates
to check for complementation of the mutant cold sensitivity at 25°C (see Materials and methods for plasmid-shuffling assay). Plates without FOA () are
used as control to confirm that the same number of cells were spotted. The strength of the complementation is evaluated by comparing plates with (FOA) or
without FOA (). (G) Expression of the PAF53/CAST heterodimer complements the RPA34 deletion phenotype. 10-fold serial dilutions of rpa34 deletion
strains containing budding yeast RPA34 (Rpa34), empty vector (), PAF53 driven from a moderate promoter (PAF53), CAST expressed from the budding
yeast promoter PTEF1 (CAST) or coexpressing PAF53 and CAST (PAF53 CAST) were spotted on 1 g/liter caffeine-containing plates to check for suppression
of the rpa34% mutant hypersensitivity. Strength of the suppression of drug sensitivity was evaluated by comparing plates with (+) or without () caffeine
spotted with equivalent amount of cells.

RNA polymerase I function depends on specific subunits • Albert et al. 279


Published January 24, 2011

Downloaded from [Link] on January 24, 2011

Figure 2. Rpa49/Rpa34 heterodimer is conserved in fission yeast. (A) In S. cerevisiae, nucleolar localization of Sp-Rpa34 depends on Sp-Rpa49.
Sp-Rpa34 fused with YFP (YFP-Sp-Rpa34) is expressed in a WT budding yeast with (Sp-Rpa49) or without () Sp-Rpa49 coexpression. In all cases, cells
produce Nop1 fused to mCherry (mCherry-Nop1) and Nup49 fused with CFP (CFP-Nup49) to label the nucleolus and the nuclear pore complexes, respec-
tively. (right) Overlay of the three fluorescent signals (merge) is shown. (B) Sp-Rpa34/Sp-Rpa49 heterodimer complements budding yeast Rpa34 essential
function in a Pol I mutant background (rpa135-D395N). 10-fold serial dilutions of rpa34% rpa135-D395N double-deletion strains containing S. cerevisiae
RPA34 (Rpa34), empty vector (), Sp-Rpa34 (Sp-Rpa34), Sp-Rpa49 (Sp-Rpa49), or coexpressing Sp-Rpa34 and Sp-Rpa49 (Sp-Rpa34/Sp-Rpa49) were
spotted on plates with (FOA) or without FOA (), and complementation was evaluated by comparing plates with (FOA) or without FOA (). (C) Sp-Rpa34
deletion barely affects growth in S. pombe. 10-fold serial dilutions of S. pombe WT and Sp-rpa34 deletion strains in rich medium at 30°C after 48 (left) and
120 h (right). (D) Sp-rpa34 Sp-rpa49 double deletion is viable in S. pombe. To generate the double-mutant strain, we crossed two haploid strains bearing

280 JCB • VOLUME 192 • NUMBER 2 • 2011


Published January 24, 2011

when coexpressed with CAST. Interestingly, CAST depletion WT fission yeast. Both drugs deplete the pool of NTP in vivo
in mouse and human cells leads to concomitant disappear- and have a strong effect on strains with defects in RNA poly-
ance of PAF53, whereas the level of other Pol I subunits is un- merase elongation. Sensitivity to both drugs is suppressed by
affected (unpublished data). Therefore, our results suggest overexpression of Sp-Rpa49 (Fig. 2 E). Therefore, our results
that coexpression of CAST and hPAF53 is required for strongly suggest that in S. pombe, both Pol I–specific subunits
hPAF53 stabilization. are conserved and functionally exchangeable with the budding
We next tested the ability of the human subunits to com- yeast Rpa49/Rpa34 heterodimer.
plement the rpa49% and/or rpa34% phenotypes by plasmid-
shuffling assays (see Materials and methods). hPAF53 on its The C-terminal domains of budding
own is unstable; therefore, we expressed hPAF53 under the yeast Rpa34 contain a nucleolar
control of the strong PGK1 or the very strong TEF1 promoter. localization signal
rpa49% cold sensitivity was corrected by hPAF53 only when We showed that Rpa49 overexpression could suppress all known
the pTEF1 promoter was used (Fig. 1 F). rpa34% has little growth phenotypes of rpa34%, suggesting that Rpa34 function is re-
defect, but it is hypersensitive to caffeine (1,3,7-trimethylxanthine; stricted to stabilization of Rpa49 (Beckouet et al., 2008), but in
Beckouet et al., 2008). We assayed the ability of CAST, hPAF53, higher eukaryotes, the orthologue of Rpa34 has several specific
or both to suppress caffeine sensitivity. CAST and hPAF53 functions of its own (Yamazaki et al., 1999; Yamamoto et al.,
complemented the rpa34% mutant phenotype only when co- 2004; Panov et al., 2006). Our sequence analysis reveals that
expressed (Fig. 1 G). Therefore, our results suggest that the these polypeptides share a lysine-rich C-terminal domain. This

Downloaded from [Link] on January 24, 2011


CAST/hPAF53 heterodimer can substitute for the endogenous domain is not required for interaction with Rpa49 (Beckouet
budding yeast Rpa49/Rpa34 within Pol I and can perform the et al., 2008), and we hypothesized that this feature could be
function of the S. cerevisiae heterodimer in vivo. responsible for a function unrelated to Rpa49. To verify this
hypothesis, we decided to perform a search for all possible ge-
The Rpa49/Rpa34 heterodimer is also netic backgrounds in which rpa34% is lethal. We performed a
conserved in fission yeast global genetic interaction mapping (GIM; Decourty et al., 2008)
Fission yeast Sp-Rpa49 can substitute for budding yeast Rpa49 using rpa34% as bait. We confirmed two previously identified
(Nakagawa et al., 2003). A recent database search revealed that synthetic lethal interactions, top1% and rpa14% (Gadal et al.,
the S. pombe SPBC11G11.05 open reading frame (hereafter 1997), and identified two novel genetic backgrounds, gcr2%
named Sp-Rpa34) has weak but significant sequence homology and stb5%, in which rpa34 became essential (Fig. 3 A). How-
with Rpa34 (Beckouet et al., 2008). We cloned and expressed ever, Rpa49 overexpression could suppress the rpa34% pheno-
Sp-Rpa34 in budding yeast and observed its nucleolar localiza- type in all tested backgrounds. Moreover, the truncated version
tion only when coexpressed with Sp-Rpa49 (Fig. 2 A). Because of Rpa34 lacking the C-terminal domain was functional, reveal-
of a slight toxicity of Sp-Rpa34 for S. cerevisiae, its effect on ing no growth phenotype associated with the absence of this
caffeine sensitivity of rpa34% was unclear. We next tested com- particular domain.
plementation by Sp-Rpa34/Sp-Rpa49 of the rpa34% mutant in We next tested whether the nucleolar localization of
an rpa135-D395N double-mutant background in which Rpa34 Rpa34 also depends on Rpa49 in budding yeast. In contrast
is essential for growth (Beckouet et al., 2008). When expressed to CAST and Sp-Rpa34, Rpa34 remains in the nucleolus
alone, Sp-Rpa34 was unable to complement the Rpa34 essential even in the absence of Rpa49 (Fig. 3 B). We next tried to
function, but the coexpressed Sp-Rpa34/Sp-Rpa49 heterodimer identify which domain of budding yeast Rpa34 could behave
restores growth (Fig. 2 B). Our results suggest that Sp-Rpa34 is as a nucleolar localization signal functioning independently
the fission yeast counterpart of budding yeast Rpa34. We next from Rpa49. The nucleolar localization of Rpa34 in Rpa49%
deleted Sp-Rpa34 in S. pombe. The Sp-rpa34% mutant fission background is lost upon truncation of the C-terminal domain
yeast was viable with only a slight growth defect (Fig. 2 C), (Fig. 3 C). The nucleolar targeting of Rpa34 C domain in
similar to the rpa34% mutant in S. cerevisiae. Our previous data S. cerevisiae appears to be species specific. Despite the appar-
demonstrated that double-deletion mutants rpa34% and rpa49% ent similarity between the C-terminal domains of Rpa34,
are phenotypically equivalent to the rpa49 single-deletion mu- CAST, and Sp-Rpa34, the nucleolar targeting of CAST and
tant and that Rpa49 overexpression can suppress the defects as- Sp-Rpa34 are strictly dependent on the coexpression of their
sociated with rpa34% (Beckouet et al., 2008). The Sp-rpa49% respective binding partner, PAF53 or Sp-Rpa49. In contrast,
single-deletion mutant and the double mutant Sp-rpa49% Rpa34 in S. cerevisiae has two nucleolar targeting mecha-
Sp-rpa34% grow similarly (Fig. 2 D). Sp-rpa34% has a strong nisms. One depends on Rpa49 association, the other on the
sensitivity to mycophenolate and 6-azauracil compared with Rpa34 C-terminal domain.

the single Sp-rpa34 or Sp-rpa49 deletion. After meiosis, we analyzed the growth of single- and double-mutant offspring. Viability of the double mutant was
confirmed in 20 tetrads. A representative tetratype tetrade is shown, with WT, single Sp-rpa34, or Sp-rpa49 deletion and double Sp-rpa34% Sp-rpa49%
($$) genotype. (E) The sensitivity of the Sp-rpa34 deletion strain to mycophenolic acid and 6-azauracil is suppressed by Sp-Rpa49 overexpression.
10-fold serial dilutions of Sp-rpa34% S. pombe expressing Sp-RPA34 (Sp-Rpa34), an empty vector (Sp-rpa34$), or overexpressing Sp-RPA49 (Sp-rpa34$ +
Sp-Rpa49) were spotted on rich media (left; ), 75 μg/ml 6-azauracil (middle; +6-AZA), or 40 μg/ml mycophenolic acid (right; +MPA) and grown for
4 d at 25°C.

RNA polymerase I function depends on specific subunits • Albert et al. 281


Published January 24, 2011

Downloaded from [Link] on January 24, 2011

Figure 3. The C-terminal domain of Rpa34 is a nucleolar localization signal. (A) Rpa34 C-terminal domain is fully dispensable in vivo. 10-fold serial dilu-
tions of four double-mutant budding yeast strains, rpa34% top1% (top left), rpa34% stb5% (top right), rpa34% rpa14% (bottom left), or rpa34% gcr2% (bot-
tom right), are shown. Double mutants containing RPA34 (Rpa34), empty vector (), Rpa34-$C driven from a Ppgk1 promoter (Rpa34-$C), or overexpressing
Rpa49 (2μ-RPA49) were spotted on 5-FOA–containing plates to check for complementation of the lethality of the double mutant. Plates were incubated for
3 d at 30°C. Strength of the complementation was evaluated by comparing plates with (FOA) or without FOA (). (B) Nucleolar localization of Rpa34
is independent of Rpa49. Rpa34 fused with YFP (YFP-Rpa34) is expressed in a WT budding yeast or in a mutant lacking Rpa49 (rpa49%). Both strains
produce Nop1 fused to mCherry (mCherry-Nop1). (right) Overlay of both fluorescent signals (merge) is shown. (C) Nucleolar localization of Rpa34-$C is
dependent on Rpa49. Rpa34$C fused with YFP (YFP-Rpa34$C) is expressed in WT or in a mutant lacking Rpa49 (rpa49%). Both strains produce Nop1
fused to mCherry (mCherry-Nop1). (right) Overlay of both fluorescent signals (merge) is shown.

282 JCB • VOLUME 192 • NUMBER 2 • 2011


Published January 24, 2011

Rpa34 and Rpa49 influence increased (French et al., 2003). We first demonstrated that
nucleolar morphology double-mutant rpa49% fob1% strains are viable at 30°C, having
We have shown that the Pol I–specific Rpa49/Rpa34 hetero- either 190 or 25 rDNA copies (Fig. 5 B). To confirm this sur-
dimer is functionally conserved from yeast to humans. We prising result, we establish that rDNA copy number in both
hypothesized that Pol I–specific subunits might be responsible for strains is unaffected by rpa49 deletion (Fig. 5 A). Growth of the
the two most prominent features of Pol I transcription: nucleo- rpa49% strain is severely impaired at 25°C (Liljelund et al.,
lar assembly and high RNA polymerase loading rate per gene. 1992). Comparing growth of the rpa49% fob1% strains con-
We first focused on nucleolar alterations caused by the absence taining 25 versus 190 rDNA copies, we noted that the cold sen-
of Pol I–specific subunits. We labeled the nuclear periphery sitivity is alleviated upon reduction in the number of rDNA
using GFP-Nup49, a nuclear pore protein, and the nucleolus repeats (Fig. 5 B).
using mCherry-Nop1, an abundant nucleolar protein, in WT, Quantitative fluorescence analysis revealed that in pres-
rpa34%, and rpa49% cells (Fig. 4 A). Nucleolar alterations in ence of Rpa49, the reduction from 190 to 25 rDNA copies
rpa34% and rpa49% cells were determined by thresholding the resulted in a nucleolus of normal size (Fig. 5 C). Electron micros-
fluorescent nucleolar signal detected using confocal microscopy copy observations showed that the nucleolus in the 25 rDNA
in a large number of cells (Berger et al., 2008). Because the copies background is characterized by an identifiable crescent-
cumulative distribution function accurately describes volume shaped area of fibrillo-granular material adjacent to the nuclear
distribution in large samples, we used this representation to envelope (Fig. 5 D). Interestingly, in the Rpa49 deletion strain
evaluate the nucleolar size for each mutant (Fig. 4 B). The nu- with 25 rDNA copies, but not with 190 copies, a crescent-shaped
cleolar size increases considerably in rpa49% cells, suggesting

Downloaded from [Link] on January 24, 2011


nucleolus is detectable in most cells (60%), as evaluated by
that the integrity of nucleolar structure is compromised (Fig. 4 A). fluorescence microscopy (Fig. 5 C). Similarly, the nucleolar
We next performed an ultrastructural study of the nucleus in morphology is partially restored at the ultrastructural level be-
rpa49% and rpa34% mutants. For optimal preservation of the cause a dense structure occupying one third of the nuclear sur-
nuclear structure, chemical fixation was avoided, and the cells face and in contact with the nuclear envelope can be detected
were cryoimmobilized before low temperature substitution. The (Fig. 5 D). These data suggest that a decrease in the rDNA copy
nucleolar ultrastructure is altered in both mutants (Fig. 4, C and D). number is enough to establish a partial nucleolar organization
In rpa34% cells, the nucleolus is decondensed with areas of in the absence of Rpa49.
low electron density. In rpa49% cells, the nucleolar morphology
is dramatically altered: its characteristic crescent shape dis- RNA Pol I distribution on single genes
appeared, and the dense material redistributed in the full volume is dependent on Rpa49
of the nucleus. Having shown that nucleolar assembly is dependent on Rpa49,
Cryofixation also allows the direct observation of individ- we next evaluated whether a high RNA Pol I loading rate per
ualized cytoplasmic ribosomes. The number of ribosomes in gene requires Rpa49. Miller spreads are the only technique
rpa34% cells is similar with WT, but it is significantly reduced allowing counting of individual Pol I on a single gene (Miller
in rpa49% cells (Fig. 4 E). To investigate a defect in translation, et al., 1969). However, the ability to quantify and accurately
we performed a polysome profile in WT and the rpa49% localize polymerase on a single gene relies on obtaining high
mutant. Interestingly, we detected polysomes in both back- contrast chromatin spreads from mutant yeast cells. The chro-
grounds, but with the appearance of half-mers in rpa49% cells, matin spreading technique was set up in our laboratory using
reminiscent of a 60S biogenesis defect (Fig. 4 F). Such a defect strain NOY886, which contains 42 actively transcribed rDNA
was previously observed in a Pol I mutant strain defective for copies (Fig. 6 A; French et al., 2003). Because of the very high
rRNA elongation (Schneider et al., 2007). Therefore, the mor- loading rate in mutant backgrounds with reduced rDNA copy
phological analysis demonstrates that Rpa49 is required for number, polymerases often appear as a continuous track, mak-
normal nucleolar morphology and efficient ribosome biogenesis. ing accurate counting of single polymerases difficult. We took
The rpa49% strain contains fewer 60S subunits relative to 40S, advantage of negatively stained Miller spreads obtained with
which is reminiscent of a Pol I elongation defect. low frequency (see Materials and methods) to demonstrate that
continuous tracks are best analyzed by assuming the presence
Reduction in the number of rDNA of a polymerase every 12 nm along such track (Fig. 6 C). We
repeats can partially compensate for the next analyzed Pol I density and distribution on the rRNA genes
alterations in nucleolar morphology caused in 25 or 190 rDNA copy strains with or without Rpa49 using
by RPA49 deletion Miller spreads (Fig. 7 A). In the presence of Rpa49, we ob-
In the rpa49% mutant, rRNA production still sustains growth, served 62 ± 11 Pol I complexes per single rRNA gene in the 190
but the nucleolus appears fully decondensed. To spatially con- rDNA copy strain. However, in this strain, we were unable to
strain rRNA production, we decided to use mutant cells with a identify rDNA in chromatin spreads in the absence of Rpa49,
decreased number of rDNA repeats (Cioci et al., 2003). rDNA probably because of a very low Pol I occupancy of the rDNA.
copy number can be stabilized at 25 copies by Fob1 deletion We next analyzed chromatin spreads in strains with 25 rDNA
without significant growth defect (Cioci et al., 2003). To sup- copies and identified single transcription units both in the pres-
port normal rRNA production from such a low number of rDNA ence and absence of Rpa49 (Fig. 7 A). We detected 122 ± 17 Pol I
genes, the number of Pol I complexes per gene is significantly complexes per gene in the presence of Rpa49 and 36 ± 5 Pol I

RNA polymerase I function depends on specific subunits • Albert et al. 283


Published January 24, 2011

Downloaded from [Link] on January 24, 2011

Figure 4. Rpa34 and Rpa49 are required for nucleolar integrity. (A) Nucleolar structure of rpa49% and rpa34% cells assessed by fluorescent microscopy.
Representative confocal sections of strains TMS1-1a (WT), BEN18-1a (rpa34%), and BEN19-1a (rpa49%) expressing TetR-GFP staining the nucleus, GFP-
Nup49 staining the NPC (NPC/nucleus), and mCherry-Nop1 staining the nucleolus (mCherry-Nop1) are shown. (right) Overlay of both fluorescent signals
(merge) is shown. (B) Cumulative distribution function of the nucleolar volume in Pol I mutants. The nucleolar volume was estimated by thresholding using
the intensity of the mCherry fluorescent signal in WT, rpa49%, and rpa34% mutant cells (nWT = 907; nrpa49 = 620; nrpa34 = 928). (C) Ultrastructural study of
cryofixed, cryosubstituted WT, rpa34%, and rpa49% budding yeast cells. Representative sections of the nuclei are depicted, with manual segmentation of
nucleolus bounded by red lines. The cytoplasmic ribosomal contents in the three budding yeast strains are depicted in a selected frame. (D) Quantification
of ultrastructural morphological alterations in Pol I mutants. Nucleolar area normalized by nuclear surface is estimated by manual segmentation of electron
microscopy sections (n = 20). (E) Quantification of the ribosomal cytoplasmic content in Pol I mutants. Ribosomal content of representative sections (n = 20)
was manually counted and expressed as ribosomes per micrometer cubed. (F) Polysomal profiles (OD260 nm) after sucrose density gradient centrifugation
derived from the rpa49% mutant and WT strain. The positions of 40S ribosomal subunits, 60S ribosomal subunits, polysomes, and half-mer polysomes (H)
are indicated.

284 JCB • VOLUME 192 • NUMBER 2 • 2011


Published January 24, 2011

Downloaded from [Link] on January 24, 2011

Figure 5. rpa49% phenotype in strains with 190 or 25 copies of rDNA. (A) rDNA copy number is unaffected by rpa49 deletion in a fob1 deletion back-
ground. PFGE of chromosomes from rpa49% fob1% strains resulting from invalidation of the rpa49% gene in fob1% strains containing either 25 or 190
copies of rDNA or from original fob1% strains. Separated chromosomes were stained with ethidium bromide (right). Hybridization of rDNA probes was
performed to estimate chromosome XII size (left). (B) Growth phenotype of the fob1%rpa49% double-mutant strains bearing 190 or 25 copies of rDNA.
10-fold serial dilutions of strains BEN20-1a (25 rDNA copies rpa49$ fob1%) and BEN21-1a (190 rDNA copies rpa49$ fob1%) deleted for rpa49 and
containing 25 or 190 copies, respectively, of rDNA and an empty vector () or bearing RPA49 (Rpa49) were spotted on plates with (FOA) or without FOA
() and grown at 25°C for 7 d. (C) Nucleolar structure of Pol I mutants assessed by fluorescent microscopy. Representative confocal sections of strains
NOY1071 (25 rDNA copies fob1%), NOY1064 (190 rDNA copies rpa49$), and BEN20-1a (25 rDNA copies rpa49%) containing GFP-Nup49 staining
the NPC (GFP-Nup49) and mCherry-Nop1 staining the nucleolus (mCherry-Nop1). (right) Overlay of both fluorescent signals (merge) is shown. (D) Ultra-
structural study of cryofixed, cryosubstituted strains with 25 rDNA copies with (WT) or without Rpa49 (Rpa49%).

RNA polymerase I function depends on specific subunits • Albert et al. 285


Published January 24, 2011

Downloaded from [Link] on January 24, 2011

Figure 6. Quantification of polymerases along transcribed rDNA genes. (A) Visualization of active genes in rDNA. Using a mutant strain with a reduced
number of rDNA copies (strain NOY886; 42 rDNA copies), we obtained high quality spreads from total nucleolar DNA. (B) Quantification of actively
transcribed rDNA genes. The quantification of active genes in mutant strain (42 active gene in NOY886) is compatible with previous results (French et al.,
2003). (C) Visualization of individual polymerases on negatively stained Miller spread. In mutant strains with 25 rDNA copies, Pol I density on each gene
is very high. Using higher magnification (bottom left), we can still detect individual polymerases, which can be quantified (right; red circles). Note that a
nascent rRNA can be visualized from each detected polymerase.

complexes per gene in its absence. We then measured the dis- polymerases with the corresponding random distribution pre-
tance between adjacent polymerases to evaluate whether the dicted (Fig. 7 B). In all cases, the observed distance between
Pol I molecules were randomly distributed on the rRNA genes polymerases was shorter than that predicted for the random dis-
(Fig. 7 B). The distances between polymerases depend intrin- tribution. These results suggest clustering of polymerases. We
sically on the Pol I density on each rRNA gene, which varies have introduced a new parameter in our simulations to take this
between strains. Therefore, for each polymerase load, we first effect into account. When 60% of polymerases are modeled as
compared the empirical measurements of distance between being in direct contact with each other and 40% are randomly

286 JCB • VOLUME 192 • NUMBER 2 • 2011


Published January 24, 2011

Downloaded from [Link] on January 24, 2011

Figure 7. Miller spread of 190 and 25 rDNA copy strains with or without Rpa49. (A) Representative Miller spread from NOY1071 bearing 25 rDNA
copies (25 rDNA copies [WT]), BEN20-1a bearing 25 rDNA copies and rpa49$ (25 rDNA copies [rpa49%]), and NOY1064 bearing 190 rDNA copies
(190 rDNA copies [WT]). (right) Interpretive tracing of the genes is shown. Polymerases that appear on the gene are shown on the tracing by black dots.
(B and C) Cumulative distribution function of the distances between adjacent polymerases in strains NOY1071 (red; 25 rDNA copies [WT]), BEN20-1a
(blue; 25 rDNA copies [rpa49%]), and NOY1064 (green; 190 rDNA copies [WT]) is shown. Solid lines, empirical measurement; dashed lines, random
(B) or simulated (C).

RNA polymerase I function depends on specific subunits • Albert et al. 287


Published January 24, 2011

Downloaded from [Link] on January 24, 2011

Figure 8. Two successive elongating Pol I complexes allow a contact between Rpa49 and Rpa43 subunit of adjacent molecules. (A) Frequent association of
adjacent Pol I depends on Rpa49. We generated diploid cells expressing two versions of Pol I containing an Rpa190 subunit fused to either the Myc or HA
tag. These tagged proteins are efficiently detected in cell extract supernatants (SUP). After formaldehyde cross-linking and extensive DNase treatment, we
immunoprecipitated Pol I using anti-HA antibodies (IP). We evaluated the amount of polymerase dimers/multimers by assessing the extent of Myc-tagged
Rpa190 coprecipitation. We use a strain bearing only Myc-Tag Pol I as negative control (no HA tag; lanes 1 and 4). The presence of dimers/multimers is
dependent on Rpa49, as shown by lack of Myc-tagged Rpa190 coimmunoprecipitation in rpa49 deletion background (rpa49%; compare lanes 5 and 6)
(B) 3D model of Pol I as determined by cryo–electron microscopy. The positions of the Pol I–specific Rpa43/Rpa14 and Rpa49/Rpa34 heterodimers are shown
in purple and in green, respectively. (C) Fitting of the atomic structure of the highly homologous Pol II elongation complex (Protein Data Bank accession
no. 2YU9) into the cryo–electron microscopy structure of RNA Pol I. The transcribed DNA is shown in red, and the 10-subunit core Pol II is shown in blue.

288 JCB • VOLUME 192 • NUMBER 2 • 2011


Published January 24, 2011

distributed, the simulated data are in good agreement with our ExoIII footprinting experiments on RNA Pol II elongation
experimental measurements in the case of the 190 and 25 rDNA complexes (Samkurashvili and Luse, 1998). Interestingly, in
copy strains in the presence of Rpa49 (Fig. 7 C). However, in this model, the Rpa49/Rpa34 subunits of one polymerase are
the 25 rDNA copy/rpa49% strain, we measured larger distances brought in close proximity to the Rpa43/Rpa14 heterodimer of
between polymerases compared with the predictions of the the following Pol I. Genetic evidence previously suggested that
model. Therefore, we propose that the interactions between suc- Rpa49 and Rpa43 are functionally linked (Beckouet et al.,
cessive Pol I complexes are strongly reduced in the absence of 2008). To test whether Rpa49 directly associates with Rpa43,
Rpa49, accounting for the reduction in the number of adjacent we coexpressed GST-tagged Rpa49 and HA-tagged Rpa43 in
Pol I complexes. Therefore, Rpa49 is required to ensure high Escherichia coli. Because Rpa49 and Rpa34 form heterodimers,
density of Pol I per rDNA gene. Furthermore, our data suggest we used GST-tagged Rpa49 and HA-tagged Rpa34 as positive
that Rpa49 is involved in establishing contact between adjacent controls. Upon purification on glutathione Sepharose beads,
Pol I complexes. both Rpa34 and Rpa43 copurify with GST-Rpa49 (Fig. 8 E,
lanes 2 and 6). In contrast, HA-tagged Rpa43 or HA-tagged
Molecular modeling of contacts between Rpa34 are not copurified with GST alone (Fig. 8 E, lane 4 and 8).
adjacent polymerases on rDNA genes Therefore, genetic and biochemical assays suggest a direct inter-
Rpa49 seems to be required for interaction between adjacent action between Rpa43 and Rpa49.
transcribing polymerases. To confirm the requirement on Rpa49
for contact between adjacent polymerases, we coexpressed in a Discussion

Downloaded from [Link] on January 24, 2011


single diploid cell two of Pol I complex’s largest subunits tagged
with different epitopes, Myc and HA. By purifying HA-tagged In this study, we addressed the function of two Pol I-specific
Pol I from the chromatin-bound fraction, we could evaluate the subunits, Rpa49 and Rpa34. We showed that heterodimers
amount of polymerase dimers or multimers by assessing the formed by human or fission yeast orthologues are functional in
extent of copurification of Myc-tagged Pol I. In WT cells, after budding yeast, demonstrating a functional conservation of these
formaldehyde cross-linking and with extensive DNase treat- two Pol I–specific subunits in the course of evolution. We also
ment, we could detect frequent Pol I dimers (Fig. 8 A). In ab- showed that these subunits are playing an important role in the
sence of Rpa49, the proportion of Pol I dimers or multimers is formation of the nucleolus and are required to produce a high
dramatically reduced (Fig. 8 A, compare lane 5 with lane 6). density of elongating Pol I on rDNA genes.
Using Miller spreads and coimmunoprecipitations, we
show that elongating Pol I enzymes are in frequent contact in an RNA Pol I evolutionary conservation
Rpa49-dependent manner. To characterize potential molecular All eukaryotic cells exploit three distinct RNA polymerases
interactions occurring between successive polymerases, we to transcribe their nuclear genome. Of these, Pol I is the most
modeled the structure of a Pol I dimer in an elongation state on divergent enzyme, probably because of its highly specialized
DNA (Fig. 8 D). We used a cryo–electron microscopy density function: it transcribes only a single gene encoding large rRNAs.
map of Pol I obtained as described previously (De Carlo et al., Our data demonstrate that despite considerable variation in se-
2003) onto which the Rpa43 and Rpa49/Rpa34 heterodimer are quence, two of the Pol I–specific subunits forming a heterodimer,
localized far away from each other in different parts of the Pol I Rpa49/Rpa34, have orthologues throughout the eukaryotic
complex (Fig. 8 B; Bischler et al., 2002; Kuhn et al., 2007). domain, suggesting that functions of this dimer are evolution-
To model the DNA upstream and downstream of the Pol I tran- ally conserved. Our results show that overexpression of Rpa49
scription bubble, we used the atomic structure of the corre- can rescue the growth defects in genetic backgrounds in which
sponding RNA Pol II elongation complex (Protein Data Bank rpa34% is lethal. The C-terminal domain of Rpa34 is responsi-
accession no. 2YU9; Fig. 8 C; Wang et al., 2006). A second ble for nucleolar localization, and it functions independently
elongation complex was then positioned according to the fol- from Rpa49. Nucleolar localization sequences are known to
lowing constraints: (a) enzymes were placed in contact, (b) the interact with various nucleolar factors (Lechertier et al., 2007),
intervening DNA connecting the two polymerases was set as suggesting the possibility of a direct interaction between the
linear, and (c) this linker DNA was modeled as B-DNA to find C-terminal domain of Rpa34 and S. cerevisiae nucleolar pro-
the rotational register between the two elongating polymerases teins. Indeed, several potential partners of Rpa34 have been
(Fig. 8 D). The minimal distance between two successive active identified in an unbiased two-hybrid interaction screen between
sites was found to be of 34 bp, which is in good agreement with Rpa34 and the complete genome. In this screen, three nucleolar

(D) Positioning of a second Pol I elongation complex (yellow) following a leading Pol I elongation complex (blue) by imposing a straight B-form linker
DNA and a contact between the Pol I molecules. The black arrow represents the direction of RNA Pol I translation during elongation. (left) The model is
rotated 180° around the vertical axis as compared with the right panel. (E) HA-tagged Rpa43 and Rpa34 bind to GST-tagged Rpa49 when expressed in
E. coli. Expression and purification of recombinant GST-Rpa49 or GST alone in the presence of HA-tagged Rpa34 or Rpa43 is described in Materials and
methods. The supernatants of E. coli cell lysates (SUP) were incubated with glutathione Sepharose 4B beads. After washing, GST-Rpa49 and GST were
eluted with sample buffer (IP), and the fractions were analyzed by Western blotting to detect coprecipitation of HA-tagged Rpa34 (lanes 1–4) or Rpa43
(lanes 5–8). In the supernatant fractions, we detect full-length HA-Rpa34 and HA-Rpa43 and minor degradation products. Note that Rpa34 and Rpa43
appear specifically enriched in samples containing affinity-purified GST-Rpa49 compared with GST alone (compare lane 2 with lane 4 for Rpa34; compare
lane 6 with lane 8 for Rpa43). White lines indicate that intervening lanes have been spliced out.

RNA polymerase I function depends on specific subunits • Albert et al. 289


Published January 24, 2011

proteins, Gno1, a cofactor of the RNA helicase Prp43, and two Materials and methods
components of the C/D snoRNP complexes Nop56 and Nop58
were shown to interact with Rpa34 (Beckouet et al., 2008). Yeast strains, plasmid construction, and plasmid-shuffling assays
Yeast strains used in this study are listed in Table S1, and oligonucleotides
Therefore, the C-terminal domain is involved in the recruitment are listed in Table S2. Yeast strains were constructed by meiotic crossing
of species-specific binding partners, which are responsible for and plasmid DNA transformation. S. cerevisiae–null alleles with KanMX4
nucleolar targeting. insertions were obtained from EUROSCARF and were checked using ad
hoc PCR amplifications. The Sp-rpa34% gene deletion in S. pombe strain
BENSP1-1a was performed by homologous recombination using PCR-
Pol I transcription influences amplified fragments with oligos 746 and 747 with plasmid p29802 as
nucleolar morphology template. Sp-Rpa49% (rpa51$) was obtained as previously described
using plasmid pYN1003usds (Nakagawa et al., 2003). pDONR201
The nucleolus is the largest nuclear domain, the integrity of (Invitrogen), pREP41 (Basi et al., 1993), pRS413, pRS423, pRS425 (Sikorski
which depends directly on rRNA production (Trumtel et al., and Hieter, 1989), pVV200, pVV208 (Van Mullem et al., 2003), p29802,
2000; Hernandez-Verdun et al., 2002). This structure is con- pUN100-mCherry-NOP1 (mCherry-NOP1) and pASZ11-CFP-NUP49
(CFP-NUP49; Berger et al., 2008), pFL36-CII, pGID-CII (Berger et al.,
served in all eukaryotes, and most nuclear steps of ribosome bio- 2007), pOG5-RPA34 (Gadal et al., 1997), pENTR-PAF53, pENTR-CAST,
genesis take place within the nucleolus. In the absence of Rpa34 pENTR-HA-CAST (Panov et al., 2006), pOG1-A34 (Beckouet et al., 2008),
and especially Rpa49, nucleolar assembly is severely compro- pENTR-RPA49 (Beckouet et al., 2008), pYN1003usds (Nakagawa et al.,
2003), and pNOY373 (Wai et al., 2000) were previously described.
mised. Importantly, the altered nucleolar morphology in rpa49- pEB5 and pENT-Rpa34DC58 were provided by E. Bertrand and
null strains correlates with a significant reduction in the number F. Beckouët, respectively.
of ribosomes per cell. When we artificially decreased the number pRS425-PPGK was constructed by ligating the NdeI fragment from
pVV200 in the SmaI site of pRS425. pCNOD08, a gateway vector that

Downloaded from [Link] on January 24, 2011


of rDNA copies from 190 to 25, in the absence of Rpa49, we ob- allows strong transcription from the TEF1 promoter, was constructed in
served a partial nucleolar reassembly. Therefore, we propose three steps. First, the 1,281-bp XhoI–NcoI fragment of pRS425-PPGK con-
that the initial event required for self-organization of the nucleo- taining promoter PPGK and attR1 lambda recombination site was inserted
into XhoI and NcoI–digested vector pFSKB3X (GTP technology) to generate
lus is a spatially constrained rRNA synthesis, which initiates the plasmid pCNOD02. Second, promoter PTEF1 was amplified by PCR using
chain of events leading to formation of nucleolar structures. oligonucleotides 439 and 440 and yeast ODN1-1a genomic DNA as tem-
plate. The XbaI–XhoI-digested PCR product was cloned into the same site
of pCNOD02 to generate plasmid pCNOD05. The 1,281-bp NcoI–XhoI
Function of the Rpa49/Rpa34 heterodimer fragment of pCNOD05 was inserted into pRS425-pPGK digested with
in Pol I transcription NcoI and XhoI generating pCNOD08. pRS423-PPGK was constructed by
A previous study revealed a close relationship between Rrn3, the subcloning the DraIII–SacI fragment from pRS425-PPGK in the same site of
pRS423. pCFP-Nup49-His was constructed by ligating the fragment from
two heterodimers Rpa49/Rpa34, and Rpa43/Rpa14 (Beckouet HindIII (filled in with Klenow) to SacI in the SmaI–SacI of pRS413. pREP41-
et al., 2008). The release of the Pol I–specific initiation factor gat was made a gateway destination vector by ligating the PCR-generated
Rrn3 during elongation requires Rpa49, despite diametrically fragment using oligos 740 and 741 and pRS425-PPGK as the template, cut
VspI–XhoI inserted in NdeI–SalI of pREP41. The following plasmids were
opposite locations within a single Pol I complex (Beckouet et al., constructed using Gateway technology (Invitrogen): (a) pENTR-Rpa34, by
2008). While our work was in progress, an elegant structural a BP reaction with pDONR201 and PCR-generated fragment amplified
study established that the Rpa49 and Rpa34 heterodimer binds using oligonucleotides 463 and 464 and genomic DNA from S. cerevisiae
strain ODN1-1a as a template, and (b) pENTR-Sp-Rpa34 and pENTR-
DNA and stimulates polymerase-intrinsic RNA cleavage (Geiger Sp-Rpa49, by a BP reaction with pDONR201 and PCR fragment generated
et al., 2010). We now show that Rpa49 is required to allow con- using oligonucleotides 742–743 or 744–745, respectively, and genomic
tact between adjacent polymerases. 3D modeling of adjacent DNA from S. pombe strain TG11 as template. pRS425-PPGK-CAST, pRS425-
PTEF1-CAST (Ptef1-CAST), pVV200-CAST, pEB5-CAST (YFP-CAST),
contiguous polymerases gives a hint as to how Rrn3 could be re- pRS425-PPGK-HA-CAST, pEB5-PAF53 (YFP-PAF53), pRS423-PPGK-PAF53,
leased. Rrn3 and its interacting partner Rpa43 are in direct con- pRS425-PPGK-PAF53, pVV200-PAF53 (PPGK-PAF53), pRS425-PTEF1-PAF53
tact with Rpa49/Rpa34 of the neighboring enzyme. Indeed, we (PTEF1-PAF53), pRS425-Sp-Rpa49, pVV200-Sp-Rpa49, pREP41-Sp-Rpa49,
pEB5-Sp-Rpa34 (YFP-Sp-Rpa34), pRS425-PPGK-Sp-Rpa34, pVV200-Sp-Rpa34,
know that mutations of Rpa43 behave as extragenic suppressors pREP41-Sp-Rpa34, pRS425-PPGK-Rpa49 (2μ-RPA49), pGID-Rpa49, pFL36-
of the rpa49% phenotype, and Rpa49 and Rpa43 when co- Rpa34, pRS425-pEB5-Rpa34 (YFP-Rpa34), pGID-Rpa34, pRS425-PPGK-
expressed in E. coli are interacting, arguing for a physical con- Rpa34DC58 (Rpa34-$C), and pEB5-Rpa34DC58 (YFP-Rpa34$C) were
obtained by LR reaction between destination vectors and entry vector and
tact between both subunits (Beckouet et al., 2008). named according to vectors used. Plasmids pGEX-6P-3, pGEX-6P-3-
From our model, we propose that adjacent polymerases rpa49GST, pet28a-rpa43HA, and pet28a-rpa34HA were used for re-
form a head to tail “camel caravan” in which Rpa49 from one combinant expression in E. coli and are described for expression.
Complementation was tested using plasmid-shuffling assays. A null
Pol I molecule is in direct contact with Rpa43 from the neigh- allele of haploid tester strain is complemented by the corresponding WT
boring molecule. These interactions determine the distance be- genes borne on URA3-containing plasmids. Fluoroorotate (FOA) is toxic for
tween successive Pol I complexes. In the absence of Rpa49, URA3+ strains (Boeke et al., 1984). FOA is used to apply a strong positive
selection on cells without plasmids containing WT genes. Complementa-
adjacent complexes are unable to interact, and this could lead to tion is tested by examining whether plasmids expressing a given cDNA
the lack of Rrn3 release (Beckouet et al., 2008) and to the in- could bypass the lethal phenotype, monitored by FOA colonies.
creased distance between polymerases (this study). All of these
data together strongly suggest that the two Pol I–specific sub- GIM
GIM analysis of RPA34 deletion mutant was performed as described previ-
units Rpa49 and Rpa34 are essential for nucleolar assembly and ously (Decourty et al., 2008). Microarray data were normalized using
formation of “Pol I caravans,” two unique Pol I features. We MATLAB (MathWorks, Inc.), and relative enrichments are described in
now need to understand how contacts between adjacent Pol I, Table S3. Genetic interactions of interest were individually confirmed
by plasmid-shuffling experiments. Deletion mutants of interest from the
promoted by Rpa49, could affect yeast nucleolar integrity, im- EUROSCARF collection were mated individually with the query strain
pacting on rDNA organization in the nuclear space. carrying RPA34 deletion tag with NAT marker under the control of the

290 JCB • VOLUME 192 • NUMBER 2 • 2011


Published January 24, 2011

MF(ALPHA)2/YGL089C promoter (prMFA2) that allowed selectivity for microscope. Wide-field fluorescent images were captured with a micro-
MATA haploid cells (Decourty et al., 2008). The strain also contains the scope (IX-81; Olympus) equipped with a polychrome V monochromator
complementing plasmid pGID-RPA34 that allows expression of Rpa34 and a camera (CoolSNAP HQ; Roper Industries) controlled with Meta-
under the control of its own promoter terminator and carrying HPH and Morph acquisition software (version 6; Universal Imaging Corp.). Confocal
klURA3 markers. Diploids were selected on YPD medium complemented microscopy was performed using a Nipkow-disk confocal system (Revolution;
with hygromycin and G418. Double mutants were generated by sporula- Andor) installed on a microscope (IX-81), featuring a confocal spinning
tion of diploids on RSS media and selection on YPD complemented with disk unit (CSU22; Yokogawa) and a cooled electron multiplying charge-
hygromycin, G418, and ClonNat. coupled device camera (DU 888; Andor). The system was controlled using
the FAST mode of Revolution IQ software (Andor). Images were acquired
Immunoprecipitation, sucrose gradient, antibodies, and pulse-field gel using a 100× Plan Apo 1.4 NA oil immersion objective and a twofold lens
electrophoresis (PFGE) in the optical path. Single laser lines used for excitation were diode-
Immunoprecipitation of Rpa190 with coexpressed CAST and PAF53 was pumped solid-state lasers exciting GFP fluorescence at 488 nm (50 mW;
performed as described previously (Galy et al., 2004). In brief, yeast cells Coherent) and mCherry fluorescence at 561 nm (50 mW; Cobolt jive), and
were lysed by French press in buffer A (10 mM Hepes, pH 7.5, 150 mM a bi-bandpass emission filter (Em01-R488/568-15; Semrock) allowed col-
KCl, 1.5 mM MgCl2, 1 mM DTT, 1 mM PMSF, 0.1% Triton X-100, 10 μg/ml lection of the green and red fluorescence. Pixel size was 65 nm. For quan-
leupeptin, and 10 μg/ml pepstatin). The lysates were centrifuged at tification of nucleolar volume, z stacks of 41 images with a 250-nm z step
15,000 g for 30 min at 4°C. TAP-tagged Rpa190 was purified using IgG were used. Exposure time was 200 ms. Digital pictures were processed
Sepharose, and bound fractions were eluted with acid elution. Isolation of using Photoshop software (version CS3; Adobe).
ribosomes under low salt conditions by sucrose gradient centrifugation was
performed as previously described (Gadal et al., 2002). In summary, cells Electron microscopy and quantitative analysis of Miller spreads
were harvested and lysed by vortexing with glass beads in buffer contain- For morphological analysis of nucleoli, budding yeast were cryofixed by
ing 10 mM Tris-HCl, pH 7.5, 100 mM NaCl, 30 mM MgCl2, and 0.35 mM high pressure freezing (EMPACT; Leica) and cryosubstituted with 0.02%
cycloheximid. Nuclei and cell debris were pelleted by centrifugation at OsO4, 0.1% uranyl acetate, and 1% glutamate in acetone for 72 h. Cells
14,000 g for 5 min at 4°C. Ribosomal subunits were separated by centrifu- were embedded in a Lowicryl resin (HM-20) polymerized at 50°C. Sec-
gation for 12 h at 100,000 g in a SW40 rotor at 4°C on a 10–40% su-

Downloaded from [Link] on January 24, 2011


tions of 100 nm were analyzed with a 1,200× electron microscope (Jeol).
crose gradient prepared in the lysis buffer. Immunoprecipitation of Pol I Chromatin spreading was performed as described previously with
dimers from diploid yeast strain bearing Rpa190-HA and Rpa190-Myc minor modifications (Osheim et al., 2009). Carbon-coated grids were
(BEN24) was derived from chromatin immunoprecipitation procedures. made hydrophilic by glow discharge instead of ethanol treatment. Depend-
Exponentially growing cells were treated with formaldehyde 1% final con- ing on the contrast of the spread chromatin, counterstaining with heavy
centration during 15 min. Cell were lysed using glass beads in Precellys24 metal can be avoided. Negatively stained chromatin was obtained by
(Precellys). Soluble material was discarded, and chromatin pellet was re- short incubation with heavy metal followed by quick drying of the sample.
covered after 3,500 g centrifugation for 5 min. Chromatin was resus- The positions of polymerases and rDNA fiber were determined by visual
pended, sheared using sonication, then treated with 20 U RQ1 DNase inspection of micrographs using ImageJ (National Institutes of Health). Digi-
(Promega) for 100 μl of extract for 30 min at 37°C. Pol I Immunoprecipita- tal pictures were processed using Photoshop.
tion from such chromatin fraction was performed as described previously
(Galy et al., 2004). Antibodies used were anti-HA (12CA5; Babco), anti-
Simulated distances and 3D modeling
Myc (9E10.3; Santa Cruz Biotechnology, Inc.), anti-PAF53 (P95220; BD),
We estimated experimental measurement errors of 2 pixels of systematic
and anti-Nhp2 (Henras et al., 2001). The monoclonal antibody 72B9 (pro-
bias and 2 pixels of random error, with a pixel size of 3 nm. Random and
vided by J. Cavaillé, University of Toulouse, Toulouse, France) was pro-
simulated distances between adjacent polymerases were determined as-
duced and characterized as an anti-fibrillarin antibody cross-reacting with
suming 185 possible Pol I positions on a single rDNA gene (12 nm for
the budding yeast Nop1 (Reimer et al., 1987). PFGE was performed using
each polymerase distributed along a 2.22-μm-long gene). Measurement
CHEF-DRIII (Bio-Rad Laboratories). Budding yeast chromosomes were sepa-
error was added to each distance, random noise being approximated
rated in a 1% agarose gel using a 87–162 switch time ramp at an in-
using the normal law of 5 nm of variance. Each random and simulated data-
cluded angle of 120° during 24 h at 6 V/cm. Southern hybridization was
set corresponds to 100 genes with 142, 62, or 36 polymerases per gene
performed using a 3.5-kb NcoI–NcoI fragment from pNOY373 (Wai et al.,
for 25 copy, 190 copy WT, and 25 copy strains bearing rpa49%, respec-
2000) as an rDNA probe, labeled by random priming (Megaprime DNA
tively. Distances were generated using MATLAB. Fitting of atomic coordi-
labeling system; GE Healthcare).
nates into electron microscopy density maps, modeling of two successive
Expression of GST-Rpa49 and Rpa43 and Rpa34 in E. coli elongating Pol I molecules, and image creation were performed using
Genes encoding Rpa43 and Rpa34 were cloned into the pET28a vector, University of California San Francisco chimera (Pettersen et al., 2004).
harboring the kanamycin-resistance marker. These genes were amplified
from genomic DNA with the primers 804–805 and 806–807, respectively, Online supplemental material
adding a C-terminal tag HA before inserting them into pET-28a (EMD) at Table S1 lists yeast strains used in this study. Table S2 lists oligo-
site NcoI–BamHI. pGEX-6P-3 (GE Healthcare) harboring the ampicillin- nucleotides used in this study. GIM analysis of RPA34 deletion mutant
resistance marker was used for GST expression. The Rpa49 gene was was performed as described previously (Decourty et al., 2008). On-
cloned into the pGEX-6P-3 vector, harboring the ampicillin-resistance marker line supplemental material is available at [Link]
and allowing N-terminal tagging with GST. For coexpression, the E. coli content/full/jcb.201006040/DC1.
BL21 (Agilent Technologies) was transformed with (a) pGEX-6P-3-rpa49GST
plus pet28a-rpa43HA, (b) pGEX-6P-3-rpa49GST plus pet28a-rpa34HA, (c) We thank Dr. Jackie Russell for comments and critical reading of the manu-
pGEX-6P-3 plus pet28a-rpa43HA, or (d) pGEX-6P-3 plus pet28a-rpa34HA. script. We thank Dr. Violette Morales for providing HeLa cell extracts, A. Diot
Transformed strains were inoculated in 0.2 liters of minimal medium plus for S. pombe WT cells, Dr. Yasuhisa Nogi for pYN1003usds plasmid and
ampicillin kanamycin with 0.01 overnight culture and grown to an OD600 rpa51$ S. pombe strain, and E. Bertrand (pEB5) and Frederic Beckouët
of 0.6 at 37°C, and production of recombinant proteins was induced for (pENT-Rpa34DC58) for plasmid gifts. We are grateful to Ann Beyer, Yvonne
3 h at 37°C with 0.1 mM isopropyl-D-thiogalactopyranoside. Purification of Osheim, and Sarah French for their advice on chromatin spreading. We thank
GST-tagged proteins was performed as described previously (Künzler and M. Riva for polyclonal antibodies and Y. Henry for critical reading of the manu-
Hurt, 1998). The E. coli cell pellet was resuspended in 1% PBS buffer Triton script. We acknowledge Stéphanie Balor and Nacer Benmeradi for their help
X-100, and cells were lysed by sonication. The supernatant was incubated in electron microscopy acquisition.
with 100 μl glutathione Sepharose 4B (Amersham), the beads were washed This work was supported by an Action Thématique et Incitative sur Pro-
with lysis buffer, and the proteins bound to the beads were eluted with sam- gramme (ATIP) Jeunes Chercheurs grant from Centre National de la Recherche
ple buffer. GST and GST-Rpa49 expression were confirmed by SDS-PAGE Scientifique, by Agence Nationale de la Recherche (Nucleopol and Ribeuc
followed by Coomassie staining. Detection of Rpa43-HA and Rpa34-HA programme), and Jeune équipe from Fondation pour la recherche médicale
was achieved by Western blotting using HA peroxydase (Roche). (FRM). B.A. is supported by a Ph.D. fellowship from FRM. The Wellcome Trust
and Cancer Research UK supported research in the laboratory of J.C.B.M.
Fluorescent microscopy Zomerdijk. This work also benefited of the assistance of the electron micros-
After centrifugation, yeast cells were resuspended in synthetic complete copy facility of the Institut Fédératif de Recherche 109 and of the imaging plat-
medium (DIFCO), mounted on a slide, and observed in the fluorescence form of Toulouse TRI.

RNA polymerase I function depends on specific subunits • Albert et al. 291


Published January 24, 2011

Submitted: 17 June 2010 Hernandez-Verdun, D., P. Roussel, and J. Gébrane-Younès. 2002. Emerging con-
Accepted: 21 December 2010 cepts of nucleolar assembly. J. Cell Sci. 115:2265–2270.
Huet, J., J.M. Buhler, A. Sentenac, and P. Fromageot. 1975. Dissociation of two
polypeptide chains from yeast RNA polymerase A. Proc. Natl. Acad. Sci.
USA. 72:3034–3038. doi:10.1073/pnas.72.8.3034
References Kuhn, C.D., S.R. Geiger, S. Baumli, M. Gartmann, J. Gerber, S. Jennebach,
Basi, G., E. Schmid, and K. Maundrell. 1993. TATA box mutations in the T. Mielke, H. Tschochner, R. Beckmann, and P. Cramer. 2007.
Schizosaccharomyces pombe nmt1 promoter affect transcription effi- Functional architecture of RNA polymerase I. Cell. 131:1260–1272.
ciency but not the transcription start point or thiamine repressibility. doi:10.1016/[Link].2007.10.051
Gene. 123:131–136. doi:10.1016/0378-1119(93)90552-E Künzler, M., and E.C. Hurt. 1998. Cse1p functions as the nuclear export re-
Beckouet, F., S. Labarre-Mariotte, B. Albert, Y. Imazawa, M. Werner, O. Gadal, ceptor for importin alpha in yeast. FEBS Lett. 433:185–190. doi:10
Y. Nogi, and P. Thuriaux. 2008. Two RNA polymerase I subunits con- .1016/S0014-5793(98)00892-8
trol the binding and release of Rrn3 during transcription. Mol. Cell. Biol. Kwapisz, M., F. Beckouët, and P. Thuriaux. 2008. Early evolution of eukary-
28:1596–1605. doi:10.1128/MCB.01464-07 otic DNA-dependent RNA polymerases. Trends Genet. 24:211–215.
Berger, A.B., L. Decourty, G. Badis, U. Nehrbass, A. Jacquier, and O. Gadal. doi:10.1016/[Link].2008.02.002
2007. Hmo1 is required for TOR-dependent regulation of ribosomal Lechertier, T., V. Sirri, D. Hernandez-Verdun, and P. Roussel. 2007. A B23-
protein gene transcription. Mol. Cell. Biol. 27:8015–8026. doi:10 interacting sequence as a tool to visualize protein interactions in a cellular
.1128/MCB.01102-07 context. J. Cell Sci. 120:265–275. doi:10.1242/jcs.03345
Berger, A.B., G.G. Cabal, E. Fabre, T. Duong, H. Buc, U. Nehrbass, J.C. Liljelund, P., S. Mariotte, J.M. Buhler, and A. Sentenac. 1992. Characterization
Olivo-Marin, O. Gadal, and C. Zimmer. 2008. High-resolution statisti- and mutagenesis of the gene encoding the A49 subunit of RNA poly-
cal mapping reveals gene territories in live yeast. Nat. Methods. 5:1031– merase A in Saccharomyces cerevisiae. Proc. Natl. Acad. Sci. USA.
1037. doi:10.1038/nmeth.1266 89:9302–9305. doi:10.1073/pnas.89.19.9302
Bischler, N., L. Brino, C. Carles, M. Riva, H. Tschochner, V. Mallouh, and P. Miller, O.L. Jr., and B.R. Beatty. 1969. Visualization of nucleolar genes. Science.
Schultz. 2002. Localization of the yeast RNA polymerase I-specific sub- 164:955–957. doi:10.1126/science.164.3882.955
units. EMBO J. 21:4136–4144. doi:10.1093/emboj/cdf392

Downloaded from [Link] on January 24, 2011


Minakhin, L., S. Bhagat, A. Brunning, E.A. Campbell, S.A. Darst, R.H. Ebright,
Boeke, J.D., F. LaCroute, and G.R. Fink. 1984. A positive selection for mu- and K. Severinov. 2001. Bacterial RNA polymerase subunit omega and
tants lacking orotidine-5-phosphate decarboxylase activity in yeast: eukaryotic RNA polymerase subunit RPB6 are sequence, structural, and
5-fluoro-orotic acid resistance. Mol. Gen. Genet. 197:345–346. doi:10 functional homologs and promote RNA polymerase assembly. Proc. Natl.
.1007/BF00330984 Acad. Sci. USA. 98:892–897. doi:10.1073/pnas.98.3.892
Bon, M., S.J. McGowan, and P.R. Cook. 2006. Many expressed genes in bacteria Misteli, T. 2001. The concept of self-organization in cellular architecture. J. Cell
and yeast are transcribed only once per cell cycle. FASEB J. 20:1721– Biol. 155:181–185. doi:10.1083/jcb.200108110
1723. doi:10.1096/fj.06-6087fje
Nakagawa, K., K. Hisatake, Y. Imazawa, A. Ishiguro, M. Matsumoto, L. Pape,
Cioci, F., L. Vu, K. Eliason, M. Oakes, I.N. Siddiqi, and M. Nomura. 2003. A. Ishihama, and Y. Nogi. 2003. The fission yeast RPA51 is a functional
Silencing in yeast rDNA chromatin: reciprocal relationship in gene homolog of the budding yeast A49 subunit of RNA polymerase I and
expression between RNA polymerase I and II. Mol. Cell. 12:135–145. required for maximizing transcription of ribosomal DNA. Genes Genet.
doi:10.1016/S1097-2765(03)00262-4 Syst. 78:199–209. doi:10.1266/ggs.78.199
Cramer, P., K.J. Armache, S. Baumli, S. Benkert, F. Brueckner, C. Buchen, Nogi, Y., R. Yano, and M. Nomura. 1991. Synthesis of large rRNAs by
G.E. Damsma, S. Dengl, S.R. Geiger, A.J. Jasiak, et al. 2008. Structure RNA polymerase II in mutants of Saccharomyces cerevisiae defec-
of eukaryotic RNA polymerases. Annu. Rev. Biophys. 37:337–352. tive in RNA polymerase I. Proc. Natl. Acad. Sci. USA. 88:3962–3966.
doi:10.1146/[Link].37.032807.130008 doi:10.1073/pnas.88.9.3962
De Carlo, S., C. Carles, M. Riva, and P. Schultz. 2003. Cryo-negative staining Oakes, M., J.P. Aris, J.S. Brockenbrough, H. Wai, L. Vu, and M. Nomura.
reveals conformational flexibility within yeast RNA polymerase I. J. Mol. 1998. Mutational analysis of the structure and localization of the nu-
Biol. 329:891–902. doi:10.1016/S0022-2836(03)00510-2 cleolus in the yeast Saccharomyces cerevisiae. J. Cell Biol. 143:23–34.
Decourty, L., C. Saveanu, K. Zemam, F. Hantraye, E. Frachon, J.C. Rousselle, doi:10.1083/jcb.143.1.23
M. Fromont-Racine, and A. Jacquier. 2008. Linking functionally re- Osheim, Y.N., S.L. French, M.L. Sikes, and A.L. Beyer. 2009. Electron micro-
lated genes by sensitive and quantitative characterization of genetic in- scope visualization of RNA transcription and processing in Saccharomyces
teraction profiles. Proc. Natl. Acad. Sci. USA. 105:5821–5826. doi:10 cerevisiae by Miller chromatin spreading. Methods Mol. Biol. 464:
.1073/pnas.0710533105 55–69. doi:10.1007/978-1-60327-461-6_4
French, S.L., Y.N. Osheim, F. Cioci, M. Nomura, and A.L. Beyer. 2003. In ex- Panov, K.I., T.B. Panova, O. Gadal, K. Nishiyama, T. Saito, J. Russell, and J.C.
ponentially growing Saccharomyces cerevisiae cells, rRNA synthesis Zomerdijk. 2006. RNA polymerase I-specific subunit CAST/hPAF49 has
is determined by the summed RNA polymerase I loading rate rather a role in the activation of transcription by upstream binding factor. Mol.
than by the number of active genes. Mol. Cell. Biol. 23:1558–1568. Cell. Biol. 26:5436–5448. doi:10.1128/MCB.00230-06
doi:10.1128/MCB.23.5.1558-1568.2003
Pettersen, E.F., T.D. Goddard, C.C. Huang, G.S. Couch, D.M. Greenblatt, E.C.
Gadal, O., S. Mariotte-Labarre, S. Chédin, E. Quemeneur, C. Carles, A. Meng, and T.E. Ferrin. 2004. UCSF Chimera—a visualization system
Sentenac, and P. Thuriaux. 1997. A34.5, a nonessential component of for exploratory research and analysis. J. Comput. Chem. 25:1605–1612.
yeast RNA polymerase I, cooperates with subunit A14 and DNA topo- doi:10.1002/jcc.20084
isomerase I to produce a functional rRNA synthesis machine. Mol. Cell.
Biol. 17:1787–1795. Reimer, G., I. Raska, E.M. Tan, and U. Scheer. 1987. Human autoantibodies:
probes for nucleolus structure and function. Virchows. Arch. B Cell
Gadal, O., D. Strauss, E. Petfalski, P.E. Gleizes, N. Gas, D. Tollervey, and E.
Pathol. Incl. Mol. Pathol. 54:131–143. doi:10.1007/BF02899205
Hurt. 2002. Rlp7p is associated with 60S preribosomes, restricted to the
granular component of the nucleolus, and required for pre-rRNA process- Rigaut, G., A. Shevchenko, B. Rutz, M. Wilm, M. Mann, and B. Séraphin.
ing. J. Cell Biol. 157:941–951. doi:10.1083/jcb.200111039 1999. A generic protein purification method for protein complex char-
acterization and proteome exploration. Nat. Biotechnol. 17:1030–1032.
Galy, V., O. Gadal, M. Fromont-Racine, A. Romano, A. Jacquier, and U.
doi:10.1038/13732
Nehrbass. 2004. Nuclear retention of unspliced mRNAs in yeast
is mediated by perinuclear Mlp1. Cell. 116:63–73. doi:10.1016/ Samkurashvili, I., and D.S. Luse. 1998. Structural changes in the RNA poly-
S0092-8674(03)01026-2 merase II transcription complex during transition from initiation to elon-
gation. Mol. Cell. Biol. 18:5343–5354.
Geiger, S.R., K. Lorenzen, A. Schreieck, P. Hanecker, D. Kostrewa,
A.J. Heck, and P. Cramer. 2010. RNA polymerase I contains a Schneider, D.A., A. Michel, M.L. Sikes, L. Vu, J.A. Dodd, S. Salgia, Y.N.
TFIIF-related DNA-binding subcomplex. Mol. Cell. 39:583–594. Osheim, A.L. Beyer, and M. Nomura. 2007. Transcription elongation by
doi:10.1016/[Link].2010.07.028 RNA polymerase I is linked to efficient rRNA processing and ribosome
Hanada, K., C.Z. Song, K. Yamamoto, K. Yano, Y. Maeda, K. Yamaguchi, and assembly. Mol. Cell. 26:217–229. doi:10.1016/[Link].2007.04.007
M. Muramatsu. 1996. RNA polymerase I associated factor 53 binds to Sikorski, R.S., and P. Hieter. 1989. A system of shuttle vectors and yeast host
the nucleolar transcription factor UBF and functions in specific rDNA strains designed for efficient manipulation of DNA in Saccharomyces
transcription. EMBO J. 15:2217–2226. cerevisiae. Genetics. 122:19–27.
Henras, A., C. Dez, J. Noaillac-Depeyre, Y. Henry, and M. Caizergues-Ferrer. Trumtel, S., I. Léger-Silvestre, P.E. Gleizes, F. Teulières, and N. Gas. 2000.
2001. Accumulation of H/ACA snoRNPs depends on the integrity of the Assembly and functional organization of the nucleolus: ultrastructural
conserved central domain of the RNA-binding protein Nhp2p. Nucleic analysis of Saccharomyces cerevisiae mutants. Mol. Biol. Cell. 11:2175–
Acids Res. 29:2733–2746. doi:10.1093/nar/29.13.2733 2189.

292 JCB • VOLUME 192 • NUMBER 2 • 2011


Published January 24, 2011

Van Mullem, V., M. Wery, X. De Bolle, and J. Vandenhaute. 2003. Construction


of a set of Saccharomyces cerevisiae vectors designed for recombina-
tional cloning. Yeast. 20:739–746. doi:10.1002/yea.999
Wai, H.H., L. Vu, M. Oakes, and M. Nomura. 2000. Complete deletion of
yeast chromosomal rDNA repeats and integration of a new rDNA re-
peat: use of rDNA deletion strains for functional analysis of rDNA
promoter elements in vivo. Nucleic Acids Res. 28:3524–3534. doi:10
.1093/nar/28.18.3524
Wang, D., D.A. Bushnell, K.D. Westover, C.D. Kaplan, and R.D. Kornberg.
2006. Structural basis of transcription: role of the trigger loop in
substrate specificity and catalysis. Cell. 127:941–954. doi:10.1016/
[Link].2006.11.023
Yamamoto, K., M. Yamamoto, K. Hanada, Y. Nogi, T. Matsuyama, and M.
Muramatsu. 2004. Multiple protein-protein interactions by RNA poly-
merase I-associated factor PAF49 and role of PAF49 in rRNA tran-
scription. Mol. Cell. Biol. 24:6338–6349. doi:10.1128/MCB.24.14
.6338-6349.2004
Yamazaki, T., Y. Hamano, H. Tashiro, K. Itoh, H. Nakano, S. Miyatake, and
T. Saito. 1999. CAST, a novel CD3epsilon-binding protein transducing
activation signal for interleukin-2 production in T cells. J. Biol. Chem.
274:18173–18180. doi:10.1074/jbc.274.26.18173

Downloaded from [Link] on January 24, 2011

RNA polymerase I function depends on specific subunits • Albert et al. 293


Published January 24, 2011

Supplemental material JCB

Albert et al., [Link]

Table S1. Yeast strains used in this study


Strain Genotype Source

S. cerevisiae
BY4741 MATa his3%1 leu2%0 met15%0 ura3%0 EUROSCARF
BY4742 MATalpha his3%1 leu2%0 lys2%0 ura3%0 EUROSCARF
ODN1-1a MATa his3%1 leu2%0 met15%0 ura3%0 trp1%0 This study
TMS1-1A MATa his3-%1, leu2-%0, C, ura3-%0, ade2-801, lys2-801,LYS2::TETR-GFP, This study
THE JOURNAL OF CELL BIOLOGY

nup49-%::HPH-MX6 + pASZ11-NUPNOP(GFP-NUP49 mCherry-NOP1)


BEN18-1a MATa his3-%1, leu2-%0, C, ura3-%0, ade2-801, lys2-801, LYS2::TETR-GFP, This study
nup49-%::HPH-MX6 rpa34%::kanMX4 + pASZ11-NUPNOP(GFP-NUP49 mCherry-NOP1)
BEN19-1A MATa his3-%1, leu2-%0, C, ura3-%0, ade2-801, lys2-801, LYS2::TETR-GFP, This study
nup49-%::HPH-MX6 rpa49%::kanMX4 + pASZ11-NUPNOP(GFP-NUP49 mCherry-NOP1)

Downloaded from [Link] on January 24, 2011


NOY1071 MATa leu2-3,112 ura3-1 his3-11 trp1-1 ade2-1 can1-100 fob1D::HIS3 Machín et al., 2006
rDNA copy number 25
NOY1064 MATa leu2-3,112 ura3-1 his3-11 trp1-1 ade2-1 can1-100 fob1D::HIS3 Machín et al., 2006
rDNA copy number 190
BEN20-1A MATa leu2-3,112 ura3-1 his3-11 trp1-1 ade2-1 can1-100 fob1D::HIS3 rpa49::kanMX4 This study
rDNA copy number 25
BEN21-1A MATa leu2-3,112 ura3-1 his3-11 trp1-1 ade2-1 can1-100 fob1D::HIS3 rpa49::kanMX4 This study
rDNA copy number 190
RPA49D::KAN MATalpha, his3%1 leu2%0 ura3%0 met15%0 rpa49%::kanMX4 This study
RPA34$::KAN MATa his3%1 leu2%0 met15 ura3%0 lys2%0 YJL148W% -KAN-MX This study
rpa135-D395N ura3 trp1 his3 lys2-801 ade2D ade3D leu2-3,112 rpa135-D395N rpa34D::HIS3 // Beckouet et al., 2008
+ pOG1-A34 (ADE3 URA3 RPA34)
BEN24 MATa/MATalpha his3%1/his3%1 leu2%0/leu2%0 met15%0/MET15 LYS2/lys2%0 This study
ura3%0/ura3%0 RPA190-HA::kanMX4/ RPA190-Myc::kanMX4
BEN25 MATa/MATalpha his3%1/his3%1 leu2%0/leu2%0 met15%0/MET15 This study
LYS2/lys2%0 ura3%0/ura3%0 rpa49-%::HPH-MX6/ rpa49-%::HPH-MX6
RPA190-HA::kanMX4/ RPA190-Myc::kanMX4
S. pombe
T611 ade6-M210 ura4-D18 leu1-32, mating type h Pelloquin et al., 1999
T612 ade6-M210 ura4-D18 leu1-32, mating type h+ Pelloquin et al., 1999
BENSP1-1A ade6-M210 ura4-D18 leu1-32, rpa34::kan-MX4 This study
BENSP2-1A ade6-M210 ura4-D18 leu1-32, rpa51::URA4 This study

RNA polymerase I function depends on specific subunits • Albert et al. S1


Published January 24, 2011

Table S2. Oligonucleotides used in this study


Name N° Sequence

o_RPA34_944 458 5-GCTATTGATTACAGTAAGG-3


o_RPA34_-40 457 5-AGGTCTGTGATCGAGTGAGC-3
Rpa49(-504)Fo 649 5-CATAGTTTCTGGCATGACCC-3
Rpa49(1701)Re 650 5-GAAGAATCCTGGTAGTATGG-3
Rep41-for 740 5-TTTTTAATTAATCGGCTAGCCGCCCCCATCACAAGTTTGTACAAAAAAGCTGAACGAGAAACGT-3
Rep41-rev 741 5-CCGCTCGAGCGGGCAGCCCATCAACCACTTTGTACAAGAAAGCTGAACGAGAAAC-3
attB1-rpa34sp 742 5-GGGGACAAGTTTGTACAAAAAAGCAGGCTTAATGGCAAAATCAAGTGAATTTGTAAACGAGG-3
attB2-rpa34sp 743 5-GGGGACCACTTTGTACAAGAAAGCTGGGTGCTAATTTTTTTCCTTTTTGCTGGATTTCTTTTGC-3
AttB1RPA49 744 5-GGGGACAAGTTTGTACAAAAAAGCAGGCTTAATGGCAGGTGACGAGTTAAAGGGCAAGAAGC-3
AttB2RPA49 745 5-GGGGACCACTTTGTACAAGAAAGCTGGGTGCTAATTTCTAGCGCGTCCACGTCGAGGTTTAGG-3
Rpa34sp-kan-for 746 5-TACCTACGTTGTGACCCACAAGCTCACCAGAGCAAAATACAGGTACGCTT
GCAAAATTTCACTTTAAATTCTACTGGGGCGTAAAACGACGGCCAGT-3
Rpa34sp-kan-for 747 5-TTGCGTTTCCAGCAACCTTACAAATTCTAAAACAAACCGTTGATG
CAGATTTTTGTTCTAAAATATTTAACAATTTCCCCAGGAAACAGCTATGACCATG-3
GEX_49_for 802 5-TCCCCCCGGGccATGTCCGTGAAAAGGTCTGTTTCTGAAATCGAAATTGAAAGTGTTCAAGATCAACCCTC-3
GEX_49_rev 803 5-AAAACCGCTCGAGATCGATCGATCTAACGTCTTGGA
CCTCTTCCTCTTCTTGTCATTTCAGGTAGCTTAAATGGA-3
Pet28_34_for 804 5-TTCATGCCATGGGTATGTCCAAGCTTTCGAAAGATT

Downloaded from [Link] on January 24, 2011


ACGTATCAGATTCAGACTCTGATGATGAAGTGATATCAA-3
Pet28_34_rev 805 5-CGCGGATCCGCGCCGATCGGCTACTAAGCGTAATCTGGAA
CATCGTATGGGTAAGCATCTCTATGTTTCTTTTTCTTATCCTTTTTATCCTTCTTCTCCC-3
Pet28_43_for 806 5-TTCATGCCATGGGTATGTCACAAGTAAAAAGAGCCAA
TGAGAACCGCGAAACCGCAAGGTTCATCAAGAAACACA-3
Pet28_43_rev 807 5-CGCGGATCCGCGCCGATCGGCTAAGCGTAATCTGGAACATCGTAT
GGGTAAGCATCACTATCACTCGATTCACCATCATTGCTTTCACTGGTGTTTTCCT-3

Table S3, showing relative enrichment of each detected yeast ORF deletion, is provided as an Excel file.

References
Beckouet, F., S. Labarre-Mariotte, B. Albert, Y. Imazawa, M. Werner, O. Gadal, Y. Nogi, and P. Thuriaux. 2008. Two RNA polymerase I subunits control the binding
and release of Rrn3 during transcription. Mol. Cell. Biol. 28:1596–1605. doi:10.1128/MCB.01464-07
Machín, F., J. Torres-Rosell, G. De Piccoli, J.A. Carballo, R.S. Cha, A. Jarmuz, and L. Aragón. 2006. Transcription of ribosomal genes can cause nondisjunction. J.
Cell Biol. 173:893–903. doi:10.1083/jcb.200511129
Pelloquin, L., P. Belenguer, Y. Menon, N. Gas, and B. Ducommun. 1999. Fission yeast Msp1 is a mitochondrial dynamin-related protein. J. Cell Sci. 112:4151–4161.

S2 JCB
I-4 Discussion Publication 2011

I-4-a-Rpa49-∆ une souche de choix pour étudier l’élongation de l’ARN pol I

Dans mon introduction, nous nous sommes attelés à décrire des facteurs de
transcription potentiellement impliqués dans l’élongation. Cette phase de la
transcription en comparaison avec l’initiation et la terminaison fut longtemps la moins
étudiée dans le cas du fonctionnement de l’ARN pol I. Il semblerait néanmoins que
l’élongation soit maintenant largement considérée puisque deux études publiées les
mois derniers viennent étoffer la liste des facteurs d’élongations communs entre
l’ARN pol II et l’ARN pol I (Beckouet et al., 2011; Lepore and Lafontaine, 2011). Les
mécanismes régissant l’élongation de l’ARN pol I sont donc des mécanismes en
pleine exploration (pour revue Albert et al. 2011 présentée en annexe).

Au cours de notre étude, nous avons étudié des mutants ou des protéines
impliquées dans l’élongation de l’ARN pol I. Nous nous sommes principalement
appuyés sur l’utilisation du mutant de l’élongation rpa49-∆ pour étudier ces
phénomènes. Durant ma thèse, d’autres équipes de recherches et notamment David
Schneider et ses collaborateurs ont cherché des liens génétiques avec RPA49 pour
identifier des facteurs d’élongation de l’ARN pol I (Anderson et al., 2011; Schneider
et al., 2006; Zhang et al., 2010). L’utilisation du mutant d’élongation rpa49-∆ est donc
un bon candidat pour identifier de nouveaux facteurs. Il serait intéressant de
rechercher par une approche génétique globale de nouveaux suppresseurs et
synthétique létaux de RPA49 pour identifier des facteurs impliqués dans l’élongation
par l’ARN pol I. Cette démarche a déjà été initiée au sein de notre laboratoire.

Dans la même optique d’identifier de nouveaux facteurs d’élongation, l’utilisation des


souches ne contenant que 25 copies pourrait également s’avérer très utile. Son
utilisation permet de se placer dans des conditions où l’ARN pol I se doit d’être
hautement efficace, et donc très sensible à des défauts impliquant l’étape la plus
longue de la transcription, l’élongation. Dans ce contexte génétique singulier, on peut
supputer qu’une altération du processus d’élongation, induite par l’absence d’une
protéine, aura des conséquences sur la croissance qui n’auraient pas été révélées
dans un contexte sauvage. Cette souche à 25 copies a d’ailleurs une sensibilité
accrue au mycophénolate (Hontz et al., 2008). De plus, un atout majeur de cette
souche est qu’elle permet de limiter les phénomènes d’adaptation autorisés par la

 MPO
plasticité du système transcriptionnel de l’ARN pol I. En effet, l’étude de ces facteurs
d’élongation dans le cas de l’ARN pol I est souvent contrariée par des phénomènes
d’expansion des répétitions des gènes d’ADNr ou par un changement du ratio entre
copies ouvertes et fermées. Dans une 25 copies les gènes seront tous sous forme
activée et le nombre de copies ne peut pas varier. Ces différents paramètres vont
faciliter la caractérisation d’un facteur d’élongation et l’interprétation des phénotypes
observés. L’utilisation de cette souche et de la souche mutante rpa49-∆ pourra
permettre d’identifier de nouveaux facteurs.

I-4-b-Contact entre ARN pol I

Dans notre étude nous avons montré l’importance des deux sous-unités spécifiques
de l’ARN pol Iet proposé un modèle permettant de réconcilier les différentes données
de la littérature pouvant apparaître contradictoires. Nous avons proposé que Rpa49
faciliterait les contacts entre deux ARN pol I adjacentes sur le locus d’ADNr en
transcription et permettrait le relargage de Rrn3 (notre étude). Pour construire ce
modèle, nous nous sommes appuyés sur les données structurales issues du travail
de l’équipe de Cramer en 2007, décrivant le positionnement des sous unités Rpa34
et Rpa49 dans une position opposé à la plate-forme de fixation de Rrn3 (Kuhn et al.,
2007). Par des approches in vitro, nous avons montré la possibilité d’une interaction
entre Rpa43 et Rpa49 qui permettrait le relargage de Rrn3. De plus, par co-
immunoprécipitation nous avons montré l’existence d’interactions entre des ARN pol
I en transcription. Dans l’avenir, il serait intéressant de tester différents mutants de
l’allèle RPA49 pour établir quels sont les domaines nécessaires à l’interaction de
Rpa49 avec Rpa43 entre 2 ARN polymérases adjacentes. La présence ou l’absence
de contact pourra être tester par co-immunoprécipitation et par FRET en étiquetant
les sous unités Rpa49 et Rpa43. De plus, les informations structurales qui sont
maintenant à notre disposition grâce aux publications de l’équipe de Patrick Cramer
pourraient nous permettre de cibler plus facilement les régions qui pourraient être
potentiellement requises pour établir cette interaction (Geiger et al., 2010; Kuhn et
al., 2007).

 MPP
II- Rôle et conservation évolutive des protéines HMGB sur la
transcription par l’ARN pol I.

II-1- préambule Publication

Comme nous l’avons évoqué en introduction, la surexpression de la protéine Hmo1


permet de corriger le phénotype de cryosensibilité causé par l’absence de Rpa49.
Les deux publications décrites précédemment dans cette thèse ont montré que
l’absence de Rpa49 entraine un défaut d’élongation et la désorganisation complète
du nucléole qui peut être partiellement corrigée par une réduction du nombre de
copies de l’ ADNr. De plus, la déplétion de Rpa49 s’accompagne d’une augmentation
significative de la distance entre deux ARN pol I adjacentes sur chaque gène ADNr.
En s’appuyant sur ces connaissances, nous nous sommes servis du mutant rpa49-∆
dans l’objectif de comprendre le rôle de la protéine HMGB Hmo1 sur l’ADNr mais
aussi de la protéine humaine UBF, toutes deux connues pour être présents sur la
séquence codante des gènes d’ADNr.

Dans cette publication, les étalements de Miller et les photographies de microscopie


électronique ont été réalisés par Isabelle Léger Silvestre. Maxime Berthaud a aussi
contribué à caractériser et à quantifier les arbres de Miller. Christine Colleran a
réalisé le travail sur l’expression et la localisation d’Hmo1 lorsqu’elle est exprimée
chez l’humain dans le laboratoire de Brian McStay. Achim Griesenbeck a apporté
son expertise concernant les expériences de “psoralen cross linking” que j’ai
réalisées. Enfin, Axel Berger a initié cette étude en clonant UBF et en l’exprimant
chez la levure S. cerevisiae.

Hmo1 chez S. cerevisiae et UBF1 chez l’Homme sont des protéines chromatiniennes
non-histones qui se lient à l'ADNr. Dans cette étude nous avons montré la
conservation fonctionnelle de ces protéines et découvert un équivalent chez S.
pombe. Nous avons montré qu’une surexpression de ces protéines peut améliorer le
fonctionnement de l’ARN Pol I et influencer la morphologie du nucléole. Une des
difficultés de ce projet résidait dans le fait que ces protéines assurent plusieurs
fonctions cellulaires et qu’elles se fixent sur les régions d’ADNr qui sont répétées et
hétérogènes. Nous avons réussi en utilisant des versions tronquées de ces protéines
à découpler différentes fonctions d’Hmo1 et par l’utilisation des souches avec un

 MPQ
nombre de copies d’ADNr réduit à étudier spécifiquement la chromatine des gènes
actifs. Nos résultats suggèrent que la fonction conservée de ces protéines serait de
maintenir une structure et une topologie de l’ADNr permissive sur la région la plus
transcrite du génome.

II-2- Publication

 MPR
HMG-box factors share conserved functions in ribosomal DNA transcription from yeast to

humans

Benjamin Albert1,2, Christine Colleran3, Isabelle Léger-Silvestre1,2, Axel B. Berger1,4, Jorge

Perez-Fernandez1,2, Manuel Wittner5, Joachim Griesenbeck5,

Brian McStay3, and Olivier Gadal1,2*

1: LBME du CNRS ; 2 : Laboratoire de Biologie Moleculaire Eucaryote, Université de

Toulouse, 118 route de Narbonne, F-31000 Toulouse, France.

3: Centre for Chromosome Biology, School of Natural Sciences, National University of

Ireland Galway, University Rd, Galway, Ireland

4: present address: Bardehle Pagenberg, Galileiplatz , 81679 München, Germany

5: Universität Regensburg, Institut für Biochemie, Genetik und Mikrobiologie, 93053

Regensburg, Germany.

* Corresponding author:

Olivier Gadal

email: gadal@[Link]

Phone: +33(0)5 61 33 59 39; Fax: +33 (0)5 61 33 58 86;

Running head: Specific HMGB are Pol I factors.

Keywords: Hmo1 / UBF / rDNA chromatin / RNA polymerase I

1
Abstract

Production of large ribosomal RNAs (rRNAs) by RNA polymerase I (Pol I) is limiting for

proliferation and growth in most eukaryotic cells. In this study, we addressed the functional

conservation of HMGB proteins, containing High Mobility Group Box motifs in transcription

of Pol I. Using heterospecific complementation assays in Saccharomyces cerevisiae, we

demonstrated that the three HMGB proteins Hmo1 (S. cerevisiae), UBF1 (human), and the

newly identified SpHmo1 (S. pombe) are localized in the nucleolus and all rescue the growth

phenotype of the Pol I mutant, rpa49-Δ. Thus we suggest the name HMGB-P for HMGB

proteins regulating Pol I for this group of factors. HMGB-Ps are not fully interchangeable

because they also acquired species-specific functions. Hmo1 co-localizes with UBF when co-

expressed in human cells, but depletion of UBF is not functionally rescued by Hmo1

expression. Conversely, Hmo1 stimulation of ribosomal protein genes expression in budding

yeast is not achieved by UBF1. Our results suggest that these HMGB-P factors are universally

able to stimulate elongation by specifying a chromatin status of rRNA genes permissive for

transcription.

2
Introduction

Cell growth requires a large amount of protein synthesis. Since the ribosome is the molecular

machine making proteins, ribosome production may be regarded as the “house building”

function of the cell (Lempiainen & Shore, 2009). Ribosome biogenesis involves the

coordinated regulation of the three nuclear RNA polymerases, to produce four ribosomal

RNAs (rRNAs). These are assembled with ribosomal proteins (RPs) and represent at least

80% of cellular RNA. RNA polymerase I (Pol I) synthesizes a large polycistronic 35S rRNA

which is processed to generate the three large rRNAs: 25S, 18S and 5.8S. RNA polymerase

III (Pol III) produces 5S rRNA. RNA polymerase II (Pol II) transcribes 80 genes encoding

RPs and over 200 genes coding for trans-acting factors involved in ribosome assembly. In this

exquisitely complex process, transcription by Pol I is thought to be the major rate-limiting

step in ribosome production (Moss & Stefanovsky, 2002).

The essential components of the Pol I transcription machinery have now been identified in all

major groups from yeast to vertebrates. Pol I consists of fourteen subunits. Each subunit

except for Rpa14, is conserved from yeast to humans, (Beckouet et al, 2008; Panov et al,

2006b). During initiation, Pol I, Rrn3 (TIF-IA in mammals), and TFIIH are recruited to

transcription factors bound to the promoter (Grummt, 2003; Iben et al, 2002). Rrn3 and TFIIH

are conserved from yeast to humans (Iben et al, 2002). Complexes bound to rRNA coding

genes (rDNA) promoters are more divergent. In mammals, the promoter specificity is

conferred by TIF-IB/SL1 complex and stabilized by the upstream binding factor (UBF) (Bell

et al, 1988). SL1 is a protein complex containing TATA-binding protein (TBP) and four TBP

associated factors (TAFs) that are required for Pol I activity (Gorski et al, 2007; Russell &

Zomerdijk, 2005). SL1 is required for rRNA transcription. In S. cerevisiae, the promoter-

bound complex comprises two components: the three-subunit Core Factor (CF) and the

3
Upstream Activating Factor (UAF). CF is functionally related to TIF-IB/SL1 and binds

directly to the core promoter domain. This factor is essential for transcription (Keys et al,

1994; Nomura, 2001). Despite the confusing nomenclature, UAF and UBF are unrelated, and

have very different activities in vivo. UAF is made of the histones H3 and H4 (Keener et al,

1997) and four other polypeptides. It strongly enhances the binding of CF to the promoter via

TBP (Siddiqi et al, 2001).

In vertebrates, UBF has been linked to Pol I regulation. UBF has two splicing variants, UBF1

and UBF2, generated from a single transcript (O'Mahony & Rothblum, 1991). Both can bind

to the rDNA promoter, UBF1 being a more potent activator (Kuhn et al, 1994). UBF1

interacts directly with the Pol I subunit PAF53 (Hanada et al, 1996; Schnapp et al, 1994) and

stimulates Pol I at several steps of the transcription cycle. It has been reported to act in the

recruitment of SL1 (Friedrich et al, 2005), in the formation of the preinitation complex

(McStay et al, 1991), and in regulating promoter escape (Panov et al, 2006a). UBF binding

extends from the promoter region to the entire transcribed region (O'Sullivan et al, 2002;

Sanij & Hannan, 2009). Through its direct binding to the transcribed region, UBF can regulate

Pol I elongation (Stefanovsky et al, 2006). Tandem arrays of a heterologous DNA sequence

with high affinity for UBF introduced into human chromosomes formed pseudo-NORs

(nucleolar organizer regions) (Mais et al, 2005). Association of UBF with pseudo-NORs

induced chromatin decondensation, and the recruitment of the Pol I machinery (Mais et al,

2005). rDNA are organized in tandem repeats, of which less than 50% are actively

transcribed. Pol I activity is controlled by both transcription rate per gene and the number of

active genes. Recent reports have demonstrated that UBF can also regulate the number of

active rRNA coding genes (Sanij & Hannan, 2008).

Despite the central regulatory function of UBF, a clear counterpart in yeasts is yet to be

4
identified. UBF1 contains six high mobility group (HMG) boxes, and via the first three HMG

boxes, it binds and kinks the DNA (Stefanovsky et al, 2001). Revealing a tight genetic

interaction with the specific Pol I subunit Rpa49, we previously identified Hmo1, a yeast

HMG-box protein, as a bona fide Pol I transcription factor (Gadal et al, 2002). Rpa49 is

implicated in recycling of Rrn3 after initiation and stimulating the elongation step in vivo

(Albert et al, 2011; Geiger et al, 2010). In vitro studies have shown that the presence of Rpa49

on Pol I stimulates elongation (Kuhn et al, 2007). Deletion of HMO1 in the rpa49Δ strain

causes lethality whereas overexpression of Hmo1 suppresses the growth phenotype of rpa49Δ

(Gadal et al, 2002). Like UBF1, Hmo1 is mostly a nucleolar protein, bound to rDNA and

implicated in Pol I transcription. UBF and Hmo1 have also been linked to the TOR pathway,

connecting the regulation of Pol I activity to nutrient signals (Berger et al, 2007; Lempiainen

& Shore, 2009).

The known functions of UBF are mainly restricted to Pol I transcription, whereas Hmo1 is

clearly a protein involved in different processes. Plasmid stability is reduced in HMO1-

deficient mutants (Lu et al, 1996), and both spontaneous and UV-induced mutation

frequencies increase (Alekseev et al, 2002). Hmo1 together with Top2 suppresses

chromosome fragility during the S phase to preserve genome integrity (Bermejo et al, 2009).

Furthermore, Hmo1 binds ribosomal protein gene (RPG) promoters and regulates their

expression (Berger et al, 2007; Hall et al, 2006b; Kasahara et al, 2007). It also interacts with

TFIID and localizes to the Pol II transcription start site (Kasahara et al, 2008).

In the present study, we directly addressed the functional conservation of HMGB proteins in

Pol I transcription by heterospecific complementation. When expressed in budding yeast,

human UBF1 and UBF2 are localized to the nucleolus, and UBF1 but not UBF2 can rescue

lethality in rpa49Δ hmo1Δ double mutants. Biochemical studies of Hmo1-mapped domains

5
are required for dimerization, DNA binding and bending (Xiao et al, 2010). Since budding

yeast Hmo1 and UBF1 N-terminal domains share a similar organization, we could define a

common core required for stimulation of Pol I. Using this core domain, we then identified a

Sp-Hmo1 ortholog in fission yeast. With three HMGB proteins behaving as bona fide Pol I

activators, we used deletion analysis to define a conserved domain required for Pol I

stimulation. Without this conserved domain, Hmo1 can stimulate RPG expression but not Pol

I transcription. Finally, using a mutant background in which all rRNA genes are active, we

showed that the three HMGB proteins could stimulate Pol I elongation most likely by

inducing the remodeling of the rDNA gene topology.

6
RESULTS

UBF1 is nucleolar and functionally substitutes Hmo1 when expressed in yeast

To determine whether the yeast Pol I factor, Hmo1, and the major human Pol I regulator,

UBF, have similar functions in vivo, we used a yeast strain to express two UBF splicing

variants, UBF1 and UBF2. YFP-UBF1 and YFP-UBF2 were expressed in a yeast strain

bearing two fusion proteins, the nucleolar mRFP-Nop1 (the yeast ortholog of fibrillarin), and

Hmo1-CFP, which maps to the rDNA. Hmo1 is associated with rDNA, and is located at the

nucleolar/nucleoplasmic interface only partly overlapping with Nop1 (Gadal et al, 2002).

Upon expression of YFP-UBF1 or YFP-UBF2, Hmo1-CFP and mRFP-Nop1 appear co

localized in vivo (Figure 1A upper panel; YFP-UBF2 not shown). This co-localization was

unexpected, but could be the result of UBF1 expression in yeast. In contrast, when YFP-

UBF1 is not expressed mRFP-Nop1 and Hmo1-CFP only partially overlap (Figure 1A lower

panel).

To test a functional complementation of Hmo1 by UBF1, we expressed untagged human

UBF1 and UBF2 in a hmo1Δ mutant background growing slowly at 25°C. No significant

rescue of the growth defect of hmo1Δ at 25°C could be observed, showing that neither UBF1

nor UBF2 can substitute fully for Hmo1 in vivo (data not shown).

Hmo1 directly interacts with the region transcribed by Pol I as well as with a subset of Pol II

promoters of RP genes (Berger et al, 2007; Hall et al, 2006a; Kasahara et al, 2007). The

absence of Hmo1 becomes lethal when combined either with mutations in components of Pol

I transcription machinery (rpa49Δ) or with a specific ribosomal protein gene deletion

(rps23AΔ). We examined whether expression of UBF1 or UBF2 can rescue the lethality of

these two double mutant strains. None of the two proteins could suppress the lethality of the

hmo1Δ rps23AΔ mutant background, and only UBF1 expression restored growth of the

7
hmo1Δ rpa49Δ double mutant (Figure 1B; see also Figure 6A). Furthermore, only untagged

UBF1 protein could rescue the growth phenotype when expressed in hmo1Δ rpa49Δ cells

(data not shown).

These results show that although UBF1 cannot fully recapitulate Hmo1 function, its

expression restores growth in a RPA49 deletion mutant in the absence of Hmo1.

UBF1 N-terminal domains and Hmo1 are structurally conserved

Hmo1 and UBF1 share a low sequence similarity but both can rescue viability of a double

mutant hmo1Δ rpa49Δ. The organization of Hmo1 into three domains has been previously

described (Figure 2A); box A is a poorly conserved HMG box which can potentially behave

as a dimerization motif, box B is a conserved HMG box, and box C is a highly charged motif

involved in DNA bending (Xiao et al, 2010). The domain organization of UBF1 is well

established with an N-terminal dimerization domain (UBF-D), five conserved HMG boxes

(with the first being the most canonical), followed by a charged C-terminal motif (Schnapp et

al, 1994). Together with the alignment of the amino acid sequences from the most conserved

HMG boxes (Hmo1 box B and UBF box 1) in both proteins (Gadal et al, 2002), Hmo1 and

UBF1 appear to share a similar organization within the first 260 amino-acids, with a

dimerization motif, a conserved HMG box, and a conserved domain spanning box C (see

Figure 6B). To compare the functions of the Hmo1 and UBF1 domains, we analyzed the

growth phenotype of different mutants. We expressed truncated forms of UBF1: UBF-box1

and UBF-box1-2 (Figure 2A). Both proteins localized in the yeast nucleolus (Figure 2B) but

only UBF-box1-2 could rescue growth in the hmo1Δ rpa49Δ background (Figure 2C). Box A

of Hmo1 is defined as a degenerated HMG box motif. We swapped the box A of Hmo1 with

the dimerization motif of UBF (Figure 2 D). To evaluate the functionality of this chimeric

8
UBF/Hmo1 (Chim-hmo1) on both Pol I machinery and Pol II promoters, it was expressed in

hmo1Δ rpa49Δ and hmo1Δ rps23aΔ backgrounds. Expression of Chim-hmo1 rescued the

growth phenotype in both mutants (Figure 2D). Thus, the N-terminal domain of UBF1

encompassing the dimerization domain and the first two HMG boxes can functionally

complement the growth phenotype of a hmo1Δ rpa49Δ strain.

Budding yeast Hmo1 expression in human cells

We showed that UBF1 expression in yeast restores rpa49Δ hmo1Δ viability. To study the

functional conservation of Hmo1 and UBF1 in more detail, we introduced an Hmo1

expression plasmid into the HT1080 human-cell line. When expressed, Hmo1 mostly co-

localized with UBF in nucleoli with a low nucleoplasmic signal (Figure 3A). Like UBF,

Hmo1 is concentrated on nucleolar organizing regions (NORs) on metaphase chromosomes

(Figure 3A) (Roussel et al, 1993). Since rDNA transcription is reduced or even stopped during

mitosis of mammalian cells (Hernandez-Verdun et al, 2002), this observation suggests that

like UBF, Hmo1 associates with ribosomal gene chromatin even in the absence of Pol I

transcription (Roussel et al, 1993; Wittner et al, 2011). To further illustrate this point, we next

expressed Hmo1 in a cell line (3D-1) bearing a pseudo-NOR (Mais et al, 2005). On

immunofluorescence imaging, pseudo-NORs appear as novel sub-nuclear bodies, distinct

from nucleoli. They sequester a significant fraction of many components of the Pol I

transcription machinery, including UBF. Pseudo NORs lack Pol I promoter sequences, and are

therefore transcriptionally silent and do not recruit RNA binding factors such as nucleolin or

fibrillarin. When expressed at low levels in 3D-1 cells, Hmo1 is concentrated in pseudo-NORs

(Figure 3A), providing further evidence that Hmo1 can be recruited directly to ribosomal gene

chromatin in human cells.

9
UBF is essential for cellular growth and proliferation, as shown by shRNA-mediated

depletion (Figure 3B). A growth arrest phenotype is observed upon activation of a tetracycline

inducible shRNA targeting both UBF1 and UBF2 in the human cell line HT1080. By

introduction of a tetracycline inducible Hmo1 expression vector, we could simultaneously

ablate UBF expression and induce Hmo1 expression (Figure 3B). In this context, we observed

that Hmo1 cannot overcome the growth arrest associated with UBF depletion (Figure 3C).

This shows that UBF fulfills specific functions that cannot be complemented by Hmo1

expression.

Using complementation assay in human cells, Hmo1 is shown to co-localize with UBF in

vivo, but it cannot recapitulate UBF function. UBF has multiple roles in the Pol I transcription

cycle, at the initiation step of rDNA transcription, and during elongation (Panov et al, 2006a;

Stefanovsky et al, 2006). Using complementation assay in budding yeast, both UBF1 and

Hmo1 could stimulate the Pol I machinery. In conclusion, UBF1 and Hmo1 are not

interchangeable, but may share a conserved ancestral function in Pol I transcription.

An HMGB protein stimulates Pol I transcription in [Link]

We next aligned the consensus region shared by Hmo1 and the UBF1 N-terminus with the

Schizosaccharomyces pombe protein database to investigate whether HMGB proteins play a

role in Pol I transcription also in this organism. We identified four HMGB proteins on the

basis of their sequence similarity with Hmo1 and UBF1 Box1-2. We first expressed each of

those four proteins in fusion with YFP in S. cerevisiae. Only SPBC28F2, hereafter called Sp-

Hmo1, is concentrated to the nucleolus (Figure 4A). We next expressed the four untagged

proteins in S. cerevisiae hmo1Δ rpa49Δ double mutant (Figure 4B). Only Sp-Hmo1 restored

growth of the double mutant. As observed for heterologous expression of UBF1 or UBF2,

expression of Sp-Hmo1 did not rescue lethality in a hmo1Δ rps23aΔ background (Figure 6A).

10
This heterospecific complementation assay suggests that Sp-Hmo1 is a Pol I transcription

factor.

We next tested whether Sp-Hmo1 influences Pol I activity in S. pombe. HA-tagged Sp-Hmo1

was detected by immunofluorescence in wild-type (WT) [Link]; the fluorescent signal was

concentrated in the nucleolus, as indicated by co-localization with Gar2, an abundant

nucleolar protein (Figure 5A). In contrast with HMO1 in S. cerevisiae, deletion of Sp-HMO1

in S. pombe did not affect growth (data not shown).

In S. cerevisiae, Hmo1 is required for growth at 25°C, and an hmo1Δ mutant strain

accumulates unprocessed 35S rRNA suggesting an rRNA processing defect (Hall et al,

2006a). We analyzed the effect of Sp-HMO1 deletion on ribosome biogenesis in [Link].

Using northern blot analysis to assess the steady-state content of ribosomal RNA precursors in

Sp-hmo1Δ mutant cells and in WT cells, we observed a depletion of the two earliest

precursors, 35S and 32S rRNA, but detected no or mild effect on other downstream precursors

(27SA, 27SBL 27BS, and 20S rRNA) (Figure 5B). Therefore, Sp-Hmo1 is required for normal

accumulation of early rRNA precursors, but not for further rRNA processing.

In S. cerevisiae, Hmo1 is essential in the absence of Rpa49 and its over-expression suppresses

the rpa49Δ growth defect at 25°C (Gadal et al, 2002). We tested whether this genetic link is

conserved in S. pombe. The ortholog of the budding yeast Rpa49 is Rpa51 in S. pombe, and is

hereafter termed Sp-Rpa49 (Nakagawa et al, 2003). We crossed the S. pombe haploid single

mutants Sp-hmo1Δ and Sp-rpa49Δ, and tried to detect double-deletion mutants after meiosis.

Out of 64 offsprings, we could not generate viable double mutants suggesting that Sp-HMO1

and Sp-RPA49 deletions are synthetically lethal in S. pombe (Figure 5C). A Sp-RPA49

deletion is unable to grow at 25°C, and over-expression of Sp-Hmo1 from the strong NMT1

promoter effectively suppresses this growth defect (Figure 5D). We then used northern

blotting to analyse the steady-state content of ribosomal RNA precursors in WT, Sp-rpa49Δ,

11
and Sp-rpa49Δ with Sp-Hmo1 over-expression. The 35S rRNA level was partially recovered

upon Sp-Hmo1 over-expression with no effect on other downstream precursors. Thus, growth-

phenotype suppression of the Sp-rpa49Δ by Sp-Hmo1 over-expression correlates with

increased 35S rRNA levels (Figure 5E).

Identification of a conserved domain essential for Pol I function

In three eukaryotes, we have identified three HMGB proteins stimulating transcription of

budding yeast Pol I. Hmo1 is also involved in the regulation of ribosomal protein gene (RPG)

expression (Berger et al, 2007). UBF1 and Sp-Hmo1 are unable to stimulate RPG expression,

as judged by the lack of rescue of hmo1Δ rps23aΔ lethality (Figure 6A). Therefore, Hmo1,

UBF1, and Sp-Hmo1 appear to share a common role in Pol I transcription. Upon sequence

alignment we identified a conserved region (CR) that may be required for an ancestral

function of these three proteins (Figure 6B). To better define the minimal core of Hmo1

necessary for Pol I activation, we generated a set of Hmo1 deletions (Figure 6C): Box A,

comprising only the first 90 residues of Hmo1; Box AB, lacking the C-terminal domain and

the CR; and “Hmo1ΔCR” containing an internal deletion spanning the CR and “Hmo1ΔC”;

and removing the last 36 residues which has been previously shown to have a no growth

phenotype (Lu et al, 1996). We expressed the four deletion constructs in two mutants in

which Hmo1 is essential, hmo1Δ rpa49Δ and hmo1Δ rps23aΔ (Figure 6C). Hmo1 and

Hmo1ΔC suppress lethality in both backgrounds whereas Hmo1ΔCR only restores growth in

the hmo1Δ rps23aΔ mutant. Without the conserved region, Hmo1 is unable to rescue lethality

in an hmo1Δ rpa49Δ strain. Therefore, each of the three HMGB proteins share a minimal

conserved core domain, which is required in Hmo1 to support growth in a Pol I-mutant

background. We propose that, in addition to HMG boxes, the presence of the conserved

12
region domain and the functional interaction with Pol I, may define a new sub-family of

proteins, termed “HMGB-P”, for HMGB transcription factors stimulating Pol I activity.

HMGB proteins regulate the number of active rDNA genes

To study how HMGB proteins influence transcription by Pol I in budding yeast, we

characterized the consequence of their over-expression in a rpa49Δ strain. RPA49 deletion is

lethal at 25°C. Upon over-expression of Hmo1, growth is rescued (Gadal et al, 2002). Over-

expression of UBF1 and Sp-Hmo1 also rescue the rpa49Δ growth defect (Figure 7A). In both

yeast and human cells, approximately half of the rRNA coding genes are simultaneously

transcribed, as revealed by psoralen photo-crosslinking (Conconi et al, 1989; Dammann et al,

1993), or Miller chromatin spreading analyses (Osheim et al, 2009). In human cells, UBF1

regulates the number of active copies in a dose-dependent manner (Sanij et al, 2008). We thus

investigated the possibility that HMGB proteins regulate the number of active genes in S.

cerevisiae. In the absence of Rpa49, the ratio of active/inactive copies is similar to the

isogenic Wild-type strain (BY4741; data not shown). Psoralen analysis shows that expression

of Hmo1 or UBF1 in rpa49Δ increases the number of active genes (Figures 7B and C). This

finding is consistent with previously published data suggesting a regulatory function of UBF

and Hmo1 in regulating the chromatin structure of rRNA genes (Sanij et al, 2008; Wittner et

al, 2011).

Chromatin status of active rDNA gene with or without Rpa49

From the above results, the rescue of rpa49Δ strain by overexpression of HMGB-P proteins

could be explained by the increase of open rDNA genes. In a previous study, we documented

13
that the rpa49Δ mutant phenotype is alleviated when artificially decreasing the copy number

of the rRNA gene from 200 to 25 (Albert et al, 2011). This drastically increased the ratio of

open/closed rDNA genes, but resulted in a reduced number of active genes. To investigate

whether stimulation by HMGB-P proteins could be observed independently of an increase in

open rRNA gene number, we next tested whether overexpression of these proteins rescued a

growth defect associated with rpa49Δ mutant while all rDNA genes were active. Using

psoralen cross-linking analyses, we first confirmed that all genes adopt the open chromatin

state in a 25copies-rpa49Δ background (Figure 7D). Overexpression of Hmo1 or UBF1

further improved the growth of rpa49Δ in a 25 rRNA gene copy number strain (Figure 7E).

Therefore, in a context where all rRNA genes are active, over-expression of HMGB protein

can further suppress a Pol I mutant related growth phenotype. These data suggest that

HMGB-P proteins can stimulate rDNA transcription via another mechanism besides

increasing open copy number.

Since HMGB-Ps are expected to act in the chromatin context of rRNA genes, we investigated

the possibility that nucleosomes inhibit Pol I activity in a rpa49Δ background. Indeed, the

strong reduction in Pol I density per gene in rpa49Δ could lead to an increased density of

nucleosomes, formed by replication independent reassembly, on rDNA. Overexpression of

HMGB-Ps could then interfere with this re-assembly (Wittner et al, 2011). To directly test

this possibility, we used the 25 copy strain, which has a very low nucleosome density (Merz

et al, 2008). We characterized by ChIP the occupancy of histones H3 and H2B on rDNA, in

the presence or absence of Rpa49 in a low-copy strain. Using optimized ChIP protocol for

rDNA, we could immunoprecipitate over 10% of the total rDNA with histones H3 and H2B

(Figure 7F). Note that 10% of total DNA is still significantly lower than yield obtained with

euchromatic loci (PMA1; supplementary figure 1) which corresponds to an overall reduced

nucleosome density at open rRNA genes (Wittner et al, 2011). In agreement with the presence
14
of H3/H4 in UAF complex, a promoter-bound transcription factor, H3 is preferentially

associated with the Pol I promoter (Keener et al, 1997). In absence of Rpa49, we did not

detect significant changes in H3 and H2B loading on rDNA compared with wild-type (Figure

7F).

This prompted us to investigate the association of the yeast homologue to linker histone H1 in

metazoan Hho1 with the 25 copies of rRNA gene loci. Hho1 is encoded in budding yeast by a

single non-essential gene and is enriched in rDNA. Hho1 could be required for normal rDNA

compaction and processing of Pol I (Levy et al, 2008). Analysis of occupancy of Hho1 in a

WT strain showed a specific enrichment on the 35S coding region (Figure 7G). In the absence

of Rpa49, we detected a two-fold decrease of Hho1 association with rDNA (Figure 7G; see

material and methods).

In conclusion, in a strain with a reduced rDNA copy number, which are nearly all actively

transcribed, we observe no differences in core histone association in a RPA49 wild type and

deletion backgrounds . However, association of the putative yeast linker histone, Hho1 is

decreased in the rpa49Δ strain. These findings suggest that HMGB-Ps could act via a

mechanism other than modifying the core histone recruitment to rDNA genes.

HMGB-P stimulates Pol I processivity

Active rDNA genes have a chromatin organization that is permissive for Pol I transcription.

To further understand how HMGB-Ps stimulates rDNA transcription of active genes in

25copy-rpa49Δ, we used the only method allowing visualization and characterization of Pol I

loading on rDNA at a single molecule level (Osheim et al, 2009). We analyzed the rDNA

locus by Miller’s spreading with or without Hmo1 over-expression in a 25-copy rpa49Δ

15
strain. A low Pol I occupancy compromises the morphological identification of rRNA

transcription units. Even when all genes are actively transcribed in the absence of Rpa49,

identification of individual genes is technically challenging (Albert et al, 2011). We had even

more difficulties to identify nucleolar regions (Miller trees) after spreading the rpa49Δ mutant

that overexpressed Hmo1. Indeed, while Hmo1 rescues the growth phenotype of a rpa49Δ

mutant, its over-expression decreases the polymerase density from 36+/-5 to 17 +/-6

polymerases per gene (Figure 8A). Since Miller spreads only reveal a snapshot of the kinetic

events of Pol I transcription, the decrease in Pol I density per gene could result from

decreased initiation, or increased elongation rate. The growth defect of the rpa49Δ mutant is

corrected by Hmo1 over-expression, concomitantly with a twofold decrease of polymerase

density per gene. We conclude that this reveals a stimulation of elongation rate. We next

evaluated the Pol I occupancy on Miller’s trees obtained from an 25-copy rRNA gene strain

with or without over-expression of Hmo1. In such strains, rDNA transcription units, identified

on the basis of their repetition and Christmas trees morphology, are easily detectable. Our

statistical analyses confirmed that Hmo1 overexpression leads to a decrease in Pol I loading

rate on active genes (Figure 8B). In conclusion, our results suggest that HMGB-Ps allows a

stimulation of Pol I elongation. This stimulation is detectable at a single gene level with wild-

type Pol I, but without any detectable growth phenotype. However, this stimulation became

essential for growth in the Pol I mutant rpa49Δ.

16
DISCUSSION

In eukaryotic cells, the transcription of the repeated rDNA genes by RNA polymerase I (Pol I)

is the first step of the very complex process of ribosome biogenesis. The extreme efficiency of

this enzyme as well as its fine regulation occur at different levels: availability and

accessibility of initiation-elongation and termination factors, number of active versus non

active genes, number of polymerases per gene, and chromatin status of the rDNA locus. In the

present study, we combined multiple approaches to better define the role of HMGB proteins

acting as Pol I transcription factors. We provide evidence that HMGB proteins may increase

the elongation rate of Pol I.

Conserved organization of HMGB-P

By combining heterospecific complementation assays with cell-biology approaches, we

demonstrated that the HMGB proteins: Hmo1 from budding yeast, Sp-Hmo1 from fission

yeast, and UBF1 from human cell, all share the capacity of stimulating Pol I activity. Despite

overall low sequence similarities, these three proteins share a similar domain organization and

their common capacity to stimulate Pol I activity might be provided by a conserved region.

This region could contact activation factors for Pol I or recognize topological features of the

rDNA gene (see below). However, since this region is proximal to the consensus HMGB

motif, we hypothesize that it might be essential for regulating the chromatin state of rDNA

genes to facilitate transcription by Pol I. The presence of such a conserved motif may define a

novel sub-type of HMGB proteins, the HMGB-P, for HMGB proteins acting as Pol I

transcription factors. The functional conservation of this motif, however, has yet to be

17
demonstrated. The finding that HMGB-Ps exist in three evolutionarily distant organisms

suggests that eukaryotes could have an ancestral HMGB-P factor, stimulating Pol I activity by

modifying the chromatin status of actively transcribed rRNA coding genes.

Do Hmo1 and UBF1 play similar roles?

Evidence that HMGB-Ps help Pol I elongation is provided in budding yeast (Gadal et al,

2002), fission yeast (this work), and in humans (Stefanovsky et al, 2006). The truncated

versions of Hmo1 allowed us to dissect two distinct in vivo activities of Hmo1: regulation of

ribosomal protein gene transcription and Pol I activation. Hmo1 is involved in many DNA-

dependent processes: genome stability (Bermejo et al, 2009), transcription by RNA

polymerase I (Gadal et al, 2002) and RNA polymerase II (Berger et al, 2007; Hall et al,

2006b; Kasahara et al, 2008; Kasahara et al, 2007). In contrast, UBF1 does not stimulate

ribosomal protein gene expression but suppresses the Pol I deletion phenotype upon

heterologous expression in yeast. Therefore, Hmo1 is an HMGB-P but has acquired other

species-specific functions in budding yeast. UBF1 acts at multiple steps of the Pol I cycle in

human cells. UBF1 has an established function during Pol I elongation (Stefanovsky et al,

2006) but has been primarily described as a key player in Pol I initiation (Paule, 1998). We

have no evidence of the function of Hmo1 in Pol I initiation. When expressed in human cells,

budding yeast Hmo1 and UBF colocalise throughout the cell cycle but Hmo1 cannot

recapitulate the essential function of UBF. The colocalization of UBF and Hmo1 could

suggest a physical association of both proteins in human cells. UBF1 contains at least five

HMG boxes, with only the first two being conserved in Hmo1. The requirement for more than

two HMG boxes in humans is well established and