Structure et Analyse des Génomes
O. Lecompte : 10h CM + 6h TD
R. Ripp : 4h CM + 6h TD + 3h TP
Mini-projet : travail personnel+ 3h TP R. Ripp
O. Lecompte
Laboratoire de Bioinformatique et Génomique Intégratives – IGBMC
[Link]
Plan
1
1. Génomes complets
2. Architecture des génomes
Procaryotes et eucaryotes
Organelles - Endosymbiose
3. Annotation des génomes
Localisation des éléments génétiques
Annotation fonctionnelle
Intégration
1
Définitions
Génome :
l’ensemble du contenu en ADN d’une cellule (haploïde)
=> l’ensemble des gènes et des régions intergéniques
Génomique :
étude multidisciplinaire
p de la structure et de la fonction des génomes
g
- Cartographie et séquençage des génomes
- Localisation des éléments génétiques
- Caractérisation fonctionnelle
- Comparaison des génomes
- Modélisation des systèmes biologiques
Le séquençage des génomes
1995 Haemophilus influenzae
1996 Saccharomyces cerevisiae
1998 Caenorhabditis elegans
2001 Version préliminaire du génome humain
2011 > 1500 génomes procaryotes et eucaryotes disponibles…
~ 2350 virus
[Link]
~ 650 phages
[Link]
~ 2650 organelles
[Link]
2
GOLD ([Link]
[Link]
3
[Link]
4
Projets génomes
Archaea Bacteria Eukarya
310 projets 6600 projets 1850 projets
60%
84%
Total : 5 phyla
Total : 30 phyla
Total : 54 phyla
Les génomes procaryotes
Funding relevance of Bacterial Genome Projects
5
Les génomes bactériens
Les bactéries p
pathogènes
g
- de mammifères : Mycobacterium, Mycoplasma, Salmonella…
- de plantes : Ralstonia, Xanthomonas…
Bactéries utilisées en biotechnologie et/ou industrie:
- enzymes et d’antibiotiques : Bacillus subtilis, Streptomyces coelicolor
- acides aminés : Corynebacterium glutamicum
- solvants : Clostridium acetobutylicum
- produits laitiers : Lactococcus lactis
- création de p
plantes transgéniques
g q : Agrobacterium
g tumefasciens
f
- traitement des eaux usées : Caulobacter crescentus
Espèces présentant un intérêt évolutif :
- bactéries photosynthétiques : Synechocystis
- bactéries endosymbiotiques : Buchnera aphidicola
- espèces situées à la base de la lignée bactérienne : Aquifex aeolicus
Recherche de cibles à partir du génome
test de l’activité
immunogène
D’après Fraser, 2000
6
Séquençage de multiples souches
exemple : Staphylococcus aureus
N315 (MRSA) 2 813 Kb 2 594 ORFs 2001
Mu50 (VRSA) 2 878 Kb 2 697 ORFs 2001
aureus MW2 2 820 Kb 2 632 ORFs 2002
MRSA252 2 902 Kb 2 634 ORFs 2004
MSSA476 2 820 Kb 2 597 ORFs 2004
aureus COL 2 809 Kb 2 618 ORFs 2005
RF122 bovine 2 515 Kb 2 665 ORFs 2005
aureus USA300 2 872 Kb 2 560 ORFs 2006 14 souches
NCTC 8325 2 969 Kb 2 892 ORFs 2006
aureus Newman 2 878 Kb 2 615 ORFs 2007
JHI VISA 2 906 Kb 2 747 ORFs 2007
JH9 VISA 2 906 Kb 2 697 ORFs 2007
aureus Mu3 2 880 Kb 2 698 ORFs 2007
aureus MRSA USA300_TCH1516 2 872 Kb 2 657 ORFs 2007
Diversité génétique intraspécifique
Bacillus Streptococcus
B. anthracis, une espèce ? un clone de B. cereus ?
Branches proportionnelles à la fraction de gènes non
partagés par les différentes souches Medini et al., Curr. Opin. Gen Dev, 2005
7
Diversité génétique intraspécifique
souvent spécifiques à une
souche
beaucoup de fonctions
inconnues
adaptation
à une niche
environnementale
translation, réplication,
homéostasie énergétique
Bentley, Nature, 2009
Le pan-génome
Pan-génome
Pan génome : le répertoire global de gènes dd’une
une espèce (somme de
tous les gènes présents dans les souches d’une espèce)
core genome
dispensable genome
Open pan-genomes:
multiple
p environments,, multiple
p ways
y of
exchanging genetic material
Closed pan-genomes:
isolated niches with limited
access to the global microbial gene pool
Medini et al., Curr. Opin. Gen Dev, 2005
8
Les génomes d’archées
A la découverte du domaine inconnu !
Le domaine des Archées
- découvertes récemment (milieux extrêmes)
- longtemps considérées comme des bactéries atypiques
- proposition des 3 domaines en 1990 (Woese)
Particularités physiologiques
- hyperthermophiles : Pyrococcus
- halophiles : Halobacterium
- acidophiles : Sulfolobus
compréhension des mécanismes biologiques
applications biotechnologiques et industrielles
Cliché IFREMER
Les génomes d’archées
Et nos origines dans tout ça ?
Bac Arc Euc Bac Arc Euc Bac Arc Euc Bac Euc Arc Bac Euc Arc
A B C D E
Intérêt évolutif : relation entre les 3 domaines du Vivant
9
Les génomes eucaryotes
Des organismes
g modèles :
Arabidopsis thaliana
Drosophila melanogaster
Le génome humain...
Caenorhabditis elegans
S. cerevisiae
Rattus norvegicus
Tetraodon nigroviridis Mus musculus
Les génomes eucaryotes
Importance agro-alimentaire Evolution au sein d’un groupe
groupe des hémiascomycètes (génome compact)
Oryza sativa
Kluyveromyces lactis
Candida glabrata
Espèces pathogènes :
E. cuniculi, P. falciparum, P. yoelii, A. gambiae (vecteur),
Leishmania, Giardia, Trypanosoma, Entamoeba…
Anopheles gambiae
Magnaporthe grisea (maladie du riz)
10
Homo sapiens
Génomes Mus musculus
Rattus norvegicus
eucaryotes Gallus gallus
Xenopus laevis
Chordata
Xenopus tropicalis
Tetraodon nigroviridis
Danio rerio
Fugu (Takifugu) rubripes
Metazoa
Ciona intestinalis
Ciona intestinalis Xenopus tropicalis Echinodermata Strongylocentrotus purpuratus
Drosophila melanogaster
Arthropoda
Anopheles gambiae
Caenorhabditis elegans
Nematoda Caenorhabditis briggsae
Brugia malayi
Cnidaria Nematostella vectensis
Strongylocentrotus
Placozoa Trichoplax adherens
purpuratus
Nematostella Choano-
vectensis Monosiga brevicollis
flagellates
Génomes eucaryotes
Trichoplax adherens (Placozoa)
=> parmi les plus simples des animaux
Monosiga brevicollis
(Choanoflagellés)
=> parmi les
unicellulaires les plus
proches des animaux
11
Fungi Ascomycetes Schizosaccharomyces pombe
Pichia stipitis
Pichia guilliermondii
Aspergillus clavatus
Fungi Aspergillus oryzae
Aspergillus fumigatus
Aspergillus terreus
Coccidioides immitis
Phaeosphaeria nodorum
Chaetomium globosum
Magnaporthe grisea
Sclerotinia sclerotiorum
Neosartorya fischeri
Botryotinia fuckeliana
Saccharomyces cerevisiae
Lodderomyces elongisporus
Vanderwaltozyma polyspora
Candida glabrata
Kluyveromyces lactis
Ashbya gossypii
Debaryomyces hansenii
Yarrowia lipolytica
Neurospora crassa
Basidiomycetes Cryptococcus neoformans
Ustilago maydis
Microsporidies Encephalitozoon cuniculi
Viridiplantae Tracheophyte Arabidopsis thaliana
Génomes Oryza sativa
Vitis vinifera
eucaryotes Bryophyte
Chlorophyte
Physcomitrella patens
Chlamydomonas reinhardtii
Ostreococcus lucimarinus
Ostreococcus tauri
Rhodophytes Cyanidioschyzon merolae
Cryptosporidium parvum
Stramenopiles Thalassiosira pseudonana
Mycetozoa Dictyostelium discoideum
Entamoebidae Entamoeba histolytica
Parabasalidea Trichomonas vaginalis
Euglenozoa Trypanosoma brucei
Trypanosoma cruzi
Leishmania major
Entamoeba histolytica
Alveolata Tetrahymena thermophila
Plasmodium falciparum
Plasmodium yoelii
Theileria parva
Theileria annulata
Trypanosoma cruzi Cryptosporidium parvum
Cryptosporidium hominis
Diplomonades Giardia lamblia
12
Génomes eucaryotes : vraiment complets ?
Publication des génomes :
• des “drafts” (séquences préliminaires)...
Ex: Oryza sativa, Plasmodium yoelli,…
• des séquences “presque complètes”
(régions centromériques et télomériques partielles et gaps)
• des génomes complets
Ex: Saccharomyces cerevisiae !
Métagénomes
métagénomique :
analyse génomique d’une population
extraction directe d’ADN et clonage
=> accès aux espèces non cultivables
symbiose
y
espèces pathogènes
prélèvements environnementaux
ADN ancien
Tringe et Rubin, Nature review genetics, 2005
13
Métagénomes
Analyses réalisées :
recherche de marqueur phylogénétique (16S rRNA, gène RecA,…)
=> caractériser les espèces présentes
recherche de gène d’intérêt : séquençage aléatoire, recherche de
gènes cibles puis ancrage phylogénétique (recherche de marqueurs
phylogénétiques à proximité)
assemblage de génomes (pour des milieux pauvres)
…
Métagénomes
paléogénomique : séquençage d’ADN ancien
Tringe et Rubin, Nature review genetics, 2005
14
Projets métagénomes
15