0% ont trouvé ce document utile (0 vote)
244 vues48 pages

Introduction au séquençage de l'ADN

Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
244 vues48 pages

Introduction au séquençage de l'ADN

Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Séquençage

Définition
§  Le séquençage de l’ADN est la détermination de la
succession des nucléotides le composant.
§  C’est aujourd'hui une technique de routine pour les
laboratoires de biologie.
§  Cette technique utilise les connaissances qui ont
été acquises depuis une trentaine d'années sur les
mécanismes de la réplication de l'ADN.

2 2
é c

Acides Nucléique
Acide nucléique = polymère de nucléotides

Nucléotides Phoebus LEVENE, 1919


(acide nucléique: Friedrich MIESCHER, 1871)
Bases

l3
3
moc
rg
Protéines
– Glucides
ADN et ARN r

– A. nucléique

3’–5 ’

t t t t t t

44
Cours G. BARTHOLE, ENS Cachan
Structure secondaire de l’ADN
§  1947-1950 Erwin CHARGAFF [Nature 165, 756 (1950)]
découvre que chez l’homme les proportions
Adénine ≈ Thymine (≈30%)
Cytosine ≈ Guanine (≈20%)
è  peut être expliqué par appariement A-T et C-G
§  1953 Rosalind FRANKLIN, James WATSON & Francis CRICK

Cliché diffraction X (R. FRANKLIN)


montrant une croix
caractéristique d’une structure
hélicoïdale 55
Pray, L., Nature Education 1, 100 (2008)
Appariement
Extrémité 5’
(relatif à la position de
l’atome de C dans le Liaisons hydrogène
pentose)

Sens de synthèse:
5’ vers 3’

Pray, L., Nature Education 1, 100 (2008)

Extrémité 3’ 66
Synthèse des protéines

Transcription:
ADN à ARNm

Noyau

Traduction:
ARNm à protéine

Acide aminé
Membrane
Protéines cellulaire
88
1977

SÉQUENÇAGE 1ÈRE GÉNÉRATION :


MÉTHODE DE SANGER

9
Technique de Sanger
§  Frederick SANGER (1918-2013)
biochimiste anglais qui a reçu
2 prix Nobel de chimie:
–  1958 : structure des protéines (insuline)
–  1980 : pour le séquençage

§  Les ADN polymérases sont capables de synthétiser


un brin complémentaire d'ADN à partir d'un brin
matrice.
§  Pour le séquençage, des nucléotides légèrement
différents sont utilisés : les didésoxyribonucléotides
(ddNTP) au lieu des désoxyribonucléotides
triphosphates (dNTP).
10
10
dNTP vs ddNTP
§  Les ddNTP diffèrent des dNTP par l'absence d'un
groupement OH en position 3’.
§  Ainsi lorsqu'une ADN polymérase utilise un ddNTP, elle
n'est plus capable de rajouter le moindre nucléotide à sa
suite : la synthèse du brin d'ADN s’arrête.
5’ 5’
CH2-groupement phosphate CH2-groupement phosphate
O O
1’ base 1’ base

3’ 3’
OH H
OH présent en 3’ : OH absent en 3’ :
dNTP ddNTP 11
11
Protocole (Sanger)
§  Il faut préparer 4 solutions contenant chacune:
–  le fragment qui doit être séquencé
–  un petit morceau d'ADN dont la séquence est
complémentaire à l’extrémité 3' du fragment à séquencer
= amorce
–  les 4 dNTP's (dCTP, dATP, dGTP, dTTP)
–  l'ADN polymérase

12
12
[Link]
Protocole
§  Dans chaque tube, on met de petites quantités d'un
ddNTP fluorescent ou radioactif (32P)

[Link]

§  L’incorporation aléatoire d’un ddNTP stoppe la


synthèse
à On obtient donc à la fin des réactions un ensemble de
brins d'ADN de tailles variées, selon l'endroit où un ddNTP
se sera inséré.
13
13
Protocole (suite)
Synthèse du brin complémentaire è si arrêt par un
ddGTP, c'est qu'il y a une Cytosine dans la séquence

14
14

[Link]
Lecture des brins ADN ADN à
3’ connu séquencer
Migration électrophorétique 5’
(4 colonnes) 5’Amorce 3’
(connue) 20 nt synthèse de 5’ vers 3’

ADN à séquencer
28 GTAGGCAT
5’-ATGCCTAC-3’
longueur du fragment

27 GTAGGCA
26 GTAGGC
25 GTAGG
24 GTAG
23 GTA Exemple d’auto-
22 GT radiographie
(marquage 32P)
21 G d’un gel
d’électrophorèse 15
Lecture optique des brins
§  Marquage de chaque ddNTP avec
un fluorophore différent (disjoint
Chromatogramme
spectralement)
§  Electrophorèse capillaire (machine
moderne)

Avantage: séquençage en une seule réaction au lieu de 4.


16
16
[Link]
Automatisation

17
17
Voir aussi une animation « flash » sur [Link]
Exemple d’application
Recherche de marqueurs génétiques de cancers

Cancer des poumons non à


petites cellules: recherche
Normal de marqueurs génétiques lié
(wild type) au gène ERBB2.

Région dupliquée
Présence d’une région
dupliquée [GCATACGTGATG]
Malade de ERBB2, apparaissant dans
plusieurs séquences è
association avec la maladie

18
18
Performances & Limitations
Performances des séquenceurs Sanger modernes
§  plusieurs centaines d’échantillons simultanément et
un séquençage par heure.
§  Séquences de longueur 300-1000 nucléotides max

Limitations
§  Si amplification (PCR) avant séquençage: des
parties de la séquence du vecteur d’amplification
sont retrouvées dans le séquençage Sanger.
§  Erreurs en début de séquence: reconnaissance
imparfaite de l’amorce
§  Faible pouvoir de résolution entre séquences qui ne
diffèrent en longueur que d’un nucléotide
19
19
Autre méthode (2ème génération):
le pyroséquençage

20
Extrait du cours de [Link]
Pyroséquençage

§  Basé sur un principe de séquençage par synthèse, par


opposition au séquençage par
« terminaison » (méthode Sanger)

§  Séquençage d’un ADN monobrin par synthèse du brin


complémentaire, base par base, en détectant à
chaque étape l’activité de la polymérase par une
autre enzyme chimiluminescente : la luciférase.

21
21
Pyroséquençage
§  Nucléotides (dNTP) ajoutés les uns Polymérase
après les autres (≠séquençage de
Sanger) ACCTTGAATTCGTCCTAGGA-----
GATCCT--------

dNTP

22
22
Pyroséquençage
§  Nucléotides (dNTP) ajoutés les uns Polymérase
après les autres (≠séquençage de
Sanger) ACCTTGAATTCGTCCTAGGA-----
GGATCCT--------
§  Si c’est le bon nucléotide :
incorporation et libération d’un dGTP
pyrophosphate (PPi)
PPi
§  Ppi à ATP par action de l’ATP-
sulfurylase
§  L’ATP apporte l’énergie nécessaire à
la réaction de conversion de la
luciférine par la luciférase. Cette
réaction génère de la lumière visible
dontPPil’intensité est proportionnelle à
la quantité d’ATP.
§  Une Apyrase dégrade les
nucléotides en surplus
23
23
Pyroséquençage
§  Nucléotides (dNTP) ajoutés les uns Polymérase
après les autres (≠séquençage de
Sanger) ACCTTGAATTCGTCCTAGGA-----
GGATCCT--------
§  Si c’est le bon nucléotide :
incorporation et libération d’un dGTP
pyrophosphate (PPi)
PPi
§  PPi à ATP par action de l’ATP-
ATP-sulfurylase
sulfurylase
ATP

24
24
Pyroséquençage
§  Nucléotides (dNTP) ajoutés les uns Polymérase
après les autres (≠séquençage de
Sanger) ACCTTGAATTCGTCCTAGGA-----
GGATCCT--------
§  Si c’est le bon nucléotide :
incorporation et libération d’un dGTP
pyrophosphate (PPi)
PPi
§  PPi à ATP par action de l’ATP-
ATP-sulfurylase
sulfurylase
§  L’ATP apporte l’énergie nécessaire à ATP
la réaction de conversion de la + Luciférine Luciférase
luciférine par la luciférase. Cette
réaction génère de la lumière visible
dont l’intensité est proportionnelle à Lumière
la quantité d’ATP.

25
25
Pyroséquençage
§  Nucléotides (dNTP) ajoutés les uns Polymérase
après les autres (≠séquençage de
Sanger) ACCTTGAATTCGTCCTAGGA-----
GGATCCT--------
§  Si c’est le bon nucléotide :
incorporation et libération d’un dNTP
pyrophosphate (PPi)
PPi
§  PPi à ATP par action de l’ATP- Apyrase
ATP-sulfurylase
sulfurylase
§  L’ATP apporte l’énergie nécessaire à ATP
dNMP
la réaction de conversion de la Luciférase
luciférine par la luciférase. Cette
réaction génère de la lumière visible
dont l’intensité est proportionnelle à Lumière
la quantité d’ATP.
§  Une Apyrase dégrade les
nucléotides en surplus
26
26
Implémentation« technologie 454 »

Pyroséquençage vs. Sanger


§  100 fois plus rapide et meilleurs marché.
§  fragments séquencés plus courts (mais en progression)

454 sequencing (Roche Diagnostics)


Intégration de plusieurs techniques de haute
technologie:
–  pyroséquençage,
–  plaques picotitres en fibre optique (1,6 millions de puits)
–  PCR en émulsion (emPCR) dans des microréacteurs
(300 000 réactions de PCR en parallèle)
–  Traitement des images…
27
27
Emulsion based clonal amplification

28
28
[Link]
Dépôt des billes dans une plaque multi-puits

400 000 réactions de séquençage en parallèle

29
29
[Link]
Exemple de machine « 454 »
Roche « GS FLX System + »

Séquençage de 100 à 400 Mbases en 7 heures (par machine)

30
30
Séquençage du génome complet

31
31
Séquençage d’un génome complet
§  Partie séquençable du génome humain : 2,9 Gpb !
–  Impossible à lire en une fois
–  Les biologistes ne savent de toute façon pas manipuler des
ADN aussi longs
–  Cependant, possible de séquencer « assez vite » avec les
nouvelles technologies.

Ø  Principes de base du séquençage d’un génome :


1.  Fragmentation aléatoire en gros morceaux
2.  Séquençage des extrémités des morceaux
3.  Reconstruction en utilisant des fragments qui se
chevauchent

32
32
Parallélisation
Library
« Usine » factory
créant une banque -de Sequencing factory -
« Usine » de séquençage
chromosome bactérien artificiel (BAC) (Sanger Institute, UK)
Whitehead Institute
au Whitehead Institute (MIT, USA)
Sanger Institute

Nature 409, 860 (2001) 33


33
Séquençage aléatoire global
§  Il faut beaucoup de séquences chevauchantes
à Certaines régions seront séquencées de nombreuses fois
à Malgré cette redondance, il reste des trous…
§  Génome fragmenté en plusieurs morceaux de petite taille
§  Séquençage des fragments
§  Reconstruction

Ex: Haemophilus influenzae (1ère bactérie séquencée)


•  1,8 Mb réduits par cassage mécanique en une banque de
fragments de 2000 pb environ
•  20 000 fragments séquencés (à 1 ou 2 extrémités)
•  24 000 lectures retenues dune longueur moyenne de 470 pb
•  à 11,6 Mpb séquencées soit 6,3 fois le génome, et il restait des
trous ! 34
34
Séquençage clone par clone
Nature 409, 860 (2001)

1.  Chromosome
bactérien
artificiel (BAC):
clone de
100-200 kb
2.  Carte physique
ordonnant les
clones

3.  Séquençage Séquençage


des petits Sanger
fragments
(100-1000 bp) Recouvre
-ments

35
35
Résumé: [Link]
repères chronologiques
1977 ϕ X147 virus 5386 nt ADN simple brin
bactérien 11 gènes circulaire
1984 HIV rétrovirus
1995 Haemophilus bactérie 1.8 Mbp
influenzae 1740 gènes
1997 Saccharomyces levure 13 Mpb
cerevisae 6275 gènes
1997 Escherichia coli bactérie 4,6 Mpb
1998 Caenorhabditis animal 97 Mpb
elegans
2000 Arabidobsis végétal 157 Mpb
thaliana
+ riz plante 430 Mpb céréale avec le +
alimentaire petit génome
2002 souris 2,5 Gpb 90% de gènes en
commun avec nous
2007 poisson zèbre 1,7 Gpb
37
37
Projet génome humain

1988 Human Genome Organisation


1992 1ere carte du génome humain
1999 séquençage du premier chromosome humain (22)
2001 Achèvement du séquençage brut
2005 Projet métagénome humain

38
38
Pacific Biosciences

ZERO-MODE-WAVEGUIDES

39
39
Principe

§  Séquençage par détection de l’incorporation de


nucléotides fluorescents.
§  Détection à l’échelle de la molécule unique.

40
40
Microscopie de fluorescence en molécule
unique : microscopie confocale

scanner
(x,y,z)

objectif

laser d’excitation

miroir dichroique

lentille de tube

photodétecteur 41
41
Microscopie de fluorescence en molécule
unique : TIRFM
§  en réflexion totale
(total-internal reflexion
fluorescence microscopy
ou TIRFM)
fluorescents
onde
évanescente
lamelle
huile

Objectif
ON=1,45
Faisceau Signal de
d’excitation fluorescence

42
42
Microscopie de fluorescence en molécule
unique : volumes élémentaires d’excitation
§  en réflexion totale §  confocale
(total-internal reflexion
fluorescence microscopy
ou TIRFM)
fluorescents
onde
évanescente
lamelle
huile

Objectif
ON=1,45
Faisceau Signal de
d’excitation fluorescence 1,22 /ON
ON=1,45
1,22 /ON =550nm
4n /ON2
100nm

Volume élem.
d’excitation
43
43
Vélem =0,02 fL Vélem =0,16 fL
Conséquence sur la concentration
concentration at which there is, on average,
will affect the quantum yield of the fluoro-
one molecule in the observation volume at
phore and therefore the shape of the observa- coefficient anden espèces
sion events at high concentrations. The diffusion
quantum yield of R110-dCTP
marquées
any given time. Volumes as small as 10
tion volume. In general, the radiative rate of a were found independently to be 2.24 , 10 -6
2
zeptoliters, more than four orders of magni-
dipole is proportional to the density of pho- cm s and 77%, respectively (22). These pa-
-1

tonic states available for emission at the ap- tude smaller than the diffraction limit, are rameters were used to derive G(() for
propriate frequency (24, 25). A detailed cal- possible. Thus, for the smallest waveguides it waveguides of various diameters with the as-
§  Si plus d’une molécule fluorescente par volume
culation of changes to the radiative rate as a
function of position in zero-mode
is possible to work at concentrations as high
as 200 'M and still have less than one mol-
sumption that the quantum yield at the entrance
of the waveguide is the same as that for the
élémentaire d’excitation : on ne voit plus rien
waveguides is beyond the scope of this paper.
However, for our current purpose we will
ecule per volume.
Arrays of zero-mode waveguides were
freely diffusing dye. Fits to a 43-nm wave-
guide for various concentrations of fluorophore
make the approximation that the photon den- manufactured as small holes in an 89-nm thick are shown in Fig. 4A; for comparison, a curve
§  Concentrations max atteignables : 100 nM en TIRFM et
sity of states, and hence the radiative rate, is
proportional to the output coupling from the
film of aluminum on fused silica coverslips
(Fig. 3). Holes of various diameters were pat-
from a conventional, diffraction-limited volume
using a dye concentration of 4 nM is also
10 nM en confocal
waveguide and therefore proportional to p(z).
The fluorescence quantum yield, Q, is a func-
terned with the use of electron beam lithogra-
phy followed by reactive ion etching (22).
shown. Zero-mode waveguides increased
the usable concentration range by well over
tion of the radiative and nonradiative rates of FCS was used to characterize the observa- three orders of magnitude.
§  Concentrations physiologiques:
dipole de-excitation, kr and knr, such that tion volume inside the waveguides and to dem- The value of G(0) scales as expected with
k r(z) p (z) onstrate their usefulness for high-concentration concentration; however, a nonfluctuating
Q(z) !– k (z)dATP,
"k
# 24±22 µM
p(z) " C (2)
FCS and cross-correlation. One-dimensional background, B, from the large pool of highly
è Il faut réduire le
r nr
FCS curves can be derived from the profile S(z) concentrated dye on the opposite side of the
–  dGTP,
where C is a constant 5.2±4.5
such that Q(0) equals µM with the use of either a Fourier (27) or a Laplace waveguide can affect the measured value of

waveguide.
–  dCTP, 29±19 µM
the quantum yield at the entrance of the (28) transform, assuming nonstick boundary
conditions, resulting
T. Traut,
volume d’excitation !
in the expression for the
Mol. Cell.
G(0) such that
N
–  bare
Quenching by dTTP 37±30
metal could µM
contribute to autocorrelation function
Biochem.,140,1 (1994) G(()
G(0) !
(N " B)2

44
44
Fig. 3. A fused silica coverslip with zero-mode waveguides arrays. (A) The Levene,
electron microscope M. J.
image of et
an al., Science
individual 299, 682–686
waveguide is shown(2003).
in (D).
mode waveguides.

Guide d’onde sans mode


(zero-mode wave guide)

On montre que pour


Aluminium
> c=1.7d
pas de mode
propagatif TE11
A B
z d 150
Onde
Solution
z
0
100 evanescente
0 -1
nm

50 -2 z/⇤
Al

Al I(z) = I0 e
-3
0
Fused Silica -4

-50
-100 -50 0 50 100
nm

Fig. 2. (A) Three-dimensional finite-element time-domain simulation of the 45inten


45
diameterguide
and 100 d’onde sans
nm long. (B) S(z) mode
curves (50waveguide
for different nm x100 nm)
diameter, d. (C
Des nanostructures pour confiner le
volume d’excitation

46
46
Levene, M. J. et al., Science 299, 682–686 (2003).
… au séquençage d’un ADN unique

47
47
… au séquençage d’un ADN unique

48
48
Résumé animé

[Link]

SMRT = single molecule real time 49


49
Sources
§  Merci à François Treussart (ENS Cachan) pour avoir amélioré ce cours

§  Animation séquençage de Sanger : [Link]


§  Transparents sur le séquençage de Sanger : [Link]
(cours de Sophie Bleves)
§  Pyroséquençage : voir [Link]
§  technologie 454 : [Link] et
[Link]
§  Les technologies de laboratoire n°5 juillet-août 2007 « Evolution des techniques de séquençage »
§  T4 : photo issue de [Link]
§  T5 : schéma issu de [Link]
§  T7 : schéma inspiré de [Link]
§  T9 & T11 : schémas issus de
[Link]
§  T12 : [Link]
§  génome humain : [Link]
§  T29-30 cf [Link]
§  zebra fish :
[Link] et
Ferris State University

50
50

Vous aimerez peut-être aussi