Alignment des séquences et
recherche d'homologie
Houcemeddine Othman (PhD)
Ecole Supérieure Privée d'Ingénierie et de Technologie Appliquée
Année universitaire 2024-2025
1
Les études comapratives
●
Les études comparatives ont
contribuées à la compréhension de
plusieurs biologiques.
●
Les modèles expérimentaux ont
permit d'inférer des conclusions sur
le fonctionnement cellulaire
(Example: [Link], phage lambda,
souris … etc).
Compraraison des séquences des bio-
macromolécules
●
En comparant les séquences de Homme CCTSIPKACSL
l'insuline, on a pu proposer des Porc CCTSIPKTCSL
alternatives thérapeutiques.
Bovin CCASVPKTC-L
●
Le changement des acides aminés peuvent
être décrits comme des évènements
moléculaires apparus au cours de l'évolution.
Comprarer les séquences:
●
Pouvoir juger si deux molécules sont homologues
ou non homologues.
●
Pouvoir arranger correctment chaque acide
aminé ou nucléotide avec ses équivalents.
Terminologie
●
Homologie:
Deux séquences sont dites homologues si elles dérivent d'un même ancêtre
commun par un phénomène de spéciation (Orthologues) ou duplication
(paralogues).
●
Similarité:
Est une mesure du degré de ressemblance entre deux séquences.
(Exemple: pourcentage d'identité de séquence).
%identité = (10 /11)x100= 91% Homme CCTSIPKACSL
Porc CCTSIPKTCSL
Terminologie
Recherche d'homologie dans les bases de
données de séquences
(HSP: High Scoring Segment Pair)
(HSP)
Recherche d'homologie dans les bases de
données de séquences
Plusieurs organismes institutionnels offrent des interfaces web pour les
programmes de recherche d'homologie. Ces interfaces sont appelés
“Serveurs” de bioinformatique
●
Les deux programmes les plus connus sont BLAST (Basic Local
Alignment Search Tool), et FASTA.
Approxiamtions:
●
Les gènes homologues partagent une similarité de séquences.
●
Les gènes (protéines) orthologues présentent la similarité la plus
importante.
●
Les gènes (protéines) orthologues partageraient des fonctions
similaires.
Comment décider si deux séquences sont
homologues
●
Le pourcentage d'identité: générélement >25% avec des bloques
de conservation bien distingués.
●
La couverture de la séquence.
●
La valeur E (E-value).
●
Inspection visuelle de l'alignment.
Comment décider si deux séquences sont
homologues
●
La valueur E: Elle est proportionnelle à la probabilité d'obtenir spécifiquement
un Hit par pur hasard: Plus la valeur E est faible, plus il y a de chance que les
deux séquences sont homologues.
●
Une valeur <0.0001 est généralement significative si la séquence n'est pas trop
courte.
●
E-value = 1 : possiblement pas d'homologie.
●
E-value = 10-3 : Borderline, l'état d'homologie nécessite plus de justification.
●
E-value = 10-4 : Homologie significative.
●
E-value = 10-10 : Homologie très significative.
Les sous programmes de BLAST
BLAST
blastp blastn tblastn blastx tblastx
ADN Protéine
De préférence les séquences
codentes doivent être traduites TTCTTAT FL
avant d'effectuer la recherche
d'homologie. TTTCT-T FL