TP3.
Annotation du génome eucaryote
Objectif : identifier les gènes dans les séquences génomiques
Nous voulons identifier des gènes dans une genomic sequence et déterminer les positions précises
de leurs exons, introns, sites d'initiation de la traduction et sites de terminaison de la traduction.
Nous utiliserons trois approches différentes pour identifier les gènes. Vous devrez comparer les
résultats des trois méthodes, essayer de comprendre les écarts entre les différentes prévisions, et
décider lequel est le plus fiable.
1- Prédiction des gènes par les méthodes ab initio
Utiliser ces liens
FGENESH Mirror sites: FGENESH SoftBerry
Genscan Mirror sites: Genscan (Heidelberg) , Genscan (Paris)
2- Recherche des régions transcrites (EST, ADNc) dans l'ADN génomique
Recherche des EST correspondant à la séquence génomique MEGABLAST (NCBI)
(utilisez la base de données EST) [Link]
DATABASE=nr&PAGE=MegaBlast&FILTER=L&QUERY=CR926887
Sélectionner toutes les EST (au moins 98% d'identité,> 70 pb) et extraire les séquences de
la sortie NCBI BLAST
Déterminer les emplacements de tous les exons et les introns
Assembler les ESTs avec [Link]
Chercher le tool CAP3 et cliquer sur le lien
Cliquer sur upload data
Cliquer sur choose local file et Télécharger votre fichier
Cliquer sur run tool
Récupérer les contigues
Prédiction des gènes
Chercher le programme Augustus
Télécharger les contigues
Cliquer sur run tool
Donc le programme va te donner
Augustus on data 12: GTF/GFF
Augustus on data 12: Protein sequence
Augustus on data 12 : Coding sequence
Approche comparative : recherche de protéines codant des régions par
similarité
La recherche de similarité des protéines prédites par BlastP
Prédiction des domaines conservés des protéines
Pour confirmer les fonctions prédites des protéines par BLAST P
Chercher le programme interproscan dans la plateforme Galaxy
Télécharger les protéines prédites
Chercher les domaines conservés
Télécharger les résultats et les ouvrir par exel
Donner les GO prédits de ces proteines
Prédiction des voies métabolique dans une séquence génomique
Copier coller la séquence génomique dans le serveur KAAS [Link]
Cliquer sur Request
Cliquer sur compute
Présenter les résultats
Prédiction des interactions entres les protéines traduites et les autres protéines
Cliquer sur [Link]
sessionId=bTbY3CJ3zsMt&input_page_show_search=on
Copier-coller chaque séquence protéine
Chercher l’espèce
Cliquer sur search
Interpréter les résultats