0% ont trouvé ce document utile (0 vote)
21 vues7 pages

TP Bioinformatique Appliqué

Ce document présente une introduction à la bioinformatique avec des travaux pratiques sur l'utilisation de bases de données biologiques telles que NCBI, UniProt et PubMed. Il inclut des étapes pour rechercher des gènes et des protéines, télécharger des séquences ADN, et effectuer des alignements de séquences. Les étudiants apprendront à explorer, annoter et comparer des données biologiques tout en réalisant des rapports sur leurs résultats.

Transféré par

h.benkorchia
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
21 vues7 pages

TP Bioinformatique Appliqué

Ce document présente une introduction à la bioinformatique avec des travaux pratiques sur l'utilisation de bases de données biologiques telles que NCBI, UniProt et PubMed. Il inclut des étapes pour rechercher des gènes et des protéines, télécharger des séquences ADN, et effectuer des alignements de séquences. Les étudiants apprendront à explorer, annoter et comparer des données biologiques tout en réalisant des rapports sur leurs résultats.

Transféré par

h.benkorchia
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Chapitre 1 : Introduction à la bioinformatique

TP :

• Initiation à l’utilisation de bases de données biologiques (NCBI, UniProt, PubMed).

• Recherche d’informations sur une protéine ou un gène spécifique.

Partie 1 – Exploration des bases de données

Outils nécessaires :

Un navigateur web (aucune installation requise).

Bases à explorer :

1. NCBI (National Center for Biotechnology Information)


[Link]

2. UniProt (Universal Protein Resource)


[Link]

3. PubMed (Bibliothèque d’articles scientifiques)


[Link]

Étape 1 – Recherche d’un gène ou d’une protéine

1. Allez sur NCBI → cliquez sur Gene ou Protein selon votre choix.

2. Dans la barre de recherche, tapez par exemple :


“BRCA1 Homo sapiens” (gène du cancer du sein).

3. Ouvrez la fiche du gène → observez :

o Le nom complet du gène

o Sa localisation chromosomique

o Les fonctions biologiques principales

o Les séquences d’ADN ou d’ARN associées

Résultat attendu :
Une fiche descriptive du gène BRCA1 (ou tout autre gène choisi), avec un résumé des
informations biologiques principales.

Étape 2 – Recherche de la protéine associée

1. Ouvrez UniProt → recherchez “BRCA1 human”.


2. Consultez la fiche principale (souvent la première entrée).

3. Observez :

o Le nom complet de la protéine

o Le gène codant

o La taille de la séquence (acides aminés)

o Les domaines fonctionnels

o Les liens vers PDB (si structure connue)

Résultat attendu :
Une fiche détaillée de la protéine BRCA1 (ou autre) contenant sa séquence et
description fonctionnelle.

Étape 3 – Recherche bibliographique

1. Rendez-vous sur PubMed.

2. Recherchez : “BRCA1 and breast cancer”.

3. Notez le nombre de publications et les thèmes récents.

Résultat attendu :
Un court résumé des recherches actuelles liées au gène ou à la protéine.

Chapitre 2 : Bases de données biologiques

TP :

• Exploration pratique de GenBank, EMBL, et DDBJ.

• Téléchargement et annotation d’une séquence ADN.

Objectif :

Apprendre à consulter, télécharger et annoter des séquences d’ADN à partir de bases


de données internationales (GenBank, EMBL, DDBJ).

Contexte :
Les bases de données biologiques contiennent des millions de séquences génétiques
provenant de différentes espèces.
Les trois principales — GenBank (USA), EMBL (Europe) et DDBJ (Japon) — partagent
leurs données et forment une base mondiale synchronisée.

Outils nécessaires :

Un simple navigateur web suffit.


Tu peux aussi installer MEGA ou BioEdit si tu veux visualiser les séquences
téléchargées.

Partie 1 – Recherche et téléchargement d’une séquence ADN

1. Va sur :
[Link]

2. Dans la barre de recherche, tape par exemple :


“rbcL Arabidopsis thaliana”
(rbcL = un gène de la photosynthèse, très connu chez les plantes)

3. Clique sur le premier résultat.


Tu verras :

o Le titre de la séquence

o Le numéro d’accès (ex. NC_000932.1)

o Le nom de l’espèce

o La longueur de la séquence

o La séquence nucléotidique complète

4. Clique sur Send to → File → FASTA → Create File


Cela télécharge la séquence ADN en format .fasta.

Résultat attendu :
Un fichier FASTA du gène rbcL contenant la séquence d’ADN.

Partie 2 – Annotation et analyse de la séquence

1. Ouvre le fichier FASTA téléchargé dans un éditeur (Bloc-notes ou BioEdit).


Exemple de contenu :

2. >rbcL gene [Arabidopsis thaliana]


3. ATGTCACCACAAACAGAAACTAAAGC...

4. Identifie dans l’en-tête (ligne qui commence par ">") :

o Le nom du gène

o L’organisme source

o Le numéro d’accès

5. Note les caractéristiques :

o Longueur totale de la séquence (nombre de bases)

o Type de molécule : ADN ou ARN

o Codon start et stop codon (affichés dans la fiche GenBank)

Partie 3 – Comparaison entre bases de données

1. Ouvre maintenant la base EMBL-EBI :


[Link]

2. Recherche le même gène : rbcL Arabidopsis thaliana


→ Compare les informations avec celles trouvées sur NCBI :

o Longueur de la séquence

o Référence de publication

o Date d’enregistrement

Chapitre 3 : Alignement de séquences

TP :

• Alignement pairwise avec BLAST et Needleman-Wunsch.

• Alignement multiple avec Clustal Omega ou MUSCLE.

Objectif :

Comprendre et réaliser des alignements de séquences pairés et multiples afin d’analyser


la similarité entre des séquences biologiques (gènes ou protéines).

Contexte :
L’alignement de séquences permet d’identifier les régions similaires entre des séquences
biologiques. Ces similitudes peuvent indiquer des liens évolutifs ou des fonctions
communes.

On distingue deux types d’alignement :

• Alignement pairé (pairwise) : comparaison entre deux séquences.

• Alignement multiple : comparaison entre trois séquences ou plus.

Outils nécessaires :

Un navigateur web et une connexion Internet


Accès aux outils en ligne suivants :

1. NCBI BLAST → [Link]

2. EMBOSS Needle (alignement pairé) →


[Link]

3. Clustal Omega (alignement multiple) → [Link]

Partie 1 – Alignement pairé avec BLAST

1. Ouvrir BLASTN (pour l’ADN) ou BLASTP (pour les protéines).

2. Coller la première séquence, par exemple le gène rbcL de Arabidopsis thaliana.

3. Dans le champ de comparaison, coller la séquence rbcL d’une autre plante, par
exemple Oryza sativa.
Les séquences peuvent être récupérées sur NCBI.

4. Cliquer sur BLAST et attendre les résultats.

Résultat attendu :
Une page contenant :

• Le pourcentage d’identité (% identity)

• La longueur de l’alignement

• La valeur E (E-value)

Les étudiants notent ces trois valeurs dans leur rapport.

Partie 2 – Alignement pairé avec EMBOSS Needle


1. Aller sur [Link]

2. Coller les deux séquences ADN ou protéiques (mêmes que celles utilisées avec
BLAST).

3. Lancer l’alignement avec les paramètres par défaut.

Résultat attendu :

• Les symboles “|” indiquent les positions identiques.

• Le pourcentage d’identité et de similarité est indiqué en bas du résultat.

Cet outil est très utile pour visualiser les différences exactes entre deux séquences.

Partie 3 – Alignement multiple avec Clustal Omega

1. Ouvrir [Link]

2. Coller trois séquences ou plus, par exemple :

o rbcL d’Arabidopsis thaliana

o rbcL d’Oryza sativa

o rbcL de Zea mays

3. Cliquer sur Submit pour lancer l’alignement.

Résultat attendu :
Un alignement multiple coloré avec :

• Des “*” indiquant les positions identiques.

• Des “:” ou “.” pour les substitutions proches.

Les étudiants doivent repérer :

• Les régions conservées entre les trois espèces. Ce sont les zones identiques ou très
similaires dans les trois séquences alignées.

* → position identique dans toutes les séquences

: → position similaire (acides aminés de propriétés proches)

. → position faiblement similaire

• Les variations éventuelles. Ce sont les positions où les séquences diffèrent :

• Substitutions (un acide aminé ou nucléotide différent)

• Insertions ou délétions (indiquées par des tirets - dans l’alignement)


Partie 4 – Rapport de TP à rendre

Le rapport doit contenir :

1. Le nom des séquences utilisées et leurs numéros d’accès (accession numbers).

2. Un tableau récapitulatif des résultats :

Outil utilisé Type d’alignement % d’identité E-value Observations

BLAST

Needle —

Clustal Omega — —

Une courte conclusion :

Vous aimerez peut-être aussi