0% ont trouvé ce document utile (0 vote)
19 vues4 pages

DS Bio-Informatique

Transféré par

soukainakaoui
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
19 vues4 pages

DS Bio-Informatique

Transféré par

soukainakaoui
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Module : Bio-informatique

Filière : GBM
Année :2024/2025

Examen session normale


« Bio-informatique »
Durée : 1h30 min

Pour chaque question, choisissez la réponse correcte


Exercice 1 : Questions de Cours
1.Qu'est-ce que la bio-informatique ?
a) L'étude de l'informatique
b) L'application d'outils statistiques aux données des entreprises
c) L'application d'outils informatiques aux données biologiques
2.Quelle est la principale fonction d'une base de données de séquences biologiques ?
a) Stocker uniquement des séquences d'ADN
b) Fournir un accès aux séquences et à des outils d'analyse pour la recherch
c) Générer de nouvelles séquences par synthèse
3. Dans le contexte des bases de données, que signifie l'abréviation BLAST ?
a) Basic Local Alignment Search Tool
b) Biological Local Analysis Search Tool
c) Basic Linear Alignment Search Tool
4. Quel est l'objectif d'une recherche BLAST ?
Pour créer des arbres phylogénétiques
Trouver des régions de similarité locale entre les séquences
Synthèse des protéines
5. Quelle est la fonction de la base de données NCBI en bio-informatique ?
a) Fournir un accès à une variété de bases de données et d'outils biologiques
b) Analyser les structures cellulaires
c) Prédire les structures des protéines
6. Quelle base de données contient des séquences de protéines vérifiées expérimentalement ?
a) Swiss-Prot
b) GenBank
c) Uniprot
7. Dans un alignement de séquences, qu'est-ce qu'un "score d'alignement" ?
a) Une mesure de la longueur de la séquence
b) Une évaluation de la similarité entre deux séquences
c) Un indicateur de la qualité d'une base de données
8. Quelle est la différence principale entre un alignement global et un alignement local ?
a) L'alignement global compare des séquences de même longueur
b) L'alignement local ne considère qu'une partie des séquences
c) L'alignement global est plus rapide que l'alignement local
9. Quel format de fichier est couramment utilisé pour stocker des séquences d'ADN ?
a) .txt
b) .csv
c) .fasta
10. Quel est l'objectif principal de l'outil de recherche BLASTP ?
a) Comparer des séquences d'ADN
b) Comparer des séquences de protéines
c) Aligner des séquences de nucléotides
11. Qu'est-ce qu'un "gap" dans un alignement de séquences ?
a) Une séquence manquante
b) Un espace inséré pour améliorer l'alignement
c) Un type de mutation
12. Quel est l'impact des "gaps" sur le score d'alignement ?
a) Ils augmentent toujours le score
b) Ils n'ont aucun impact
c) Ils peuvent diminuer le score selon la pénalité appliquée

Exercice 2 : Analyse de Séquence FASTA


D’après la figure 1 [Annexe]
13. Quelle est la longueur totale de la séquence de myoglobine indiquée dans l'image ?
a) 123 acides aminés
b) 154 acides aminés
c) 200 acides aminés
14. D'après la figure, quelle est l'espèce source de cette séquence ?
a) H. erectus
b) H. sapiens
c) H. habilis
15. Dans le champ "DEFINITION", quel type d'information est généralement incluse ?
a) La structure tridimensionnelle de la protéine
b) Le nom, le type, et l'origine de la séquence
c) Les résultats expérimentaux associés à la séquence
16. L'élément "NCBI Reference Séquence" fait référence à :
a) Une séquence de référence pour des études phylogénétiques
b) Un identifiant spécifique à la base de données NCBI
c) Une séquence de contrôle pour l'alignement
17. Pourquoi est-il crucial de connaître l'organisme source, ici "Homo sapiens", dans les études
comparatives ?
a) Pour comprendre les variations de séquence
b) Pour établir des relations évolutives
c) Toutes les réponses ci-dessus
18. Comment peut-on utiliser l'ACCESSION numéro pour des recherches futures ?
a) Pour accéder à des données brutes de séquençage
b) Pour interroger d'autres bases de données
c) Pour trouver des articles scientifiques liés
19. Quel est le principal avantage d'utiliser le format FASTA pour représenter une séquence ?
a) Il permet de stocker des informations complexes sur la séquence.
b) Il est facile à lire et à analyser par des programmes informatiques.
c) Il garantit la qualité de la séquence.
20. Dans une séquence FASTA, que signifie le symbole ">" au début de la ligne ?
a) Indique la fin de la séquence
b) Indique le début d'une nouvelle séquence
c) Indique la longueur de la séquence
21. Si une séquence FASTA est très longue, comment est-elle généralement organisée dans le
fichier ?
a) En une seule ligne
b) En plusieurs lignes, chacune contenant un maximum de 80 caractères
c) En blocs de 100 acides aminés

Exercice 3 : Résultats d'alignement de séquences


D’après la figure 2 [Annexe]
22. Lors de la recherche d'une séquence dans une base de données, que représente le "score"
affiché dans les résultats ?
a) La longueur de la séquence
b) La qualité de l'alignement
c) Le nombre de gènes trouvés
23. Qu'indique la colonne "E-value" dans les résultats ?
a) La probabilité que l'alignement soit dû au hasard
b) Le pourcentage d'identité entre les séquences
c) La longueur de l'alignement
24. Quelle information serait la plus utile pour déterminer l’homologie d’une séquence ?
a) Le score maximum
b) Le type de séquence
c) L’E-value
25. Que représente le terme "Hits" dans les résultats ?
a) Un identifiant unique pour chaque entrée
b) Une séquence trouvée qui correspond à votre requête
c) Le score d'alignement
26. Que signifie une E-value de 0.00% pour un hit ?
a) L'alignement est de mauvaise qualité
b) Il y a une forte probabilité que l'alignement soit dû au hasard
c) L'alignement est statistiquement significatif
27. Si vous voyez plusieurs hits, quel critère est le plus important pour évaluer la pertinence
d'un hit ?
a) Le pourcentage d'identité
b) La longueur de la séquence
c) Le type de séquence (ADN ou protéine)
28. Quel est l'impact d'un pourcentage d'identité élevé sur l'interprétation des résultats ?
a) Les séquences sont identiques
b) Les séquences proviennent de la même espèce
c) Les séquences ont une fonction similaire
29. Pourquoi est-il important de considérer à la fois le score et l'E-value dans les résultats ?
a) Pour évaluer la qualité et la signification statistique de l'alignement
b) Pour choisir la méthode d'alignement
c) Pour vérifier la longueur des séquences.
30. Dans les résultats de recherche, que représente le terme "accession number" ?
a) Un identifiant unique pour chaque entrée dans la base de données
b) Le nom du chercheur ayant soumis la séquence
c) Le score d'alignement
Annexe

Figure 1. Analyse de Séquence FASTA

Figure 2. Résultats d'alignement de séquences

Vous aimerez peut-être aussi