0% ont trouvé ce document utile (0 vote)
19 vues3 pages

Test pratique : Analyse de données biologiques

Le document est un test pratique pour le cours d'analyse de données en biologie, comprenant deux questions à répondre avant 10h00. La première question concerne l'analyse de la ferritine dans des échantillons sanguins pour détecter des différences entre pays et laboratoires, tandis que la deuxième question porte sur l'évaluation d'une méthode d'amplification de l'ADN en fonction de la richesse en bases GC. Les étudiants doivent soumettre leurs rapports au format PDF via Moodle, avec des exigences spécifiques sur le contenu et la présentation.

Transféré par

Nikita Miroshnichenko
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
19 vues3 pages

Test pratique : Analyse de données biologiques

Le document est un test pratique pour le cours d'analyse de données en biologie, comprenant deux questions à répondre avant 10h00. La première question concerne l'analyse de la ferritine dans des échantillons sanguins pour détecter des différences entre pays et laboratoires, tandis que la deuxième question porte sur l'évaluation d'une méthode d'amplification de l'ADN en fonction de la richesse en bases GC. Les étudiants doivent soumettre leurs rapports au format PDF via Moodle, avec des exigences spécifiques sur le contenu et la présentation.

Transféré par

Nikita Miroshnichenko
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Test pratique du cours « Analyse de données en biologie »

1er juin 2016 – semestre de printemps

Vous devez répondre aux deux questions ci-dessous. Vous devez terminer votre travail avant
10h00 et rendre votre rapport au format PDF via le site Moodle (moodle2.unil.ch). Moodle
acceptera vos rapports jusqu'à 10h10, mais les dix dernières minutes sont exclusivement
consacrées à la résolution d'éventuels problèmes techniques lors de la soumission. Aucun rapport
ne sera accepté après 10h10, quelle qu'en soit la raison. Vous pouvez rendre autant de rapports
intermédiaires que vous voulez pendant l’examen, mais seul le dernier rapport envoyé est
considéré ; chaque rapport intermédiaire doit donc contenir l'intégralité de votre travail.
Le rapport devra comprendre les résultats explicites, un bref commentaire sur la démarche que
vous avez suivie, les commandes R qui ont été nécessaires pour obtenir les résultats et une
interprétation de ces derniers. N'oubliez pas, en particulier, de rédiger des conclusions claires qui
détaillent les résultats biologiques obtenus.
Si un test statistique est nécessaire, vous devrez toujours spécifier le détail de la démarche en 6
points décrite dans la série 8 (sauf s'il est spécifié explicitement que ce n'est pas nécessaire).
N’oubliez pas d’indiquer votre nom, et assurez-vous que les résultats sont lisibles (en particulier
si vous copiez des résultats sous forme de tableau). La présentation du rapport, quand elle
influence sur la lisibilité, sera prise en compte dans l'évaluation.
Vous avez droit à tous les documents que vous voulez (papier, documents PDF ou sites internet),
mais toute communication est interdite. Quittez tout programme de messagerie, de chat ou
similaire avant de commencer. Si un tel programme tourne sur votre ordinateur, même en tâche
de fond, cela sera considéré comme une tentative de fraude.

Le test comporte 2 questions et 3 pages (une page recto-verso + une page recto).
Question 1 (pondération : 2/3)

L’Agence Mondiale Antidopage (AMA) a fait analyser des échantillons sanguins prélevés dans le
passé pour vérifier si certains pays ont mis en place un programme de dopage systématique.
Elle a chargé six laboratoires accrédités d’analyser les échantillons d’un certain nombre de pays,
et s’intéresse à un paramètre sanguin en particulier : la quantité de ferritin, une protéine
responsable du stockage du fer. L’AMA craint qu’il y ait des différences systématiques de mesure
entre les laboratoires.
Les données provenant de ces analyses sont fournies dans le fichier ferritin.csv ; celui-ci
contient une ligne pour chaque athlète analysé ; les différentes variables sont les suivantes :
• ID : une identification unique, anonymisée, de l’athlète ;

• pays : pays d’origine de l’athlète, anonymisé sous la forme A, B, C, etc ;

• labo : le nom du laboratoire qui a réalisé l’analyse ;

• ferritin : la mesure de ferritin (en ng/ml).

A l’aide de ces données, effectuez les analyses demandées dans les trois points suivants:
1. Analysez ces données afin de déterminer si les moyennes de la ferritin des différents pays
sont les mêmes, ou s’il y a des différences significatives.
2. L’AMA est convaincue que les athlètes du pays A ne sont pas dopés, et que ce pays
constitue une bonne population de référence. Utilisez les résultats obtenus au point 1 pour
montrer si la moyenne de la ferritin pour les autres pays est significativement différente de
la moyenne du pays A.
3. Confirmez (ou infirmez), avec des justifications, la crainte de l’AMA concernant l’existence
de différences significatives entre les laboratoires.

UNIL – Analyse de données en biologie – Test du 1er juin 2016 2/3


Question 2 (pondération : 1/3)
Un laboratoire expérimente une nouvelle méthode d’amplification de l’ADN, et a collecté des
données lors d’une expérience pilote, en particulier la quantité d’ADN original ainsi que la quantité
d’ADN après amplification. Les chercheurs pensent que l’efficacité de cette méthode pourrait
dépendre du fait que les séquences amplifiées soient « GC rich » (plus de 50 % de bases C/G)
ou non, et désirent évaluer cela. Bien entendu, l’abondance d’ADN amplifié dépend également de
la quantité d’ADN disponible avant amplification.
Les données sont disponibles dans le fichier amplification.csv ; chaque ligne correspond à
un échantillon, et les variables sont les suivantes :
• adn_original : l’abondance de l’ADN avant amplification

• adn_amplifie : l’abondance de l’ADN amplifié

• GC: une variable binaire indiquant si l’ADN était enrichi en bases GC ou non.

Effectuez les analyses suivantes. Si vous effectuez des tests statistiques, vous n’avez pas besoin
de faire la démarche en six points (en particulier, il n’est pas nécessaire de vérifier d’éventuelles
conditions d’application).
1. Evaluez si l’abondance de l’ADN après amplification est significativement différente selon
si la séquence est enrichie en GC ou non. Expliquez la situation, et fournissez les
graphiques nécessaires pour l’illustrer.
2. Imaginons que l’instrument utilisé pour l’amplification indique à la fin de l’expérience si
l’amplification a réussi ou non. L’expérimentateur aimerait pouvoir montrer si cette réussite
(ou absence de réussite) dépend de la quantité d’ADN original et de la variable GC.
Quelle procédure statistique conseilleriez-vous d’utiliser dans un tel cas ?

UNIL – Analyse de données en biologie – Test du 1er juin 2016 3/3

Vous aimerez peut-être aussi