M2 SIN
C106 : Analyse et Fouille de Données- mercredi 15 juin 2022
Consignes: Ce document expose une série de questions dont les réponses seront présentées à l’oral.
Les questions peuvent être traitées avec un ordinateur équipé du logiciel Scilab.
Tout support de cous est autorisé.
Contexte
On se propose de travailler des données météorologiques. Ces données sont issues d’une plateforme
expérimentale équipée d’une station météo qui mesure:
{ la température (TEM) en degrés Celcius [o C].
Le fichier de données (.sod) qui vous est confié pour cette évaluation considère un vecteur de
données TEM qui concatène 30 jours de mesures (du 1er au 30 juillet). Les données ont été
enregistrées avec une fréquence d’acquisition d’une minute. Nous disposons donc d’une mesure par
minute.
Questions
1. À partir du vecteur T EM , générer une matrice de données, notée M AT , de type individus/variables,
pour laquelle les variables seraient associées aux 30 premiers jours du mois de juillet. Ainsi la
première colonne de M AT sera associée aux données du 1er juillet, la seconde à celles du 2 juillet,
la j ème à celle du j juillet,.., la 30ème à celle du 30/07.
2. Calculer la matrice de corrélation COR30 ∈ R30×30 relative à la matrice M AT . Vérifier que
les coefficients présents sur la diagonale de COR30 sont tous égaux à "1".
3. A partir de la matrice COR30, donner les deux variables (donc les deux jours) les plus
corrélées. On notera J1 et J2 ces deux jours.
4. Vérifier le résultat de la question précédente graphiquement. Conclusion.
5. Calculer l’erreur au sens des moindres carrés entre les variables J1 et J2 . Conclusion.
B [Link]@[Link]