0% ont trouvé ce document utile (0 vote)
45 vues68 pages

Analyse Statistique et Bases de Données

Transféré par

olsaintenelus199
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
45 vues68 pages

Analyse Statistique et Bases de Données

Transféré par

olsaintenelus199
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Centre National d’Etudes Agronomiques des Régions Chaudes

Analyse Statistique
et
Introduction aux bases de données

Mastère Développement Agricole Tropical


Année 2003-2004, UV : DAT 104

Stéphanie Laffont & Vivien ROSSI


UMR ENSAM-INRA
Analyse des systèmes et Biométrie
rossiv@[Link]

1
Plan du Cours

Partie I. Analyse statistique

Statistiques descriptives pour le traitement d’enquêtes


Applications à plusieurs jeux de données

Partie II. Initiation aux bases de données

Présentation générale

2
Traitement statistique des enquêtes

Introduction

Traitements préliminaires

- Le questionnaire
- L’échantillonnage
- La collecte des données

Traitements statistiques

- Analyse uni-varié des variables : tris à plats, répartition,


histogrammes, 
- Analyse bi-variée des variables : tris croisés, corrélations,
test du  , 
- Analyse multi-variée : ACP, AFC

Conclusion

3
Détails des phases d’une enquête (I)

I. L’idée

1- Le commanditaire

2- Le but

3- La population

4- Les types d’informations à collecter

5- Le budget

4
Détails des phases d’une enquête (II)

II. La préparation

1- Etude du domaine

2- Formulation du problème posé

3- Détermination de la population

4- Détermination des objectifs

5- Définition des informations à recueillir

6- Choix de l’échantillon

7- Choix du mode de collecte

8- Rédaction du projet de questionnaire,


du guide d’entretien

9- Test du projet de questionnaire et guide d’entretien

10- Rédaction du questionnaire définitif,


du guide d’entretien définitif

5
Etude du domaine

Identifier les éléments pertinents

Recueillir un maximum d’idées de personnes :

- compétentes sur le domaine


- concernées par le problème

6
Formulation du problème posé

Les options possibles des décisions à prendre

Les hypothèses a priori

7
Détermination de la population

Qui en fait parti ?

Qui en exclu ?

8
Détermination des objectifs

Les objectifs sont souvent limités par :

Le budget disponible

La longueur du questionnaire acceptable pour l’enquêté


Aller à l’essentiel

Les outils de traitements

9
Choix du mode de collecte

Entretien face à face

Questionnaire par enquêteur

Dépouillement de documents

Questionnaire auto administré

Extraction de fichiers

10
Choix de l’échantillonnage

Définition : Sous ensemble de la population censé la repré-


senter dans son ensemble

Utilité : Limiter le coût de l’enquête

Relève de la théorie des sondages

11
Détails des phases d’une enquête (III)

III. Recueil des données

1- Approche de l’enquêté

2- Soumission des questions

3- Enregistrement des réponses

12
Détails des phases d’une enquête (IV)

IV. Analyse

1- Codage et transformation des données

2- Analyse univariée

3- Analyse bivariée

4- Analyse multivariée

13
Détails des phases d’une enquête (V)

V. Rapport et conclusion

1- Structure

2- Contenu

3- Présentation

14
Les Méthodes d’échantillonnages

Méthodes empiriques :

Méthode des unités types

Méthode des quotas

Méthodes probabilistes

Méthodes aléatoires

Sondage élémentaire

Sondage stratifié

Echantillonnage systématique

Echantillonnage à plusieurs degrés

15
Introduction du cadre statistique pour le
traitement de données

Présentation générale pour un tableau de données :


    
 
        
 .. .. . . . .. 
         

-   réponse à la  ème question sur le  ème


questionnaire, avec
   ! et     #" .

- La  ème colonne regroupe toutes les réponses du  ème


ques-
tionnaire.

- La  ème
ligne regroupe toutes les réponses à la  ème
question.

Toutes les enquêtes peuvent s’exprimer sous la forme du


tableau ci-dessus

16
Formalisation des données

La réponse  à la question 
,      , du question-
naire est appelée variable.
la  ème ligne du tableau précédent rassemble " observations
de la variable  .

Deux types de variables : quantitatives et qualitatives


Deux traitements différents

17
Les types de variables

Les variables qantitatives : données numériques

Exemples : taille, poids, concentrations, pH, 

Les variables qualitatives : données non numériques

Exemples : couleur des yeux, lieu de naissance,  

Les modalités sont les valeurs possibles d’une variable


qualitatives :

Modalités ordonnées
Ex : Faible, Moyen, Bon, Très Bon

Modalités quelconques
Ex : Bleu, Vert, Marron

18
Analyse univariée ou Tris à plats des variables

Présentation générale : Soient     des observations de



la variable

Exemple les " réponses         de la question 


.

Objectif : Résumer l’information contenue dans     

Moyens :

Approches numériques
Approches graphiques

Outils différents suivant que la variables soit qualitative ou


quantitative

19
Traitements numériques d’une variable
quantitative


Estimation de la valeur centrale de
 
La moyenne des    :    

La médiane des    :     “le  du milieu”.



La dispersion de
  
L’écart-type à la moyenne :      

Les quartiles, le minimum, le maximum

Exemple, la série de notes : 10, 12, 7, 14, 11, 8, 9, 15, 5, 12,


10.5, 11, 14, 8, 16

Min  Médiane  Max


 

5 8.5 11 13 16

20
Traitement graphique d’une variable
quantitative

Histogramme

- Représentation des effectifs par classe


- Dépendant des classes : nombre et taille

- Exemple : Les mêmes notes 10, 12, 7, 14, 11, 8, 9, 15, 5, 12,
10.5, 11, 14, 8, 16.

Les classes :     ,     ,      , 


  ,   
   

0
0.0 2.5 5.0 7.5 10.0 12.5 15.0 17.5 20.0 22.5
Notes

21
Traitements numériques d’une variable
qualitative
    
Soient  les modalités de

La fréquence de la modalité  dans l’échantillon     :


  " 

"
où "  est le nombre d’occurences de la modalité  dans     

Modalités quelconques
Le tableau des fréquences des modalités     dans
     est

Modalités   
   
Fréquences  

Modalités ordonnées
Le tableau des fréquences des modalités     dans
     est :
Modalités   
   
Fréquences  
     
Fréquences cumulées  

22
Traitements graphiques d’une variable
qualitative

Modalités quelconques :

Illustration visuelle de la répartition dans les classes


Diagramme en batons, histogramme, graphique en secteurs,
 

Modalités ordonnées
Idem mais il faut respecter l’ordre des modalités

23
Exemple de traitement d’une variable
qualitative à modalités quelconques
Quel type d’engrais utilisez-vous ? a : chimiques, b : bio-
logiques c : mélange des deux, d : aucun
Réponses : b, b, a, a, c, d, c, b, c, a, d, c, b, a, c, a, b, c, c,b.

a b c d
Le tableau des fréquences :
5/20 6/20 7/20 2/20

24
Exemple de traitement d’une variable
qualitative à modalités ordonnées
Comment trouvez-vous le café ?
TB : Très bon, B : Bon, A : Acceptable, M : Mauvais

Réponses : A, B, B, TB, M, A, B, A, TB, M, B, TB, A, A, B,


M, M, TB, A, B

TB B A M
Tableau des fréquences : Fréquences 0.2 0.3 0.3 0.2
Fréq. cumulées 0.2 0.5 0.8 1
Commentaires :

- 50% des clients apprécient ce café (TB+B)


- 80% des clients sont satisfaits du café (TB+B+A)

25
Analyse bivariée ou tris croisés des variables

Présentation générale : Soient     des observations



de la variable et    des observations conjointes de
la variable  .

Exemple les " réponses à deux questions différentes.



Objectif : Etudier le lien entre et 

Moyens :

Approches numériques
Approches graphiques

Outils différents suivant que les variables soient qualita-


tives ou quantitatives

26
Cas de deux variables quantitatives


Recherche d’un lien linéaire entre et 

Coefficient de corrélation linéaire entre et  :
     
  
 
 
Interprétation de  

- Si     est proche de 1, le lien entre et  est linaiére




- Sinon le lien n’est pas linéaire (on peut rien dire de plus)

Etude graphique du lien entre et 

Représentation du nuage de points :     en abscisse


et   

Si le nuage a une forme spécifique  il existe un lien


Si le nuage n’a pas de structure particulière  pas de lien ?

27
Exemple de traitement de deux variables
quantitatives

 4.59, 3.37, 9.33, 4.85, 9.64, 3.68, 6.19, 5.39, 2.43,   
  -0.99, -0.70, -3.31, -1.39, -4.35, 0.84, -1.73 -1.90   .
  
    proche de 1  lien linéaire entre et  .


 -3.03, -4.44, 1.45, -1.83, 0.66, 1.31, -3.69, -0.19, 
  774.08, 7676.3, 9.57, 37.51, 0.00864, 6.05,  .
 
  pas proche de 1  pas de lien linéaire.


il semble exister un lien quadratique entre et 
28
Cas de deux Variables Qualitatives

    
-  les modalités de .
-      les modalités de  .

Le tableau de contingence
 
 "  "  "  " 
.. .. .. ..
 "  "  "  " 
.. .. .. ..
 " 
 "  "  " 
"  "  " "

"   est l’effectif de l’intersection des modalités  et .
"      "   (i.e. l’effectif de la modalité )
"      "   (i.e. l’effectif de la modalité  ).
"  marges en lignes
"  marges en colonnes

La constitution de ce tableau est l’opération appelée


“tri croisé”.

29
Test d’indépendance du de deux variables
qualitatives


Caractériser l’indépendance entre deux variables et  est
très utile dans une étude et en particulier pour une enquête.
 
La mesure de liaison  entre et  est
  
  
 "  
 
    

 
Si les variables et   sont indépendantes  suit approxi-
mativement une loi de           .

 Sous l’hypothèse que et  sont indépendantes,  on
connait donc les valeurs vraisemblables que peut prendre 

30
Test d’indépendance du de deux variables
qualitatives (suite)


Si   est supérieur à la valeur critique  qu’une va-
riable           à une probabilité  de dépasser alors on

rejettera l’hypothèse d’indépendance de et  .

La valeur critique  est définie par


 
            
pour trouver  on doit utiliser des tables de probabilité.
  
Si   , on accepte l’hypthotèse d’indépendance de
et  au seuil 

Sinon on la rejette.

Bien entendu, si  et  sont proches il est préférable de mi-
tiger la conclusion.

31
Exemple du traitement de deux variables
qualitatives

 Comment trouvez-vous le café ?


 1-TB très bon, 2-B bon, 3-A acceptable, 4-M mauvais



 Comment jugez-vous la qualité du service ?
 1-S satisfaisante, 2-C convenable, 3-Insuffisante

 : 1TB, 2B, 3A, 2B, 2B, 3A, 4M, 2B, 1TB, 3A, 4M, 3A,
2B, 2B, 2B, 1TB, 2B, 3A, 4M, 2B, 2B, 1TB, 2B, 4M, 3A,
1TB
 : 1S, 1S, 2C, 3I, 1S, 2C, 2C, 2C, 3I, 3I, 3I, 2C, 1S, 2C, 2C,
1S, 1S, 3I, 3I, 1S, 1S, 1S, 3I, 3I, 2C, 1S.

Tri croisé des variables café et service :

F IG . 1 – Tableau de contingence

32
Exemple de deux variables qualitatives (suite)

Représentation graphique du tableau de contingence :

F IG . 2 – Histogramme en 3D du tableau de contingence

Commentaire :
-Les clients semblent avoir la même opinion concernant le
café et le service.
-Il y aurait donc une dépendance entre les deux variables.

Effectuons un test statistique afin d’approfondir la question.

33
Exemple de deux variables qualitatives (fin)


Voici la sortie de test d’indépendance du  réalisé avec Stat-
Box :

Variable en lignes : Café


Variable en colonnes : Service

Tests d’indépendance entre les lignes et les colonnes du ta-


bleau de contingence :

Valeur observée du khi (ddl = 6) : 14,28
P-value associée : 0,03
Le test étant unilatéral, la p-value est comparée au seuil de si-
gnification : alpha= 0,05

Valeur critique du khi (ddl = 6) : 12,57

Conclusion : Au seuil de signification alpha= 0,05 on peut re-


jeter l’hypothèse nulle d’indépendance entre les lignes et les
colonnes.
Autrement dit, la dépendance entre les lignes et les colonnes
est significative

Les commentaires initiaux sont donc confirmés par le test.


34
Analyse multi-variée

Formalisations

Les " “points sujets” : variables par individu


 er sujet   
ème
sujet    
.. ..
" ème sujet   

Les “points variables” : " individus par variable


    

  
         

..   ..  
.. 
  

Objectif : Etudier globalement toutes les variables et tous les


individus

Moyens :

Variables quantitatives : ACP


Variables qualitatives : AFC

35
Analyse Multi-variée de variables
quantitatives : ACP

Difficulté : " et sont souvent supérieurs à 10 ou 20


Les points sujets ou variables sont dans un espace de di-
mension élevée

Extraction d’un espace de dimension plus petite contenant


beaucoup d’information l’ACP

Illustration en dimension 3 (3 variables)

36
Recherche de la première composante
principale

La première composante est la direction suivant laquelle le


nuage est le plus étiré :

37
Recherche de la seconde composante principale

Projection des individus sur le plan perpendiculaire à la pre-


mière composante :

Deuxième composante : direction selon laquelle le nuage


des projections est le plus étendu

38
Remarques générales sur l’ACP

Représentation graphique optimisée

- Réduit la dimension en conservant un maximum d’infor-


mation
- Préserve au mieux la disposition originale des points

ACP normalisée ?

- Quand ? Si les données ont des échelles très différentes


- Pourquoi ? Pour ne pas donner trop d’importance aux va-
riables qui ont les plus grandes valeurs

39
Exemple de réalisation d’une ACP

Les notes d’une classe de collège :

Maths Physique Français [Link]. Anglais Histoire


Elève 1 18,00 13,00 2,00 11,00 9,00 7,00
Elève 2 18,00 14,00 2,00 12,00 8,00 6,00
Elève 3 14,00 11,00 6,00 10,00 11,00 9,00
Elève 4 5,00 8,00 15,00 10,00 14,00 12,00
Elève 5 14,00 14,00 6,00 12,00 8,00 6,00
Elève 6 1,00 0,00 19,00 0,00 20,00 20,00
Elève 7 8,00 6,0 0 12,00 8,00 16,00 14,00
Elève 8 12,00 10,00 8,00 10,00 12,00 10,00
Elève 9 17,00 13,00 3,00 11,00 9,00 7,00
Elève 10 11,00 12,00 9,00 10,00 10,00 8,00
Elève 11 12,00 14,00 8,00 12,00 8,00 6,00
Elève 12 16,00 10,00 4,00 10,00 12,00 10,00
Elève 13 12,00 16,00 8,00 14,00 6,00 4,00
Elève 14 7,00 16,00 13,00 14,00 6,00 4,00
Elève 15 16,00 9,00 4,00 10,00 13,00 11,00
Elève 16 11,00 15,00 9,00 13,00 7,00 5,00
Elève 17 12,00 13,00 8,00 11,00 9,00 7,00
Elève 18 14,00 10,00 6,00 10,00 12,00 10,00

40
Exemple de réalisation d’une ACP (suite)

Première étape tris à plats :

Traitements de base du jeu de données Notes avec StatBox

41
Exemple de réalisation d’une ACP (suite)
Représentation graphique globale : Box plots

Représentation graphique par variable : histogrammes

Histogramme des notes de Math

42
Exemple de réalisation d’une ACP (suite)
Deuxième étape : étude des corrélations

43
Exemple de réalisation d’une ACP (suite)

Etude numérique des corrélations : Matrice des corrélations

Beaucoup de liens linéaires :

Entre Math et Français


Entre Physique [Link], Anglais et Histoire

44
Exemple de réalisation d’une ACP (suite)

Calcul des composantes principales :

- Les valeurs propres :

- Les vecteurs propres associés i.e. les composantes


principales

45
Exemple de réalisation d’une ACP (suite)

Les deux premiers axes principaux


F1 = 0.34*Maths + 0.44*Physique - 0.34*Français + 0.43 * Science Nat
F2 = 0.62*Maths - 0.23*Physique - 0.62*Français - 0.23*Science Nat

expliquent 98,42% de la variance : c’est exceptionnel !

Représentation des variables dans le plan principal (F1,F2) :

46
Exemple de réalisation d’une ACP (suite)

Représentation des individus sur le premier plan principal :

47
Exemple de réalisation d’une ACP (fin)

Représentation des individus et variables sur le premier plan


principal :

Graphique très utile pour faire les commentaires


Attention : éviter l’interprétation simultanée variable-individu

48
Analyse Multi-variée de variables
quantitatives : AFC

Adaptation de l’ACP au cas des variables qualitatives

Les principales différences entre AFC et ACP

- AFC : Chaque modalité d’une variable est représentée par


un point
ACP : Chaque variable est représentée par un point

- ACP : sa qualité est évaluée sur le pourcentage de la va-


riance restitué
AFC : plus délicat, car les variances restituées par les va-
leurs propres sont sous estimées

- AFC : Ajout de variables illustratives n’intervenant pas


dans le calcul des axes principaux Aide à l’interpré-
tation

49
Exemple de réalisation d’une AFC
On a demandé aux élèves de classer les matières par ordre de
préférence :

Toutes les variables sont qualitatives  AFC


On considère alors toutes les variables suivantes :
Math.a, Math.b, Math.c, Math.d, Math.e, Math.f,
Phy.a, Phy.b, Phy.c, Phy.e, Phy.f,
Fran.a, Fran.c, Fran.d, Fran.e, Fran.f,
ScNat.b, ScNat.c, ScNat.d, ScNat.f,
Ang.a, Ang.b, Ang.c, Ang.d, Ang.e,
Hist.b, Hist.c, Hist.d, Hist.e et Hist.f

50
Exemple de réalisation d’une AFC (suite)

Etude des valeurs propres :

Histogramme des valeurs propres :

51
Exemple de réalisation d’une AFC (suite)

Le premier plan principal restitue 73.47% de la variance 


Il restitue suffisament d’information pour faire une interpréta-
tion des données.

Représentation des variables sur le plan principal :

52
Exemple de réalisation d’une AFC (suite)

Ajoutons deux variables illustratives : [Link] (1 ou 2) et


[Link] (1 ou 2)

Représentation de ces variables illustratives :

53
Exemple de réalisation d’une AFC (fin)

Interprétations

Les élèves qui ont la moyenne en Français et pas la moyenne


en Math préfèrent les matières littéraires

Les élèves qui ont la moyenne en Math et pas la moyenne en


Français préfèrent les matières scientifiques

Il émerge quatre groupes dans la classe

- Groupe 1 : Littéraire avec préférence Anglais-Histoire


- Groupe 2 : Scientifique avec préférence [Link]
- Groupe 3 : Scientifique avec préférence Math
- Groupe 4 : Littéraire avec préférence Français

54
Conclusion

Sur le traitement d’enquête :

- La création du questionnnaire est une étape fondamen-


tale
Bien adapter les questions au problème que l’on se pose
et aux traitements qu’on souhaite leur faire subir.

- Utilisation des outils statistiques généraux


fonctionnement facilité pour des données de bonnes
qualités

Sur les outils statistiques :

Nombre et Nature des variables Méthodes


1 variable quantitative histogramme, box plots
1 variable qualitative diagramme à secteur
2 variables quantitatives nuage de points
2 variables qualitatives tableau de contingence

variables quantitatives ACP

variables qualitatives AFC

55
Partie II

I NITIATION AUX BASES DE DONNÉES

Principales sources :

- Cours “Initiation aux bases de données sous ACCES”,


ENSA.M Philipe Vismara

- Cours “Base de données” 2ème année EFPG

56
Introduction

- Différence entre base de données et tableur

- Eléments fondamentaux d’une base de données

Les tables
L’indexation
La clé d’indentification
Les requêtes

- Eléments techniques

sécurité, multi-accès,   
entretien, matériel,  

57
Différences entre Tableur et Base de données

Une base de données n’est ni un grand tableau ni un grand


tableur

Les tableurs sont efficaces pour traiter de simples grilles de


calculs, mais ils gèrent mal :

- la sémantique des données


- les liens entre les données, i.e. la cohérence après une mo-
dification
- les accès multi-utilisateurs
- la présentation sous divers formats (saisie, bilan,   )
- la sécurité, la fiabilité,  
-  

Les SGBD : Systèmes de Gestion d’une Base de Données,


gèrent correctement tous ces points.

58
Les rôles du SGBD

Permettre la description d’informations structurées

- A chaque type d’information correspond un ensemble de


champs pour le décrire

- Chaque information enrigistrée (enregistrement) est décrite


par les valeurs de ses champs.

- Exemple :

Adhérents

N adhérent : 1 2
Nom : Leroux Dupond
Prénom : Alex Julie
Adresse : 3 rue des lilas 4 imp. du sud
Ville : Montpellier Jacou

Cotisations

Date : 01/09/96 10/10/96 07/08/97


Ref. adhérent : 1 2 1
Montant : 50

75 100

CHAMPS ou ATTRIBUTS

59
Les Tables

Table : Ensemble d’enregistrements ayant la même structure

Adhérents

N adhérent : 1 2 3
Nom : Leroux Dupond Leroux
Prénom : Alex Julie Sylvie
Adresse : 3 rue des lilas 4 imp. du sud 8 av. de Nîmes
Ville : Montpellier Jacou Sommières

Table : Adhérents

Champs
 

N adhérent Nom Prénom Adresse Ville
Leroux Alex 3, rue des lilas Montpellier

Dupond Julie 4, imp. du sud Jacou
Enregistrements  Leroux Sylvie 8, av de Nîmes Sommières

60
Description d’une Table

Structure d’une table = description des champs


Table Adhérents (N adhérent, Nom, Prénom, Adresse, Ville)
où “N adhérent” est un entier, “Adresse” ne dépasse pas 50
lettres,   

Contenu d’une table = Ensemble d’enregistrements (l’ordre


n’a pas d’importance).

Tri par “N adhérent” :

1 Leroux Alex 3, rue des lilas Montpellier


2 Dupond Julie 4, imp. du sud Jacou
3 Leroux Sylvie 8, av de Nîmes Sommières

Tri par “Nom” puis “Prénom” :

2 Dupond Julie 4, imp. du sud Jacou


1 Leroux Alex 3, rue des lilas Montpellier
3 Leroux Sylvie 8, av de Nîmes Sommières

Problème : comment désigner un enregistrement ?

61
Identifier chaque enregistrement d’une table

Clé primaire = sous-ensemble minimal de champs assurant


l’unicité des enregistrements.

Exemples :

Table Adhérents (N adhérent, Nom, Prénom, Adresse, Ville)


Table Cotisations (Ref. adhérent, Date, Montant)

Numéro INSEE d’une personne : 2 74 03 34 123 456


(sexe, année naissance, mois, département,   )

Remarque : Jamais deux enregistrements identiques dans une


même table.

62
Autre illustration

Adhérents (N adhérent, Nom, Prénom, Adresse, Ville)

N adhérent Nom Prénom Adresse Ville


1 Leroux Alex 3, rue des lilas Montpellier
28 Droopy Bob 4, imp. du sud Montpellier
7 Leroux Alex 3, rue des lilas Montpellier
1 Pouce Tom 8 av de Nîmes Montpellier

Cotisations (Ref. adhérent, Date, Montant)

Ref. adhérent Date Montant


28 22/11/99 50
28 03/05/00 350
1 22/11/99 50
28 22/11/99 150

63
Traiter les données stockées dans les tables

Requêtes : calculs à paritr des données d’une ou plusieurs


tables pour générer un ensemble de résultats ( table virtuelle)

Filtrer les enregistrements suivant certains critères

Exemple sélection de tous les adhérents qui habitent à Mont-


pellier :

N adhérent Nom Prénom Adresse Ville


1 Leroux Alex 3, rue des lilas Montpellier
28 Droopy Bob 4, imp. du sud Montpellier
74 Pouce Tom 8 av de Nîmes Montpellier

Sélectionner un sous ensemble de champs

Exemple ne conserver que les champs “Noms” et “Prénom” :

Nom Prénom
Leroux Alex
Droopy Bob
Pouce Tom

64
Traiter les données stockées dans les tables
(suite)

Définir un nouveau “champ calculé”

Exemple : calculer l’âge de chaque adhérent

N adhérent Nom Prénom Date de naissance Age


1 Leroux Alex 3/06/75 28
28 Droopy Bob 4/5/72 31
74 Pouce Tom 2/1/76 27

Regrouper un ensemble d’enregistrements et leur appliquer


une opération

Exemple : compter le nombre d’adhérents habitant dans chaque


ville

Ville Nb d’adhérents
Montpellier 12
Nîmes 5
Sommières 1

65
Traiter les données stockées dans les tables (fin)

Jointure : associer des enregistrements issus de tables dif-


férentes
Table : Cotisations Table : Adhérents
Date [Link]. Montant
N adh. Nom Prénom Adresse Ville
01/09/96 2 50
1 Leroux Alex 3 rue des lilas Montpellier
10/10/96 1 75
2 Dupond Julie 4 imp. du sud Jacou
7/08/97 1 100
3 Leroux Sylvie 8, av de Nîmes Sommières
12/10/97 2 50

Date [Link]. Montant Nom Prénom Adresse Ville


01/09/96 2 50 Dupond Julie 4 imp. du sud Jacou
10/10/96 1 75 Leroux Alex 3 rue des lilas Montpellier
7/08/97 1 100 Leroux Alex 3 rue des lilas Montpellier
12/10/97 2 50 Dupond Julie 4 imp. du sud Jacou

Requête réalisant une jointure entre les tables “Adhérents” et


“Cotisations”

66
Aspects Techniques

Materiel : pas nécessairement besoin d’un “gros” ordinateur


ça dépend

- Du nombre de données
- Du nombre d’utilisateurs

L’administration d’une base de donnée nécessite

- Des compétences spécifiques en informatique


- Beaucoup de temps

67
Conclusion

SGBD = logiciel fournissant des outils fiables et performants


pour gérer une base de données.

Les différentes SGBD :

- Très grandes bases essentiellement Oracle


- Petite base (personnelle) : Access,  
- Gratuits MySQL, PostgreSQL,  

Base de données = collection d’informations structurées mo-


délisant des entités du monde réel et mémorisées sur un sup-
port permanent.

Méthode de “normalisation” pour limiter la redondance (ou


duplication) des données.

- gain de place
- facilité de mise à jour

68

Vous aimerez peut-être aussi