Centre National d’Etudes Agronomiques des Régions Chaudes
Analyse Statistique
et
Introduction aux bases de données
Mastère Développement Agricole Tropical
Année 2003-2004, UV : DAT 104
Stéphanie Laffont & Vivien ROSSI
UMR ENSAM-INRA
Analyse des systèmes et Biométrie
rossiv@[Link]
1
Plan du Cours
Partie I. Analyse statistique
Statistiques descriptives pour le traitement d’enquêtes
Applications à plusieurs jeux de données
Partie II. Initiation aux bases de données
Présentation générale
2
Traitement statistique des enquêtes
Introduction
Traitements préliminaires
- Le questionnaire
- L’échantillonnage
- La collecte des données
Traitements statistiques
- Analyse uni-varié des variables : tris à plats, répartition,
histogrammes,
- Analyse bi-variée des variables : tris croisés, corrélations,
test du ,
- Analyse multi-variée : ACP, AFC
Conclusion
3
Détails des phases d’une enquête (I)
I. L’idée
1- Le commanditaire
2- Le but
3- La population
4- Les types d’informations à collecter
5- Le budget
4
Détails des phases d’une enquête (II)
II. La préparation
1- Etude du domaine
2- Formulation du problème posé
3- Détermination de la population
4- Détermination des objectifs
5- Définition des informations à recueillir
6- Choix de l’échantillon
7- Choix du mode de collecte
8- Rédaction du projet de questionnaire,
du guide d’entretien
9- Test du projet de questionnaire et guide d’entretien
10- Rédaction du questionnaire définitif,
du guide d’entretien définitif
5
Etude du domaine
Identifier les éléments pertinents
Recueillir un maximum d’idées de personnes :
- compétentes sur le domaine
- concernées par le problème
6
Formulation du problème posé
Les options possibles des décisions à prendre
Les hypothèses a priori
7
Détermination de la population
Qui en fait parti ?
Qui en exclu ?
8
Détermination des objectifs
Les objectifs sont souvent limités par :
Le budget disponible
La longueur du questionnaire acceptable pour l’enquêté
Aller à l’essentiel
Les outils de traitements
9
Choix du mode de collecte
Entretien face à face
Questionnaire par enquêteur
Dépouillement de documents
Questionnaire auto administré
Extraction de fichiers
10
Choix de l’échantillonnage
Définition : Sous ensemble de la population censé la repré-
senter dans son ensemble
Utilité : Limiter le coût de l’enquête
Relève de la théorie des sondages
11
Détails des phases d’une enquête (III)
III. Recueil des données
1- Approche de l’enquêté
2- Soumission des questions
3- Enregistrement des réponses
12
Détails des phases d’une enquête (IV)
IV. Analyse
1- Codage et transformation des données
2- Analyse univariée
3- Analyse bivariée
4- Analyse multivariée
13
Détails des phases d’une enquête (V)
V. Rapport et conclusion
1- Structure
2- Contenu
3- Présentation
14
Les Méthodes d’échantillonnages
Méthodes empiriques :
Méthode des unités types
Méthode des quotas
Méthodes probabilistes
Méthodes aléatoires
Sondage élémentaire
Sondage stratifié
Echantillonnage systématique
Echantillonnage à plusieurs degrés
15
Introduction du cadre statistique pour le
traitement de données
Présentation générale pour un tableau de données :
.. .. . . . ..
- réponse à la ème question sur le ème
questionnaire, avec
! et #" .
- La ème colonne regroupe toutes les réponses du ème
ques-
tionnaire.
- La ème
ligne regroupe toutes les réponses à la ème
question.
Toutes les enquêtes peuvent s’exprimer sous la forme du
tableau ci-dessus
16
Formalisation des données
La réponse à la question
, , du question-
naire est appelée variable.
la ème ligne du tableau précédent rassemble " observations
de la variable .
Deux types de variables : quantitatives et qualitatives
Deux traitements différents
17
Les types de variables
Les variables qantitatives : données numériques
Exemples : taille, poids, concentrations, pH,
Les variables qualitatives : données non numériques
Exemples : couleur des yeux, lieu de naissance,
Les modalités sont les valeurs possibles d’une variable
qualitatives :
Modalités ordonnées
Ex : Faible, Moyen, Bon, Très Bon
Modalités quelconques
Ex : Bleu, Vert, Marron
18
Analyse univariée ou Tris à plats des variables
Présentation générale : Soient des observations de
la variable
Exemple les " réponses de la question
.
Objectif : Résumer l’information contenue dans
Moyens :
Approches numériques
Approches graphiques
Outils différents suivant que la variables soit qualitative ou
quantitative
19
Traitements numériques d’une variable
quantitative
Estimation de la valeur centrale de
La moyenne des :
La médiane des : “le du milieu”.
La dispersion de
L’écart-type à la moyenne :
Les quartiles, le minimum, le maximum
Exemple, la série de notes : 10, 12, 7, 14, 11, 8, 9, 15, 5, 12,
10.5, 11, 14, 8, 16
Min Médiane Max
5 8.5 11 13 16
20
Traitement graphique d’une variable
quantitative
Histogramme
- Représentation des effectifs par classe
- Dépendant des classes : nombre et taille
- Exemple : Les mêmes notes 10, 12, 7, 14, 11, 8, 9, 15, 5, 12,
10.5, 11, 14, 8, 16.
Les classes : , , ,
,
0
0.0 2.5 5.0 7.5 10.0 12.5 15.0 17.5 20.0 22.5
Notes
21
Traitements numériques d’une variable
qualitative
Soient les modalités de
La fréquence de la modalité dans l’échantillon :
"
"
où " est le nombre d’occurences de la modalité dans
Modalités quelconques
Le tableau des fréquences des modalités dans
est
Modalités
Fréquences
Modalités ordonnées
Le tableau des fréquences des modalités dans
est :
Modalités
Fréquences
Fréquences cumulées
22
Traitements graphiques d’une variable
qualitative
Modalités quelconques :
Illustration visuelle de la répartition dans les classes
Diagramme en batons, histogramme, graphique en secteurs,
Modalités ordonnées
Idem mais il faut respecter l’ordre des modalités
23
Exemple de traitement d’une variable
qualitative à modalités quelconques
Quel type d’engrais utilisez-vous ? a : chimiques, b : bio-
logiques c : mélange des deux, d : aucun
Réponses : b, b, a, a, c, d, c, b, c, a, d, c, b, a, c, a, b, c, c,b.
a b c d
Le tableau des fréquences :
5/20 6/20 7/20 2/20
24
Exemple de traitement d’une variable
qualitative à modalités ordonnées
Comment trouvez-vous le café ?
TB : Très bon, B : Bon, A : Acceptable, M : Mauvais
Réponses : A, B, B, TB, M, A, B, A, TB, M, B, TB, A, A, B,
M, M, TB, A, B
TB B A M
Tableau des fréquences : Fréquences 0.2 0.3 0.3 0.2
Fréq. cumulées 0.2 0.5 0.8 1
Commentaires :
- 50% des clients apprécient ce café (TB+B)
- 80% des clients sont satisfaits du café (TB+B+A)
25
Analyse bivariée ou tris croisés des variables
Présentation générale : Soient des observations
de la variable et des observations conjointes de
la variable .
Exemple les " réponses à deux questions différentes.
Objectif : Etudier le lien entre et
Moyens :
Approches numériques
Approches graphiques
Outils différents suivant que les variables soient qualita-
tives ou quantitatives
26
Cas de deux variables quantitatives
Recherche d’un lien linéaire entre et
Coefficient de corrélation linéaire entre et :
Interprétation de
- Si est proche de 1, le lien entre et est linaiére
- Sinon le lien n’est pas linéaire (on peut rien dire de plus)
Etude graphique du lien entre et
Représentation du nuage de points : en abscisse
et
Si le nuage a une forme spécifique il existe un lien
Si le nuage n’a pas de structure particulière pas de lien ?
27
Exemple de traitement de deux variables
quantitatives
4.59, 3.37, 9.33, 4.85, 9.64, 3.68, 6.19, 5.39, 2.43,
-0.99, -0.70, -3.31, -1.39, -4.35, 0.84, -1.73 -1.90 .
proche de 1 lien linéaire entre et .
-3.03, -4.44, 1.45, -1.83, 0.66, 1.31, -3.69, -0.19,
774.08, 7676.3, 9.57, 37.51, 0.00864, 6.05, .
pas proche de 1 pas de lien linéaire.
il semble exister un lien quadratique entre et
28
Cas de deux Variables Qualitatives
- les modalités de .
- les modalités de .
Le tableau de contingence
" " " "
.. .. .. ..
" " " "
.. .. .. ..
"
" " "
" " " "
où
" est l’effectif de l’intersection des modalités et .
" " (i.e. l’effectif de la modalité )
" " (i.e. l’effectif de la modalité ).
" marges en lignes
" marges en colonnes
La constitution de ce tableau est l’opération appelée
“tri croisé”.
29
Test d’indépendance du de deux variables
qualitatives
Caractériser l’indépendance entre deux variables et est
très utile dans une étude et en particulier pour une enquête.
La mesure de liaison entre et est
"
Si les variables et sont indépendantes suit approxi-
mativement une loi de .
Sous l’hypothèse que et sont indépendantes, on
connait donc les valeurs vraisemblables que peut prendre
30
Test d’indépendance du de deux variables
qualitatives (suite)
Si est supérieur à la valeur critique qu’une va-
riable à une probabilité de dépasser alors on
rejettera l’hypothèse d’indépendance de et .
La valeur critique est définie par
pour trouver on doit utiliser des tables de probabilité.
Si , on accepte l’hypthotèse d’indépendance de
et au seuil
Sinon on la rejette.
Bien entendu, si et sont proches il est préférable de mi-
tiger la conclusion.
31
Exemple du traitement de deux variables
qualitatives
Comment trouvez-vous le café ?
1-TB très bon, 2-B bon, 3-A acceptable, 4-M mauvais
Comment jugez-vous la qualité du service ?
1-S satisfaisante, 2-C convenable, 3-Insuffisante
: 1TB, 2B, 3A, 2B, 2B, 3A, 4M, 2B, 1TB, 3A, 4M, 3A,
2B, 2B, 2B, 1TB, 2B, 3A, 4M, 2B, 2B, 1TB, 2B, 4M, 3A,
1TB
: 1S, 1S, 2C, 3I, 1S, 2C, 2C, 2C, 3I, 3I, 3I, 2C, 1S, 2C, 2C,
1S, 1S, 3I, 3I, 1S, 1S, 1S, 3I, 3I, 2C, 1S.
Tri croisé des variables café et service :
F IG . 1 – Tableau de contingence
32
Exemple de deux variables qualitatives (suite)
Représentation graphique du tableau de contingence :
F IG . 2 – Histogramme en 3D du tableau de contingence
Commentaire :
-Les clients semblent avoir la même opinion concernant le
café et le service.
-Il y aurait donc une dépendance entre les deux variables.
Effectuons un test statistique afin d’approfondir la question.
33
Exemple de deux variables qualitatives (fin)
Voici la sortie de test d’indépendance du réalisé avec Stat-
Box :
Variable en lignes : Café
Variable en colonnes : Service
Tests d’indépendance entre les lignes et les colonnes du ta-
bleau de contingence :
Valeur observée du khi (ddl = 6) : 14,28
P-value associée : 0,03
Le test étant unilatéral, la p-value est comparée au seuil de si-
gnification : alpha= 0,05
Valeur critique du khi (ddl = 6) : 12,57
Conclusion : Au seuil de signification alpha= 0,05 on peut re-
jeter l’hypothèse nulle d’indépendance entre les lignes et les
colonnes.
Autrement dit, la dépendance entre les lignes et les colonnes
est significative
Les commentaires initiaux sont donc confirmés par le test.
34
Analyse multi-variée
Formalisations
Les " “points sujets” : variables par individu
er sujet
ème
sujet
.. ..
" ème sujet
Les “points variables” : " individus par variable
.. ..
..
Objectif : Etudier globalement toutes les variables et tous les
individus
Moyens :
Variables quantitatives : ACP
Variables qualitatives : AFC
35
Analyse Multi-variée de variables
quantitatives : ACP
Difficulté : " et sont souvent supérieurs à 10 ou 20
Les points sujets ou variables sont dans un espace de di-
mension élevée
Extraction d’un espace de dimension plus petite contenant
beaucoup d’information l’ACP
Illustration en dimension 3 (3 variables)
36
Recherche de la première composante
principale
La première composante est la direction suivant laquelle le
nuage est le plus étiré :
37
Recherche de la seconde composante principale
Projection des individus sur le plan perpendiculaire à la pre-
mière composante :
Deuxième composante : direction selon laquelle le nuage
des projections est le plus étendu
38
Remarques générales sur l’ACP
Représentation graphique optimisée
- Réduit la dimension en conservant un maximum d’infor-
mation
- Préserve au mieux la disposition originale des points
ACP normalisée ?
- Quand ? Si les données ont des échelles très différentes
- Pourquoi ? Pour ne pas donner trop d’importance aux va-
riables qui ont les plus grandes valeurs
39
Exemple de réalisation d’une ACP
Les notes d’une classe de collège :
Maths Physique Français [Link]. Anglais Histoire
Elève 1 18,00 13,00 2,00 11,00 9,00 7,00
Elève 2 18,00 14,00 2,00 12,00 8,00 6,00
Elève 3 14,00 11,00 6,00 10,00 11,00 9,00
Elève 4 5,00 8,00 15,00 10,00 14,00 12,00
Elève 5 14,00 14,00 6,00 12,00 8,00 6,00
Elève 6 1,00 0,00 19,00 0,00 20,00 20,00
Elève 7 8,00 6,0 0 12,00 8,00 16,00 14,00
Elève 8 12,00 10,00 8,00 10,00 12,00 10,00
Elève 9 17,00 13,00 3,00 11,00 9,00 7,00
Elève 10 11,00 12,00 9,00 10,00 10,00 8,00
Elève 11 12,00 14,00 8,00 12,00 8,00 6,00
Elève 12 16,00 10,00 4,00 10,00 12,00 10,00
Elève 13 12,00 16,00 8,00 14,00 6,00 4,00
Elève 14 7,00 16,00 13,00 14,00 6,00 4,00
Elève 15 16,00 9,00 4,00 10,00 13,00 11,00
Elève 16 11,00 15,00 9,00 13,00 7,00 5,00
Elève 17 12,00 13,00 8,00 11,00 9,00 7,00
Elève 18 14,00 10,00 6,00 10,00 12,00 10,00
40
Exemple de réalisation d’une ACP (suite)
Première étape tris à plats :
Traitements de base du jeu de données Notes avec StatBox
41
Exemple de réalisation d’une ACP (suite)
Représentation graphique globale : Box plots
Représentation graphique par variable : histogrammes
Histogramme des notes de Math
42
Exemple de réalisation d’une ACP (suite)
Deuxième étape : étude des corrélations
43
Exemple de réalisation d’une ACP (suite)
Etude numérique des corrélations : Matrice des corrélations
Beaucoup de liens linéaires :
Entre Math et Français
Entre Physique [Link], Anglais et Histoire
44
Exemple de réalisation d’une ACP (suite)
Calcul des composantes principales :
- Les valeurs propres :
- Les vecteurs propres associés i.e. les composantes
principales
45
Exemple de réalisation d’une ACP (suite)
Les deux premiers axes principaux
F1 = 0.34*Maths + 0.44*Physique - 0.34*Français + 0.43 * Science Nat
F2 = 0.62*Maths - 0.23*Physique - 0.62*Français - 0.23*Science Nat
expliquent 98,42% de la variance : c’est exceptionnel !
Représentation des variables dans le plan principal (F1,F2) :
46
Exemple de réalisation d’une ACP (suite)
Représentation des individus sur le premier plan principal :
47
Exemple de réalisation d’une ACP (fin)
Représentation des individus et variables sur le premier plan
principal :
Graphique très utile pour faire les commentaires
Attention : éviter l’interprétation simultanée variable-individu
48
Analyse Multi-variée de variables
quantitatives : AFC
Adaptation de l’ACP au cas des variables qualitatives
Les principales différences entre AFC et ACP
- AFC : Chaque modalité d’une variable est représentée par
un point
ACP : Chaque variable est représentée par un point
- ACP : sa qualité est évaluée sur le pourcentage de la va-
riance restitué
AFC : plus délicat, car les variances restituées par les va-
leurs propres sont sous estimées
- AFC : Ajout de variables illustratives n’intervenant pas
dans le calcul des axes principaux Aide à l’interpré-
tation
49
Exemple de réalisation d’une AFC
On a demandé aux élèves de classer les matières par ordre de
préférence :
Toutes les variables sont qualitatives AFC
On considère alors toutes les variables suivantes :
Math.a, Math.b, Math.c, Math.d, Math.e, Math.f,
Phy.a, Phy.b, Phy.c, Phy.e, Phy.f,
Fran.a, Fran.c, Fran.d, Fran.e, Fran.f,
ScNat.b, ScNat.c, ScNat.d, ScNat.f,
Ang.a, Ang.b, Ang.c, Ang.d, Ang.e,
Hist.b, Hist.c, Hist.d, Hist.e et Hist.f
50
Exemple de réalisation d’une AFC (suite)
Etude des valeurs propres :
Histogramme des valeurs propres :
51
Exemple de réalisation d’une AFC (suite)
Le premier plan principal restitue 73.47% de la variance
Il restitue suffisament d’information pour faire une interpréta-
tion des données.
Représentation des variables sur le plan principal :
52
Exemple de réalisation d’une AFC (suite)
Ajoutons deux variables illustratives : [Link] (1 ou 2) et
[Link] (1 ou 2)
Représentation de ces variables illustratives :
53
Exemple de réalisation d’une AFC (fin)
Interprétations
Les élèves qui ont la moyenne en Français et pas la moyenne
en Math préfèrent les matières littéraires
Les élèves qui ont la moyenne en Math et pas la moyenne en
Français préfèrent les matières scientifiques
Il émerge quatre groupes dans la classe
- Groupe 1 : Littéraire avec préférence Anglais-Histoire
- Groupe 2 : Scientifique avec préférence [Link]
- Groupe 3 : Scientifique avec préférence Math
- Groupe 4 : Littéraire avec préférence Français
54
Conclusion
Sur le traitement d’enquête :
- La création du questionnnaire est une étape fondamen-
tale
Bien adapter les questions au problème que l’on se pose
et aux traitements qu’on souhaite leur faire subir.
- Utilisation des outils statistiques généraux
fonctionnement facilité pour des données de bonnes
qualités
Sur les outils statistiques :
Nombre et Nature des variables Méthodes
1 variable quantitative histogramme, box plots
1 variable qualitative diagramme à secteur
2 variables quantitatives nuage de points
2 variables qualitatives tableau de contingence
variables quantitatives ACP
variables qualitatives AFC
55
Partie II
I NITIATION AUX BASES DE DONNÉES
Principales sources :
- Cours “Initiation aux bases de données sous ACCES”,
ENSA.M Philipe Vismara
- Cours “Base de données” 2ème année EFPG
56
Introduction
- Différence entre base de données et tableur
- Eléments fondamentaux d’une base de données
Les tables
L’indexation
La clé d’indentification
Les requêtes
- Eléments techniques
sécurité, multi-accès,
entretien, matériel,
57
Différences entre Tableur et Base de données
Une base de données n’est ni un grand tableau ni un grand
tableur
Les tableurs sont efficaces pour traiter de simples grilles de
calculs, mais ils gèrent mal :
- la sémantique des données
- les liens entre les données, i.e. la cohérence après une mo-
dification
- les accès multi-utilisateurs
- la présentation sous divers formats (saisie, bilan, )
- la sécurité, la fiabilité,
-
Les SGBD : Systèmes de Gestion d’une Base de Données,
gèrent correctement tous ces points.
58
Les rôles du SGBD
Permettre la description d’informations structurées
- A chaque type d’information correspond un ensemble de
champs pour le décrire
- Chaque information enrigistrée (enregistrement) est décrite
par les valeurs de ses champs.
- Exemple :
Adhérents
N adhérent : 1 2
Nom : Leroux Dupond
Prénom : Alex Julie
Adresse : 3 rue des lilas 4 imp. du sud
Ville : Montpellier Jacou
Cotisations
Date : 01/09/96 10/10/96 07/08/97
Ref. adhérent : 1 2 1
Montant : 50
75 100
CHAMPS ou ATTRIBUTS
59
Les Tables
Table : Ensemble d’enregistrements ayant la même structure
Adhérents
N adhérent : 1 2 3
Nom : Leroux Dupond Leroux
Prénom : Alex Julie Sylvie
Adresse : 3 rue des lilas 4 imp. du sud 8 av. de Nîmes
Ville : Montpellier Jacou Sommières
Table : Adhérents
Champs
N adhérent Nom Prénom Adresse Ville
Leroux Alex 3, rue des lilas Montpellier
Dupond Julie 4, imp. du sud Jacou
Enregistrements Leroux Sylvie 8, av de Nîmes Sommières
60
Description d’une Table
Structure d’une table = description des champs
Table Adhérents (N adhérent, Nom, Prénom, Adresse, Ville)
où “N adhérent” est un entier, “Adresse” ne dépasse pas 50
lettres,
Contenu d’une table = Ensemble d’enregistrements (l’ordre
n’a pas d’importance).
Tri par “N adhérent” :
1 Leroux Alex 3, rue des lilas Montpellier
2 Dupond Julie 4, imp. du sud Jacou
3 Leroux Sylvie 8, av de Nîmes Sommières
Tri par “Nom” puis “Prénom” :
2 Dupond Julie 4, imp. du sud Jacou
1 Leroux Alex 3, rue des lilas Montpellier
3 Leroux Sylvie 8, av de Nîmes Sommières
Problème : comment désigner un enregistrement ?
61
Identifier chaque enregistrement d’une table
Clé primaire = sous-ensemble minimal de champs assurant
l’unicité des enregistrements.
Exemples :
Table Adhérents (N adhérent, Nom, Prénom, Adresse, Ville)
Table Cotisations (Ref. adhérent, Date, Montant)
Numéro INSEE d’une personne : 2 74 03 34 123 456
(sexe, année naissance, mois, département, )
Remarque : Jamais deux enregistrements identiques dans une
même table.
62
Autre illustration
Adhérents (N adhérent, Nom, Prénom, Adresse, Ville)
N adhérent Nom Prénom Adresse Ville
1 Leroux Alex 3, rue des lilas Montpellier
28 Droopy Bob 4, imp. du sud Montpellier
7 Leroux Alex 3, rue des lilas Montpellier
1 Pouce Tom 8 av de Nîmes Montpellier
Cotisations (Ref. adhérent, Date, Montant)
Ref. adhérent Date Montant
28 22/11/99 50
28 03/05/00 350
1 22/11/99 50
28 22/11/99 150
63
Traiter les données stockées dans les tables
Requêtes : calculs à paritr des données d’une ou plusieurs
tables pour générer un ensemble de résultats ( table virtuelle)
Filtrer les enregistrements suivant certains critères
Exemple sélection de tous les adhérents qui habitent à Mont-
pellier :
N adhérent Nom Prénom Adresse Ville
1 Leroux Alex 3, rue des lilas Montpellier
28 Droopy Bob 4, imp. du sud Montpellier
74 Pouce Tom 8 av de Nîmes Montpellier
Sélectionner un sous ensemble de champs
Exemple ne conserver que les champs “Noms” et “Prénom” :
Nom Prénom
Leroux Alex
Droopy Bob
Pouce Tom
64
Traiter les données stockées dans les tables
(suite)
Définir un nouveau “champ calculé”
Exemple : calculer l’âge de chaque adhérent
N adhérent Nom Prénom Date de naissance Age
1 Leroux Alex 3/06/75 28
28 Droopy Bob 4/5/72 31
74 Pouce Tom 2/1/76 27
Regrouper un ensemble d’enregistrements et leur appliquer
une opération
Exemple : compter le nombre d’adhérents habitant dans chaque
ville
Ville Nb d’adhérents
Montpellier 12
Nîmes 5
Sommières 1
65
Traiter les données stockées dans les tables (fin)
Jointure : associer des enregistrements issus de tables dif-
férentes
Table : Cotisations Table : Adhérents
Date [Link]. Montant
N adh. Nom Prénom Adresse Ville
01/09/96 2 50
1 Leroux Alex 3 rue des lilas Montpellier
10/10/96 1 75
2 Dupond Julie 4 imp. du sud Jacou
7/08/97 1 100
3 Leroux Sylvie 8, av de Nîmes Sommières
12/10/97 2 50
Date [Link]. Montant Nom Prénom Adresse Ville
01/09/96 2 50 Dupond Julie 4 imp. du sud Jacou
10/10/96 1 75 Leroux Alex 3 rue des lilas Montpellier
7/08/97 1 100 Leroux Alex 3 rue des lilas Montpellier
12/10/97 2 50 Dupond Julie 4 imp. du sud Jacou
Requête réalisant une jointure entre les tables “Adhérents” et
“Cotisations”
66
Aspects Techniques
Materiel : pas nécessairement besoin d’un “gros” ordinateur
ça dépend
- Du nombre de données
- Du nombre d’utilisateurs
L’administration d’une base de donnée nécessite
- Des compétences spécifiques en informatique
- Beaucoup de temps
67
Conclusion
SGBD = logiciel fournissant des outils fiables et performants
pour gérer une base de données.
Les différentes SGBD :
- Très grandes bases essentiellement Oracle
- Petite base (personnelle) : Access,
- Gratuits MySQL, PostgreSQL,
Base de données = collection d’informations structurées mo-
délisant des entités du monde réel et mémorisées sur un sup-
port permanent.
Méthode de “normalisation” pour limiter la redondance (ou
duplication) des données.
- gain de place
- facilité de mise à jour
68