STATS
CM1
Statistique = ensemble de méthodes permettant de décrire et d’analyser des observations
(ou données).
Population: Ensemble de personnes ou d’objets équivalents étudiés. Étudiants STAPS
en France
Echantillon: Ensemble d'individus représentatifs d'une population. Les L2 STAPS
Chambéry
Individus : Chaque individu/objet d’une population. Vous
Variables : Caractéristiques que l’on mesure. Taille, IMC, Vitesse de course
Série statistique : Série d’observations recueillies. Valeurs
L’ECHANTILLONNAGE
Les méthodes empiriques :
****Les plus utilisées par les instituts de sondage.
• Echantillonnage sur la base du jugement —> Expertise +++: Un expert
sélectionne délibérément ce qu’il considère comme un échantillon représentatif
• Echantillonnage par la méthode des quotas —>Pertinence de categories +++ .Se
base sur une hypothèse de répartition de la population en différentes sous-
catégories
o Exemple : Si la population compte 100 hommes et 100 femmes, et il faut
tirer un échantillon de 20 personnes, 10 hommes et 10 femmes peuvent
être interviewés.
• Les méthodes aléatoires:
• Echantillonnage aléatoire simple
• Echantillonnage aléatoire stratifié: Sous-populations homogènes, différentes
entre elles
• Echantillonnage par grappe: Sous-populations différentes, homogènes entre elles
DESCRIPTION DES DONNÉES
Le type de données va influencer l’ensemble du processus de traitement des données !
• Quantitatives
o Discréte
o Continue
• Qualitatives
Example:
REPRÉSENTATIONS GRAPHIQUES
Il faut passer par des étapes de synthèse.
DISTRIBUTION GAUSIENNE
Un prérequis indispensable à l’utilisation d’indice de distribution & tendance du type
Moyenne-Ecart Type.
LE COUPLE MOYENNE / ECART-TYPE
Les indices de tendance centrale et de distribution – Quels indices?
LES AUTRES INDICES DE DISPERSION
QUID DES DISTRIBUTIONS NON NORMALES ?
CM 2
LES CORRÉLATIONS
• Objectif :Mettre en évidence une relation entre 2 variables en terme d’évolution.
• Utilisé ++ en science pour chercher des pistes scientifiques (à confirmer
expérimentalement)
LA NOTION DE COVARIANCE
Calcul de coefficient de corrélation : r
LA SIGNIFICATIVITÉ STATISTIQUE
Risque α ou risque de première espèce —> le risque de rejeter l'hypothèse nulle (H0)
alors que celle-ci est vraie.
Un risque de 5% est en général jugé acceptable par la communauté scientifique.
L’hypothèse nulle et son rejet —> Exemple Diapo 24
3 Cas de figures principaux:
Corrélation due à un facteur médiateur (Corrélé avec le prédicteur, explique le lien)
ou modérateur (Pas corrélé avec le prédicteur, module le lien déjà existant)
Corrélation avec médiateur & relation frauduleuse
Corrélation due au hasard (https://www.tylervigen.com/spurious-correlations)
3 Cas de figures principaux
• Corrélation due à un facteur médiateur ou modérateur
• Corrélation due au hasard
• Corrélation due à une relation causale
DIFFERENCE R ET R2
CM 3
LA COMPARAISON D’ECHANTILLONS
Objectif :
Différencier l’expression d’une variable dépendante au sein d’un échantillon en fonction
d’une ou plusieurs variables indépendantes
• Variable dépendante : Variable mesurée ou calculée
• Variable indépendante : Variable manipulée par l’expérimentateur. Elle permet
de classer les sujets
LA COMPARAISON DE DEUX GROUPES CATEGORISES SUR LA BASE
D’UNE VARIABLE INDEPENDANTE
Une des plus utilisée : T-test de Student
Basé sur la moyenne + variance des données
T-TEST INDEPENDANT Se base sur la notion d’hypothèse nulle :
• H0 = Pas de différence entre les groupes
• H1 = Les groupes sont différents
• Risque α = Rejet de H0 à tort
• Risque β = Rejet de H1 à tort
Comment tester ces hypothèses ?
Si t>s(α), alors on rejette H0 au risque α → Sinon, on rejette H1 au risque β.
COMPARAISON DE DEUX ECHANTILLONS EN NONPARAMETRIQUE
U DE MANN WHITNEY
• Test basé sur les rangs signés
• i.e. le classement des valeurs
BILAN
TEST D’HOMOSCEDASTICITE - TEST DE LEVENE
Principe du test —> Tester une potentielle différence entre la variance de ces erreurs
parmi les groupes à
Test d’égalité des variances (Ftest) sur les erreurs à la moyenne.
H0 : Les variances sont égales
H1 : Les variances sont différentes
Si F<Fcritique alors on accepte H0
Ici, on ne rejette pas H0, on assume ainsi le prérequis d’homoscédasticité
CM 4
Le T-Test apparié
• S’effectue sur des données Pre/Post,
• i.e. dépendantes
Test des rangs signés de Wilcoxon