0% ont trouvé ce document utile (0 vote)
25 vues14 pages

Stats

Le document traite des méthodes statistiques, y compris l'échantillonnage, la description des données, et les représentations graphiques. Il aborde également les corrélations, la significativité statistique, et la comparaison d'échantillons à l'aide de tests comme le T-test de Student et le test de Mann-Whitney. Enfin, il discute des tests d'homoscédasticité et des tests appariés.

Transféré par

jorge moreno
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
25 vues14 pages

Stats

Le document traite des méthodes statistiques, y compris l'échantillonnage, la description des données, et les représentations graphiques. Il aborde également les corrélations, la significativité statistique, et la comparaison d'échantillons à l'aide de tests comme le T-test de Student et le test de Mann-Whitney. Enfin, il discute des tests d'homoscédasticité et des tests appariés.

Transféré par

jorge moreno
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

STATS

CM1

Statistique = ensemble de méthodes permettant de décrire et d’analyser des observations


(ou données).

Population: Ensemble de personnes ou d’objets équivalents étudiés. Étudiants STAPS


en France

Echantillon: Ensemble d'individus représentatifs d'une population. Les L2 STAPS


Chambéry

Individus : Chaque individu/objet d’une population. Vous

Variables : Caractéristiques que l’on mesure. Taille, IMC, Vitesse de course

Série statistique : Série d’observations recueillies. Valeurs

L’ECHANTILLONNAGE

Les méthodes empiriques :

****Les plus utilisées par les instituts de sondage.


• Echantillonnage sur la base du jugement —> Expertise +++: Un expert
sélectionne délibérément ce qu’il considère comme un échantillon représentatif

• Echantillonnage par la méthode des quotas —>Pertinence de categories +++ .Se


base sur une hypothèse de répartition de la population en différentes sous-
catégories
o Exemple : Si la population compte 100 hommes et 100 femmes, et il faut
tirer un échantillon de 20 personnes, 10 hommes et 10 femmes peuvent
être interviewés.

• Les méthodes aléatoires:

• Echantillonnage aléatoire simple

• Echantillonnage aléatoire stratifié: Sous-populations homogènes, différentes


entre elles

• Echantillonnage par grappe: Sous-populations différentes, homogènes entre elles


DESCRIPTION DES DONNÉES

Le type de données va influencer l’ensemble du processus de traitement des données !

• Quantitatives
o Discréte
o Continue
• Qualitatives

Example:

REPRÉSENTATIONS GRAPHIQUES

Il faut passer par des étapes de synthèse.


DISTRIBUTION GAUSIENNE
Un prérequis indispensable à l’utilisation d’indice de distribution & tendance du type
Moyenne-Ecart Type.

LE COUPLE MOYENNE / ECART-TYPE

Les indices de tendance centrale et de distribution – Quels indices?

LES AUTRES INDICES DE DISPERSION


QUID DES DISTRIBUTIONS NON NORMALES ?

CM 2
LES CORRÉLATIONS

• Objectif :Mettre en évidence une relation entre 2 variables en terme d’évolution.


• Utilisé ++ en science pour chercher des pistes scientifiques (à confirmer
expérimentalement)

LA NOTION DE COVARIANCE

Calcul de coefficient de corrélation : r

LA SIGNIFICATIVITÉ STATISTIQUE

Risque α ou risque de première espèce —> le risque de rejeter l'hypothèse nulle (H0)
alors que celle-ci est vraie.

Un risque de 5% est en général jugé acceptable par la communauté scientifique.

L’hypothèse nulle et son rejet —> Exemple Diapo 24


3 Cas de figures principaux:

Corrélation due à un facteur médiateur (Corrélé avec le prédicteur, explique le lien)


ou modérateur (Pas corrélé avec le prédicteur, module le lien déjà existant)

Corrélation avec médiateur & relation frauduleuse

Corrélation due au hasard (https://www.tylervigen.com/spurious-correlations)


3 Cas de figures principaux

• Corrélation due à un facteur médiateur ou modérateur


• Corrélation due au hasard
• Corrélation due à une relation causale

DIFFERENCE R ET R2

CM 3
LA COMPARAISON D’ECHANTILLONS

Objectif :

Différencier l’expression d’une variable dépendante au sein d’un échantillon en fonction


d’une ou plusieurs variables indépendantes

• Variable dépendante : Variable mesurée ou calculée


• Variable indépendante : Variable manipulée par l’expérimentateur. Elle permet
de classer les sujets

LA COMPARAISON DE DEUX GROUPES CATEGORISES SUR LA BASE


D’UNE VARIABLE INDEPENDANTE

Une des plus utilisée : T-test de Student

Basé sur la moyenne + variance des données

T-TEST INDEPENDANT Se base sur la notion d’hypothèse nulle :

• H0 = Pas de différence entre les groupes


• H1 = Les groupes sont différents
• Risque α = Rejet de H0 à tort
• Risque β = Rejet de H1 à tort

Comment tester ces hypothèses ?


Si t>s(α), alors on rejette H0 au risque α → Sinon, on rejette H1 au risque β.

COMPARAISON DE DEUX ECHANTILLONS EN NONPARAMETRIQUE

U DE MANN WHITNEY

• Test basé sur les rangs signés


• i.e. le classement des valeurs
BILAN

TEST D’HOMOSCEDASTICITE - TEST DE LEVENE

Principe du test —> Tester une potentielle différence entre la variance de ces erreurs
parmi les groupes à

Test d’égalité des variances (Ftest) sur les erreurs à la moyenne.

H0 : Les variances sont égales

H1 : Les variances sont différentes


Si F<Fcritique alors on accepte H0

Ici, on ne rejette pas H0, on assume ainsi le prérequis d’homoscédasticité

CM 4

Le T-Test apparié

• S’effectue sur des données Pre/Post,


• i.e. dépendantes

Test des rangs signés de Wilcoxon

Vous aimerez peut-être aussi