QCM Total
QCM Total
échantillon à un autre.
Distribution avec un skewness positif signifie une distribution asymétrique
à droite.
Moyenne harmonique sert à calculer un rapport moyen. La moyenne
géometrique sert à calculer un taux moyen.
Etude ad hoc est une étude quanti ou quali réalisée pour le compte d’un seul
client .
Baromète est une étude réalisée à date fixe comme l’omnibus , mais avec le
meme questionnaire d’une étude à l’autre , pour le compte d 1 ou plusieurs
clients.
Rls permet d’estimer la valeur d’une variable dépendante par un ensemble de
variations indépendantes quantitatives.
Méthode théorique de RLS : Y= β zero + β un fois X
Diagramme de dispersion est une représentation graphique d’un nuage de
points.
Loi normale : S ≤1 et K ≤ 1,5
Méthode des moindres carrés permet de construire une droite de régression
empirique qui minimise la somme des carrés des résidus càd les distances
verticales entre la droite et chacun des points observés.
La régression est une méthode statistique qui permet d’expliquer une
variable dépendante par une ou plusieurs variables indépendantes.Elle dite
simple si elle permet de prédire la valeur dépendante par des vars
indépendants.
Le coefficient de corrélation r yx est utilisé pour quantifier la relation entre 2
variables.
£ : différence entre valeur calculée et valeur estimée.
Relation symétrique : L'analyse cherche à mesurer la liaison entre les deux
variables.
Coefficient de détermination : r²=b² x (Ʃxi² - n (moy de x)² ) ÷ (Ʃyi² - n (moy
de y)² ) = SC rég(somme des carrés de la rég) ÷ SC totale
Lorsque le seuil de confiance grandit la marge d’erreur baisse et
l’intervalle de confiance grandit
Test hypothèses : on rejette H zero si t supérieur à t(⍺/2 (n-2)dl ou t inférieur
à - t(⍺/2 (n-2)dl
Si la valeur de 0 appartient à l’intervalle de confiance de β zero ; on rejette
l’hypothèse nulle .
Sachant que z=(b1 – β1) ÷ Sb1 si n-2 sup à 30 ; t=(b1 – β1) ÷ Sb1 si n-2 inf à 30
La loi du x² (x=t ou z) suit une relation Asymétrique dont la forme dépend du
nombre de degrés de liberté.
1. Quelles sont les différences cruciales entre les méthodes de Non supervisée : la segmentation ; la supervisée : pour
prédiction et nécessite une variable output et un échantillon
classification supervisées et les non supervisées. d’apprentissage.
2. Dans le cadre de la régression linéaire, si la valeur 0 Dans le cadre la régression linéaire simple oui MAIS multiple
appartient à l’intervalle de confiance de la β0 nous non, il faut vérifier les autres β i. (il faut voir les autres
acceptons le modèle ou nous le rejetons ? justifiez. prédicteurs)
3. Qu’est-ce que l'homoscédasticité ? Une des prémisses de la régression linéaire qui devrait être
vérifiée avant de continuer l’analyse, qui signifie la
variance constante des erreurs.
4. A quoi sert le test de Durbin-Watson? et comment Vérifier l’indépendance des termes d’erreurs.
L’idéal qu’il soit égal à 2 et admissible entre 1 «et 3.
l’interpréter ?
5. L'intensité et/ou le signe de la relation entre une variable
X Y
indépendante et une autre dépendante peut être
influencé par une co-variable. Expliquer à travers un Z
schéma illustratif.
6. Faites une distribution d’échantillonnage des moyennes Nombre d’échantillons : 3
(4 ; 5) (4 ; 6) (5 ; 6) qui ont comme moyenne
sachant que la population est la suivante : {4;5;6}, et que la respectivement
taille de l’échantillon est de deux (2). 4,5 5 5,5 et la moyenne des moyennes est de 5.
Enquête approfondie réalisée périodiquement sur les
mêmes clients. S'appuyant sur des échantillons importants
7. Qu’est-ce que des panels ?
de 2 000 à 10,000 individus.
…
8. L'erreur systématique est : Due à l’échelle de mesure (manque de clarté de l'échelle, ,
due à sa longueur…..),
9. L’erreur aléatoire est : Elle est due aux aléas comme la fatigue, l’humeur du
répondant, etc.
Fischer est pour tester le modèle dans sa globalité alors
que le test t de student ou Z testent les prédicteurs c’est-à-
10. Qu’elle est la différence entre le test de « Fischer », le test
dire distinguer entre celle qui expliquent Y et les autres qui
« t » et le test « Z » ? n’expliquent pas. (selon taille ou ddl)
Vérifiez l’hypothèse nulle β1 = 0 et qui consiste à comparer le t
11. En quoi consiste le test d’hypothèse sur la β1 ? calculer au t tabulé. Rejeter H0 tc est sup au tt.
1 : linéarité du phénomène.
2 : homosedasticité
12. Citez brièvement les prémisses de la régression linéaire
3 :L’indépendance des termes d’erreur
multiple. 4 : La normalité de la distribution des termes
d’erreurs ;
5 : L’indépendance des variables exogènes (pas de
colinéarité)
13. Est-ce que le niveau de satisfaction explique le rendement ANOVAa
au seuil de 80% ? justifiez. Somme des Carré
Modèle carrés ddl moyen F Sig.
Au niveau de 80% oui parce que sigANOVA ≤ α 19 ,1% ≤ 20% (100% – 80%)
1 Régression 141071,479 2,119 ,191b
14. Calculez et interprétez le coefficient de détermination. Résidu 1130332,807
R2 = SCR / SCT = 141071,479 / 1271404,286 = 11%. 11% de de la variance du Total 1271404,286
la satisfaction est expliquée par a. Variable dépendante : Rendement
Prédicteurs : (Constante), Satisfaction
Ecole Nationale de Commerce et de Gestion de Casablanca, B.P. 2725, Beau site Ain Sebaâ - Casablanca - Maroc
Tel.: +212 5 22 66 08 52/ +212 5 22 66 06 95 | Fax: +212 5 22 66 01 43 | Email: [email protected] 1/6
www.encgcasa.ac.ma
15. Interprétez le modèle et écrivez le CA en fonction des Coefficients
variables explicatives. standardisés
Modèle B Bêta t Sig.
Nous ne pouvons pas écrire le modèle parce que la publicité est une variable
1 (Constante) 140,757 19,463 ,000
non explicative, elle devrait être retirée et l’analyse devrait être refaite.
recherche 13,084 ,811 31,645 ,000
publicité -,124 -,012 -,470 ,639
a. Variable dépendante : CA
Composante
1 2
Esprit d’analyse ,979 - Les étudiants 5 ; 1 ; 3 ; et
Ambition ,996 4 sont des analystes ont les
Charisme ,963 caractères de la première composante (Esprit d’analyse, Ambition, Charisme, Niveau d’éducation,
Niveau d’éducation ,996 Raison, Imagination)
Raison ,996 - Les élements 2 et 7 sont des paresseux ont les caractères de la deuxième composante.
Imagination ,998
Emotions ,985 ,896
Paresse ,997 PS : Le nombre d’observations est inférieur à 50 et aucune analyse ne pourrait être exécutée.
Idiotisme ,989
20. interprétez les grandeurs soulignées.
Bêta : Lorsque « le niveau perception de sureté des achats sur net » augmente de son écart type « la fréquence d’achat » augmente de son écart
type x ,978.
T : t calculé est de 176,692, il faut le comparer au t tabulé de student. (test student ou test d’hypothèse.)
Tolérance : test la colinéarité, il est excellent et d’ailleurs nous n’avons qu’une seule variable indépendante donc c’est évident de ne pas avoir de
colinéarité.
21. Estimez la fréquence d’achat au seuil de 95%
Avec quelle fréquence achetez-vous sur Internet = ,028+ ,969* Je pense que faire des achats sur Internet est sûr.
Avec quelle fréquence achetez-vous sur Internet = ,095 + ,991* Je pense que faire des achats sur Internet est sûr.
Nous n’avons pas de valeur de la variable indépendante pour l’estimer !!!!!
Coefficients
Coefficients non standardisés standardisés
Modèle B Erreur standard Bêta t
1 (Constante) ,062 ,017 3,582
Je pense que faire des achats sur ,980 ,006 ,978 176,692
Internet est sûr.
Ecole Nationale de Commerce et de Gestion de Casablanca, B.P. 2725, Beau site Ain Sebaâ - Casablanca - Maroc
Tel.: +212 5 22 66 08 52/ +212 5 22 66 06 95 | Fax: +212 5 22 66 01 43 | Email: [email protected]
www.encgcasa.ac.ma 2/6
22. L’objectif de l’étude est prendre une décision à propos de la société X voulant contracter un CMT (crédit
à moyen terme). Coefficients non standardisés
Résultats du test Fonction 1
M de Box 1,186
R05 ,009
F Approximativement 8,434
R08 -,066
ddl1 28
R09 4,562
ddl2 6805,124
R10 ,418
Signification 1,000
R11 ,006
Test l'hypothèse nulle d'égalité de matrices de
covariance des populations. R12 2,535
R14 ,260
(Constante) -,796
Y = -,796 + 0,009xR05 -,066x R08 + 4,562x R09 + ,418x R10 + ,006xR11 + 2,535x R12 +,260xR14
Justificatif : le score de l’entreprise x est de 1,875 est supérieur au score critique -0,106
PS : la bonne réponse : la signification de M de BOX supérieur à α (5%) l’analyse doit
s’arrêter.
Ratios R01 R02 R04 R05 R07 R08 R09 R10 R11 R12 R14
E/se X 10,764 479 5,765 0,10 0,10 0,010 0,10 0,00 0,010 0,010 10
Défaillante -1,760
Saine 1,548
Exercice II :
1- Les principales applications des équations structurelles sont regroupées dans le tableau sur la feuille de
réponses ainsi que l’objectif de chacune d’elles. Complétez le tableau.
Rhô de Jöreskog.
Rhô de validité convergente.
Validation d’une échelle de Test de la validité discriminante.
mesure
Vérification de la validité nomologique ou prédictive.
Identification de
l’importance des
effets médiateurs dans le Test de Sobel. Procédure de bootstrap (avec simulation de
modèle. Monte Carlo).
Ecole Nationale de Commerce et de Gestion de Casablanca, B.P. 2725, Beau site Ain Sebaâ - Casablanca - Maroc 3/6
Tel.: +212 5 22 66 08 52/ +212 5 22 66 06 95 | Fax: +212 5 22 66 01 43 | Email: [email protected]
www.encgcasa.ac.ma
2- Selon Hoyle (1995), la modélisation par les équations structurelles représente « une approche statistique
globale permettant de tester des hypothèses traitant des relations entre les variables observées et les
variables latentes ». L’élaboration d’un modèle d’équations structurelles rend nécessaire le suivi d’une
démarche composée d’un ensemble d’étapes successives. Citez-les et développez l’objectif de chaque
étape.
- Respécification du
modèle. La respécification du modèle représente une phase de réflexion qui offre l’opportunité
de reconsidérer la conception du modèle et d’en proposer des modifications éventuelles,
en tenant compte du cadre théorique de la recherche en question
A titre d’exemple, il serait possible d’ajouter ou de supprimer des paramètres, de fixer
ou de modifier des contraintes, etc.
3- Votre directeur vous demande de mesurer le niveau d’ambition moyen des employés.
Recherche documentaire
Revue de littérature
Entretien
Élaborer une échelle de mesure, vue que la variable est subjective ou latente il faut faire
appel au paradigme de Churchill pour approcher la vraie valeur (M = V + Es + Ea)
M : Mesure obtenue
V : Vraie valeur
Es : Erreur systématique
Ea : Erreur aléatoire
Nous devrions faire appel à l’AFE ou l’ACP pour valider l’échelle de mesure
Ecole Nationale de Commerce et de Gestion de Casablanca, B.P. 2725, Beau site Ain Sebaâ - Casablanca - Maroc 4/6
Tel.: +212 5 22 66 08 52/ +212 5 22 66 06 95 | Fax: +212 5 22 66 01 43 | Email: [email protected]
www.encgcasa.ac.ma
Université Hassan II Mohammedia – Casablanca
Ecole Nationale de Commerce et de Gestion
ﺍﻟﻤﺪﺭﺳﺔ ﺍﻟﻮﻁﻨﻴﺔ ﻟﻠﺘﺠﺎﺭﺓ ﻭﺍﻟﺘﺴﻴﻴﺮ ﺍﻟﺪﺍﺭ ﺍﻟﺒﻴﻀﺎء
Examen final (2019/2020) Nom : ………………………………..………………………………………………………………..…………………………………….…..… …….…..… Note : …………………………………………..………
EXERCICE III
1- Voulant établir un modèle conceptuel en matière de capacité d’innovation, basé sur les facteurs que
sont le leadership, le réseautage externe et l’innovation. Nous avons formulé une série d’hypothèses:
- Les facteurs d’innovation et le réseautage externe sont tous deux positivement associés à la capacité
d’innovation autoproclamée ;
- Les types de leadership qui sont favorables à l’innovation sont positivement associés aux facteurs que
sont la capacité d’innovation autoproclamée, le réseautage et l’innovation ;
- Les facteurs d’innovation sont positivement associés au réseautage.
La Figure ci-après et le tableau au-dessous présentent les résultats finaux de l’analyse.
Effets directs, scores standardises a partir des modelés par équation structurelle.
Capacité GV DU ENTREPRENEURIAL TRANSFORMA ALTRUISTE FACTEURS RESEAUT
D’innovation RESEAU TIONNEL D’INNOVATION AGE
autoproclamée
Echantillon complet 0,25 0,17 0,16 −0,10 0,02 0,05
Barcelone 0,40 −0,15 0,34 −0,18 0,08 0,07
Copenhague 0,35 0,13 0,20 −0,07 −0,01 0,03
Rotterdam 0,25 0,33 0,10 0,08 0,04
−0,17
5/6
………………………………………………………………………………………………………………………………………………...…………………………………………………………………………………………………………………………………………………...……...
………………………………………………………………………………………………………………………………………………………………...…………………………………………………………………………………………………………………………………………
………...……...…………………………………………………………………………………………………………………………………………………………………...………………………………………………………………………………………………………………………
…………………………...……...…………………………………………………………………………………………………………………………………………………………………...……………………………………………………………………………………………………
……………………………………………...……...………………………………………………………………………………………………………………………………………………………………...……………………………………………………………………………………
……………………………………………………………...……...…………………………………………………………………………………………………………………………………………………………………...…………………………………………………………………
………………………………………………………………………………...……...…………………………………………………………………………………………………………………………………………………………………...………………………………………………
…………………………………………………………………………………………………...……...………………………………………………………………………………………………………………………………………………………………...………………………………
…………………………………………………………………………………………………………………...……...…………………………………………………………………………………………………………………………………………………………………...……………
……………………………………………………………………………………………………………………………………...……...………………………………………………………………………………………………………………………………………………………………
…...…………………………………………………………………………………………………………………………………………………...……...……………………………………………………………………………………………………………………………………………
………...……...…………………………………………………………………………………………………………………………………………………………………...………………………………………………………………………………………………………………………
…………………………...……...…………………………………………………………………………………………………………………………………………………………………...……………………………………………………………………………………………………
……………………………………………...……...………………………………………………………………………………………………………………………………………………………………...……………………………………………………………………………………
……………………………………………………………...……...…………………………………………………………………………………………………………………………………………………………………...…………………………………………………………………
………………………………………………………………………………...……...…………………………………………………………………………………………………………………………………………………………………...………………………………………………
…………………………………………………………………………………………………...……...………………………………………………………………………………………………………………………………………………………………...………………………………
…………………………………………………………………………………………………………………...……...…………………………………………………………………………………………………………………………………………………………………...……………
……………………………………………………………………………………………………………………………………...……...………………………………………………………………………………………………………………………………………………………………
…...…………………………………………………………………………………………………………………………………………………...……...……………………………………………………………………………………………………………………………………………
………...……...…………………………………………………………………………………………………………………………………………………………………...………………………………………………………………………………………………………………………
…………………………...……...…………………………………………………………………………………………………………………………………………………………………...……………………………………………………………………………………………………
……………………………………………...……...………………………………………………………………………………………………………………………………………………………………...……………………………………………………………………………………
……………………………………………………………...……...…………………………………………………………………………………………………………………………………………………………………...…………………………………………………………………
………………………………………………………………………………...……...…………………………………………………………………………………………………………………………………………………………………...………………………………………………
…………………………………………………………………………………………………...……...………………………………………………………………………………………………………………………………………………………………...………………………………
…………………………………………………………………………………………………………………...……...…………………………………………………………………………………………………………………………………………………………………...……………
……………………………………………………………………………………………………………………………………...……...………………………………………………………………………………………………………………………………………………………………
…...…………………………………………………………………………………………………………………………………………………...……...……………………………………………………………………………………………………………………………………………
………...……...…………………………………………………………………………………………………………………………………………………………………...………………………………………………………………………………………………………………………
…………………………...……...…………………………………………………………………………………………………………………………………………………………………...……………………………………………………………………………………………………
……………………………………………...……...………………………………………………………………………………………………………………………………………………………………...……………………………………………………………………………………
……………………………………………………………...……...…………………………………………………………………………………………………………………………………………………………………...…………………………………………………………………
………………………………………………………………………………...……...…………………………………………………………………………………………………………………………………………………………………...………………………………………………
…………………………………………………………………………………………………...……...………………………………………………………………………………………………………………………………………………………………...………………………………
…………………………………………………………………………………………………………………...……...…………………………………………………………………………………………………………………………………………………………………...……………
……………………………………………………………………………………………………………………………………...……...………………………………………………………………………………………………………………………………………………………………
…...…………………………………………………………………………………………………………………………………………………...……...……………………………………………………………………………………………………………………………………………
………...……...…………………………………………………………………………………………………………………………………………………………………...………………………………………………………………………………………………………………………
…………………………...……...…………………………………………………………………………………………………………………………………………………………………...……………………………………………………………………………………………………
……………………………………………...……...………………………………………………………………………………………………………………………………………………………………...……………………………………………………………………………………
……………………………………………………………...……...…………………………………………………………………………………………………………………………………………………………………...…………………………………………………………………
………………………………………………………………………………...……...…………………………………………………………………………………………………………………………………………………………………...………………………………………………
6/6
Analyse de Données : famille de méthodes statistiques dont les
principales caractéristiques sont d'être multidimensionnelles et descriptives,
permet de traiter un nombre très important de données et de dégager les
aspects intéressants de la structure de celles-ci.
Etude Quantitative : consiste à rechercher des infos chiffrées quantifiables et
des données statistiques
Etude Qualitative : consiste à collecter et analyser des infos permettant
d'expliquer des faits, des opinions, des comportements...
Ad-Hoc : Etude quanti ou quali réalisée pour le compte d'un seul client
Omnibus : Etude quanti réalisée à date régulière, le questionnaire utilisé
regroupe l'ensemble des questions de différents souscripteurs
Baromètre : réalisée à date fixe, le questionnaire ne change pas d'une étude à
l'autre et pour le compte d'un seul ou plusieurs clients
Panel : enquête approfondie, réalisée périodiquement sur les mêmes clients,
avec 2.000 à 10.000 individus (pseudo=diff. clients)
Marché-test : étude quanti visant à prévoir les ventes et les parts de marché
des nouveaux produits
Entretien individuel : a pour objet de recueillir le discours individuel : entretien
directif/non directif/semi-directif/associatif ou projectif
Réunion de groupe : étude quali libre et non structurée d'un groupe de 8 à 12
participants, conduite par un animateur ; discours repose sur les phénomènes
de psychologie collective des groupes restreints. (logique exploratoire)
Etudes descriptives : ont pour but de créer des structures décrivant les
caractéristiques d'une ppl cible ou marché
Etudes explicatives : ont pour but de transformer des données brutes en
structures ou en modèles mathématiques expliquant les relations de cause à
effet entre les variables
Etudes prédictives : ont pour but de transformer les données brutes collectées
sur les caractéristiques comportementales des consos, e/ses, marchés etc. pour
prédire certaines variables
Données primaires : sont collectées pour la 1ère fois pour résoudre
le problème propre à l'étude
Données secondaires : sont d'accès facile, peu coûteuses, à faible VA,
abondantes et devraient être examinées et consultées avant d'être
collectées
Variable : expression des différents états ou valeurs observés dans la
population ;
• Variables quali : (Modalité) peuvent être ordinales ou
nominales
• Variables quanti : (Occurrence) peuvent être continues ou
discrètes
Echelle de mesure : transformer les questions en mise en situation, a
pour objet de fournir au répondant un support d'expression de
phénomènes abstraits, subjectifs et complexes à mesurer facilement.
➢ Nominale : chacune des modalités sont équivalentes aux autres,
les modalités sont codifiés
➢ Ordinale : l'ensemble des modalités suivent un ordre sous-
jacent
➢ Métrique : permet de comparer la distance entre les objets et
les modalités par des espaces équidistants
▪ Osgood : mesure la qualité (1-5)
▪ Likert : L'accord du consommateur (1-5)
▪ Intention : intention d'achat
Relation médiatrice : variable intermédiaire qui permet de mesurer
l'effet de la var indép sur la var dép
Relation modératrice : une variable qui peut influencer l'intensité ou
le signe de la relation entre X et Y en décomposant l'éch en sous-éch
Mesurer à l'aide du questionnaire :
Conditions de forme : types de questions, style de rédaction
Conditions de fond : validité/fiabilité
1/échelle de mesure : obtenir une mesure parfaite pour réduire les erreurs
Erreur aléatoire : dépend des circonstances de mesure, due aux aléas tels que
la fatigue du répondant, l'humeur etc.
Erreur systématique : dépend aux instruments de mesure, due au manque de
clarté du questionnaire ou d'échelle, la longueur etc.
2/Mesurer :
Modèle de vraie valeur : consiste à décomposer le résultat d'une mesure en ses
diff éléments : la VV et les termes d'erreur Ea/Es ;
M (Mesure obtenue) = VV + Es + Ea
3/Validation du questionnaire :
Fiabilité : avoir les mêmes résultats si on refait l'analyse dans les mêmes
conditions ; sinon Ea
Validité : mesurer ce qu'on cherche à mesurer
• V. interne :
o V. convergente : Tous les items appartenant au même construit
doivent mesurer la même chose
o V. discriminante : supprimer les vars corrélées à 2 composantes
à la fois
• V.externe : tous les éléments doivent être pris en considération en
répondant aux questionnaires
4/méthodes d'analyse
L’ADD est une clé d'accès à la prise de décision à partir d'infos fiables et valides
déjà existantes.
L’analyse uni-variée : consiste à examiner la distribution des modalités de
réponse pour une variable
L'analyse bi-variée : consiste à étudier les relations entre deux variables
L'analyse multi variée : permet de dépasser les techniques précédentes
Statistique : ensemble des méthodes mathématiques qui à partir du
recueil et de l'analyse des données réelles permettent l'élaboration de
modèles probabilistes autorisant les prévisions.
Stat descriptive : décrire un ou + paramètres d'une population
Stat probabiliste : utilisation des lois usuelles
Stat inférentielles : ensemble de méthodes qui permettent l'extrapolation
des résultats qu'on a trouvé dans la stat descriptive (échan. /Estim.)
• Population : ensemble d'individus sur lesquels porte l'étude stat
• Échantillon : sous ensemble de la population
• Items : ensemble de var qui mesurent la même chose
• Construits : ensemble d'items
• Paramètre : critère utilisé pour décrire une population
Description d'une variable quali : Présenter les effectifs, les fréquences
relatives à chaque modalité + graph
Description d'une var quanti :
Mesures de tendance centrale : résumer la série d'observations par une
valeur considérée comme représentative.
• Moyenne : le centre des observations
∑ 𝑋𝑖
o Arithmétique : permet de trouver le point central 𝑋̅=
𝑛
∑ 𝐿𝑜𝑔(𝑋𝑖)
o Géométrique : calculer le taux moyen log(𝑋̅)=
𝑛
1
1 ∑
𝑋𝑖
o Harmonique : calculer le rapport moyen (plus précise) =
𝐻 𝑛
Σ𝑋𝑖²
o Quadratique : calculer la variance 𝑄 2 =
𝑁
• Médiane : La valeur qui partage la série en 2 groupes égaux
o réelle : existe dans la série
o artificielle : ne fait pas partie de la série (12, 15, 16, 18)
o sans médiane : ex : (12, 13, 14, 14, 15, 16, 17)
• Mode : la valeur la plus fréquente/redondante
Mesures de dispersion :
• Etendue : Xmax - Xmin
• Variance : mesure de dispersion autour de la moyenne
1
o discrète : 𝑆 2 = Σ𝑥𝑖 2 − 𝑋̅ ²
𝑛
1
o continue : 𝑆 2 = Σ𝑟𝑖(𝑐𝑖 − 𝑋̅)²
𝑛
• Ecart-type : mesure la dispersion en moyenne autour de la
moyenne
• Coefficient de variation : indicateur approprié pour comparer
plusieurs sous-échantillons, en terme de dispersion 𝐶𝑉 =
𝑆
̅ × 100
𝑋
RLS : expliquer/estimer, prédire la valeur d'une var dépendante par un ensemble de vars
indépendante quantitatives explicatives
Régression Logistique : quand la var est quali. 2 modalités = binaire, sinon multinominale
Régression discriminante : comme la R Logi mais exige la normalité de la distribution des variables
Etapes de la RLS :
• 1_Coefficient de corrélation : Mesure la force du lien entre 2 variables. r=1 : varient dans le
même sens, r=-1: sens inverse, r=0 pas de corrélation linéaire, r>=0,7 très forte
(Non linéarité=/=Non Liaison)
• 2_Coefficient de détermination : la part de variance de Y expliquée par la variance de X.
(SCRés/SCTotal)
• 3_Covariance : vise à quantifier l'écart entre les vars
• 4_Analyse de l'ANOVA:
• SigANOVA<=α, on accepte.
• SigANOVA>=50% auto-reject
• La méthode de la vraisemblance
• La méthode des moindres carrés: méthode qui permet de tracer une droite qui minimise les
écarts et les résidus.
o Droite théorique: droite qui passe par tout les points; impossible donc on trace une
droite empirique
o Droite empirique: Minimise les écarts
▪ B0 et B1; coefficients théoriques de la régression.
Deux tests sont couramment utilisés : t ou z; ou F. Les deux test nécessitent une estimation de Se², la
variance des erreurs "e" du modèle de régression
Etapes de la RLM :
1- La validation du modèle : Est-ce que les X sont significatives pour expliquer la variance de Y.
SigAnova > α Rejeter ; sinon il existe au moins une var significative.
▪ ANOVA
▪ VIF : Facteur d'inflation de la variance. On cherche B≈1; si B=10 problème de
colinéarité
Si la corrélation entre deux Var indep (X1, X2) se situe à 0,9/-0,9 elle mesurent la même chose.
dans la population
Beta: Indique le sens de la relation. (Lorsque X augmente de l'Ecart type, Y augmente de l'Ecart
type*Beta)
Analyse Bi-Variée : La description des variables et leurs relations relève une série de
questions qu'on doit approcher 2 à 2 dans cette analyse.
Tris Croisés: permettent d'examiner les relations entre deux ou plusieurs variables en
rassemblant dans un tableau unique les distributions de fréquences ou d'effectifs de
deux ou plusieurs variables.
Test Khi-deux : cherche à tester l'indépendance des variables qualitatives présentées
dans un tableau croisé ; en comparant la distribution observée Oij à celle Théorique
Tij qui correspond à l'hypothèse selon laquelle les deux variables sont indépendantes.
(𝑂𝑖𝑗 − 𝑇𝑖𝑗)²
𝑋2 = Σ
𝑇𝑖𝑗
Procédure :
1-Emission des Hypothèses : H0/H1
2-Règle de décision : X²c>X²th ==> Rejeter H0/Accepter H1 avec X²th = X²[α;(r-
1)(c-1)]
Condition : Chaque case du tableau devrait avoir un effectif théorique au moins égal
à 5.
Interprétation : Comme l'ANOVA
Indicateurs :
Coefficient phi Ø : Dans le cas des tableaux 2x2, il est recommandé d'appliquer une
𝑋²
correction du X², ou d'utiliser le coefficient Ø = √
𝑛