0% ont trouvé ce document utile (0 vote)
39 vues4 pages

Untitled

Transféré par

oumaima V Inejjarne
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
39 vues4 pages

Untitled

Transféré par

oumaima V Inejjarne
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF ou lisez en ligne sur Scribd
123, 6:44 PN Messagerie Université bn Total & Kéntra - Examen R S5-2021/2022 tes Universit ee) bn Seal AHMED MAWIA BUSHARA Examen R S5- 2021/2022 Google Forms 14 janvier 2022 a 12:26 X: mohammedbushara,ahmedmawiahassan@[Link] Merci d'avoir rempli le formulaire Examen R S5- 2021/2022 Voici ce qui a été regu. Examen R S5- 2021/2022 Note : Merci de vérifier avant de quitter la salle que vous avez regu une copie de ce formulaire comme accusé de bonne réception sur vos boites emails institutionnels Votre adresse e-mail ([Link]@[Link]) a été enregistrée lorsque vous avez envoyé ce formulaire. Nom et prénom * Ahmed Mawia Bushara Numéro Apogee * 18008045 Merci de répondre par vrais ou faux aux affirmations en bas * Vrais Faux La statistique est la discipline qui étudie des phénoménes a travers la collecte de © oO données, leur traitement, leur analyse, linterprétation des résultats En stochastique, un phénoméne est décrit par un ensemble de variable, cos Oo © hitpsimall. google.commallu0/7ic=a926308528viewspt&search=all&permmsgié=msg-F&3A17219291568960880868simpl-msg 63172192... 118 111723, 6:44 PM Messagerie Université bn Total & Kéntra - Examen R S5-2021/2022 variables sont dites aléatoires Une variable aléatoire est une série de valeur numérique uniquement selon une loi de répartition analyse de donnée est ensemble des techniques statistiques utilisées pour le traitement des données Les techniques d’analyse de donnée utllisent des lois mathématiques pour décrire les phénoménes et pas la prédiction des comportements, ceci n'est du sort des statisticiens mais des magiciens Oo © Les grandes étapes d’analyse de donnée sont : 1- Définition des données et problématique, 2- Prétraitement, 3-Analyse, 4-Interpretation des résultats La normalité consiste a vérifier la distribution des variables discrétes, s'ils suivent la loi normale Le [Link] est le seul test a faire pour vérifier la normalité, quand le p-value cst inférieur au seuil de significativité, la distribution est dite quasi-normale, La quasi-normalité consiste a verifier allure de la distribution, en utilisant par exemple la fonction density ou bien les indicateurs de symétrie et d'aplatissement Si une variable quantitative n'est pas normale ni quasi-normale, alors on cherche la normalité des variables qualitatives Le nettoyage des données consiste a utiliser la fonction [Link]() pour identifier les valeurs manquantes et aberrantes La boucle ci-dessous permet diidentifier une valeur aberrante pour la variable age (voir le code sur la feuille de examen) Le seull de significativité est la probabilté de trouver HO Ce code source est incorrecte : (voir le code sur la feullle de examen) Une variable ordinale est une variable catégorielle dont les modalités expriment un ordre conventionnet Lanalyse & composante principale est une analyse qui permet d'identifier les valeurs non normale 00 G08 G8 0 0 G8 0 0 © © ® 08000 © © 0 G8 © 0 Le test Khi-deux est un test d’hypothése paramétrique sur une variable catégorielle ordinale uniquement Langage R - est un langage de programmation interprété, multiplateformes (Windows, Unix/Linux, Mac...). Il favorise la programmation impérative structurée ot rélctve Il est doté dun typage dynamique fort, une gestion automatiquede © © la mémoire par ramasse-mieties et dun systéme de gestion c'exceptions (comme python). hitps:simail. [Link] mallu0/7ic=a826908528view=pt&searchallépermmsgid=msg-Fk3A1721829156896088088Asimpl-msg4%3A172192... 214 111723, 6:44 PM Messagerie Université bn Total & Kéntra - Examen R S5-2021/2022 Le typage dynamique fort permet & R de passer d'une variable & une autre © variable sans préciser le type préalablement Dés qu'on ne trouve pas la normalité vérifié, on ne peut ullliser que le khi-deux pour tester les hypotheses Une hypothase est une phrase verbale affirmative uniquement et qui représente tune possible réponse a la question de étude Le Plan d’échantilonnage n'est définit que lorsque la population est connu Si la population est inconnue on utilise la formule : Le z est intervalle de confiance, Le p est la probabilité, Le n la taille de la population (voir la formule sur la feuille de examen) Oo 00 0 © © ® © 0 Une population connu est un sous échantillon dont les individus sont connu davance et inscrit dans une liste, dans ce cas de figure le plan d’échantillon & utiliser est aléatoire, dont le stratifié, le par quota et laléatoire simple sont des modes d’échantillonnage possible dans ce cas, oO ® Le test t ou le test de student permet de comparer les moyennes d'une variable quantitative entre deux groupes et il permet de conclure a l'association possible © oO entre les variables. La fonction utlisée en R est :ttest() Dans la phase d'analyse de donnée, le premier test a effectuer est le test sur Oo © 'échantilonnage si il est représentalif, équilibré ou non représentatif Pour tester 'équilibre sur la variable sexe, ci-dessous la commande a utiliser [Link](a$Sexe), sile p-value est supérieur a0, latest déquiibre estat §=§ Cs © validé Lots Krkea ee user toujours pour confer association onto vafsble Cy @ quantitative et une autre qualitative & plusieurs niveaux és qu'on teste Féquilibre de I'échantllon, on valide la représentativité de V'échantilon par rapport a la population et on entame la confirmation des © Oo hypothases d'étude LLors de induction des items depuis la phase des interviews, 'analyste de donnée a formulé les items suivants : Item 1 : La maitrise des langues contribue améliorer Vemployablité des étudiants. Item 2 : L'autonomie contribue a améliorer Vemployabilité des étudiants. lem 3 : La prise dinitiative contribue a améliorer Oo © employabilité des ouvriers. Item 4 : esprit d'équipe contribue améliorer employabilité des étudiants, L'alpha de cronbach est attendu quil soit accepts ot satisfaisant Pour valider 'hypothése formulé dans I'item 1 (question 30), on devrait d'abord vérifier la normalité de cet item, ensuite on vérifie silos effectives théoriques et © oO observés avec |e test de Khi-deux et on conclut en utilisant les fréquences des réponses hitps:imail. google. commallu0/7ic=a8269085C28view=pt&searchallépermmsgid=msg-Fk3A1721829156896088088Asimpl-msg4%3A172192... 314 111723, 6:44 PM Messagerie Université bn Total & Kéntra - Examen R S5-2021/2022 iy @ ue cons surtem 2, cst quand Hest accept Ht ree. test Khi-deux. Oo © Le code ci-dessous permet de vérifer, sily a une différence significative entre les moyennes revenues des hommes et des femmes : (voir le code sur la feuille de Oo © examen) Les test [Link] et ttest sont utilisés quand la variable quantitative est quasi- normale. Siily a pas une concordance des résullats des tests, on favoriseletest © © rnon-paramétrique de comparaison de rang des moyennes Le modele de régression linéaires simple est un modeéle de classification entre oO © plusiours variables quantitatives & expliquer et explicatives Le modéle de régression linéaire multiple repose sur les hypothéses : Les variables sont quantitatives uniquement et ils sont en association, La variable quantitative & expliquer suit la normalité ou la quasi-normalté, Les coefficients Oo © sont signifcatives (le p-value supérieur & 5%), La valeur résiduelle suit fa loi normale, La colinéarté est vérifé (VIF inférieur & 10) Les modéles de classification ou de clustering est possible pour les variables quantitatives et qualitatives Lanalyse & composante principale est possible avec la librairie Remdr et FactoMiner analyse & composante principale est possible quand le KMO est supériour & 0.6/0.7, un Alpha de cronbach est supérieur a 0.6/0.7. ‘Sur cette examen si les étudiants obtiennes un p-value de 'hypothase alternative de khisdeux des fréquences des notes, supérieur 4 5%, ceci signif quilly a des Oo © étudiants qui ont des notes similaires Créer votre propre formulaire Google Signaler un cas dlutlisation abusive hitps:imail. google. commallu0/7ic=a8269085c28view=pt&searchallépermmsgid=msg-Fk3A17218929156896088098Asimpl-msg4%3A172192... 414

Vous aimerez peut-être aussi